25 Daneyên Perwerdehiya AI-ya Alternatîf a çêtirîn (2024)

Naha, piraniya me li ser pêşkeftina fêrbûna makîneyê û modelên AI-yê û çareserkirina pirsgirêkan bi karanîna daneyên heyî ve mijûl dibin. Lê pêşî, divê em danesek, girîngiya wê, û rola wê di pêşvebirina çareseriyên AI û ML-ya bihêz de diyar bikin.

Îro, me gelek danehevên çavkaniya vekirî hene ku li ser wan lêkolînan bikin an serîlêdanan pêşve bibin da ku di cûrbecûr sektoran de pirsgirêkên cîhana rastîn çareser bikin.

Lêbelê, kêmbûna danûstendinên mîqdar ên kalîteya bilind çavkaniya fikaran e. Daneyên pir zêde bûne û dê di pêşerojê de bi rêjeyek zûtir berfireh bibe.

Di vê postê de, em ê danûstendinên belaş ên berdest ên ku hûn dikarin bikar bînin da ku projeya xweya AI-ya paşîn pêşve bibin veşêrin.

1. CelebFaces Atributes Dataset

CelebFaces Attributes Dataset (CelebA) ji bo her wêneyê zêdetirî 200K wêneyên navdar û 40 şiroveyên taybetmendiyê vedihewîne, ku ew ji bo projeyên wekî xalek destpêkek hêja ye. naskirina rû, tespîtkirina rû, nîşana (an jî pêkhateya rû) herêmîkirin, û guherandin û senteza rû. Wekî din, wêneyên di vê berhevokê de cûrbecûr guhertoyên pozîsyonê û tevliheviya paşxanê vedihewîne.

2. GIVEN

DOTA (Daneyên ji Vebijêrk Armanca di Wêneyên Hewayî de) danehevek mezin e ji bo tespîtkirina tiştan ku 15 kategoriyên hevpar (mînak, keştî, balafir, otomobîl, hwd.), 1411 wêne ji bo perwerdehiyê, û 458 wêne ji bo pejirandinê vedihewîne.

3. Daneya berhevdana Rûyê ya Google

Danûstendina berhevdana rûçikên rûyê Google li dora 500,000 sêçikên wêneyan, di nav de 156,000 wêneyên rû hene. Hêjayî gotinê ye ku her sêyek di vê databasê de bi kêmî ve şeş nirxdêrên mirovan hatine şîrove kirin.

Ev danûstendina ji bo projeyên ku bi analîza derbirrîna rû re têkildar in, wekî vegerandina wêneyê-based îfadeyê, kategorîzekirina hestan, senteza derbirînê, û hwd. Ji bo gihîştina danehevê, divê formek kurt were tije kirin.

4. Visual Genome

Visual Question Bersiva daneyan di hawîrdorek pir-bijartî de di Visual Genome de heye. Ew ji 101,174 wêneyên MSCOCO bi 1.7 mîlyon cotên QA, bi navgîniya 17 pirsan ji her wêneyê re pêk tê.

Li gorî daneheva Bersiva Pirsa Visualê, daneya Genome ya Visual di nav şeş celeb pirsan de belavbûnek adiltir heye: Çi, Li ku, Kengî, Kî, Çima û Çawa.

Wekî din, databasa Visual Genome 108K wêneyên ku bi giranî bi tişt, taybetmendî û girêdanan ve hatine nîşankirin vedihewîne.

5. LibriSpeech

Korpusa LibriSpeech berhevokek ji dora 1,000 demjimêran pirtûkên dengî yên projeya LibriVox e. Piraniya pirtûkên dengî ji Projeya Gutenberg têne çêkirin.

Daneyên perwerdehiyê li sê beşên 100hr, 360hr, û 500hr têne dabeş kirin, dema ku daneyên dev û testê bi dirêjahiya dengî bi qasî 5 demjimêran in.

6. Cihên bajaran

Yek ji databasên mezin ên herî naskirî yên vîdyoyên stereo bi dîmenên bajarî re The Cityscapes tê gotin.

Bi şîroveyên pixel-rast ên ku cîhên GPS-ê, germahiya derve, daneyên ego-tevgerê, û perspektîfên stereo yên rast vedigirin, ew tomarên ji 50 bajarên cuda yên Alman vedihewîne.

7. Kinetic Dataset

Yek ji berhevokên vîdyoyê yên herî naskirî yên ji bo naskirina çalakiya mirovî li ser pîvanek mezin û bi qalîteya baş, databasa Kinetics e. Ji bo her 600 dersên çalakiya mirovî herî kêm 600 vîdyoklîp hene, ku bi tevahî zêdetirî 500,000 e.

Fîlmên ji YouTube hatin kişandin; her yek bi qasî 10 saniyeyan dirêj e û tenê yek pola çalakiyê tête navnîş kirin.

8. CelebAMask-HQ

CelebAMask-HQ berhevokek ji 30,000 wêneyên rûyê bi rezîliya bilind e ku bi maskeyên bi baldarî hatine şîrovekirin û 19 çînên ku pêkhateyên rû yên wekî çerm, poz, çav, birû, guh, dev, lêv, por, hat, çav, guh, gerdan, vedihewîne, stû, materyal.

Danûstendin dikare ji bo ceribandin û perwerdekirina naskirina rû, parskirina rû, û GAN-an ji bo algorîtmayên çêkirina rû û guherandinê were bikar anîn.

9. Penn treebank

Yek ji corporên herî berbiçav û pir caran tê bikar anîn ji bo nirxandina modelan ji bo nîşankirina rêzê, korpusa Penn Treebank (PTB) ya Englishngilîzî ye, nemaze beşa korpusê ku bi gotarên Wall Street Journal re têkildar e.

Pêdivî ye ku her peyv beşek wê ya axaftinê wekî pêkhateyek peywirê were nîşankirin. Asta tîpan û asta peyvan modelkirina ziman di heman demê de pir caran korpus bikar tîne.

10. VoxCeleb

VoxCeleb danehevek nasnameya axaftinê ya mezin e ku bixweber jê hatî çêkirin medyaya çavkaniya vekirî. VoxCeleb ji zêdetirî 6 hezar axaftvan zêdetirî mîlyonek gotinên xwe hene.

Ji ber ku daneheva deng-vîzûal dihewîne, ew dikare ji bo cûrbecûr sepanên zêde were bikar anîn, di nav de senteza axaftina dîtbar, veqetandina axaftinê, veguheztina xaç-modal ji rû bi deng an berevajî, û perwerdekirina naskirina rûyê ji vîdyoyê ji bo pêvekirina nasîna rûyê heyî. datasets.

11. SIXray

Danûstendina SIXray 1,059,231 wêneyên rontgenê yên ku ji stasyonên metroyê hatine berhev kirin û ji hêla mufetîşên ewlehiya mirovî ve hatine şîrove kirin vedihewîne da ku şeş cûreyên sereke yên tiştên qedexe tespît bike: pistole, kêr, kulm, pêl, maqûr, û çakûç. Wekî din, qutiyên sînorkirî yên ji bo her tiştê nedestûrkirî bi destan li komên ceribandinê hatine zêde kirin da ku performansa herêmîkirina tiştan binirxînin.

12. Qezayên Dewletên Yekbûyî

Madeya projeyê jixwe bi navê danûstendinê, Qezayên Dewletên Yekbûyî, diyar dibe. Ev daneheva li ser qezayên otomobîlan ên li seranserê welêt agahdariya ji Sibata 2016-an heya Kanûna 2021-an vedihewîne û 49 eyaletên Dewletên Yekbûyî vedihewîne.

Nêzîkî 1.5 mîlyon qeydên qezayê naha di vê berhevokê de hene. Ew bi karanîna gelek API-yên trafîkê di demek rast de hate berhev kirin.

Van API agahdariya seyrûseferê ku ji cûrbecûr çavkaniyan hatine berhev kirin, di nav de kamerayên trafîkê, rêxistinên dadrêsiyê, û dezgehên veguheztinê yên Dewletên Yekbûyî û eyaletan vediguhezînin.

13. Naskirina Nexweşiya Çavê

Databasa ophthalmîkî ya organîze Naskirina Aqilmend a Nexweşiya Çavê (ODIR) li ser 5,000 nexweşan agahdarî dihewîne, di nav de temenê wan, rengê binê çavên wan ên çep û rast, û peyvên sereke yên teşhîsê yên pisporên bijîşkî.

Ev danehev berhevokek rastîn a daneyên nexweşan e ji nexweşxane û saziyên bijîjkî yên cihêreng ên li Chinaînê ku Shanggong Medical Technology Co., Ltd. Bi rêveberiya kontrolkirina kalîteyê, şirove ji hêla xwendevanên mirovî yên jêhatî ve hatin tag kirin.

14. Nexweşiya dil

Ev databasa Nexweşiya Dil di naskirina hebûna nexweşiya dil di nexweşek de li ser bingeha 76 parametreyên wekî temen, zayend, celeb êşa sîngê, tansiyona xwînê ya bêhnvedanê, û hwd.

Digel 303 bûyeran, databas hewil dide ku hebûna nexweşiyekê (nirx 1,2,3,4) ji tunebûna wê (nirx 0) bi tenê cûda bike.

15. CLEVR

Danûstendina CLEVR (Zimanê Pêkhatî û Aqlê Dîtbarî ya Seretayî) Bersiva Pirsa Dîtbarî teqlîd dike. Ew ji wêneyên tiştên ku bi 3D hatine pêşkêş kirin pêk tê, digel her wêneyek rêzek pirsên pir pêkhatî li çend kategoriyan têne dabeş kirin.

Ji bo hemî wêne û pirsên trênê û pejirandinê, databas 70,000 wêne û 700,000 pirsan ji bo perwerdehiyê, 15,000 wêne û 150,000 pirs ji bo erêkirinê, û 15,000 wêne û 150,000 pirsan ji bo ceribandina nesne, bersiv, û bernameya fonksîyonê pêk tîne.

16. Girêdanên Gerdûnî

Projeya Universal Dependencies (UD) armanc dike ku ji bo gelek zimanan morfolojiya yekreng û hevoksaziya hevoksaziyê biafirîne. Guhertoya 2.7, ku di sala 2020-an de hate derxistin, bi 183 zimanan 104 darên daran hene.

Navnîşan ji tagên POW-ya gerdûnî, serikên girêdayîbûnê, û etîketên pêwendiya gerdûnî pêk tê.

17. Kitti - 360

Yek ji danûstendinên ku herî zêde têne bikar anîn ji bo robotên mobîl û ajotinê xweser KITTI (Enstîtuya Teknolojiyê ya Karlsruhe û Enstîtuya Teknolojiyê ya Toyota) ye.

Ew ji senaryoyên trafîkê yên bi saetan pêk tê ku bi karanîna cûrbecûr modalîteyên senzorê hatine girtin, wek mînak RGB-ya rezîliya bilind, stereo ya gewr, û kamerayên 3D-ya lazerê. Danûstendin bi demê re ji hêla gelek lêkolîneran ve hatî çêtir kirin ku bi destan beşên wê yên cihêreng li gorî hewcedariyên xwe şîrove kirin.

18. MOT (Şopandina Pir tiştan)

MOT (Multiple Object Tracking) danehevek e ji bo şopandina pir tiştan ku dîmenên hundur û derve yên cihên giştî yên ku peyayan wekî tiştên balkêş vedihewîne vedihewîne. Vîdyoya her dîmenê di du beşan de tê dabeş kirin, yek ji bo perwerdehiyê û ya din ji bo ceribandinê.

Danûstendinê dihewîne tespîtên objeyan di çarçoveyên vîdyoyê de sê dedektor bikar tînin: SDP, Faster-RCNN, û DPM.

19. Pascal 3D +

Danûstendina pir-dîtinan a Pascal3D+ ji wêneyên ku li çolê hatine berhev kirin, ango wêneyên kategoriyên tiştan ên bi guhêrbariya zêde, ku di şert û mercên nekontrolkirî de, li hawîrdorên qelebalix û di cîhên cihê de hatine girtin, pêk tê. Pascal3D+ 12 kategoriyên tiştên hişk ên ku ji daneyên PASCAL VOC 2012 hatine kişandin vedihewîne.

Van tiştan agahdariya pozîsyonê li ser wan nîşankirî ne (asîmut, bilindbûn, û dûrbûna ji kamerayê re). Pascal3D+ di van 12 kategoriyan de ji berhevoka ImageNet-ê wêneyên poz-naskirî jî vedihewîne.

20. Modelên Deformkirî yên Rûyê yên Heywanan

Armanca projeya Modelên Heywanên Deformkirî yên Rûyê (FDMA) ew e ku metodolojiyên heyî yên di nasandin û şopandina nîşana rûyê mirovan de bişopîne û algorîtmayên nû pêş bixe ku dikare bi guherbariya pir mezin a ku taybetmendiya taybetmendiyên rûyê heywanan e re mijûl bibe.

Algorîtmayên projeyê şiyana naskirin û şopandina nîşaneyên li ser rûyê mirovan destnîşan kirin dema ku mijûlbûna bi cûrbecûrên ku ji ber guheztinên di hestên rû an pozîsyonan de, girtina qismî, û ronahiyê ve têne çêkirin.

21. Daneyên Posta Mirovan a MPII

Daneyên Poza Mirovan a MPII dora 25K wêneyan vedihewîne, 15K ji wan nimûneyên perwerdehiyê ne, 3K ji wan nimûneyên pejirandinê ne, û 7K ji wan nimûneyên ceribandinê ne.

Cih bi destan bi 16 girêkên laş ve têne nîşankirin, û wêne ji fîlimên YouTube-ê hatine girtin ku 410 çalakiyên cûda yên mirovan vedihewîne.

22. UCF101

Danûstendina UCF101 13,320 klîbên vîdyoyê di nav 101 kategoriyan de têne saz kirin. Ev 101 kategorî li pênc kategoriyan têne dabeş kirin: tevgerên laş, danûstendinên mirov-mirov, danûstendinên mirov-obje, lêxistina amûrên muzîkê û werzîş.

Vîdyoyên ji YouTube-ê ne û 27 demjimêran dirêj dikin.

23. Audioset

Audioset danehevek bûyerek dengî ye ku ji zêdetirî 2 mîlyon beşên vîdyoyê yên 10-saniyeyî yên ku ji hêla mirovan ve hatine şîrovekirin pêk tê. Ji bo şîrovekirina vê daneyê, ontolojîyek hiyerarşîk ku ji 632 celeb bûyeran pêk tê tê bikar anîn, ku tê vê wateyê ku dibe ku heman deng bi rengek cûda were destnîşan kirin.

24. Encama Zimanê Xwezayî ya Stanford

Danûstendina SNLI (Encama Zimanê Xwezayî ya Stanford) 570 hezar hevokên hevokê vedihewîne ku bi destan wekî pêvek, nakokî, an bêalî hatine kategorî kirin.

Navnîşan ravekirinên wêneya Flickr30k ne, di heman demê de hîpotez ji hêla annotatorên elalet-çavkaniyê ve hatine pêşve xistin ku pêşnumayek hatine peyda kirin û hatine ferman kirin ku danûstendinên berbiçav, nakok û bêalî biafirînin.

25. Bersiva Pirsa Visual

Bersiva Pirsa Dîtbar (VQA) danehevek e ku pirsên vekirî yên di derbarê wêneyan de vedihewîne. Ji bo bersiva van pirsan, hûn hewce ne ku dîtin, ziman û hişmendiya hevpar bigirin.

Xelasî

Her ku fêrbûna makîneyê û îstîxbarata sûnî (AI) di pratîkê de her karsazî û di jiyana me ya rojane de berbelavtir dibe, bi vî rengî hejmara çavkanî û agahdariya li ser mijarê berdest dibe.

Daneyên giştî yên amade destpêkek girîng peyda dikin da ku modelên AI-ê pêş bixin û di heman demê de rê didin bernamenûsên ML yên demsalî ku dem teserûf bikin û balê bikişînin ser hêmanên din ên projeyên xwe.

Daneyên Perwerdehiya AI-ya Alternatîf a çêtirîn

25 Daneyên Perwerdehiya AI-ya Alternatîf a çêtirîn

1. CelebFaces Atributes Dataset

2. GIVEN

3. Daneya berhevdana Rûyê ya Google

4. Visual Genome

5. LibriSpeech

6. Cihên bajaran

7. Kinetic Dataset

8. CelebAMask-HQ

9. Penn treebank

10. VoxCeleb

11. SIXray

12. Qezayên Dewletên Yekbûyî

13. Naskirina Nexweşiya Çavê

14. Nexweşiya dil

15. CLEVR

16. Girêdanên Gerdûnî

17. Kitti - 360

18. MOT (Şopandina Pir tiştan)

19. Pascal 3D +

20. Modelên Deformkirî yên Rûyê yên Heywanan

21. Daneyên Posta Mirovan a MPII

22. UCF101

23. Audioset

24. Encama Zimanê Xwezayî ya Stanford

25. Bersiva Pirsa Visual

Xelasî

Ji dor Jay

Gotarên Zêdetir li ser HashDork:

Meriv çawa di AI-ya xwe de Halusînasyonan kêm dike

Colossyan vs Heygen

Ev Nûçenameya Teknolojiya Pêşerojê Sê Nake

25 Daneyên Perwerdehiya AI-ya Alternatîf a çêtirîn

1. CelebFaces Atributes Dataset

2. GIVEN

3. Daneya berhevdana Rûyê ya Google

4. Visual Genome

5. LibriSpeech

6. Cihên bajaran

7. Kinetic Dataset

8. CelebAMask-HQ

9. Penn treebank

10. VoxCeleb

11. SIXray

12. Qezayên Dewletên Yekbûyî

13. Naskirina Nexweşiya Çavê

14. Nexweşiya dil

15. CLEVR

16. Girêdanên Gerdûnî

17. Kitti - 360

18. MOT (Şopandina Pir tiştan)

19. Pascal 3D +

20. Modelên Deformkirî yên Rûyê yên Heywanan

21. Daneyên Posta Mirovan a MPII

22. UCF101

23. Audioset

24. Encama Zimanê Xwezayî ya Stanford

25. Bersiva Pirsa Visual

Xelasî

Ji dor Jay

Gotarên Zêdetir li ser HashDork:

Meriv çawa di AI-ya xwe de Halusînasyonan kêm dike

10 Amûrên AI-ê yên çêtirîn ji bo Medya Civakî

Colossyan vs Heygen

10 Baştirîn Amûrên Çêkera Vîdyoyê Anîmated AI

Interaction Reader

Leave a Reply Cancel reply

Ev Nûçenameya Teknolojiya Pêşerojê Sê Nake