Table of Contents[Qari][muuji]
- 1. CelebFaces Sifooyinka Xogta
- 2. DOTA
- 3. Xogta isbarbardhigga Wejiga Google
- 4. Visual Genome
- 5. Hadal-qoraal
- 6. Goobaha Magaalada
- 7. Xogta Kinetics
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. Shilalka Maraykanka
- 13. Aqoonsiga Cudurka Indhaha
- 14. Wadna xanuunka
- 15. CLEVR
- 16. Ku-tiirsanaanta Caalamiga ah
- 17. KITTI – 360
- 18. MOT (Raadinta Walxaha Badan)
- 19. PASCAL 3D+
- 20. Qaababka Xayawaanka ee Wajigu Deformable
- 21. MPII Human Post Dataset
- 22. UCF101
- 23. Maqal maqal
- 24. Tilmaamaha Luqadda Dabiiciga ah ee Stanford
- 25. Jawaabta Su'aasha Muuqaal
- Ugu Dambeyn
Maalmahan, inteena badan waxaan diirada saareynaa horumarinta mashiinka barashada iyo moodooyinka AI iyo wax ka qabashada arrimaha isticmaalka xogta hadda jirta. Laakiin marka hore, waa in aan qeexno xogta xogta, muhiimaddeeda, iyo doorkeeda horumarinta xalalka AI iyo ML xooggan.
Maanta, waxaan haynaa xog uruurin badan oo il furan oo lagu sameeyo cilmi baaris ama lagu horumariyo codsiyada si wax looga qabto arrimaha dhabta ah ee aduunka ee qaybaha kala duwan.
Si kastaba ha ahaatee, yaraanta xog-ururinta tayada sare leh ayaa ah isha welwelka. Xogtu si aad ah ayay kor ugu kacday waxayna sii wadi doontaa inay ku fido si xawli ah mustaqbalka.
Maqaalkan, waxaanu ku dabooli doonaa xog-ururin si xor ah loo heli karo oo aad ka faa'iidaysan karto si aad u horumariso mashruucaaga AI ee soo socda.
1. CelebFaces Sifooyinka Xogta
CelebFaces Attributes Dataset (CelebA) waxa uu ka kooban yahay in ka badan 200k sawiro caan ah iyo 40 tilmaamo sifada sawir kasta, taas oo ka dhigaysa meel aad u fiican mashaariicda sida waji aqoonsi, ogaanshaha wejiga, calaamadaynta (ama qaybta wejiga) meelaynta, iyo tafatirka wejiga & isku dhafka. Intaa waxaa dheer, sawirada ku jira ururintan waxay ka kooban yihiin noocyo badan oo kala duwanaansho ah iyo jahawareer xagga dambe ah.
2. DOTA
DOTA (Xogta Xaqiiji Qalab Sawirrada hawada) waa xog-ururin baaxad leh oo loogu talagalay ogaanshaha shay ay ku jiraan 15 qaybood oo caadi ah (tusaale, markabka, diyaaradda, baabuur, iwm.), 1411 sawir oo tababar ah, iyo 458 sawir oo la ansaxiyay.
3. Xogta isbarbardhigga Wejiga Google
Xogta isbarbardhigga wajiga Google ayaa ka kooban ilaa 500,000 oo sawir saddex-geesood ah, oo ay ku jiraan 156,000 oo sawiro waji ah. Waxaa xusid mudan in saddex-geesood kasta oo xogtan ku jira ay qeexeen ugu yaraan lix qiimeeyaal bini'aadam ah.
Xog-ururintani waxa ay faa'iido u leedahay mashaariicda ku lug leh falanqaynta muujinta wejiga, sida soo celinta sawir ku salaysan muujinta, kala soocidda shucuurta, soo saarista muujinta, iyo wixii la mid ah. Si aad u gasho xog-ururinta, foom kooban waa in la buuxiyaa.
4. Visual Genome
Su'aasha Muuqaalka Kajawaabista xogta ee jawi doorasho badan ayaa laga heli karaa Visual Genome. Waxay ka kooban tahay 101,174 sawir MSCOCO oo leh 1.7 milyan oo lammaane QA ah, celcelis ahaan 17 su'aalood sawirkiiba.
Marka la barbar dhigo xog-ururinta Su'aasha Muuqaalka ah, Xogta Visual Genome waxay leedahay qaybin cadaalad ah oo ka badan lix nooc oo su'aal ah: Waa maxay, Halkee, Goorma, Yaa, Sabab, iyo Sidee.
Intaa waxaa dheer, xog-ururinta Visual Genome waxaa ku jira 108K sawiro kuwaas oo si weyn loogu calaamadeeyay walxo, hanti, iyo isku xidhid.
5. Hadal-qoraal
LibriSpeech corpus waa ururinta ku dhawaad 1,000 saacadood oo buugaag maqal ah oo laga helay mashruuca LibriVox. Inta badan buugaagta maqalku waxay ka yimaadeen Project Gutenberg.
Xogta tababarku waxa loo qaybiyaa saddex qaybood oo kala ah 100hr, 360hr, iyo 500hrs,halka xogta dev iyo imtixaanku ay ku dhawaad 5hr yihiin dhererka maqalka.
6. Meelaha Magaalada
Mid ka mid ah xogta ugu caansan ee baaxadda weyn ee fiidiyowyada stereo ee leh aragtida magaalada waxaa lagu magacaabaa Cityscapes.
Iyada oo la adeegsanayo sharraxaad sax ah oo pixel ah oo ay ku jiraan meelaha GPS-ka, heerkulka dibadda, xogta dhaqdhaqaaqa- ego, iyo aragtiyaha stereo saxda ah, waxa ku jira duubista 50 magaalo oo Jarmal ah oo kala duwan.
7. Xogta Kinetics
Mid ka mid ah xogta ugu caansan ee xogta fiidiyooga ah ee lagu aqoonsanayo dhaqdhaqaaqa aadanaha si weyn oo tayo leh waa xogta Kinetics. Waxa jira ugu yaraan 600 oo fiidiyoow ah mid kasta oo ka mid ah 600 oo fasal hawleedka aadanaha, oo wadartoodu ka badan tahay 500,000.
Filimada waxaa laga soo saaray YouTube; Mid kastaa wuxuu ku dhow yahay 10 ilbiriqsi wuxuuna leeyahay hal fasal oo waxqabad oo taxan.
8. CelebAMAsk-HQ
CelebAMask-HQ waa ururinta 30,000 sawiro weji oo heersare ah oo si taxadar leh loo sharraxay iyo 19 fasal oo ay ku jiraan qaybaha wejiga sida maqaarka, sanka, indhaha, bustaha, dhegaha, afka, faruuryaha, timaha, koofiyada, muraayadaha indhaha, hilqado, silsilad, qoorta, maaddada.
Xogta waxa loo isticmaali karaa in lagu tijaabiyo oo lagu tababaro aqoonsiga wejiga, falanqaynta wejiga, iyo GAN-yada samaynta wejiga iyo tafatirka algorithmsyada.
9. Penn Treebank
Mid ka mid ah kuwa ugu caansan oo inta badan loo isticmaalo corpora ee qiimeynta moodooyinka loogu talagalay calaamadaynta taxanaha waa Ingiriis Penn Treebank (PTB) corpus, gaar ahaan qaybta corpus ee u dhiganta maqaallada Wall Street Journal.
Eray kastaa waa in qaybtiisa hadalka lagu calaamadeeyaa qayb hawsha ka mid ah. Heerka dabeecadda iyo heerka ereyga qaabaynta luqadda sidoo kale inta badan waxay isticmaashaa corpus.
10. VoxCeleb
VoxCeleb waa xog-aqoonsi hadal baaxad weyn oo si toos ah looga soo saaray warbaahinta il furan. VoxCeleb waxa ay leedahay in ka badan hal milyan oo odhaah oo ka yimi in ka badan 6k ku hadla.
Sida xogta ay ku jirto maqal-muuqaal, waxaa loo isticmaali karaa noocyo kala duwan oo codsiyo dheeraad ah, oo ay ku jiraan ereyada hadalka muuqaalka, kala-soocidda hadalka, qaab beddelka weji ilaa cod ama lid ku ah, iyo aqoonsiga wejiga ee tababarka si loo kabo aqoonsiga wajiga hadda jira. xog-ururinta.
11. SIXray
Xogta SIXray waxa ka mid ah 1,059,231 sawiro raajada ah oo laga soo ururiyay saldhigyada tareenada dhulka hoostiisa mara oo ay qeexeen kormeerayaasha amniga bini'aadmigu si ay u ogaadaan lix nooc oo ah walxaha mamnuuca ah: bastoolado, mindiyo, koofiyadaha, koofiyadaha, maqas, iyo dubbaha. Intaa waxaa dheer, sanduuqyada ku-xiran ee shay kasta oo la diido ayaa si gacanta loogu daray qaybaha tijaabada si loo qiimeeyo waxqabadka meelaynta shayga.
12. Shilalka Mareykanka
Walaxda mashruuca waxa mar hore lagu muujiyay magaca xogta, Shilalka Maraykanka. Xogtan ku saabsan shilalka baabuurta ee dalka oo dhan waxaa ku jira macluumaadka laga bilaabo Febraayo 2016 ilaa Disembar 2021 waxayna daboolaysaa 49 gobol oo Mareykanka ah.
Ku dhawaad 1.5 milyan diiwaanka shilalka ayaa hadda ku jira ururintan. Waxaa lagu soo ururiyay wakhtiga dhabta ah iyadoo la adeegsanayo API-yada taraafig badan.
API-yadaan waxay gudbiyaan macluumaadka taraafikada laga soo ururiyay ilo kala duwan, oo ay ku jiraan kamaradaha taraafikada, ururada fulinta sharciga, iyo waaxaha gaadiidka ee Mareykanka iyo gobolka.
13. Aqoonsiga Cudurka Indhaha
Xog-ururinta indhaha ee habaysan ee Aqoonsiga Indheer-garadka Cudurrada Indhaha (ODIR) ayaa ka kooban macluumaad ku saabsan 5,000 bukaan, oo ay ku jiraan da'dooda, midabka fundus ee indhahooda bidix iyo midig, iyo ereyada furaha ogaanshaha xirfadlayaasha caafimaadka.
Xog-ururintan waa xog ururin dhab ah oo bukaan-socod ah oo laga helay cusbitaallo iyo xarumo caafimaad oo kala duwan oo Shiinaha ku yaalla oo ay Shanggong Medical Technology Co., Ltd. heshay. leh maaraynta tayada tayada, tafaasiisha waxa calaamadeeyay akhristayaasha xirfada leh
14. Cudurka wadnaha
Xogtan ku saabsan cudurrada Wadnaha waxay gacan ka geysataa aqoonsiga jiritaanka cudurrada wadnaha ee bukaanka iyadoo lagu saleynayo 76 cabbir sida da'da, jinsiga, nooca xanuunka laabta, cadaadiska dhiigga ee nasashada, iyo wixii la mid ah.
Iyadoo 303 xaaladood, xog ururintu waxay raadinaysaa inay si fudud u kala saarto jiritaanka jirrada (qiimaha 1,2,3,4) maqnaanshihiisa (qiimaha 0).
15. CLEVR
Xogta CLEVR (Luqadda Isku-dhafka ah iyo Sababta Muuqaalka Dugsiga Hoose) waxay u ekaysiisay Jawaabta Su'aasha Muuqaalka. Waxay ka kooban tahay sawiro walxaha 3D-ga la sameeyay, iyadoo sawir walba ay la socdaan su'aalo taxane ah oo si heersare ah u curiyay oo loo qaybiyay dhawr qaybood.
Dhammaan sawirada iyo su'aalaha tareenka iyo ansaxinta, xogtu waxay ka kooban tahay 70,000 sawiro iyo 700,000 su'aalood oo tababar ah, 15,000 sawir iyo 150,000 su'aalood si loo ansixiyo, iyo 15,000 sawir iyo 150,000 su'aalood oo tijaabo ah oo ku lug leh walxaha, jawaabaha, barnaamijyada garaafyada, iyo sawirada goobta.
16. Ku-tiirsanaanta Caalamiga ah
Mashruuca Ku-tiirsanaanta Caalamiga ah (UD) wuxuu higsanayaa inuu abuuro qaab-dhismeed luqadeed oo isku-dhafan iyo sharraxa bangiga geedka ee luqado badan. Nooca 2.7, oo la sii daayay 2020, wuxuu leeyahay 183 bangi geed oo ku yaal 104 luqadood.
Qoraalku waxa uu ka kooban yahay summada POW ee caalamiga ah, madaxda ku-tiirsanaanta, iyo sumadaha ku-tiirsanaanta caalamiga ah.
17. KITTI - 360
Mid ka mid ah xogta inta badan loo isticmaalo aaladaha moobiilka iyo Wadista baabuurta waa KITTI (Machadka Farsamada ee Karlsruhe iyo Machadka Tignoolajiyada Toyota).
Waxay ka kooban tahay saacado qiimo leh oo xaalado taraafik ah oo la qabtay iyadoo la adeegsanayo habab dareemeyaal kala duwan, sida RGB-ga sare, stereo-cawlan, iyo kamaradaha 3D laser scanner. Xog-ururinta waxa horumariyay muddo ka dib dhawr cilmi-baarayaal kuwaas oo gacanta ku qeexay qaybo kala duwan si ay ugu habboonaato baahidooda.
18. MOT (Raadinta Walxaha Badan)
MOT (Raadinta Walxaha Badan) waa xog kaydinta shay badan oo ay ku jiraan muuqaalada gudaha iyo dibadda ee goobaha caamka ah oo ay ku jiraan dadka lugaynaya sida shayga xiisaha leh. Muuqaal kasta oo muuqaal ah ayaa loo qaybiyaa laba qaybood, mid tababar iyo mid tijaabo ah.
Xogta waxa ka mid ah ogaanshaha walxaha Fiidiyowyada qaab-dhismeedkooda iyadoo la adeegsanayo saddex qalab oo kala ah: SDP, Faster-RCNN, iyo DPM.
19. PASCAL 3D+
Xogta daawashada badan ee Pascal3D+ waxa ay ka kooban tahay sawiro laga soo ururiyay duurjoogta, tusaale ahaan, sawirada qaybaha shay ee kala duwanaanshiyaha sare leh, oo lagu qabtay duruufo aan la xakamayn, goobo camiran, iyo meelo kala duwan. Pascal3D+ waxa ku jira 12 qaybood oo walax adag ah oo laga soo min guuriyay xogta PASCAL VOC 2012.
Shayadani waxa ay wataan xogta habsan ee lagu calaamadeeyay (azimuth, sara u qaadis, iyo masaafada u jirta kamarada). Pascal3D+ waxa kale oo ku jira sawiro la sharraxay oo laga helay ururinta ImageNet ee 12kan qaybood.
20. Qaababka Xayawaanka ee Wajigu Deformable
Hadafka mashruuca Models Deformable Models of Animals (FDMA) waa in laga hortago hababka hadda jira ee aqoonsiga iyo raadraaca wejiga wajiga iyo in la horumariyo algorithmsyo cusub kuwaas oo wax ka qaban kara kala duwanaanshiyaha aadka u weyn ee sifada sifooyinka wejiga xayawaanka.
Algorithms-yada mashruuca ayaa muujiyay awoodda lagu aqoonsan karo oo lagu ogaan karo astaamaha wejiyada bini'aadamka iyadoo lala tacaalayo kala duwanaanshiyaha ay keeneen isbeddellada dareenka wejiga ama boosaska, xannibaadyada qayb ahaan, iyo iftiinka.
21. MPII Human Post Dataset
MPII Human Pose Dataset waxa ay ka kooban tahay ilaa 25K sawiro, 15k ka mid ah waa muunado tababar, 3K oo ka mid ah waa muunado ansax ah, iyo 7K oo ka mid ah waa muunado tijaabo ah.
Boosaska waxaa gacanta lagu calaamadiyay ilaa 16 kalagoysyo jirka ah, sawiradana waxaa laga soo qaaday filimaanta YouTube oo daboolaya 410 waxqabadyo kala duwan oo aadanaha ah.
22. UCF101
Xogta UCF101 waxa ay ka kooban tahay 13,320 muuqaal muuqaal ah oo loo habeeyey 101 qaybood. 101-kan qaybood ayaa loo qaybiyay shan qaybood: dhaqdhaqaaqa jidhka, isdhexgalka bini'aadamka iyo bini'aadamka, isdhexgalka dadka, qalabka muusikada, iyo ciyaaraha.
Fiidyowyadu waxay ka yimaadeen YouTube waxayna ka kooban yihiin 27 saacadood.
23. Qalabka maqalka
Audioset waa xog-ururin maqal ah oo ka kooban in ka badan 2 milyan oo qaybood oo muuqaal ah oo 10-ilbiriqsi ah oo bini'aadmigu sharraxay. Si loo qeexo xogtan, cilmi-nafsiyeedka ontology ee ka kooban 632 nooc oo dhacdo ayaa la isticmaalaa, taas oo tusinaysa in isla codka si ka duwan loo calaamadin karo.
24. Tilmaamaha Luqadda Dabiiciga ah ee Stanford
Xogta SNLI (Inference Luqadda Dabiiciga ah ee Stanford) waxa ay ka kooban tahay 570k jumladood oo lammaane ah kuwaas oo gacanta lagu sifeeyay inay yihiin kuwo ku lug leh, iska hor imanaya, ama dhexdhexaad ah.
Dhismuhu waa sharraxaadaha sawirka Flickr30k, halka mala-awaalka ay sameeyeen falanqeeye dad badani ka soo jeedaan kuwaas oo la siiyay dhismo lana faray inay dhaliyaan hadallo soo jiidasho leh, iska hor imanaya, iyo dhexdhexaad ah.
25. Jawaabta Su'aasha Muuqaal
Kajawaabista Su'aalaha Visual (VQA) waa xog-ururin ka kooban su'aalo-dhammaad furan oo ku saabsan sawirrada. Si aad uga jawaabto su'aalahan, waxaad u baahan tahay inaad fahanto aragti, luqad, iyo caqli-galnimo.
Ugu Dambeyn
Sida barashada mashiinka iyo sirdoonka macmalka ah (AI) ay u noqdaan kuwo aad ugu faafo ganacsi kasta iyo nolol maalmeedkeena, sidaas oo kale tirada agabka iyo macluumaadka laga heli karo mawduuca.
Xogta dadweynaha ee diyaarsan ayaa bixisa bilow fiican si loo horumariyo moodooyinka AI iyadoo sidoo kale u oggolaanaysa barnaamijyada ML ee xilliyeedka ah inay badbaadiyaan waqtiga oo ay diiradda saaraan qaybaha kale ee mashruucyadooda.
Leave a Reply