Table of Contents[Kache][Montre]
- 1. CelebFaces Atribi Dataset
- 2. DOTA
- 3. Google Facial Expression konparezon done
- 4. Vizyèl Genomic
- 5. LibriSpeech
- 6. Espas vil yo
- 7. Kinetics Dataset
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. Aksidan Etazini
- 13. Rekonesans maladi okilè
- 14. Maladi Kè
- 15. CLEVR
- 16. Depandans Inivèsèl
- 17. KITTI – 360
- 18. MOT (Swiv plizyè objè)
- 19. PASCAL 3D+
- 20. Facial Deformable Modèl bèt yo
- 21. MPII Moun Post Dataset
- 22. UCF101
- 23. Audioset
- 24. Stanford Lang natirèl Enferans
- 25. Vizyèl Kesyon Reponn
- konklizyon
Sèjousi, pifò nan nou konsantre sou devlope aprantisaj machin ak modèl AI epi adrese pwoblèm lè l sèvi avèk done aktyèl yo. Men, anvan, nou dwe defini yon seri done, siyifikasyon li, ak wòl li nan devlope solisyon AI ak ML solid.
Jodi a, nou gen yon pakèt seri done sous louvri pou fè rechèch oswa devlope aplikasyon pou atake pwoblèm reyèl nan yon varyete sektè.
Sepandan, mank de bon jan kalite seri done quantitative se yon sous enkyetid. Done yo te ogmante anpil epi yo pral kontinye elaji nan yon vitès pi vit nan tan kap vini an.
Nan pòs sa a, nou pral kouvri seri done ki disponib gratis ke ou ka itilize pou devlope pwochen pwojè AI ou a.
1. CelebFaces Atribi Dataset
CelebFaces Atribi Dataset (CelebA) gen plis pase 200K foto selebrite ak 40 anotasyon atribi pou chak imaj, sa ki fè li yon ekselan pwen depa pou pwojè tankou rekonesans figi, deteksyon figi, lokalizasyon bòn tè (oswa eleman feminen), ak koreksyon figi ak sentèz. Anplis de sa, foto yo nan koleksyon sa a gen yon pakèt varyant pozisyon ak dezord seri.
2. DOTA
DOTA (Dataset of Deteksyon objè nan Foto Ayeryen) se yon seri done gwo echèl pou deteksyon objè ki gen ladan 15 kategori komen (pa egzanp, bato, avyon, machin, elatriye), 1411 imaj pou fòmasyon, ak 458 imaj pou validation.
3. Google Facial Expression konparezon done
Dataset konparezon ekspresyon vizaj Google la gen anviwon 500,000 foto triple, ki gen ladan 156,000 foto figi. Li se vo anyen ke chak triplet nan dataset sa a te anote pa omwen sis moun ki evalye.
Ansanm done sa a itil pou pwojè ki enplike analiz ekspresyon figi, tankou rekipere foto ki baze sou ekspresyon, kategorize emosyon, sentèz ekspresyon, ak sou sa. Pou jwenn aksè nan seri done a, yo dwe ranpli yon fòm kout.
4. Genomic vizyèl
Done Vizyèl Kesyon Reponn nan yon anviwònman ki gen plizyè chwa disponib nan Genome Vizyèl. Li konpoze de 101,174 foto MSCOCO ak 1.7 milyon pè QA, ak yon mwayèn de 17 kesyon pou chak imaj.
An konparezon ak done repons Vizyèl Kesyon an, seri done Vizyèl Genome a gen yon distribisyon ki pi jis nan sis kalite kesyon: Ki sa, Ki kote, Ki lè, Ki moun, Poukisa, ak Ki jan.
Anplis de sa, seri done Vizyèl Genome a gen ladan foto 108K ki te lou ak objè, pwopriyete, ak koneksyon.
5. LibriSpeech
Corpus LibriSpeech a se yon koleksyon anviwon 1,000 èdtan liv odyo ki soti nan pwojè LibriVox la. Majorite liv odyo yo soti nan Pwojè Gutenberg.
Done fòmasyon yo divize an twa patisyon 100hr, 360hr, ak 500hr ansanm, pandan y ap dev ak done tès yo apeprè 5hr nan longè odyo.
6. Espas vil yo
Youn nan baz done ki pi koni nan gwo echèl videyo stereo ak opinyon iben yo rele Cityscapes yo.
Avèk annotasyon pixel ki egzak ki gen ladan pozisyon GPS, tanperati deyò, done mouvman ego, ak pèspektiv stereo dwat, li gen ladan anrejistreman ki soti nan 50 vil Alman diferan.
7. Kinetics Dataset
Youn nan seri done videyo ki pi koni pou rekonèt aktivite imen sou yon gwo echèl ak bon jan kalite se done Kinetics la. Gen omwen 600 clip videyo pou chak nan 600 klas aktivite imen yo, totalize plis pase 500,000 an total.
Fim yo te rale soti nan YouTube; yo chak se anviwon 10 segonn longè epi yo gen sèlman yon klas aktivite ki nan lis.
8. CelebAMask-HQ
CelebAMask-HQ se yon koleksyon 30,000 foto figi wo rezolisyon ak mask ak anpil atansyon anote ak 19 klas ki gen ladan eleman feminen tankou po, nen, je, sousi, zòrèy, bouch, lèv, cheve, chapo, linèt, zanno, kolye, kou, materyèl.
Yo ka itilize seri done a pou teste ak antrene rekonesans figi, analiz figi, ak GAN pou jenerasyon figi ak koreksyon algoritm.
9. Penn Treebank
Youn nan corpus ki pi remakab e ki pi souvan itilize pou evalyasyon modèl pou balisaj sekans se corpus angle Penn Treebank (PTB), an patikilye pòsyon corpus ki koresponn ak atik Wall Street Journal.
Chak mo dwe genyen pati li nan lapawòl make kòm yon eleman nan travay la. Nivo karaktè ak nivo mo modèl langaj tou souvan itilize corpus la.
10. VoxCeleb
VoxCeleb se yon seri done idantifikasyon lapawòl a gwo echèl ki pwodui otomatikman medya sous louvri. VoxCeleb gen plis pase yon milyon pawòl ki soti nan plis pase 6k moun ki pale.
Kòm done a gen ladan odyo-vizyèl, li ka itilize pou yon varyete aplikasyon adisyonèl, ki gen ladan sentèz lapawòl vizyèl, separasyon lapawòl, transfè kwa-modal soti nan figi a vwa oswa vis vèrsa, ak fòmasyon rekonesans figi soti nan videyo pou konplete rekonesans figi aktyèl la. datasets.
11. SIXray
Ansanm done SIXray la gen ladan 1,059,231 foto radyografi ki rasanble nan estasyon tren yo epi enspektè sekirite imen yo te fè anote pou detekte sis kalite prensipal atik entèdi: pistolè, kouto, kle, pens, sizo, ak mato. Anplis de sa, bwat limit pou chak atik ki pa pèmèt yo te ajoute manyèlman nan seri tès yo nan lòd yo evalye pèfòmans nan lokalizasyon objè.
12. Aksidan Etazini
Sibstans pwojè a deja revele pa non an nan dataset la, US Accidents. Ansanm done sa a sou aksidan otomobil nan tout peyi a gen ladan enfòmasyon ki soti nan mwa fevriye 2016 rive desanm 2021 epi li kouvri 49 eta nan peyi Etazini.
Apeprè 1.5 milyon dosye aksidan kounye a prezan nan koleksyon sa a. Li te rasanble an tan reyèl lè yo itilize plizyè API trafik.
API sa yo transmèt enfòmasyon trafik yo rasanble nan yon varyete sous, tankou kamera trafik, òganizasyon ki fè respekte lalwa, ak depatman transpò Etazini ak eta a.
13. Rekonesans maladi okilè
Baz done oftalmik òganize Ocular Disease Intelligent Recognition (ODIR) gen enfòmasyon sou 5,000 pasyan, ki gen ladan laj yo, koulè fon an nan je gòch ak dwa yo, ak mo kle dyagnostik pwofesyonèl medikal yo.
Dataset sa a se yon koleksyon aktyèl done pasyan ki soti nan divès lopital ak enstalasyon medikal nan Lachin ke Shanggong Medical Technology Co., Ltd te akeri. Ak jesyon kontwòl kalite, lektè imen kalifye te make nòt yo.
14. Maladi kè
Ansanm done maladi kè sa a ede idantifye egzistans maladi kè nan yon pasyan ki baze sou 76 paramèt tankou laj, sèks, kalite doulè nan pwatrin, tansyon repoze, ak sou sa.
Avèk 303 ka, baz done a ap chèche tou senpleman diferansye egzistans yon maladi (valè 1,2,3,4) ak absans li (valè 0).
15. CLEVR
Ansanm done CLEVR (Lang Konpozisyon ak Rezonman Vizyèl Elemantè) imite repons Vizyèl Kesyon an. Li konsiste de foto objè ki rann 3D, ak chak foto akonpaye pa yon seri kesyon trè konpozisyon divize an plizyè kategori.
Pou tout foto ak kesyon tren ak validation, dataset la gen ladan 70,000 foto ak 700,000 kesyon pou fòmasyon, 15,000 imaj ak 150,000 kesyon pou validation, ak 15,000 imaj ak 150,000 kesyon pou tès ki enplike objè, repons, graf fonksyonèl, ak graf fonksyonèl.
16. Depandans Inivèsèl
Pwojè Depandans Inivèsèl (UD) la gen pou objaktif pou kreye mòfoloji inifòm ak sentaks pou plizyè lang. Vèsyon 2.7, ki te pibliye an 2020, gen 183 treebank nan 104 lang.
Anotasyon an fèt ak tags inivèsèl POW, tèt depandans, ak etikèt depandans inivèsèl.
17. KITTI – 360
Youn nan seri done ki pi souvan itilize pou robo mobil ak kondwi otonòm se KITTI (Karlsruhe Enstiti Teknoloji ak Toyota Technological Institute).
Li fèt ak senaryo trafik ki gen valè èdtan ke yo te kaptire lè l sèvi avèk yon seri modalités detèktè, tankou RGB rezolisyon wo, stereo echèl gri, ak kamera eskanè lazè 3D. Ansanm done a te amelyore sou tan pa plizyè chèchè ki manyèlman anote divès pòsyon nan li nan adapte bezwen yo.
18. MOT (Swiv plizyè objè)
MOT (Multiple Object Tracking) se yon seri done pou swiv objè miltip ki gen ladann peyizaj andedan ak deyò nan lokal piblik ki gen ladann pyeton kòm objè ki enterese yo. Se videyo chak sèn kase an de moso, youn pou fòmasyon ak lòt la pou tès.
Dataset la gen ladann deteksyon objè nan ankadreman videyo lè l sèvi avèk twa detektè: SDP, Faster-RCNN, ak DPM.
19. PASCAL 3D+
Ansanm done Pascal3D+ milti-view yo fòme ak foto yo kolekte nan bwa a, sa vle di imaj kategori atik ki gen gwo varyab, yo te kaptire nan sikonstans san kontwòl, nan anviwònman ki gen anpil moun, ak nan yon varyete pozisyon. Pascal3D+ gen ladan 12 kategori objè rijid ki soti nan seri done PASCAL VOC 2012 la.
Atik sa yo gen enfòmasyon sou pozisyon ki make sou yo (azimit, elevasyon, ak distans ak kamera a). Anplis de sa, Pascal3D+ gen ladan foto po-anote nan koleksyon ImageNet nan 12 kategori sa yo.
20. Facial deformable Modèl bèt yo
Objektif pwojè Facial Deformable Models of Animals (FDMA) se defye metodoloji aktyèl yo nan idantifikasyon ak swivi fasyal moun epi devlope nouvo algoritm ki ka fè fas ak varyasyon konsiderableman pi gwo ki karakteristik karakteristik bèt vizaj yo.
Algoritm pwojè a te demontre kapasite pou rekonèt ak swiv repère sou figi moun pandan y ap fè fas ak divèjans pwovoke pa chanjman nan emosyon oswa pozisyon vizaj, okluzyon pasyèl, ak ekleraj.
21. MPII Moun Post Dataset
MPII Moun Pose Dataset gen anviwon 25K foto, 15K nan yo se echantiyon fòmasyon, 3K nan yo se echantiyon validasyon, ak 7K nan yo se echantiyon tès yo.
Pozisyon yo manyèlman make ak jiska 16 jwenti kòporèl, epi yo pran foto yo nan fim YouTube ki kouvri 410 divès aktivite imen.
22. UCF101
Dataset UCF101 la gen 13,320 klip videyo ki òganize nan 101 kategori. 101 kategori sa yo divize an senk kategori: mouvman kòporèl, entèraksyon moun-moun, entèraksyon moun-objè, jwe enstriman mizik, ak espò.
Videyo yo soti nan YouTube epi yo gen 27 èdtan nan dire.
23. Audioset
Audioset se yon seri done evènman odyo ki fòme ak plis pase 2 milyon segman videyo 10-segonn ki bay yon nòt imen. Pou anote done sa yo, yo itilize yon ontoloji yerarchize ki gen 632 kalite evènman, ki vle di ke menm son an ta ka make yon fason diferan.
24. Stanford Lang natirèl Enferans
Ansanm done SNLI (Stanford Natural Language Inference) gen 570 XNUMX kouple fraz ke yo te kategorize manyèlman kòm patisipasyon, kontradiksyon oswa net.
Lokal yo se deskripsyon foto Flickr30k, pandan y ap ipotèz yo te devlope pa annotatè foul moun yo ki te bay yon site epi yo te bay enstriksyon yo jenere deklarasyon ki enplike, kontredi, ak net.
25. Vizyèl Kesyon Reponn
Vizyèl Question Answering (VQA) se yon seri done ki gen kesyon ouvè konsènan foto yo. Pou reponn kesyon sa yo, ou bezwen konprann vizyon, langaj, ak bon sans.
konklizyon
Kòm aprantisaj machin ak entèlijans atifisyèl (AI) vin pi répandus nan prèske chak biznis ak nan lavi chak jou nou an, se konsa kantite resous ak enfòmasyon ki disponib sou sijè a.
Ansanm done piblik ki pare yo bay yon bon pwen depa pou devlope modèl AI pandan y ap pèmèt pwogramè ML ki gen eksperyans yo ekonomize tan epi konsantre sou lòt eleman nan pwojè yo.
Kite yon Reply