Tebulu ọdịnaya[Zoo][Gosi]
- 1. CelebFaces Njirimara Dataset
- 2. DOTA
- 3. Ntụle dataset ihu ihu Google
- 4. Visual Genome
- 5. Okwu Libri
- 6. Oghere obodo
- 7. Kinetics Dataset
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. Ihe mberede US
- 13. Achọpụta ọrịa anya
- 14. Ọrịa Obi
- 15. CLEVR
- 16. Ndabere ụwa niile
- 17. KITTI - 360
- 18. MOT(Ọtụtụ ihe nleba anya)
- 19. PASCAL 3D+
- 20. Ụdị nrụrụ ihu nke anụmanụ
- 21. MPII Human Post Dataset
- 22. UCF101
- 23. Anụ ụda
- 24. Nkọwa Asụsụ Eke Stanford
- 25. Azịza ajụjụ anya
- mmechi
N'oge a, ọtụtụ n'ime anyị na-elekwasị anya n'ịzụlite mmụta igwe na ụdị AI na iji dozie nsogbu site na iji datasets ugbu a. Mana nke mbụ, anyị ga-akọwarịrị ihe ndekọ data, mkpa ọ pụtara, yana ọrụ ọ na-eme n'ịmepụta ngwọta AI na ML siri ike.
Taa, anyị nwere plethora nke datasets mepere emepe nke anyị ga-eme nyocha ma ọ bụ mepụta ngwa iji gboo nsogbu ụwa n'ezie na ngalaba dị iche iche.
Agbanyeghị, ụkọ dataset ọnụọgụ dị elu bụ isi iyi nke nchegbu. Data ebiliwo nke ukwuu ma ga-aga n'ihu na-agbasa ngwa ngwa n'ọdịnihu.
Na post a, anyị ga-ekpuchi datasets dị n'efu nke ị nwere ike iji mepụta ọrụ AI na-esote gị.
1. Nchịkọta njirimara CelebFaces
CelebFaces Attributes Dataset (CelebA) nwere ihe karịrị foto ndị ama ama 200K na nkọwa njirimara 40 maka onyonyo ọ bụla, na-eme ka ọ bụrụ mmalite dị mma maka ọrụ dị ka. ihu njirimara, nchọpụta ihu, akara ala (ma ọ bụ akụkụ ihu) mpaghara, yana ndezi ihu & njikọ. Ọzọkwa, foto ndị dị na mkpokọta a nwere ọtụtụ ụdị ọnọdụ dị iche iche na ndagide azụ.
2. DOTA
DOTA (Nhazi data nke Nchọpụta ihe na Foto Aerial) bụ nnukwu dataset maka nchọpụta ihe nke gụnyere ụdị 15 a na-ahụkarị (dịka ụgbọ mmiri, ụgbọ elu, ụgbọ ala, wdg), onyonyo 1411 maka ọzụzụ, yana onyonyo 458 maka nkwado.
3. Ntụle data ntule ihu ihu Google
Ntụle ntule ihu Google nwere ihe dị ka 500,000 foto atọ, gụnyere foto ihu 156,000. Ọ dị mma ịmara na ọ dịkarịa ala mmadụ isii depụtara ihe atọ ọ bụla dị na dataset a.
Ihe ndekọ data a bara uru maka ọrụ metụtara nyocha ihu, dị ka iweghachite onyonyo dabere na okwu, nhazi mmetụta uche, njikọ okwu, na ndị ọzọ. Iji nweta ohere na dataset, a ga-emecha akwụkwọ nkenke.
4. Visual Genome
Ajụjụ Anya Azịza data na gburugburu ọtụtụ nhọrọ dị na Visual Genome. Ọ bụ foto MSCOCO 101,174 nwere ụzọ abụọ QA nde 1.7, yana nkezi nke ajụjụ 17 n'otu onyonyo ọ bụla.
N'ịtụnyere ihe ndekọ data ịza ajụjụ Anya, Visual Genome dataset nwere nkesa ziri ezi n'ofe ụdị ajụjụ isii: Gịnị, Ebee, Mgbe, Onye, Gịnị mere, na Olee otú.
Na mgbakwunye, dataset Visual Genome gụnyere foto 108K ejirila ihe, akụrụngwa na njikọ kpado nke ukwuu.
5. Okwu Libri
LibriSpeech corpus bụ mkpokọta akwụkwọ ọdịyo dị ihe dị ka awa 1,000 sitere na ọrụ LibriVox. Ọtụtụ akwụkwọ ọdịyo sitere na Project Gutenberg.
E kewara data ọzụzụ ahụ ụzọ atọ nke usoro 100hr, 360hr, na 500hr, ebe data dev na nnwale dị ihe dị ka 5hr n'ogologo ọdịyo.
6. Oghere obodo
Otu n'ime ọdụ data nnukwu ama ama nke vidiyo stereo nwere echiche obodo mepere emepe ka a na-akpọ The Cityscapes.
Site na nkọwa ziri ezi nke pikselụ gụnyere ọnọdụ GPS, okpomọkụ dị n'èzí, data ego-ego, na echiche stereo ziri ezi, ọ gụnyere ndekọ sitere na obodo 50 dị iche iche German.
7. Kinetics Dataset
Otu n'ime ihe ndekọ vidiyo kachasị ama ama maka ịmara ọrụ mmadụ n'ọtụtụ buru ibu yana ezigbo mma bụ Kinetics dataset. Enwere opekata mpe vidiyo 600 maka nke ọ bụla n'ime klaasị ọrụ mmadụ 600, na-agbakọta ihe karịrị 500,000 na mkpokọta.
E wepụrụ ihe nkiri ndị ahụ na YouTube; nke ọ bụla dị ihe dịka sekọnd iri n'ogologo ma nwee naanị otu klas mmemme edepụtara.
8. CelebAMAsk-HQ
CelebAMask-HQ bụ mkpokọta foto ihu dị elu 30,000 nwere ihe mkpuchi ejiri nlezianya depụta ya na klaasị 19 gụnyere akụkụ ihu dị ka akpụkpọ, imi, anya, brow, ntị, ọnụ, egbugbere ọnụ, ntutu, okpu, ugogbe anya, ọla ntị, olu, olu, ihe.
Enwere ike iji setịpụ data ahụ iji nwalee ma zụọ njirimara ihu, ntule ihu, yana GAN maka imepụta ihu na ndezi algọridim.
9. Ụlọ ọrụ Penn Treebank
Otu n'ime ihe ndị a ma ama na nke a na-ejikarị eme ihe maka nyocha nke ụdị maka mkpado usoro bụ English Penn Treebank (PTB) corpus, karịsịa akụkụ nke corpus kwekọrọ na akwụkwọ akụkọ Wall Street Journal.
Okwu ọ bụla ga-enwerịrị mkpado akụkụ nke okwu ya dịka akụkụ nke ọrụ ahụ. Ọkwa agwa na ọkwa okwu nhazi asụsụ na-ejikarị corpus eme ihe.
10. VoxCeleb
VoxCeleb bụ nnukwu data njirimara okwu ewepụtara na-akpaghị aka mgbasa ozi mepere emepe. VoxCeleb nwere ihe karịrị otu nde okwu sitere na ndị ọkà okwu karịrị 6k.
Dị ka dataset na-agụnye audio-visual, enwere ike iji ya maka ngwa ndị ọzọ dị iche iche, gụnyere nhazi okwu anya, nkewa okwu, ịnyefe usoro site na ihu gaa n'olu ma ọ bụ nke ọzọ, na ọzụzụ ihu site na vidiyo iji gbakwunye njirimara ihu ugbu a. datasets.
11. SIXray
Ihe ndekọ data SIXray gụnyere foto X-ray 1,059,231 anakọtara site na ọdụ ụgbọ oloko ma ndị nyocha nchekwa mmadụ depụtara iji chọpụta ụdị isi ihe isii a machibidoro iwu: egbe, mma, wrenches, ngwa mkpachị, mkpa na hama. Ọzọkwa, ejiri aka tinye igbe ejichi maka ihe ọ bụla anabataghị n'usoro nnwale iji nyochaa arụmọrụ nke nhazi ihe.
12. Ihe mberede US
Egopụtalarị ihe ngo a site n'aha nke dataset, ihe ọghọm US. Nke a dataset na ihe mberede ụgbọ ala mba na-agụnye ozi site na February 2016 ruo December 2021 na kpuchie 49 steeti na USA.
Ihe ndekọ ihe mberede 1.5 nde dị ugbu a na mkpokọta a. Achịkọtara ya ozugbo site na iji ọtụtụ API okporo ụzọ.
API ndị a na-ebufe ozi okporo ụzọ anakọtara site na isi mmalite dị iche iche, gụnyere igwefoto okporo ụzọ, otu ndị mmanye iwu, na ngalaba njem US na steeti.
13. Nchọpụta ọrịa anya
Ebe nchekwa data ophthalmic ahaziri ahazi Ocular Disease Intelligent Recognition (ODIR) nwere ozi gbasara ndị ọrịa 5,000, gụnyere afọ ha, agba nke fundus dị n'aka ekpe na anya aka nri, yana mkpụrụokwu nyocha ndị ọkachamara ahụike.
Ihe ndekọ data a bụ nchịkọta data ndị ọrịa sitere na ụlọ ọgwụ dị iche iche na ụlọ ọgwụ dị na China nke Shanggong Medical Technology Co., Ltd. nwetara. Ya na njikwa njikwa mma, ndị na-agụ akwụkwọ nwere nkà kanyere nkọwa.
14. Ọrịa Obi
Ihe ndekọ ọrịa obi a na-enyere aka n'ịchọpụta ịdị adị nke ọrịa obi na onye ọrịa dabere na usoro 76 dị ka afọ, okike, ụdị mgbu obi, ọbara mgbali elu, na ihe ndị ọzọ.
N'okwu ikpe 303, nchekwa data na-achọ ịmata ọdịiche dị na ịdị adị nke ọrịa (uru 1,2,3,4) site na enweghị ya (uru 0).
15. CLEVR
Ihe ndekọ data CLEVR (Asụsụ mejupụtara yana echiche a na-ahụ anya nke elementrị) na-eṅomi Azịza ajụjụ Anya. Ọ nwere foto nke ihe 3D arụpụtara, yana foto ọ bụla na-esonyere ọtụtụ ajụjụ mejupụtara nke ukwuu nke kewara n'ụdị dị iche iche.
Maka ụgbọ oloko niile na foto nkwado na ajụjụ niile, dataset ahụ nwere foto 70,000 na ajụjụ 700,000 maka ọzụzụ, onyonyo 15,000 na ajụjụ 150,000 maka nkwado, yana onyonyo 15,000 na ajụjụ 150,000 maka nnwale metụtara ihe, nzaghachi, eserese ngosi, na eserese ngosi.
16. Ndabere zuru ụwa ọnụ
Ihe oru ngo nke dabere na Universal (UD) bu n'obi imepụta ụdị ọdịdị nke otu asụsụ na nkọwapụta osisi osisi syntax maka ọtụtụ asụsụ. Ụdị 2.7, nke e wepụtara na 2020, nwere osisi osisi 183 n'asụsụ 104.
Emebere nkọwa a site na mkpado POW zuru ụwa ọnụ, ndị isi ndabere, na akara ndabere ụwa niile.
17. KITTI - 360
Otu n'ime datasets a na-ejikarị eme ihe maka robọt mkpanaka na kwurula kwụ ọtọ bụ KITTI (Karlsruhe Institute of Technology na Toyota Technological Institute).
Ọ bụ ihe nhụta okporo ụzọ bara uru nke awa nke ewepụtara site n'iji ụdị ihe mmetụta dị iche iche, dị ka RGB dị elu, stereo grayscale, na igwefoto nyocha laser 3D. Ọtụtụ ndị nchọpụta ejirila aka kọwaa akụkụ ya dị iche iche iji kwado mkpa ha ka oge na-aga.
18. MOT (Nsochi ọtụtụ ihe)
MOT (Ọtụtụ Ihe Ndepụta) bụ ihe ndekọ data maka ọtụtụ ihe nleba anya nke gụnyere ime ụlọ na n'èzí nke ebe ọha na-agụnye ndị na-agafe agafe dị ka ihe mmasị. A na-agbaji vidiyo ọ bụla nke ihe nkiri ụzọ abụọ, otu maka ọzụzụ na nke ọzọ maka nnwale.
Nchịkọta data gụnyere nchọpụta ihe na vidiyo vidiyo na-eji ihe nchọpụta atọ: SDP, Faster-RCNN, na DPM.
19. PASCAL 3D+
Pascal3D+ multi-view dataset bụ foto anakọtara n'ime ọhịa, ya bụ, onyonyo nke otu ihe nwere oke mgbanwe dị elu, weghaara n'ọnọdụ enweghị nchịkwa, na gburugburu ebe ndị mmadụ juru, na n'ọnọdụ dị iche iche. Pascal3D+ gụnyere ụdị ihe siri ike iri na abụọ ewepụtara na dataset PASCAL VOC 12.
Ihe ndị a nwere ozi ọnọdụ nke edobere na ha (azimuth, elu, na anya na igwefoto). Pascal3D+ gụnyekwara foto ndị akọwapụtagoro site na nchịkọta ImageNet na ngalaba iri na abụọ a.
20. Ụdị anụmanụ na-emebi ihu
Ebumnobi nke oru ngo ngbanwe ihu ụdị anụmanụ (FDMA) bụ ịgba mgba usoro dị ugbu a na njirimara ihu mmadụ na nsochi yana imepụta algọridim ọhụrụ nke nwere ike ịnagide nnukwu mgbanwe dị ukwuu nke e ji mara ọdịdị ihu anụmanụ.
Algọridim ọrụ ahụ gosipụtara ikike ịmata na soro akara ngosi dị n'ihu mmadụ mgbe ọ na-emekọ ihe ngbanwe nke mgbanwe mmetụta ihu ma ọ bụ ọnọdụ ihu, oghere akụkụ, na ọkụ.
21. MPII Human Post Dataset
Ihe ndekọ data MPII Human Pose nwere ihe dị ka foto 25K, 15K n'ime ha bụ ihe nlele ọzụzụ, 3K nke bụ nlele nkwado, yana 7K nke na-anwale nlele.
A na-eji aka na-edepụta ọnọdụ ndị ahụ ihe ruru nkwonkwo anụ ahụ 16, na foto ndị a na-ese na ihe nkiri YouTube na-ekpuchi ihe omume mmadụ 410 dị iche iche.
22. UCF101
Ihe ndekọ data UCF101 nwere obere vidiyo 13,320 ahaziri n'ime otu 101. A na-ekewa ngalaba 101 ndị a ụzọ ise: mmegharị ahụ, mmekọrịta mmadụ na mmadụ, mmekọrịta mmadụ na ihe, egwu egwu, na egwuregwu.
Vidiyo ndị a sitere na YouTube ma nwee awa 27 n'ogologo.
23. Ọdịda ọdịyo
Audioset bụ ihe ndekọ data mmemme ọdịyo mebere ihe karịrị nde mmadụ abụọ akụkụ vidiyo nkeji nkeji iri nke abụọ. Iji kọwapụta data a, a na-eji ontology hierarchical nwere ụdị mmemme 2, nke na-egosi na enwere ike ịkpọ otu ụda ahụ n'ụzọ dị iche.
24. Ntụnye Asụsụ Eke Stanford
SNLI dataset (Stanford Natural Language Inference) nwere mmakọ ahịrịokwu 570k ejiri aka chịkọta ya dị ka ntinye, mgbagha, ma ọ bụ nnọpụiche.
Oghere ụlọ bụ nkọwa foto Flickr30k, ebe ndị na-akọwapụta echiche igwe mmadụ mepụtara bụ ndị enyere ụlọ ma nye ya ntụziaka ka ha wepụta okwu na-adọrọ adọrọ, na-emegiderịta onwe na na nnọpụiche.
25. Azịza ajụjụ anya
Azịza ajụjụ a na-ahụ anya (VQA) bụ ihe ndekọ data nwere ajụjụ mepere emepe gbasara foto. Iji zaa ajụjụ ndị a, ọ dị gị mkpa ịghọta ọhụụ, asụsụ, na ọgụgụ isi.
mmechi
Dika mmụta igwe na ọgụgụ isi mmadụ (AI) na-agbasawanye n'ihe fọrọ nke nta ka ọ bụrụ azụmahịa ọ bụla yana na ndụ anyị kwa ụbọchị, ọnụọgụ akụrụngwa na ozi dị na isiokwu a na-abawanye.
Ihe ndekọ data ọha emebere emebere na-enye nnukwu mmalite mmalite iji mepụta ụdị AI ma na-ahapụkwa ndị na-eme mmemme ML nwere oge ịchekwa oge na ilekwasị anya na akụkụ ndị ọzọ nke ọrụ ha.
Nkume a-aza