Table of Contents[Hide][Show]
- 1. CelebFaces Attributes Dataset
- 2. DOTA
- 3. Google Facial Expression piv dataset
- 4. Visual Genome
- 5. LibriSpeech
- 6. Lub Nroog Thaj Chaw
- 7. Kinetics Dataset
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. Teb Chaws Asmeskas Kev Nyuaj Siab
- 13. Kev Paub Txog Kab Mob Ocular
- 14. Mob plawv
- 15. CLEVR
- 16. Universal Dependencies
- 17. TSI – 360
- 18. MOT (Ntau yam khoom taug qab)
- 19. PASCAL 3D+
- 20. Lub ntsej muag Deformable qauv tsiaj
- 21. MPII Human Post Dataset
- 22. UAS 101
- 23. Audioset
- 24. Stanford Natural Language Inference
- 25. Visual Question teb
- xaus
Niaj hnub no, peb feem ntau yog tsom rau kev tsim kho tshuab kev kawm thiab AI qauv thiab daws teeb meem siv cov ntaub ntawv tam sim no. Tab sis ua ntej, peb yuav tsum txhais cov ntaub ntawv, nws qhov tseem ceeb, thiab nws lub luag haujlwm hauv kev tsim cov kev daws teeb meem AI thiab ML.
Niaj hnub no, peb muaj ntau ntau ntawm cov ntaub ntawv qhib cov ntaub ntawv uas yuav ua rau kev tshawb fawb lossis tsim cov ntawv thov los daws cov teeb meem tiag tiag hauv ntau qhov haujlwm.
Txawm li cas los xij, qhov tsis txaus ntawm cov ntaub ntawv muaj txiaj ntsig zoo yog qhov muaj kev txhawj xeeb. Cov ntaub ntawv tau nce siab heev thiab yuav txuas ntxiv nthuav dav ntawm tus nqi nrawm dua yav tom ntej.
Hauv cov ntawv tshaj tawm no, peb yuav npog cov ntaub ntawv muaj dawb uas koj tuaj yeem siv los tsim koj qhov project AI tom ntej.
1. CelebFaces Attributes Dataset
CelebFaces Attributes Dataset (CelebA) muaj ntau dua 200K cov duab nto moo thiab 40 tus cwj pwm annotations rau txhua daim duab, ua rau nws yog qhov pib zoo rau cov haujlwm xws li ntsej muag kom paub, nrhiav pom lub ntsej muag, thaj chaw (lossis lub ntsej muag tivthaiv) hauv zos, thiab kho lub ntsej muag & synthesis. Tsis tas li ntawd, cov duab hauv phau ntawv no muaj ntau yam ntawm txoj haujlwm sib txawv thiab cov duab hauv qab clutter.
2. DOTA
DOTA (Cov ntaub ntawv ntawm Kev Tshawb Fawb hauv Aerial Photos) yog cov ntaub ntawv loj loj rau kev tshawb pom cov khoom uas suav nrog 15 pawg (piv txwv li, nkoj, dav hlau, tsheb, thiab lwm yam), 1411 cov duab rau kev cob qhia, thiab 458 cov duab rau kev siv tau.
3. Google Facial Expression piv dataset
Google lub ntsej muag qhia kev sib piv dataset muaj nyob ib ncig ntawm 500,000 daim duab peb sab, suav nrog 156,000 daim duab ntsej muag. Nws yog tsim nyog sau cia tias txhua triplet nyob rau hauv cov ntaub ntawv no yog annotated los ntawm tsawg kawg yog rau tib neeg tus nqi.
Cov ntaub ntawv no muaj txiaj ntsig zoo rau cov haujlwm uas cuam tshuam nrog kev tsom xam ntawm lub ntsej muag, xws li kev nthuav qhia cov duab rov qab, kev xav categorization, qhia kev sib txuas lus, thiab lwm yam. Txhawm rau nkag mus rau cov ntaub ntawv, ib daim ntawv luv luv yuav tsum ua kom tiav.
4. Visual Genome
Visual Question Teb cov ntaub ntawv hauv ntau qhov chaw xaiv muaj nyob hauv Visual Genome. Nws yog tsim los ntawm 101,174 MSCOCO duab nrog 1.7 lab QA khub, nrog rau qhov nruab nrab ntawm 17 cov lus nug rau ib daim duab.
Hauv kev sib piv rau Visual Question Answering dataset, Visual Genome dataset muaj kev faib ncaj ncees ntau dua nyob rau ntawm rau lo lus nug: Dab tsi, Qhov twg, Thaum twg, Leej twg, Vim Li Cas, thiab Yuav Ua Li Cas.
Tsis tas li ntawd, Visual Genome dataset suav nrog 108K cov duab uas tau raug ntaus tag nrog cov khoom, khoom, thiab kev sib txuas.
5. LibriSpeech
Lub LibriSpeech corpus yog ib phau ntawm ib ncig ntawm 1,000 teev ntawm audiobooks los ntawm LibriVox project. Feem ntau ntawm cov phau ntawv audio yog los ntawm Project Gutenberg.
Cov ntaub ntawv kev cob qhia tau muab faib ua peb ntu ntawm 100hr, 360hr, thiab 500hr teev, thaum cov ntaub ntawv dev thiab cov ntaub ntawv xeem yog kwv yees li 5hr hauv lub suab ntev.
6. Cov Cityspaces
Ib qho ntawm qhov zoo tshaj plaws-paub cov ntaub ntawv loj ntawm cov yeeb yaj kiab tso suab nrog cov kev pom hauv nroog hu ua Cityscapes.
Nrog pixel-txhim kho cov lus piav qhia uas suav nrog GPS qhov chaw, qhov kub thiab txias sab nraum zoov, cov ntaub ntawv ego-motion, thiab txoj cai tso suab, nws suav nrog cov ntaub ntawv kaw tseg los ntawm 50 lub nroog German.
7. Kinetics Dataset
Ib qho ntawm cov ntaub ntawv video uas paub zoo tshaj plaws rau kev paub txog tib neeg kev ua haujlwm ntawm qhov loj thiab muaj txiaj ntsig zoo yog Kinetics dataset. Muaj tsawg kawg yog 600 video clips rau txhua qhov ntawm 600 tib neeg kev ua ub no, suav nrog ntau dua 500,000 hauv tag nrho.
Cov yeeb yaj kiab raug rub los ntawm YouTube; txhua tus yog nyob ib ncig ntawm 10 vib nas this ntev thiab tsuas muaj ib chav kawm ua haujlwm tau teev tseg.
8. CelebAMask-HQ
CelebAMask-HQ yog ib qho kev sau ntawm 30,000 lub ntsej muag daws teeb meem siab nrog cov lus piav qhia kom zoo thiab 19 chav kawm uas suav nrog lub ntsej muag xws li tawv nqaij, qhov ntswg, qhov muag, qhov muag, pob ntseg, qhov ncauj, di ncauj, plaub hau, kaus mom, tsom iav, qhwv ntsej, caj dab, caj dab, khoom siv.
Cov ntaub ntawv tuaj yeem siv los kuaj thiab qhia lub ntsej muag paub, ntsej muag parsing, thiab GANs rau lub ntsej muag tsim thiab kho algorithms.
9. Penn Treebank
Ib qho tseem ceeb tshaj plaws thiab feem ntau siv corpora rau kev ntsuam xyuas ntawm cov qauv rau kev sib txuas tagging yog English Penn Treebank (PTB) corpus, tshwj xeeb tshaj yog cov feem ntawm lub cev sib xws rau Wall Street Journal cov ntawv.
Txhua lo lus yuav tsum muaj nws ib feem ntawm kev hais lus tagged ua ib feem ntawm txoj haujlwm. Cim-theem thiab lo lus-qib kev ua qauv lus kuj nquag siv corpus.
10. VoxCeleb
VoxCeleb yog cov ntaub ntawv qhia txog kev hais lus loj uas tau tsim los ntawm open-source media. VoxCeleb muaj ntau dua ib lab cov lus los ntawm ntau dua 6k tus neeg hais lus.
Raws li cov ntaub ntawv muaj xws li audio-visual, nws tuaj yeem siv rau ntau yam kev siv ntxiv, suav nrog kev hais lus pom, kev sib cais ntawm kev hais lus, kev hloov pauv ntawm lub ntsej muag mus rau lub suab lossis lwm qhov, thiab kev cob qhia lub ntsej muag lees paub los ntawm video los ntxiv kev paub lub ntsej muag tam sim no. cov ntaub ntawv.
11. SIXray
SIXray dataset suav nrog 1,059,231 X-ray duab sau los ntawm subway chaw nres tsheb thiab sau tseg los ntawm tib neeg kev ruaj ntseg soj ntsuam xyuas rau XNUMX yam tseem ceeb ntawm cov khoom txwv tsis pub: rab yaj phom, riam, ciaj sia taus, pliers, txiab, thiab rauj. Tsis tas li ntawd, bounding thawv rau txhua yam khoom uas tsis tau tso cai tau manually ntxiv rau cov kev xeem teev nyob rau hauv thiaj li yuav ntsuas qhov ua tau zoo ntawm cov khoom localization.
12. Teb Chaws Asmeskas Kev Nyuaj Siab
Lub phiaj xwm cov khoom twb tau nthuav tawm los ntawm lub npe ntawm cov ntaub ntawv, US Accidents. Cov ntaub ntawv no hais txog kev sib tsoo tsheb thoob tebchaws suav nrog cov ntaub ntawv txij Lub Ob Hlis 2016 txog Lub Kaum Ob Hlis 2021 thiab suav nrog 49 lub xeev hauv Tebchaws Meskas.
Kwv yees li 1.5 lab cov ntaub ntawv kev sib tsoo tam sim no muaj nyob rau hauv phau ntawv no. Nws tau sib sau ua ke hauv lub sijhawm tiag tiag los ntawm kev siv ntau lub tsheb APIs.
Cov APIs no xa cov ntaub ntawv xov xwm tsheb sib sau los ntawm ntau qhov chaw, suav nrog lub koob yees duab tsheb, cov koom haum tub ceev xwm, thiab US thiab xeev cov chaw thauj mus los.
13. Ocular Disease Recognition
Lub koom haum ophthalmic database Ocular Disease Intelligent Recognition (ODIR) muaj cov ntaub ntawv ntawm 5,000 tus neeg mob, suav nrog lawv lub hnub nyoog, xim ntawm cov nyiaj hauv lawv ob lub qhov muag sab laug thiab sab xis, thiab cov kws kho mob cov ntsiab lus kuaj mob.
Cov ntaub ntawv no yog kev sau cov ntaub ntawv tus neeg mob los ntawm ntau lub tsev kho mob thiab chaw kho mob hauv Suav teb uas Shanggong Medical Technology Co., Ltd. tau txais. Nrog kev tswj xyuas zoo, annotations tau tagged los ntawm cov neeg txawj nyeem ntawv.
14. mob plawv
Cov ntaub ntawv kab mob plawv no pab txhawm rau txheeb xyuas qhov muaj kab mob plawv hauv tus neeg mob raws li 76 yam xws li hnub nyoog, poj niam txiv neej, mob hauv siab, mob ntshav siab, thiab lwm yam.
Nrog 303 tus neeg mob, cov ntaub ntawv nrhiav kom yooj yim sib txawv ntawm qhov muaj mob (tus nqi 1,2,3,4) los ntawm nws qhov tsis muaj (tus nqi 0).
15. CLEVR
CLEVR dataset (Compositional Language and Elementary Visual Reasoning) ua raws li Cov Lus Nug Lus Teb. Nws muaj cov duab ntawm 3D-rendered cov khoom, nrog rau txhua daim duab nrog rau cov lus nug uas muaj feem ntau muab faib ua ntau pawg.
Rau tag nrho cov tsheb ciav hlau thiab kev siv tau cov duab thiab cov lus nug, cov ntaub ntawv muaj 70,000 daim duab thiab 700,000 cov lus nug rau kev cob qhia, 15,000 cov duab thiab 150,000 cov lus nug rau kev siv tau, thiab 15,000 cov duab thiab 150,000 cov lus nug rau kev sim nrog cov khoom, cov lus teb, cov duab kos duab thiab cov haujlwm.
16. Universal Dependencies
Txoj haujlwm Universal Dependencies (UD) lub hom phiaj los tsim cov lus sib txawv ntawm cov lus sib txawv thiab cov lus piav qhia ntawm tsob ntoo ntoo rau ntau hom lus. Version 2.7, uas tau tshaj tawm xyoo 2020, muaj 183 tsob ntoo hauv 104 yam lus.
Cov lus piav qhia yog ua los ntawm universal POW tags, dependence heads, thiab universal dependency labels.
17. TSI – 360
Ib qho ntawm feem ntau siv datasets rau mobile robots thiab autonomous tsav tsheb yog KITTI (Karlsruhe Institute of Technology thiab Toyota Technological Institute).
Nws yog tsim los ntawm cov sij hawm tsim nyog ntawm cov xwm txheej tsheb uas tau ntes siv ntau yam kev hloov pauv, xws li kev daws teeb meem siab RGB, greyscale stereo, thiab 3D laser scanner koob yees duab. Cov ntaub ntawv tau raug txhim kho nyob rau lub sijhawm los ntawm ntau tus kws tshawb fawb uas tau piav qhia ntau yam ntawm nws kom haum lawv cov kev xav tau.
18. MOT (Ntau yam khoom taug qab)
MOT (Multiple Object Tracking) yog cov ntaub ntawv rau ntau yam khoom taug qab uas suav nrog sab hauv tsev thiab sab nraum zoov ntawm cov chaw pej xeem uas suav nrog cov neeg taug kev raws li cov khoom nyiam. Txhua qhov kev yees duab tau tawg ua ob daim, ib qho rau kev cob qhia thiab lwm qhov rau kev sim.
Cov ntaub ntawv muaj xws li cov khoom nrhiav pom hauv video thav duab siv peb lub cuab yeej: SDP, Faster-RCNN, thiab DPM.
19. PASCAL 3D +
Pascal3D + ntau cov ntaub ntawv saib yog tsim los ntawm cov duab khaws cia hauv cov tsiaj qus, piv txwv li, cov duab ntawm cov khoom pawg uas muaj qhov sib txawv siab, raug ntes nyob rau hauv qhov xwm txheej tsis muaj kev tswj hwm, nyob rau hauv ib puag ncig neeg coob, thiab ntau txoj haujlwm. Pascal3D+ suav nrog 12 yam khoom nruj uas tau kos los ntawm PASCAL VOC 2012 dataset.
Cov khoom no muaj cov ntaub ntawv qhia txog kev taw qhia ntawm lawv (azimuth, qhov siab, thiab kev ncua deb ntawm lub koob yees duab). Pascal3D + ntxiv nrog rau cov duab kos duab los ntawm ImageNet sau hauv 12 pawg.
20. Lub ntsej muag Deformable qauv ntawm Tsiaj
Lub hom phiaj ntawm Facial Deformable Models of Animals (FDMA) project yog los tawm tsam cov txheej txheem tam sim no hauv tib neeg lub ntsej muag kev txheeb xyuas thiab taug qab thiab tsim kho cov txheej txheem tshiab uas tuaj yeem cuam tshuam nrog qhov sib txawv loj dua uas yog cov yam ntxwv ntawm cov tsiaj ntsej muag.
Qhov project algorithms tau pom tias muaj peev xwm paub txog thiab taug qab thaj chaw ntawm tib neeg lub ntsej muag thaum cuam tshuam nrog kev sib txawv ntawm kev ntxias los ntawm kev hloov ntawm lub ntsej muag lub ntsej muag lossis txoj haujlwm, ib feem occlusions, thiab teeb pom kev zoo.
21. MPII Human Post Dataset
Lub MPII Human Pose Dataset muaj nyob ib ncig ntawm 25K cov duab, 15K ntawm uas yog cov qauv kev cob qhia, 3K uas yog cov qauv siv tau, thiab 7K uas yog cov qauv kuaj.
Cov haujlwm tau muab sau ua ke nrog txog li 16 lub cev pob qij txha, thiab cov duab tau muab los ntawm YouTube yeeb yaj kiab npog 410 ntau yam kev ua haujlwm ntawm tib neeg.
22. UAS 101
UCF101 dataset muaj 13,320 video clips muab faib ua 101 pawg. Cov 101 pawg no tau muab faib ua tsib pawg: kev txav ntawm lub cev, kev sib cuam tshuam ntawm tib neeg-tib neeg, kev sib cuam tshuam ntawm tib neeg-khoom, kev ntaus suab paj nruag, thiab kev ua si.
Cov yeeb yaj kiab yog los ntawm YouTube thiab suav nrog 27 teev hauv lub sijhawm.
23. Audioset
Audioset yog ib qho kev tshwm sim audio dataset ua los ntawm ntau tshaj 2 lab tib neeg-annotated 10-thib ob video ntu. Txhawm rau piav qhia cov ntaub ntawv no, ib qho kev qhia hierarchical ontology suav nrog 632 hom kev tshwm sim yog siv, uas txhais tau hais tias tib lub suab yuav raug sau npe txawv.
24. Stanford Natural Language Inference
Cov ntaub ntawv SNLI (Stanford Natural Language Inference) muaj 570k kab lus ua ke uas tau muab faib ua manually raws li kev nkag siab, kev tsis sib haum xeeb, lossis nruab nrab.
Qhov chaw yog Flickr30k daim duab piav qhia, thaum cov kev xav tau tsim los ntawm cov neeg sau xov xwm los ntawm cov neeg coob coob uas tau muab qhov chaw thiab qhia kom tsim kom muaj kev sib cav, sib cav, thiab cov lus tsis sib haum.
25. Visual Question Teb
Visual Question Answering (VQA) yog cov ntaub ntawv uas muaj cov lus nug qhib txog cov duab. Txhawm rau teb cov lus nug no, koj yuav tsum nkag siab qhov pom, lus, thiab kev nkag siab zoo.
xaus
Raws li kev kawm tshuab thiab kev txawj ntse txawj ntse (AI) tau dhau los ua ntau yam hauv txhua qhov kev lag luam thiab hauv peb lub neej niaj hnub, yog li muaj pes tsawg tus peev txheej thiab cov ntaub ntawv muaj nyob rau ntawm qhov kev kawm.
Cov ntaub ntawv npaj rau pej xeem npaj tau muab qhov pib zoo los tsim AI qauv thaum tseem tso cai rau cov neeg ua haujlwm ML raws caij nyoog kom txuag sijhawm thiab tsom mus rau lwm yam ntawm lawv cov haujlwm.
Sau ntawv cia Ncua