Fizahan-takelaka[Afeno][Aseho]
- 1. CelebFaces Attributes Dataset
- 2. DOTA
- 3. Data fampitahana Google Facial Expression
- 4. Genome hita maso
- 5. LibriSpeech
- 6. The Cityspaces
- 7. Kinetika Dataset
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. Loza any Etazonia
- 13. Famantarana ny aretina amin'ny maso
- 14. Aretim-po
- 15. CLEVR
- 16. Fiankinan'ny rehetra
- 17. KITTI – 360
- 18. MOT (Fanaraha-maso zavatra maro)
- 19. PASCAL 3D+
- 20. Modely amin'ny biby miodina amin'ny tarehy
- 21. MPII Human Post Dataset
- 22. UCF101
- 23. Audioset
- 24. Famintinana ny fiteny voajanahary Stanford
- 25. Famaliana fanontaniana hita maso
- Famaranana
Amin'izao fotoana izao, ny ankamaroantsika dia mifantoka amin'ny famolavolana ny fianarana milina sy ny maodely AI ary ny famahana ny olana amin'ny fampiasana ny angona ankehitriny. Fa aloha, tsy maintsy mamaritra ny angon-drakitra, ny dikany ary ny anjara asany amin'ny famolavolana vahaolana AI sy ML matanjaka.
Amin'izao fotoana izao, manana angon-drakitra misokatra malalaka izay hanaovana fikarohana na hampivelatra rindranasa hamahana ireo olana tena izy amin'ny sehatra isan-karazany.
Na izany aza, ny tsy fahampian'ny angon-drakitra avo lenta dia loharanom-panahiana. Nitombo be ny angon-drakitra ary mbola hiitatra haingana kokoa amin'ny ho avy.
Ato amin'ity lahatsoratra ity dia handrakotra ny angona azo alaina maimaim-poana izay azonao ampiasaina hamolavolana ny tetikasa AI manaraka.
1. CelebFaces Attributes Dataset
Ny CelebFaces Attributes Dataset (CelebA) dia misy sary malaza maherin'ny 200K sy fanamarihana toetra 40 ho an'ny sary tsirairay, ka mahatonga azy io ho toerana fanombohana tsara ho an'ny tetikasa toy ny fanekena tarehy, famantaran-tava, fanamafisam-peo (na singa amin'ny tarehy), ary fanitsiana tarehy sy synthesis. Fanampin'izany, ny sary ao amin'ity fanangonana ity dia misy karazana toerana maro be sy fikorontanan'ny lamosina.
2. DotA
DOTA (Dataset of Object Detection in Aerial Photos) dia angon-drakitra midadasika ho an'ny fitadiavana zavatra izay misy sokajy mahazatra 15 (oh: sambo, fiaramanidina, fiara, sns.), sary 1411 ho an'ny fanofanana, ary sary 458 ho fanamarinana.
3. Data fampitahana Google Facial Expression
Ny angon-drakitra fampitahana ny endriky ny tarehy Google dia misy sary telopolo eo amin'ny 500,000, ao anatin'izany ny sary 156,000. Tsara ny manamarika fa ny triplet tsirairay amin'ity angon-drakitra ity dia nomarihin'ny olona enina farafahakeliny.
Ity tahirin-kevitra ity dia ilaina amin'ny tetikasa misy famakafakana fanehoana endrika, toy ny fakana sary mifototra amin'ny fanehoana, fanasokajiana ny fihetseham-po, synthesis fanehoana, sy ny sisa. Mba hahazoana fidirana amin'ny angon-drakitra dia tsy maintsy fenoina ny endrika fohy.
4. Visual Genome
Hita ao amin'ny Visual Genome ny angon-drakitra mamaly fanontaniana amin'ny tontolo misy safidy maro. Izy io dia ahitana sary MSCOCO 101,174 miaraka amin'ny mpivady QA 1.7 tapitrisa, miaraka amin'ny fanontaniana 17 eo ho eo isaky ny sary.
Raha ampitahaina amin'ny angona Visual Question Answering, ny angona Visual Genome dia manana fizarana ara-drariny kokoa amin'ireo karazana fanontaniana enina: Inona, Aiza, Rahoviana, Iza, Nahoana ary Ahoana.
Ho fanampin'izay, ny angona Visual Genome dia ahitana sary 108K izay nasiana marika be dia be miaraka amin'ny zavatra, fananana ary fifandraisana.
5. LibriSpeech
Ny LibriSpeech corpus dia fanangonana boky manodidina ny 1,000 ora avy amin'ny tetikasa LibriVox. Ny ankamaroan'ny boky audio dia avy amin'ny Project Gutenberg.
Ny angon-drakitra fanofanana dia mizara ho fizarana telo amin'ny 100hr, 360hr, ary 500hr, raha ny devoly sy ny angona fitsapana dia eo amin'ny 5hr amin'ny halavan'ny feo.
6. Ny Cityspaces
Ny iray amin'ireo angon-drakitra malaza indrindra amin'ny horonan-tsary stereo misy fomba fijery an-tanàn-dehibe dia antsoina hoe The Cityscapes.
Miaraka amin'ny fanamarihana mazava tsara amin'ny piksela izay misy ny toerana GPS, ny mari-pana any ivelany, ny angon-drakitra momba ny ego, ary ny fomba fijery stereo havanana, dia misy firaketana avy amin'ny tanàna alemà 50 miavaka.
7. Takelaka data Kinetics
Iray amin'ireo tahirin-dahatsary fanta-daza indrindra amin'ny fanekena ny asan'ny olombelona amin'ny ambaratonga lehibe sy manana kalitao tsara ny angona Kinetics. Misy horonan-tsarimihetsika 600 farafahakeliny isaky ny kilasy 600 ataon'ny olombelona, ka mahatratra 500,000 ny fitambarany.
Nalaina tao amin'ny YouTube ireo sarimihetsika; Manodidina ny 10 segondra eo ho eo ny halavan'ny tsirairay ary tsy misy afa-tsy kilasy hetsika iray voatanisa.
8. CelebAMask-HQ
CelebAMask-HQ dia fitambarana sary 30,000 avo lenta miaraka amin'ny saron-tava voamarika tsara sy kilasy 19 izay misy singa tarehy toy ny hoditra, orona, maso, volomaso, sofina, vava, molotra, volo, satroka, solomaso, kavina, rojo, vozony, fitaovana.
Ny angon-drakitra dia azo ampiasaina hitsapana sy hanofanana ny famantarana ny tarehy, ny famafazana tarehy ary ny GAN ho an'ny algorithm amin'ny famoronana tarehy sy fanitsiana.
9. Penn Treebank
Ny iray amin'ireo corpora malaza indrindra sy matetika ampiasaina amin'ny fanombanana ny maodely amin'ny fametahana filaharana dia ny English Penn Treebank (PTB) corpus, indrindra ny ampahany amin'ny corpus mifanaraka amin'ny lahatsoratra Wall Street Journal.
Ny teny tsirairay dia tsy maintsy manana ny ampahany amin'ny kabary voamarika ho singa iray amin'ny asa. Ambaratonga toetra sy ambaratongam-teny modeling fiteny koa matetika mampiasa corpus.
10. VoxCeleb
VoxCeleb dia angon-drakitra famantarana kabary midadasika natsangana ho azy avy haino aman-jery open-source. VoxCeleb dia manana fitenenana mihoatra ny iray tapitrisa avy amin'ny mpandahateny 6k mahery.
Satria ny angon-drakitra dia ahitana feo-visual, dia azo ampiasaina amin'ny fampiharana fanampiny isan-karazany, ao anatin'izany ny synthesis kabary hita maso, ny fisarahana amin'ny kabary, ny fifindrana amin'ny fomba mivantana avy amin'ny tarehy mankany amin'ny feo na ny mifamadika amin'izany, ary ny fanofanana ny famantarana ny tarehy avy amin'ny horonan-tsary mba hanampiana ny famantarana ny tarehy ankehitriny. datasets.
11. SIXray
Ny angon-drakitra SIXray dia ahitana sary X-ray 1,059,231 nangonina avy amin'ny toby fiantsonan'ny metro ary nosoritan'ny mpanara-maso ny fiarovana ny olombelona mba hamantarana ireo karazana enina lehibe voarara: basy poleta, antsy, wrenches, pliers, hety ary tantanana. Fanampin'izay, ny boaty famehezana ho an'ny singa tsirairay tsy navela dia nampidirina amin'ny tanana ho an'ny andian-tsarimihetsika mba hanombanana ny zava-bitan'ny toerana.
12. US Accidents
Ny votoatin'ny tetikasa dia efa nambara tamin'ny anaran'ny angon-drakitra, US Accidents. Ity angona momba ny lozam-piarakodia manerana ny firenena ity dia ahitana fampahalalana nanomboka tamin'ny Febroary 2016 ka hatramin'ny Desambra 2021 ary mandrakotra fanjakana 49 any Etazonia.
Manodidina ny 1.5 tapitrisa eo ho eo ny firaketana momba ny lozam-pifamoivoizana amin'izao fotoana izao. Nangonina tamin'ny fotoana tena izy tamin'ny fampiasana API fifamoivoizana maromaro.
Ireo API ireo dia mampita vaovao momba ny fifamoivoizana nangonina avy amin'ny loharano isan-karazany, ao anatin'izany ny fakantsary fifamoivoizana, fikambanana mpampihatra lalàna, ary ny sampan-draharahan'ny fitaterana any Etazonia sy ny fanjakana.
13. Fanekena aretina ocular
Ny tahiry ophthalmic voarindra Ocular Disease Intelligent Recognition (ODIR) dia ahitana fampahalalana momba ny marary 5,000, anisan'izany ny taonany, ny lokon'ny fundus amin'ny masony havia sy havanana, ary ny teny fanalahidy diagnostika an'ny mpitsabo matihanina.
Ity tahirin-kevitra ity dia angon-drakitra marina momba ny marary avy amin'ny hopitaly sy tobim-pitsaboana isan-karazany ao Shina izay azon'i Shanggong Medical Technology Co., Ltd.. amin'ny fitantanana fanaraha-maso kalitao, nomarihin'ny olona mahay mamaky teny ny fanamarihana.
14. Aretim-po
Ity tahirin-kevitra momba ny aretim-po ity dia manampy amin'ny famantarana ny fisian'ny aretim-po amin'ny marary iray mifototra amin'ny mari-pamantarana 76 toy ny taona, lahy sy vavy, karazana fanaintainan'ny tratra, tosidra miala sasatra, sy ny sisa.
Miaraka amin'ny tranga 303, ny angon-drakitra dia mikasa ny hanavaka tsotra izao ny fisian'ny aretina (sanda 1,2,3,4) amin'ny tsy fisiany (sanda 0).
15. CLEVR
Ny angon-drakitra CLEVR (Compositional Language and Elementary Visual Reasoning) dia maka tahaka ny Visual Question Answering. Izy io dia ahitana sarin'ny zavatra natao 3D, miaraka amin'ny sary tsirairay miaraka amin'ny andiana fanontaniana tena voaforona mizara ho sokajy maromaro.
Ho an'ny fiaran-dalamby sy sary sy fanontaniana rehetra, ny angona dia misy sary 70,000 sy fanontaniana 700,000 ho an'ny fanofanana, sary 15,000 ary fanontaniana 150,000 ho fanamarinana, ary sary 15,000 sy fanontaniana 150,000 ho an'ny fitsapana misy zavatra, valiny, sarin'ny fandaharan'asa miasa.
16. Universal Dependencies
Ny tetikasa Universal Dependencies (UD) dia mikendry ny hamorona morphologie mitovitovy amin'ny fiteny sy fanamafisam-peo ho an'ny fiteny maro. Version 2.7, izay navoaka tamin'ny 2020, dia manana banky hazo 183 amin'ny fiteny 104.
Ny annotation dia misy marika POW manerantany, lohan'ny fiankinan-doha, ary etikety miankina amin'ny rehetra.
17. KITTI – 360
Iray amin'ireo tahirin-kevitra matetika ampiasaina amin'ny robots finday sy mitondra fiara mitokana dia KITTI (Karlsruhe Institute of Technology sy Toyota Technological Institute).
Izy io dia voaforona amin'ny toe-javatra momba ny fifamoivoizana mandritra ny ora maro izay nalaina tamin'ny fampiasana karazana sensor, toy ny RGB avo lenta, stereo grayscale, ary fakan-tsary scanner laser 3D. Nohatsaraina nandritra ny fotoana ny angona angona avy amin'ny mpikaroka maromaro izay nanamarika ny ampahany isan-karazany amin'izany mba hifanaraka amin'ny filan'izy ireo.
18. MOT (Fanaraha-maso zavatra maro)
MOT (Multiple Object Tracking) dia angon-drakitra ho an'ny fanaraha-maso zavatra marobe izay ahitana ny sehatra anatiny sy ivelany amin'ny toerana ho an'ny daholobe izay ahitana mpandeha an-tongotra ho zavatra mahaliana. Ny lahatsarin'ny sehatra tsirairay dia mizara roa, ny iray ho an'ny fampiofanana ary ny iray ho an'ny fitsapana.
Ny dataset dia misy zavatra hita maso amin'ny rindran-tsary mampiasa mpitsikilo telo: SDP, Faster-RCNN, ary DPM.
19. PASCAL 3D+
Ny angon-drakitra Pascal3D+ dia ahitana sary voaangona any anaty ala, izany hoe, sarin'ny sokajy singa manana fiovaovana avo lenta, azo alaina amin'ny toe-javatra tsy voafehy, amin'ny tontolo feno olona, ary amin'ny toerana isan-karazany. Ny Pascal3D+ dia misy sokajy 12 henjana nalaina avy amin'ny tahiry PASCAL VOC 2012.
Ireo singa ireo dia misy fampahafantarana momba ny fihetsika voamarika eo amin'izy ireo (azimuth, haavony ary halavirana amin'ny fakantsary). Ny Pascal3D+ koa dia ahitana sary misy annotation avy amin'ny fanangonana ImageNet amin'ireo sokajy 12 ireo.
20. Modely amin'ny biby miodina amin'ny tarehy
Ny tanjon'ny tetikasa Facial Deformable Models of Animals (FDMA) dia ny hanohitra ny fomba fiasa amin'izao fotoana izao amin'ny famantarana sy ny fanaraha-maso ny tavan'olombelona ary ny famolavolana algorithm vaovao izay afaka miatrika ny fiovaovana lehibe kokoa izay mampiavaka ny toetran'ny biby.
Nasehon'ny algorithm an'ilay tetikasa ny fahaizana mamantatra sy manara-maso ny mari-pamantarana eo amin'ny tarehin'olombelona eo am-panaovana ny fiovaovan'ny toetr'andro vokatry ny fiovan'ny fihetseham-po na ny toerana misy azy, ny fanakanana ampahany ary ny jiro.
21. Takelaka data MPII Human Post
Ny Dataset Human Pose MPII dia misy sary manodidina ny 25K, ny 15K amin'ireo dia santionany fanofanana, 3K amin'ireo santionany fanamarinana, ary 7K amin'ireo santionany fitsapana.
Ny toerana dia voamarika amin'ny tanana miaraka amin'ny tonon-taolana hatramin'ny 16, ary ny sary dia nalaina tamin'ny horonan-tsarimihetsika YouTube mirakitra hetsika 410 isan-karazany.
22. UCF101
Ny angon-drakitra UCF101 dia misy horonan-tsary 13,320 voalamina ho sokajy 101. Ireo sokajy 101 ireo dia mizara ho sokajy dimy: ny fihetsehan’ny vatana, ny fifandraisan’ny olombelona amin’ny olombelona, ny fifampikasohana amin’ny olona, ny filalaovana zava-maneno ary ny fanatanjahantena.
Avy amin'ny YouTube ireo horonan-tsary ary maharitra 27 ora.
23. Audioset
Audioset dia angon-drakitra hetsika am-peo ahitana fizarana horonan-tsary 2 segondra 10 tapitrisa mahery voamariky ny olombelona. Mba hanamarihana an'io angona io dia ampiasaina ny ontologie ambaratonga misy karazana hetsika 632, izay midika fa ny feo iray ihany no azo lazaina amin'ny fomba hafa.
24. Stanford Natural Language Inference
Ny angon-drakitra SNLI (Stanford Natural Language Inference) dia misy fehezanteny 570 miaraka amin'ny fehezan-teny nosokajiana ho toy ny entailment, fifanoherana, na tsy miandany.
Ny toerana dia famariparitana sary ao amin'ny Flickr30k, raha ny vinavina kosa dia novolavolain'ireo mpanadihady avy amin'ny vahoaka izay nomena tombam-bidy ary nomena toromarika mba hamoronana fanambarana manafintohina, mifanohitra ary tsy miandany.
25. Fanontaniana hita maso
Visual Question Answering (VQA) dia angon-drakitra misy fanontaniana misokatra momba ny sary. Mba hamaliana ireo fanontaniana ireo, dia mila mahazo ny fahitana sy ny fiteny ary ny saina ianao.
Famaranana
Satria ny fianarana milina sy ny faharanitan-tsaina artifisialy (AI) dia mihamitombo saika amin'ny orinasa rehetra sy amin'ny fiainantsika andavanandro, dia mitombo koa ny isan'ny loharanon-karena sy fampahalalana azo momba izany.
Ny angon-drakitra ho an'ny daholobe efa vonona dia manome toerana fanombohana tsara amin'ny famolavolana maodely AI ary mamela ny mpandrindra ML efa za-draharaha mba hamonjy fotoana sy hifantoka amin'ireo singa hafa amin'ny tetikasany.
Leave a Reply