Мундариҷа[Пинҳон кардан][Намоиш]
- 1. Маҷмӯаи аттрибутҳои CelebFaces
- 2. DOTA
- 3. Маҷмӯаи муқоисаи Google Facial Expression
- 4. Геном визуалӣ
- 5. LibriSpeech
- 6. Фазоҳои шаҳрӣ
- 7. Маҷмӯи маълумоти кинетикӣ
- 8. CelebAMask-HQ
- 9. Пенн Трибанк
- 10. VoxCeleb
- 11. SIXray
- 12. Садамаҳои ИМА
- 13. Шиносоии бемориҳои чашм
- 14. Бемории дил
- 15. CLEVR
- 16. Вобастагии универсалӣ
- 17. КИТТИ – 360
- 18. MOT (пайгирии якчанд объект)
- 19. PASCAL 3D+
- 20. Моделҳои деформатсияшавандаи чеҳраи ҳайвонот
- 21. Маҷмӯи маълумоти MPII Post Human
- 22. UCF101
- 23. Маҷмӯаи аудио
- 24. Хулосаи забони табиии Стэнфорд
- 25. Ҷавоб ба саволҳои визуалӣ
- хулоса
Имрӯзҳо, аксарияти мо ба таҳияи моделҳои омӯзиши мошинсозӣ ва AI ва ҳалли мушкилот бо истифода аз маҷмӯаҳои додаҳои ҷорӣ нигаронида шудааст. Аммо аввал, мо бояд маҷмӯи додаҳо, аҳамияти он ва нақши онро дар таҳияи қарорҳои қавии AI ва ML муайян кунем.
Имрӯз, мо миқдори зиёди маълумотҳои кушодаасос дорем, ки дар онҳо тадқиқот гузаронем ё барномаҳоро барои ҳалли масъалаҳои воқеии бахшҳои гуногун таҳия кунем.
Бо вуҷуди ин, нарасидани маҷмӯаҳои миқдории баландсифат манбаи ташвиш аст. Маълумот хеле афзоиш ёфтааст ва дар оянда бо суръати тезтар густариш хоҳад ёфт.
Дар ин паём, мо маҷмӯаҳои дастраси озодро фаро хоҳем гирифт, ки шумо метавонед барои таҳияи лоиҳаи навбатии AI-и худ истифода баред.
1. Маҷмӯи маълумотҳои атрибутҳои CelebFaces
CelebFaces Attributes Dataset (CelebA) дорои зиёда аз 200 ҳазор аксҳои машҳур ва 40 шарҳи атрибутҳо барои ҳар як тасвир мебошад, ки онро барои лоиҳаҳо, аз қабили оғози олӣ табдил медиҳад. шинохти чеҳра, муайянкунии чеҳра, маҳаллисозии нишона (ё ҷузъи чеҳра) ва таҳрир ва синтези чеҳра. Ғайр аз он, аксҳои ин маҷмӯа дорои доираи васеи вариантҳои мавқеъ ва бесарусомонии замина мебошанд.
2. DOTA
DOTA (Маҷмӯи маълумоти Муайян кардани объект дар Суратҳои ҳавоӣ) маҷмӯи маълумотҳои васеъмиқёс барои муайянкунии объект мебошад, ки 15 категорияи умумӣ (масалан, киштӣ, ҳавопаймо, мошин ва ғайра), 1411 тасвир барои омӯзиш ва 458 тасвирро барои санҷиш дар бар мегирад.
3. Маҷмӯаи муқоисаи Google Facial Expression
Маҷмӯаи муқоисаи ифодаи чеҳраи Google тақрибан 500,000 156,000 сегонаи расм, аз ҷумла XNUMX XNUMX акси чеҳраро дар бар мегирад. Қобили зикр аст, ки ҳар як сегона дар ин маҷмӯаи маълумот ҳадди аққал шаш баҳодиҳии инсонӣ шарҳ дода шудааст.
Ин маҷмӯаи додаҳо барои лоиҳаҳои марбут ба таҳлили ифодаи чеҳра, аз қабили ҷустуҷӯи тасвир дар асоси ифода, гурӯҳбандии эҳсосот, синтези ифода ва ғайра муфид аст. Барои дастрасӣ ба маҷмӯаи додаҳо, як шакли мухтасар бояд пур карда шавад.
4. Геном визуалӣ
Ҷавоби саволҳои визуалӣ маълумот дар муҳити бисёр интихоб дар Visual Genome дастрас аст. Он аз 101,174 акси MSCOCO бо 1.7 миллион ҷуфт QA иборат аст, ки ба ҳисоби миёна 17 савол барои як тасвир аст.
Дар муқоиса бо маҷмӯаи додаҳои визуалӣ ба саволҳои ҷавоб, маҷмӯи додаҳои Visual Genome дар шаш намуди саволҳо тақсимоти одилонатар дорад: Чӣ, Дар куҷо, Кай, Кӣ, Чаро ва Чӣ тавр.
Илова бар ин, маҷмӯаи маълумоти Visual Genome дорои 108К аксҳо мебошад, ки бо объектҳо, хосиятҳо ва пайвастҳо ба таври ҷиддӣ қайд карда шудаанд.
5. LibriSpeech
Корпуси LibriSpeech маҷмӯи тақрибан 1,000 соат китобҳои аудиоӣ аз лоиҳаи LibriVox мебошад. Аксарияти китобҳои аудиоӣ аз лоиҳаи Гутенберг сарчашма мегиранд.
Маълумоти омӯзишӣ ба се қисм аз маҷмӯи 100 соат, 360 соат ва 500 соат тақсим карда мешавад, дар ҳоле ки маълумоти таҳиякунанда ва санҷишӣ тақрибан 5 соат дарозии аудио доранд.
6. Фазоҳои шаҳрӣ
Яке аз маъруфтарин пойгоҳи додаҳои васеъмиқёси видеоҳои стерео бо манзараҳои шаҳрӣ The Cityscapes номида мешавад.
Бо эзоҳҳои дақиқи пиксел, ки маконҳои GPS, ҳарорати берунӣ, маълумоти ҳаракати ego ва дурнамои дурусти стереоро дар бар мегиранд, он сабтҳоро аз 50 шаҳри алоҳидаи Олмон дар бар мегирад.
7. Маҷмӯи маълумоти кинетикӣ
Яке аз маҷмӯаҳои маъруфи видеоӣ барои эътирофи фаъолияти инсон дар миқёси калон ва бо сифати хуб маҷмӯи додаҳои Кинетика мебошад. Барои ҳар як аз 600 синфи фаъолияти инсон ҳадди аққал 600 видеоклип мавҷуд аст, ки дар маҷмӯъ зиёда аз 500,000 аст.
Филмҳо аз YouTube гирифта шуданд; Ҳар яки онҳо тақрибан 10 сония тӯл мекашад ва танҳо як синфи фаъолият дар рӯйхат аст.
8. CelebAMask-HQ
CelebAMask-HQ маҷмӯаи 30,000 аксҳои баландсифати чеҳра бо ниқобҳои бодиққат шарҳ додашуда ва 19 синф мебошад, ки ҷузъҳои чеҳраро ба мисли пӯст, бинӣ, чашмҳо, абрӯҳо, гӯшҳо, даҳон, лаб, мӯй, кулоҳ, айнак, гӯшвора, гарданбанд, гардан, мавод.
Маҷмӯи додаҳо метавонад барои озмоиш ва омӯзиши шинохти чеҳра, таҳлили чеҳра ва GANҳо барои алгоритмҳои тавлид ва таҳрири чеҳра истифода шавад.
9. Пенн Трибанк
Яке аз корпусҳои барҷастатарин ва аксаран истифодашаванда барои арзёбии моделҳо барои тамғагузории пайдарпай ин корпуси англисии Penn Treebank (PTB) мебошад, бахусус қисми корпуси мувофиқ ба мақолаҳои Wall Street Journal.
Ҳар як калима бояд қисми нутқи худро ҳамчун ҷузъи вазифа нишон диҳад. Дараҷаи аломат ва сатҳи калима моделсозии забон корпусро низ тез-тез истифода мебарад.
10. VoxCeleb
VoxCeleb як маҷмӯаи бузурги идентификатсияи нутқ аст, ки ба таври худкор аз васоити ахбори оммаи кушода. VoxCeleb дорои беш аз як миллион изҳорот аз беш аз 6к сухангӯ мебошад.
Азбаски маҷмӯаи маълумот аудио-визуалиро дар бар мегирад, он метавонад барои барномаҳои гуногуни иловагӣ, аз ҷумла синтези нутқи визуалӣ, ҷудокунии нутқ, интиқоли кроссмодалӣ аз рӯй ба овоз ё баръакс ва омӯзиши шинохти чеҳра аз видео барои такмил додани шинохти ҷории чеҳра истифода шавад. маҷмӯи маълумот.
11. SIXray
Маҷмӯи маълумоти SIXray 1,059,231 тасвири рентгениро дар бар мегирад, ки аз истгоҳҳои метро ҷамъоварӣ шудаанд ва аз ҷониби нозирони амнияти инсонӣ шарҳ дода шудаанд, то шаш намуди асосии ашёи мамнӯъро ошкор кунанд: таппонча, корд, калидҳо, анбӯр, кайчи ва болға. Ғайр аз он, қуттиҳои маҳдудкунанда барои ҳар як ашёи иҷозатдодашуда ба маҷмӯаҳои санҷишӣ ба таври дастӣ илова карда шудаанд, то баҳодиҳии иҷрои маҳаллисозии объектҳо.
12. Садамаҳои ИМА
Моҳияти лоиҳа аллакай бо номи маҷмӯаи маълумот, садамаҳои ИМА ошкор шудааст. Ин маҷмӯаи маълумот дар бораи садамаҳои автомобилии умумимиллӣ маълумотро аз феврали соли 2016 то декабри соли 2021 дар бар мегирад ва 49 иёлоти ИМА-ро дар бар мегирад.
Ҳоло дар ин маҷмӯа тақрибан 1.5 миллион сабтҳои садамаҳо мавҷуданд. Он дар вақти воқеӣ тавассути истифодаи якчанд API-ҳои трафик ҷамъ карда шуд.
Ин APIҳо иттилооти трафикро, ки аз сарчашмаҳои гуногун ҷамъ оварда шудаанд, интиқол медиҳанд, аз ҷумла камераҳои трафик, созмонҳои ҳифзи ҳуқуқ ва департаментҳои ИМА ва иёлоти нақлиёт.
13. Шиносоии бемориҳои чашм
Пойгоҳи муташаккили офталмологии ташхиси зеҳнии чашм (ODIR) дорои маълумот дар бораи 5,000 бемор, аз ҷумла синну соли онҳо, ранги чашмони чап ва рости онҳо ва калимаҳои калидии ташхиси мутахассисони соҳаи тиб мебошад.
Ин маҷмӯаи маълумот маҷмӯи воқеии маълумоти беморон аз беморхонаҳо ва муассисаҳои тиббии Чин мебошад, ки Shanggong Medical Technology Co., Ltd. ба даст овардааст. Бо идоракунии назорати сифат, эзоҳҳо аз ҷониби хонандагони бомаҳорат нишон дода шудаанд.
14. Heart бемори
Ин маҷмӯаи маълумоти бемориҳои дил барои муайян кардани мавҷудияти бемории дил дар бемор дар асоси 76 параметр ба монанди синну сол, ҷинс, намуди дарди қафаси сина, фишори хуни ором ва ғайра кӯмак мекунад.
Бо 303 ҳолат, пойгоҳи додаҳо кӯшиш мекунад, ки мавҷудияти бемориро (қимати 1,2,3,4) аз набудани он (қимати 0) фарқ кунад.
15. CLEVR
Маҷмӯи додаҳои CLEVR (Забони таркибӣ ва мулоҳизаҳои визуалӣ) ба Ҷавоби визуалӣ ба саволҳо тақлид мекунад. Он аз аксҳои объектҳои 3D-редернершуда иборат аст, ки ҳар як акс бо як қатор саволҳои хеле композитсия ба якчанд категорияҳо тақсим карда мешавад.
Барои ҳама расмҳо ва саволҳо оид ба омӯзиш ва санҷиш, маҷмӯаи маълумот аз 70,000 акс ва 700,000 савол барои омӯзиш, 15,000 тасвир ва 150,000 савол барои тасдиқ ва 15,000 тасвир ва 150,000 савол барои санҷиш бо объектҳо, ҷавобҳо, графикҳои функсионалии саҳна ва ғайра иборат аст.
16. Вобастагии универсалӣ
Лоиҳаи Universal Dependencies (UD) ҳадафи эҷоди як аннотацияи дарахтонии морфология ва синтаксиси байнизабонӣ барои бисёр забонҳо мебошад. Версияи 2.7, ки соли 2020 бароварда шудааст, дорои 183 дарахти дарахтон ба 104 забон мебошад.
Эзоҳ аз барчаспҳои универсалии POW, сарлавҳаҳои вобастагӣ ва тамғакоғазҳои универсалии вобастагӣ иборат аст.
17. КИТТИ - 360
Яке аз маҷмӯаҳои маъмултарин барои роботҳои мобилӣ ва рондани автономӣ КИТТИ (Институти технологии Карлсруэ ва Институти технологии Toyota) мебошад.
Он аз сенарияҳои соатҳои трафик иборат аст, ки бо истифода аз як қатор усулҳои сенсорӣ, аз қабили RGB-и баландсифат, стерео хокистарӣ ва камераҳои сканери лазерии 3D гирифта шудаанд. Маҷмӯи маълумот бо гузашти вақт аз ҷониби якчанд муҳаққиқон такмил дода шуд, ки қисмҳои гуногуни онро ба таври дастӣ барои мувофиқ кардани ниёзҳои худ шарҳ доданд.
18. MOT (пайгирии якчанд объект)
MOT (Multiple Object Tracking) як маҷмӯаи додаҳо барои пайгирии сершумори объектҳо мебошад, ки манзараҳои дарунӣ ва берунии маконҳои ҷамъиятиро дар бар мегирад, ки пиёдагардонро ҳамчун объекти таваҷҷӯҳ дар бар мегиранд. Видеои ҳар як саҳна ба ду қисм тақсим мешавад, яке барои омӯзиш ва дигаре барои санҷиш.
Маҷмӯи маълумот дар бар мегирад ошкоркунии объект дар чаҳорчӯбаҳои видеоӣ бо истифода аз се детектор: SDP, Faster-RCNN ва DPM.
19. PASCAL 3D+
Маҷмӯи додаҳои бисёрҷанбаи Pascal3D+ аз аксҳое иборат аст, ки дар ваҳшӣ ҷамъоварӣ шудаанд, яъне тасвирҳои категорияҳои ашёи дорои тағирёбии баланд, ки дар ҳолатҳои беназорат, дар муҳити серодам ва мавқеъҳои гуногун гирифта шудаанд. Pascal3D+ 12 категорияи объекти сахтро дар бар мегирад, ки аз маҷмӯи додаҳои PASCAL VOC 2012 гирифта шудаанд.
Ин ашёҳо дорои маълумоти мавқеият дар онҳо (азимут, баландӣ ва масофа ба камера) мебошанд. Pascal3D+ ба таври илова аксҳои изофӣ аз коллексияи ImageNet дар ин 12 категорияро дар бар мегирад.
20. Моделҳои деформатсияшавандаи чеҳраи ҳайвонот
Ҳадафи лоиҳаи моделҳои деформатсияшавандаи чеҳраи ҳайвонот (FDMA) ин шубҳа кардан ба методологияҳои кунунӣ дар муайян ва пайгирии аломатҳои чеҳраи инсон ва таҳияи алгоритмҳои нав мебошад, ки метавонанд бо тағирёбии хеле калонтаре, ки хоси хусусиятҳои чеҳраи ҳайвонот мебошанд, мубориза баранд.
Алгоритмҳои лоиҳа қобилияти шинохтан ва пайгирии аломатҳои чеҳраи инсонро ҳангоми мубориза бо ихтилофҳое, ки дар натиҷаи тағирёбии эҳсосот ё мавқеъҳои чеҳра, пӯшиши қисман ва равшанӣ ба вуҷуд омадаанд, нишон доданд.
21. Маҷмӯи маълумоти MPII Post Human
Маълумоти MPII Human Pose тақрибан 25К аксро дар бар мегирад, ки 15К-и онҳо намунаҳои омӯзишӣ, 3К-и онҳо намунаҳои санҷиш ва 7К-и онҳо намунаҳои санҷишӣ мебошанд.
Мавқеъҳо то 16 буғумҳои баданро дастӣ нишон медиҳанд ва аксҳо аз филмҳои YouTube гирифта шудаанд, ки 410 фаъолияти гуногуни инсониро дар бар мегиранд.
22. UCF101
Маҷмӯи додаҳои UCF101 дорои 13,320 клипҳои видеоӣ мебошад, ки ба 101 категория тақсим карда шудаанд. Ин 101 категория ба панҷ категория тақсим шудааст: ҳаракатҳои бадан, муоширати инсон ва инсон, робитаи инсон бо ашё, навохтани асбобҳои мусиқӣ ва варзиш.
Видеоҳо аз YouTube гирифта шудаанд ва 27 соат давом мекунанд.
23. Маҷмӯаи аудио
Audioset маҷмӯаи додаҳои рӯйдодҳои аудиоӣ мебошад, ки аз зиёда аз 2 миллион сегментҳои видеоии 10 сония аз ҷониби инсон шарҳ дода шудааст. Барои шарҳи ин маълумот, онтологияи иерархӣ, ки 632 намуди ҳодисаро дар бар мегирад, истифода мешавад, ки маънои онро дорад, ки як садо метавонад ба таври дигар нишон дода шавад.
24. Хулосаи забони табиии Стэнфорд
Маҷмӯи додаҳои SNLI (Stanford Inference Language Natural Language) 570k ҷуфтҳои ҷумларо дар бар мегирад, ки ба таври дастӣ ҳамчун муқовимат, зиддият ё бетараф гурӯҳбандӣ шудаанд.
Биноҳо тавсифи тасвирҳои Flickr30k мебошанд, дар ҳоле ки гипотезаҳо аз ҷониби аннотаторҳои аз ҷониби издиҳом гирифташуда таҳия шуда буданд, ки бино пешниҳод карда шуданд ва дастур доданд, ки изҳоротҳои дорои, зиддиятнок ва бетарафро тавлид кунанд.
25. Ҷавоб ба саволҳои визуалӣ
Ҷавоби визуалӣ ба саволҳо (VQA) маҷмӯи маълумотест, ки дорои саволҳои кушода оид ба тасвирҳо мебошад. Барои ҷавоб додан ба ин саволҳо шумо бояд биниш, забон ва ақли солимро дарк кунед.
хулоса
Вақте ки омӯзиши мошинсозӣ ва зеҳни сунъӣ (AI) амалан дар ҳар як тиҷорат ва дар ҳаёти ҳаррӯзаи мо бештар паҳн мешавад, шумораи захираҳо ва иттилооти мавҷуд дар ин мавзӯъ зиёд мешавад.
Маҷмӯаҳои маълумоти оммавии омода барои таҳияи моделҳои AI як нуқтаи бузурги ибтидоӣ фароҳам меоранд ва инчунин ба барномасозони ботаҷриба имкон медиҳанд, ки вақтро сарфа кунанд ва ба дигар унсурҳои лоиҳаҳои худ тамаркуз кунанд.
Дин ва мазҳаб