Преглед садржаја[Сакрити][Прикажи]
- 1. Скуп података атрибута ЦелебФацес
- 2. ДОТА
- 3. Скуп података за поређење Гоогле израза лица
- 4. Визуелни геном
- 5. ЛибриСпеецх
- 6. Градски простори
- 7. Кинетички скуп података
- 8. ЦелебАМаск-ХК
- 9. Пенн Треебанк
- 10. ВокЦелеб
- 11. СИКСраи
- 12. Несреће у САД
- 13. Препознавање очних болести
- 14. Болести срца
- 15. ЦЛЕВР
- 16. Универзалне зависности
- 17. КИТТИ – 360
- 18. МОТ (праћење више објеката)
- 19. ПАСЦАЛ 3Д+
- 20. Деформабилни модели лица животиња
- 21. МПИИ Хуман Пост Датасет
- 22. УЦФ101
- 23. Аудиосет
- 24. Станфордско закључивање природног језика
- 25. Одговарање на визуелно питање
- Zakljucak
Данас је већина нас фокусирана на развој машинског учења и АИ модела и решавање проблема користећи тренутне скупове података. Али прво, морамо дефинисати скуп података, његов значај и његову улогу у развоју јаких АИ и МЛ решења.
Данас имамо мноштво скупова података отвореног кода на којима можемо да спроводимо истраживање или развијамо апликације за решавање стварних проблема у различитим секторима.
Међутим, недостатак висококвалитетних квантитативних скупова података је извор забринутости. Подаци су изузетно порасли и наставиће да се шире бржом брзином у будућности.
У овом посту ћемо покрити слободно доступне скупове података које можете користити за развој вашег следећег АИ пројекта.
1. Скуп података атрибута ЦелебФацес
ЦелебФацес Аттрибутес Датасет (ЦелебА) садржи преко 200 фотографија славних личности и 40 атрибута за сваку слику, што га чини одличном полазном тачком за пројекте као што су препознавање лица, препознавање лица, локализација оријентира (или компоненте лица) и уређивање и синтеза лица. Штавише, фотографије у овој колекцији садрже широк спектар варијанти положаја и нереда позадине.
2. ДОТА
ДОТА (скуп података од Објецт Детецтион ин Аериал Пхотос) је скуп података великих размера за детекцију објеката који укључује 15 уобичајених категорија (нпр. брод, авион, аутомобил, итд.), 1411 слика за обуку и 458 слика за валидацију.
3. Скуп података за поређење Гоогле израза лица
Гоогле скуп података за поређење израза лица садржи око 500,000 тројки слика, укључујући 156,000 фотографија лица. Вреди напоменути да је сваки триплет у овом скупу података означен са најмање шест људи.
Овај скуп података је користан за пројекте који укључују анализу израза лица, као што је проналажење слика на основу израза, категоризација емоција, синтеза израза итд. Да бисте добили приступ скупу података, морате попунити кратак образац.
4. Визуелни геном
Подаци за одговор на визуелна питања у окружењу са више избора доступни су у Висуал Геноме-у. Састоји се од 101,174 МСЦОЦО фотографије са 1.7 милиона КА парова, са просечно 17 питања по слици.
У поређењу са скупом података Висуал Куестион Ансверинг, скуп података визуелног генома има праведнију дистрибуцију у шест типова питања: Шта, Где, Када, Ко, Зашто и Како.
Поред тога, скуп података Висуал Геноме укључује 108 фотографија које су јако означене објектима, својствима и везама.
5. ЛибриСпеецх
Корпус ЛибриСпеецх је колекција од око 1,000 сати аудио књига из пројекта ЛибриВок. Већина аудио књига потиче из пројекта Гутенберг.
Подаци за обуку су подељени у три партиције од 100, 360 и 500 сати, док су подаци за развој и тестирање отприлике 5 сати у аудио дужини.
6. Тхе Цитиспацес
Једна од најпознатијих великих база података стерео видео записа са урбаним погледима се зове Тхе Цитисцапес.
Са напоменама тачним у пикселима које укључују ГПС локације, спољашњу температуру, податке о его-кретању и праве стерео перспективе, укључује снимке из 50 различитих немачких градова.
7. Кинетицс Датасет
Један од најпознатијих видео скупова података за препознавање људских активности у великом обиму и доброг квалитета је Кинетицс сет података. Постоји најмање 600 видео клипова за сваки од 600 часова људских активности, укупно преко 500,000.
Филмови су повучени са Јутјуба; свака од њих траје око 10 секунди и има само једну наведену класу активности.
8. ЦелебАМаск-ХК
ЦелебАМаск-ХК је колекција од 30,000 фотографија лица високе резолуције са пажљиво означеним маскама и 19 класа које укључују компоненте лица као што су кожа, нос, очи, обрве, уши, уста, усне, коса, шешир, наочаре, минђуше, огрлица, врат, материјал.
Скуп података се може користити за тестирање и обуку за препознавање лица, рашчлањивање лица и ГАН-ове за алгоритме за генерисање и уређивање лица.
9. Пенн Треебанк
Један од најистакнутијих и најчешће коришћених корпуса за процену модела за означавање секвенци је енглески корпус Пенн Треебанк (ПТБ), посебно део корпуса који одговара чланцима Валл Стреет Јоурнал-а.
Свака реч мора имати свој део говора означен као компонента задатка. Ниво карактера и ниво речи језичко моделовање такође често користи корпус.
КСНУМКС. ВокЦелеб
ВокЦелеб је велики скуп података за идентификацију говора који се аутоматски генерише из медији отвореног кода. ВокЦелеб има преко милион изговора са преко 6к звучника.
Пошто скуп података укључује аудио-визуелне, може се користити за разне додатне апликације, укључујући визуелну синтезу говора, раздвајање говора, међумодални пренос са лица на глас или обрнуто, и обуку за препознавање лица са видео снимка као допуну тренутног препознавања лица скупови података.
КСНУМКС. СИКСраи
СИКСраи скуп података укључује 1,059,231 рендгенску слику прикупљену са станица метроа и обележену од стране инспектора људске безбедности за откривање шест главних врста забрањених предмета: пиштољи, ножеви, кључеви, клијешта, маказе и чекићи. Штавише, гранични оквири за сваку недозвољену ставку су ручно додати скуповима за тестирање како би се проценио учинак локализације објекта.
КСНУМКС. УС Аццидентс
Суштина пројекта је већ откривена именом скупа података, УС Аццидентс. Овај скуп података о аутомобилским несрећама широм земље укључује информације од фебруара 2016. до децембра 2021. и покрива 49 држава у САД.
У овој колекцији сада је присутно око 1.5 милиона записа о незгодама. Прикупљен је у реалном времену коришћењем неколико саобраћајних АПИ-ја.
Ови АПИ-ји преносе информације о саобраћају прикупљене из различитих извора, укључујући саобраћајне камере, организације за спровођење закона и одељења за саобраћај САД и државе.
КСНУМКС. Препознавање очних болести
Организована офталмолошка база података Оцулар Дисеасе Интеллигент Рецогнитион (ОДИР) садржи информације о 5,000 пацијената, укључујући њихову старост, боју фундуса левог и десног ока и дијагностичке кључне речи медицинских стручњака.
Овај скуп података је стварна збирка података о пацијентима из различитих болница и медицинских установа у Кини које је купио Сханггонг Медицал Тецхнологи Цо., Лтд. Витх управљање контролом квалитета, напомене су означили вешти људски читаоци.
КСНУМКС. Болест срца
Овај скуп података о срчаним болестима помаже у идентификацији постојања срчане болести код пацијента на основу 76 параметара као што су старост, пол, врста бола у грудима, крвни притисак у мировању итд.
Са 303 случаја, база података настоји једноставно разликовати постојање болести (вредност 1,2,3,4) од њеног одсуства (вредност 0).
КСНУМКС. ЦЛЕВР
ЦЛЕВР скуп података (композицијски језик и елементарно визуелно резоновање) опонаша визуелно одговарање на питања. Састоји се од фотографија 3Д приказаних објеката, при чему је свака фотографија праћена низом висококомпозиционих питања подељених у неколико категорија.
За све слике и питања о обуци и валидацији, скуп података садржи 70,000 фотографија и 700,000 питања за обуку, 15,000 слика и 150,000 питања за валидацију и 15,000 слика и 150,000 питања за тестирање која укључују објекте, одговоре, функционалне графове програма.
КСНУМКС. Универзалне зависности
Пројекат Универзалне зависности (УД) има за циљ да створи међујезички уједначену морфологију и анотацију стабла синтаксе за многе језике. Верзија 2.7, која је објављена 2020. године, има 183 стабла на 104 језика.
Белешка се састоји од универзалних ПОВ ознака, глава зависности и универзалних ознака зависности.
КСНУМКС. КИТТИ – 360
Један од најчешће коришћених скупова података за мобилне роботе и аутономна вожња је КИТТИ (Технолошки институт Карлсруе и Тојотин технолошки институт).
Састоји се од сценарија саобраћаја у вредности од сати који су снимљени коришћењем низа модалитета сензора, као што су РГБ високе резолуције, стерео и 3Д ласерске камере за скенирање. Скуп података је временом побољшано од стране неколико истраживача који су ручно означили различите његове делове како би одговарали њиховим потребама.
КСНУМКС. МОТ (праћење више објеката)
МОТ (Праћење више објеката) је скуп података за праћење више објеката који укључује унутрашње и спољашње пејзаже јавних локација које укључују пешаке као објекте од интереса. Видео сваке сцене је подељен на два дела, један за обуку, а други за тестирање.
Скуп података укључује детекције објеката у видео оквирима користећи три детектора: СДП, Фастер-РЦНН и ДПМ.
КСНУМКС. ПАСЦАЛ 3Д+
Пасцал3Д+ скуп података са више приказа састоји се од фотографија прикупљених у дивљини, тј. слика категорија артикала са великом варијабилности, снимљених у неконтролисаним околностима, у пренасељеном окружењу и на различитим позицијама. Пасцал3Д+ укључује 12 категорија крутих објеката извучених из скупа података ПАСЦАЛ ВОЦ 2012.
Ове ставке имају означене информације о положају (азимут, надморска висина и удаљеност до камере). Пасцал3Д+ додатно укључује фотографије означене позом из ИмагеНет колекције у ових 12 категорија.
КСНУМКС. Фациални деформабилни модели животиња
Циљ пројекта Фациал Деформабле Моделс оф Анималс (ФДМА) је да изазове постојеће методологије у идентификацији и праћењу оријентира на људском лицу и да развије нове алгоритме који могу да се носе са знатно већом варијабилности која је карактеристична за карактеристике лица животиња.
Алгоритми пројекта показали су способност препознавања и праћења оријентира на људским лицима док се баве варијацијама изазваним променама у емоцијама или положајима лица, делимичним оклузијама и осветљењем.
КСНУМКС. МПИИ скуп података људских постова
МПИИ скуп података људске позе садржи око 25 фотографија, од којих је 15 узорака за обуку, од којих су 3К узорци за валидацију, а 7К су узорци за тестирање.
Положаји су ручно означени са до 16 телесних зглобова, а фотографије су преузете са ИоуТубе филмова који покривају 410 различитих људских активности.
КСНУМКС. УЦФ101
УЦФ101 скуп података садржи 13,320 видео клипова организованих у 101 категорију. Ових 101 категорија подељена је у пет категорија: покрети тела, интеракције човека и човека, интеракције човека и објекта, свирање музичких инструмената и спорт.
Видео снимци су са ИоуТубе-а и трају 27 сати.
КСНУМКС. Аудиосет
Аудиосет је скуп података о аудио догађајима који се састоји од преко 2 милиона 10-секундних видео сегмената означених људима. За означавање ових података користи се хијерархијска онтологија која садржи 632 типа догађаја, што имплицира да исти звук може бити различито означен.
КСНУМКС. Станфордски закључак о природном језику
СНЛИ скуп података (Станфорд Натурал Лангуаге Инференце) садржи 570 парова реченица које су ручно категорисане као последица, контрадикција или неутрална.
Премисе су описи слика на Флицкр30к, док су хипотезе развили анотатори из гомиле који су добили премису и добили инструкције да генеришу садршке, контрадикторне и неутралне изјаве.
КСНУМКС. Одговарање на визуелно питање
Висуал Куестион Ансверинг (ВКА) је скуп података који садржи отворена питања у вези са сликама. Да бисте одговорили на ова питања, морате схватити визију, језик и здрав разум.
Zakljucak
Како машинско учење и вештачка интелигенција (АИ) постају све присутнији у практично сваком послу иу нашем свакодневном животу, тако расте и број ресурса и информација доступних на ту тему.
Готови јавни скупови података пружају одличну полазну тачку за развој АИ модела, а истовремено омогућавају искусним МЛ програмерима да уштеде време и фокусирају се на друге елементе својих пројеката.
Ostavite komentar