Змест[Схаваць][Паказаць]
Адной з самых простых, але найбольш інтрыгуючых ідэй глыбокага навучання з'яўляецца выяўленне аб'ектаў. Фундаментальная ідэя складаецца ў тым, каб падзяліць кожны элемент на паслядоўныя класы, якія прадстаўляюць супастаўныя рысы, а затым намаляваць вакол яго рамку.
Гэтыя адметныя характарыстыкі могуць быць такімі ж простымі, як форма або колер, што дапамагае ў нашай здольнасці класіфікаваць іх.
Прыкладанні выяўленне аб'екта шырока прымяняюцца ў медыцынскіх навуках, аўтаномным кіраванні аўтамабілем, абароне і ваенным, дзяржаўным кіраванні і многіх іншых галінах дзякуючы істотным паляпшэнням камп'ютэрнага зроку і апрацоўкі малюнкаў.
Тут у нас ёсць MMDetection, фантастычны набор інструментаў для выяўлення аб'ектаў з адкрытым зыходным кодам, створаны на аснове Pytorch. У гэтым артыкуле мы дэталёва разгледзім MMDetection, пазнаёмімся з ім практычна, абмяркуем яго магчымасці і многае іншае.
Што такое Выяўленне MMD?
,en Выяўленне MMD toolbox быў створаны як кодавая база Python спецыяльна для праблем, звязаных з ідэнтыфікацыяй аб'ектаў і сегментацыяй асобнікаў.
Выкарыстоўваецца рэалізацыя PyTorch, і яна створана ў модульнай форме. Для распазнання аб'ектаў і сегментацыі асобнікаў шырокі спектр эфектыўных мадэляў быў сабраны ў розныя метадалогіі.
Гэта дазваляе эфектыўныя высновы і хуткае навучанне. З іншага боку, набор інструментаў уключае вагі для больш чым 200 папярэдне падрыхтаваных сетак, што робіць яго хуткім выпраўленнем у полі ідэнтыфікацыі аб'ектаў.
Маючы магчымасць адаптаваць сучасныя метады або стварыць новы дэтэктар з дапамогай даступных модуляў, MMDetection функцыянуе як эталон.
Ключавой асаблівасцю панэлі інструментаў з'яўляецца ўключэнне простых, модульных частак ад звычайнага выяўленне аб'ектаў каркас, які можна выкарыстоўваць для стварэння унікальных канвеераў або унікальных мадэляў.
Магчымасці эталоннага аналізу гэтага набору інструментаў дазваляюць лёгка стварыць новую структуру дэтэктара на аснове існуючай і параўнаць яе прадукцыйнасць.
Асаблівасці
- Папулярныя і сучасныя структуры выяўлення, такія як Faster RCNN, Mask RCNN, RetinaNet і г.д., непасрэдна падтрымліваюцца наборам інструментаў.
- Выкарыстанне 360+ падрыхтаваных мадэляў для тонкай налады (або навучання нанова).
- Для добра вядомых набораў дадзеных бачання, уключаючы COCO, Cityscapes, LVIS і PASCAL VOC.
- На графічных працэсарах выконваюцца ўсе фундаментальныя аперацыі bbox і маскі. Іншыя кодавыя базы, такія як Detectron2, maskrcnn-benchmark і SimpleDet, можна навучаць з большай хуткасцю, чым гэтая.
- Даследчыкі разбіваюць выяўленне аб'ектаў структуру на некалькі модуляў, якія затым можна аб'яднаць для стварэння унікальнай сістэмы выяўлення аб'ектаў.
Архітэктура MMDetection
MMDetection вызначае агульны дызайн, які можа быць ужыты да любой мадэлі, паколькі гэта набор інструментаў з мноствам гатовых мадэляў, кожная з якіх мае ўласную архітэктуру. Наступныя кампаненты складаюць гэтую агульную архітэктуру:
- Пазваночнік: магістраль, такая як ResNet-50 без канчатковага цалкам злучанага ўзроўню, з'яўляецца кампанентам, які пераўтворыць малюнак у карты аб'ектаў.
- шыя: Шыя - гэта сегмент, які злучае пазваночнік з галовамі. На неапрацаваных картах функцый магістралі выконваюцца пэўныя карэкціроўкі або рэканфігурацыі. Функцыя Pyramid Network - адна ілюстрацыя (FPN).
- Густагаловы (AnchorHead/AnchorFreeHead): гэта кампанент, які працуе на шчыльных абласцях карт функцый, такіх як AnchorHead і AnchorFreeHead, такіх як RPNHead, RetinaHead і FCOSHead.
- RoIExtractor: з выкарыстаннем аператараў, падобных на RoIPooling, гэта раздзел, які выцягвае функцыі RoIwise з адной або калекцыі карт функцый. Узор SingleRoIExtractor здабывае функцыі RoI з адпаведнага ўзроўню пірамід функцый.
- RoIHead (BBoxHead/MaskHead): гэта частка сістэмы, якая выкарыстоўвае характарыстыкі рэнтабельнасці інвестыцый у якасці ўваходных дадзеных і стварае прагнозы на аснове рэнтабельнасці інвестыцый для канкрэтных задач, такія як класіфікацыя/рэгрэсія абмежавальнай рамкі і прагназаванне па масцы.
Канструкцыя аднакаскадных і двухкаскадных дэтэктараў ілюструецца з дапамогай вышэйзгаданых паняццяў. Мы можам распрацаваць нашы ўласныя працэдуры, проста стварыўшы некалькі свежых частак і аб'яднаўшы некаторыя існуючыя.
Спіс мадэляў, уключаных у MMDetection
MMDetection забяспечвае першакласныя кодавыя базы для некалькіх вядомых мадэляў і задачна-арыентаваных модуляў. Мадэлі, якія былі зроблены раней, і адаптыўныя метады, якія можна выкарыстоўваць з наборам інструментаў MMDetection, пералічаны ніжэй. Спіс расце па меры дадання новых мадэляў і метадаў.
- Хуткі R-CNN
- Больш хуткі R-CNN
- Маска R-CNN
- RetinaNet
- DCN
- DCNv2
- Каскад R-CNN
- M2Det
- GHM
- ScratchDet
- Двухгаловы R-CNN
- Сетка R-CNN
- ФСАФ
- Шалі R-CNN
- GCNet
- HRNet
- Ацэнка маскі R-CNN
- FCOS
- SSD
- R-FCN
- Навучанне змешанай дакладнасці
- Стандартызацыя вагі
- Гібрыдны каскад задач
- Кіраванае замацаванне
- Абагульненая ўвага
Пабудова мадэлі выяўлення аб'екта з дапамогай MMDetection
У гэтым уроку мы будзем выкарыстоўваць нататнік для сумеснай працы Google, таму што яго лёгка наладзіць і выкарыстоўваць.
ўстаноўка
Каб усталяваць усё неабходнае, мы спачатку ўсталюем неабходныя бібліятэкі і кланіруем праект MMdetection GitHub.
Імпарт env
Асяроддзе для нашага праекта цяпер будзе імпартавана з рэпазітара.
Імпарт бібліятэк і MMdetection
Цяпер мы імпартуем неабходныя бібліятэкі разам з MMdetection, вядома.
Спампаваць папярэдне падрыхтаваныя кантрольныя кропкі
Папярэдне падрыхтаваныя кантрольныя кропкі мадэлі з MMdetection цяпер трэба загрузіць для далейшай карэкціроўкі і высновы.
Мадэль будынка
Зараз мы пабудуем мадэль і прыменім кантрольныя кропкі да набору даных.
Вывад дэтэктара
Цяпер, калі мадэль правільна пабудавана і загружана, давайце праверым, наколькі яна выдатная. Мы выкарыстоўваем высокаўзроўневы дэтэктар высновы API MMDetection. Гэты API быў распрацаваны, каб палегчыць працэс высновы.
Вынік
Давайце паглядзім на вынікі.
заключэнне
У заключэнне, набор інструментаў MMDetection пераўзыходзіць нядаўна выпушчаныя кодавыя базы, такія як SimpleDet, Detectron і Maskrcnn-benchmark. З вялікай калекцыяй мадэляў,
MMDetection цяпер з'яўляецца самай сучаснай тэхналогіяй. MMDetection пераўзыходзіць усе іншыя кодавыя базы з пункту гледжання эфектыўнасці і прадукцыйнасці.
Адна з самых прыемных рэчаў у MMdetection заключаецца ў тым, што цяпер вы можаце проста паказаць на іншы файл канфігурацыі, загрузіць іншую кантрольную кропку і запусціць той жа код, калі хочаце змяніць мадэлі.
Раю паглядзець на іх інструкцыі калі вы сутыкнуліся з праблемамі на любым з этапаў або хочаце выканаць некаторыя з іх па-іншаму.
Пакінуць каментар