Увод у ИОЛО: Детекција објеката у реалном времену

Преглед садржаја[Сакрити][Прикажи]

Дакле, шта је ИОЛО?
ИОЛО ради
Различите варијације ИОЛО-а+-
ИОЛО ограничења
Почните да користите ИОЛОв5
Zakljucak

Детекција објеката је врста категоризације слике у којој неуронска мрежа предвиђа ставке на слици и црта граничне оквире око њих. Откривање и локализација ствари на слици која је у складу са унапред постављеним скупом класа се назива детекција објеката.

Откривање објеката (познато и као препознавање објеката) је посебно значајан поддомен рачунарског вида јер задаци као што су откривање, идентификација и локализација налазе широку примену у контексту стварног света.

ИОЛО приступ вам може помоћи да обавите ове задатке. У овом есеју ћемо детаљније погледати ИОЛО, укључујући шта је то, како функционише, различите варијације и још много тога.

Дакле, шта је ИОЛО?

ИОЛО је метода за идентификацију и препознавање објеката у реалном времену на фотографијама. То је акроним за Иоу Онли Лоок Онце. Редмонд ет ал. предложио је приступ у раду који је првобитно објављен 2015. на ИЕЕЕ/ЦВФ конференцији о компјутерском виду и препознавању узорака (ЦВПР).

Лист је добио награду ОпенЦВ Пеопле'с Цхоице. За разлику од претходних метода идентификације објеката, који су пренаменили класификаторе за откривање, ИОЛО предлаже употребу енд-то-енд неуронска мрежа који истовремено предвиђа граничне кутије и вероватноће класа.

ИОЛО производи најсавременије резултате узимајући фундаментално нови приступ препознавању објеката, лако надмашујући претходне методе детекције објеката у реалном времену.

ИОЛО ради

ИОЛО метода дели слику на Н мрежа, свака са СкС димензионалним сектором једнаке величине. Свака од ових Н мрежа је задужена за откривање и лоцирање објекта који садржи.

ИОЛО Арцхитецтуре

Ове мреже, заузврат, предвиђају Б координате оквира у односу на координате ћелије, као и назив ставке и вероватноћу да је објекат присутан у ћелији. Због многих ћелија које предвиђају исту ставку са различитим предвиђањима граничних оквира, ова техника значајно смањује израчунавање јер и детекцијом и препознавањем рукују ћелије са слике.

Међутим, производи много дуплих предвиђања. Да би решио овај проблем, ИОЛО користи не-максимално потискивање. ИОЛО потискује све граничне оквире са нижим резултатима вероватноће у немаксималном потискивању.

ИОЛО то ради тако што испитује резултате вероватноће повезане са сваком опцијом и бира ону са највећим резултатом. Граничне кутије са највећим пресеком преко Уније са тренутном граничном кутијом велике вероватноће се тада потискују.

ИОЛО Воркинг

Овај процес се наставља све док се гранични оквири не заврше.

Различите варијације ИОЛО-а

Погледаћемо неке од најчешћих ИОЛО верзија. Хајде да почнемо.

1. ИОЛОв1

Почетна верзија ИОЛО објављена је 2015. године у публикацији „Гледате само једном: обједињена детекција објеката у реалном времену” Џозефа Редмона, Сантоша Диввале, Роса Гиршика и Алија Фархадија.

Због своје брзине, тачности и способности учења, ИОЛО је брзо доминирао у области идентификације објеката и постао најчешће коришћени алгоритам. Уместо да се баве откривањем објеката као проблемом класификације, аутори су му приступили као проблему регресије са географски одвојеним граничним оквирима и придруженим вероватноћама класа, који су решили користећи једну неуронска мрежа.

ИОЛОв1

ИОЛОв1 је обрађивао фотографије брзином од 45 кадрова у секунди у реалном времену, док је мања варијанта, Фаст ИОЛО, обрађивала при 155 кадрова у секунди и још увек је добијала дупло већу мапу од других детектора у реалном времену.

2. ИОЛОв2

Годину дана касније, 2016., Џозеф Редмон и Али Фархади објавили су ИОЛОв2 (такође познат као ИОЛО9000) у листу „ИОЛО9000: Боље, брже, јаче".

Капацитет модела да предвиди чак 9000 различитих категорија ставки док још увек ради у реалном времену донео му је ознаку 9000. Не само да је нова верзија модела истовремено обучена за скупове података за откривање објеката и класификацију, већ је добила и Даркнет-19 као нову основну линију модел.

ИОЛОв2

Пошто је ИОЛОв2 такође био велики успех и брзо је постао следећи најсавременији модел за препознавање објеката, други инжењери су почели да експериментишу са алгоритмом и производе сопствене, јединствене ИОЛО верзије. О некима од њих ће бити речи на различитим местима у раду.

3. ИОЛОв3

У листу „ИОЛОв3: Инкрементално побољшање,” Џозеф Редмон и Али Фархади објавили су нову верзију алгоритма 2018. Направљен је на архитектури Даркнет-53. Независни логистички класификатори заменили су софтмак активациони механизам у ИОЛОв3.

Бинарни губитак унакрсне ентропије је коришћен током тренинга. Даркнет-19 је побољшан и преименован у Даркнет-53, који сада има 53 конволуциона слоја. Осим тога, предвиђања су урађена на три различите скале, што је помогло ИОЛОв3 да побољша своју тачност у предвиђању ситних ствари.

ИОЛОв3

ИОЛОв3 је била последња ИОЛО верзија Џозефа Редмона, пошто је одлучио да не ради на даљим ИОЛО побољшањима (па чак ни у области компјутерског вида) како би избегао да његов рад има штетан утицај на свет. Сада се углавном користи као полазна тачка за конструисање јединствених архитектура за детекцију објеката.

4. Иолов4

Алексеј Бочковски, Чиен-Јао Ванг и Хонг-Јуан Марк Лиао објавили су „ИОЛОв4: Оптимална брзина и тачност детекције објеката” у априлу 2020., што је била четврта итерација ИОЛО алгоритма.

Пондерисане преостале везе, унакрсне-делимичне везе, нормализација унакрсних мини серија, само-конкурентна обука, мисх активација, пад блока и губитак ЦИоУ-а су уведени као део СПДаркнет53 архитектуре.

ИОЛОв4

ИОЛОв4 је потомак породице ИОЛО, међутим, развили су га одвојени научници (не Џозеф Редмон и Али Фархади). СПДаркнет53 кичма, просторно пирамидално удруживање, ПАНет агрегација путања као врат и ИОЛОв3 глава чине његову архитектуру.

Као последица тога, у поређењу са својим родитељем, ИОЛОв3, ИОЛОв4 постиже 10% већу просечну прецизност и 12% бољу метрику оквира у секунди.

5. ИОЛОв5

ИОЛОв5 је пројекат отвореног кода који укључује низ модела и алгоритама идентификације објеката заснованих на ИОЛО моделу који је претходно обучен на ЦОЦО скупу података.

ИОЛОв5 је колекција модела идентификације објеката у сложеној скали обучени за скуп података ЦОЦО, са лаким могућностима за ТТА, састављање модела, развој хиперпараметара и извоз у ОННКС, ЦореМЛ и ТФЛите. Пошто ИОЛОв5 не имплементира нити развија никакве јединствене приступе, формални документ није могао бити објављен. То је једноставно ИОЛОв3 ПиТорцх екстензија.

ИОЛОв5 Вариатионс

Ултранитицс је искористио овај сценарио да објави „нову ИОЛО“ верзију под својим спонзорством. Пошто је доступно и пет унапред обучених модела, почетна страница ИОЛОв5 је прилично јасна и професионално структурирана и написана, са бројним лекцијама и предлозима о обуци и коришћењу ИОЛОв5 модела.

ИОЛОв5 Спеед

ИОЛО ограничења

Иако се чини да је ИОЛО најбоља техника за решавање откривање објекта проблема, има низ недостатака. Пошто свака мрежа може да идентификује само једну ставку, ИОЛО има потешкоћа да открије и одвоји ситне ствари на сликама које се јављају у групама. Мале ствари у ројевима, као што је рој мрава, ИОЛО је тешко идентификовати и лоцирати.

У поређењу са знатно споријим методама идентификације објеката као што је Фаст РЦНН, ИОЛО се такође одликује мањом прецизношћу.

Почните да користите ИОЛОв5

Ако сте заинтересовани да видите ИОЛОв5 у акцији, погледајте званични ГитХуб ИОЛОв5 у ПиТорцх-у.

Zakljucak

Почетна верзија ИОЛОв5 је изузетно брза, ефикасна и једноставна за коришћење. Иако ИОЛОв5 не додаје никакву нову архитектуру модела породици ИОЛО, он пружа нови оквир за обуку и примену ПиТорцх-а који побољшава стање технике за детекторе објеката.

Штавише, ИОЛОв5 је изузетно лак за употребу и долази „из кутије“ спреман за употребу на објектима по мери.

Увод у ИОЛО: Детекција објеката у реалном времену

Дакле, шта је ИОЛО?

ИОЛО ради