ʻO ka ʻike mea he ʻano o ka hoʻokaʻawale kiʻi kahi i manaʻo ai kahi neural network i nā mea i loko o ke kiʻi a huki i nā pahu paʻa a puni lākou. ʻO ka ʻike ʻana a me ka hoʻokaʻawale ʻana i nā mea i loko o ke kiʻi e like me kahi papa i hoʻonohonoho mua ʻia i kapa ʻia he ʻike mea.
ʻO ka ʻike mea (ʻike pū ʻia ʻo ka ʻike mea) he subdomain koʻikoʻi o Computer Vision no ka mea ʻo nā hana e like me ka ʻike, ʻike, a me ka localization e ʻike i ka noi ākea ma nā pōʻaiapili honua maoli.
Hiki i ke ala YOLO ke kōkua iā ʻoe e hana i kēia mau hana. Ma kēia ʻatikala, e nānā pono mākou iā YOLO, me ke ʻano o ia mea, pehea e hana ai, nā ʻano like ʻole, a me nā mea hou aku.
No laila, he aha ka YOLO?
ʻO YOLO kahi ala no ka ʻike ʻana a me ka ʻike ʻana i nā mea i ka manawa maoli ma nā kiʻi. He acronym ia no You Look Once. ʻO Redmond et al. Ua noi ʻo ia i ke ala i loko o kahi pepa i paʻi mua ʻia ma 2015 ma ka IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).
Hāʻawi ʻia ka OpenCV People's Choice Award i ka pepa. ʻAʻole like me nā ʻano hana ʻike mua, kahi i hoʻokaʻawale i nā classifiers e hana i ka ʻike, ua manaʻo ʻo YOLO i ka hoʻohana ʻana i kahi hopena-a-hope. kaʻenehana kikowaena e wānana ana i nā pahu hoʻopaʻa a me nā kūlana papa i ka manawa like.
Hoʻopuka ʻo YOLO i nā hopena hou loa ma o ka lawe ʻana i kahi ala hou loa i ka ʻike ʻana i nā mea, me ka maʻalahi ma mua o nā ʻano hana ʻike maka manawa maoli.
YOLO hana
Hoʻokaʻawale ke ʻano YOLO i ke kiʻi i loko o nā mākia N, kēlā me kēia me kahi ʻāpana SxS like-nui. ʻO kēlā me kēia o kēia mau mākia N ke kuleana o ka ʻimi ʻana a me ka ʻimi ʻana i ka mea i loko.
ʻO kēia mau mākia, ʻo ia hoʻi, wānana nā hoʻonohonoho pahu paʻa B pili e pili ana i nā hoʻonohonoho kelepona, a me ka inoa ʻikamu a me ka hiki ke loaʻa ka mea i loko o ke kelepona. Ma muli o ka nui o nā pūnaewele e wānana ana i ka mea like me nā wānana pahu paʻa like ʻole, hoʻemi nui kēia ʻenehana i ka helu ʻana no ka mea e mālama ʻia ka ʻike a me ka ʻike e nā cell mai ke kiʻi.
Eia nō naʻe, hoʻopuka ia i ka nui o nā wānana pālua. No ka hoʻoponopono ʻana i kēia pilikia, hoʻohana ʻo YOLO i ka Non-Maximal Suppression. Kāohi ʻo YOLO i nā pahu paʻa a pau me nā helu haʻahaʻa haʻahaʻa ma Non-Maximal Suppression.
Hana ʻo YOLO i kēia ma ka nānā ʻana i nā helu kūpono i hoʻopili ʻia me kēlā me kēia koho a koho i ka mea me ka helu kiʻekiʻe. Hoʻopau ʻia nā pahu hoʻopaʻa me ka Intersection nui loa ma luna o Union me ka pahu hoʻopaʻa kiʻekiʻe o kēia manawa.
Hoʻomau ʻia kēia hana a hiki i ka pau ʻana o nā pahu hoʻopaʻa.
Nā ʻano like ʻole o YOLO
E nānā mākou i kekahi o nā mana YOLO maʻamau. E hoʻomaka kākou.
1. YOLOv1
Ua hoʻolaha ʻia ka mana YOLO mua ma 2015 ma ka paʻi "Hoʻokahi wale nō ʻoe e nānā: Unified, Real-Time Object Detection” na Joseph Redmon, Santosh Divvala, Ross Girshick, a me Ali Farhadi.
Ma muli o kona wikiwiki, pololei, a me ka hiki ke aʻo, ua hoʻomalu koke ʻo YOLO i ka ʻāpana o ka ʻike mea a lilo i algorithm i hoʻohana nui ʻia. Ma mua o ka hoʻoponopono ʻana i ka ʻike ʻana i nā mea ma ke ʻano he hoʻohālikelike, ua hoʻokokoke nā mea kākau iā ia ma ke ʻano he pilikia regression me nā pahu hoʻopaʻa ʻāina i hoʻokaʻawale ʻia a me nā probabilities papa pili, a lākou i hoʻoponopono ai me ka hoʻohana ʻana i hoʻokahi. kaʻenehana kikowaena.
Hoʻoponopono ka YOLOv1 i nā kiʻi ma 45 mau kiʻi i kēlā me kēia kekona i ka manawa maoli, ʻoiai he ʻano liʻiliʻi liʻiliʻi, ʻo Fast YOLO, i hana ʻia ma 155 mau kiʻi i kēlā me kēia kekona a loaʻa mau i ka papalua o ka mAP o nā mea ʻike manawa maoli.
2. YOLOv2
I hoʻokahi makahiki ma hope, ma 2016, ua hoʻokuʻu ʻo Joseph Redmon lāua ʻo Ali Farhadi iā YOLOv2 (ʻike ʻia ʻo YOLO9000) ma ka pepa "YOLO9000: ʻOi, ʻoi aku ka wikiwiki, ʻoi aku ka ikaika. "
ʻO ka mana o ke kŘkohu e wānana i 9000 mau ʻano mea ʻokoʻa ʻoiai e holo mau ana i ka manawa maoli, ua loaʻa iā ia ka inoa 9000. ʻAʻole wale ka mana hoʻohālike hou i aʻo ʻia i ka manawa like i ka ʻike ʻana i nā mea a me ka hoʻokaʻawale ʻana, akā ua loaʻa pū ʻo Darknet-19 ma ke ʻano kumu hou. kumu hoʻohālike.
Ma muli o ka lanakila nui o YOLOv2 a ua lilo koke i kumu hoʻohālike o ka ʻike mea hou, ua hoʻomaka nā mea ʻenekinia ʻē aʻe e hoʻokolohua me ka algorithm a hana i kā lākou mau mana YOLO kūʻokoʻa. E kūkākūkā ʻia kekahi o lākou ma nā wahi like ʻole o ka pepa.
3. YOLOv3
Ma ka pepa "YOLOv3: He Hoʻonui Hoʻonui, "Ua hoʻopuka ʻo Joseph Redmon lāua ʻo Ali Farhadi i kahi mana hou o ka algorithm ma 2018. Ua kūkulu ʻia ma ka hale kiʻi Darknet-53. Ua hoʻololi nā mea hoʻohālikelike logistic kūʻokoʻa i ka mīkini hoʻoulu softmax ma YOLOv3.
Ua hoʻohana ʻia ka poho cross-entropy binary i ke aʻo ʻana. Ua hoʻonui ʻia ʻo Darknet-19 a ua kapa hou ʻia ʻo Darknet-53, i kēia manawa he 53 mau papa convolutional. Ma waho aʻe o kēlā, ua hana ʻia nā wānana ma ʻekolu mau unahi like ʻole, i kōkua iā YOLOv3 e hoʻonui i kona pololei i ka wānana ʻana i nā mea liʻiliʻi.
ʻO YOLOv3 ka mana hope loa o YOLO a Joseph Redmon, no ka mea, ua koho ʻo ia ʻaʻole e hana i nā hoʻomaikaʻi hou aʻe o YOLO (a i ʻole ma ka ʻaoʻao ʻike kamepiula) i mea e pale aku ai i kāna hana e hoʻopilikia i ka honua. Hoʻohana nui ʻia i kēia manawa ma ke ʻano he kumu hoʻomaka no ke kūkulu ʻana i nā hale kiʻi kiʻi ʻike ʻike.
4. Yolov4
Ua paʻi ʻo Alexey Bochkovskiy, Chien-Yao Wang, a me Hong-Yuan Mark Liao "YOLOv4: ʻO ka wikiwiki a me ka pololei o ka ʻike mea” i ʻApelila 2020, ʻo ia ka hā o ka YOLO algorithm.
Hoʻohui ʻia ʻo Weighted Residual Connections, Cross-Stage-Partial Connections, cross mini-batch normalization, self-adversarial training, mish activation, drop block, a me CIoU nalowale ua hoʻokomo ʻia ma ke ʻano he ʻāpana o ka papa hana SPDarknet53.
He mamo ʻo YOLOv4 no ka ʻohana YOLO, akā naʻe, ua hoʻomohala ʻia e nā ʻepekema ʻokoʻa (ʻaʻole ʻo Joseph Redmon lāua ʻo Ali Farhadi). SPDarknet53 iwi kuamoʻo, spatial pyramid pooling, PANet ala-hui e like me ka ʻāʻī, a me YOLOv3 poʻo i kona hale hana.
ʻO ka hopena, ke hoʻohālikelike ʻia me kona makua, ʻo YOLOv3, loaʻa iā YOLOv4 i ka 10% kiʻekiʻe Average Precision a me 12% ʻoi aku ka maikaʻi o nā metric Frames Per Second.
5. YOLOv5
YOLOv5 he papahana open-source i loaʻa i nā ʻano hiʻohiʻona ʻike mea a me nā algorithm e pili ana i ka hoʻohālike YOLO i hoʻomaʻamaʻa mua ʻia ma ka dataset COCO.
ʻO YOLOv5 kahi hōʻiliʻili o nā hiʻohiʻona ʻike mea hoʻohuihui i hoʻomaʻamaʻa ʻia ma ka ʻikepili COCO, me nā hiki maʻalahi no ka TTA, ka hui hoʻohālike, ka hoʻomohala ʻana i ka hyperparameter, a me ka lawe ʻana aku i ONNX, CoreML, a me TFLite. No ka mea ʻaʻole hoʻokō a hoʻomohala paha ʻo YOLOv5 i kekahi ala kūʻokoʻa, ʻaʻole hiki ke hoʻokuʻu ʻia ka pepa maʻamau. ʻO ka hoʻonui PyTorch wale nō ʻo YOLOv3.
Ua hoʻohana ʻo Ultranytics i kēia hiʻohiʻona e hoʻolaha i ka mana "YOLO hou" ma lalo o kāna kākoʻo. No ka mea he ʻelima mau hiʻohiʻona i hoʻomaʻamaʻa mua ʻia, hiki ke ʻike ʻia ka ʻaoʻao home YOLOv5 a ua hoʻonohonoho ʻia a kākau ʻia me ka ʻoihana, me nā haʻawina a me nā manaʻo e pili ana i ke aʻo ʻana a me ka hoʻohana ʻana i nā hiʻohiʻona YOLOv5.
YOLO palena
ʻOiai ʻo YOLO ka ʻenehana nui loa no ka hoʻoponopono ʻana ʻike mea pilikia, loaʻa iā ia kekahi mau drawbacks. No ka mea hiki i kēlā me kēia mākia ke ʻike i hoʻokahi mea wale nō, paʻakikī ʻo YOLO i ka ʻike ʻana a me ka hoʻokaʻawale ʻana i nā mea liʻiliʻi ma nā kiʻi e kū nei ma nā hui. ʻO nā mea liʻiliʻi i loko o nā pūʻulu, e like me ka pūʻulu o nā ʻanuʻu, paʻakikī iā YOLO ke ʻike a loaʻa.
Ke hoʻohālikelike ʻia me nā ʻano ʻike mea ʻoi aku ka lohi e like me Fast RCNN, ʻike ʻia ʻo YOLO me ka liʻiliʻi o ka pololei.
E hoʻomaka e hoʻohana iā YOLOv5
Inā makemake ʻoe e ʻike i kahi YOLOv5 i ka hana, e nānā i ka luna GitHub a YOLOv5 ma PyTorch.
Panina
ʻO ka mana mua o YOLOv5 he wikiwiki loa, hoʻokō, a maʻalahi hoʻi e hoʻohana. ʻOiai ʻaʻole hoʻohui ʻo YOLOv5 i kahi hoʻolālā hoʻohālike hou i ka ʻohana YOLO, hāʻawi ia i kahi hoʻomaʻamaʻa PyTorch hou a me ka hoʻolālā hoʻolālā e hoʻonui ai i ke kūlana o ka noʻonoʻo no nā mea ʻike mea.
Eia kekahi, ʻoluʻolu loa ʻo YOLOv5 a hele mai "mai loko o ka pahu" mākaukau e hoʻohana i nā mea bespoke.
Waiho i ka Reply