பொருள் கண்டறிதல் என்பது ஒரு வகை பட வகைப்படுத்தல் ஆகும், இதில் ஒரு நரம்பியல் நெட்வொர்க் ஒரு படத்தில் உள்ள உருப்படிகளை எதிர்நோக்கி அவற்றைச் சுற்றி எல்லைப் பெட்டிகளை வரைகிறது. முன்னமைக்கப்பட்ட வகுப்புகளின் தொகுப்பிற்கு இணங்கக்கூடிய ஒரு படத்தில் உள்ள விஷயங்களைக் கண்டறிந்து உள்ளூர்மயமாக்குவது பொருள் கண்டறிதல் என குறிப்பிடப்படுகிறது.
பொருள் கண்டறிதல் (பொருள் அங்கீகாரம் என்றும் அழைக்கப்படுகிறது) என்பது கணினி பார்வையின் குறிப்பாக குறிப்பிடத்தக்க துணை டொமைன் ஆகும், ஏனெனில் கண்டறிதல், அடையாளம் காணல் மற்றும் உள்ளூர்மயமாக்கல் போன்ற பணிகள் நிஜ-உலக சூழல்களில் பரந்த பயன்பாட்டைக் காண்கின்றன.
YOLO அணுகுமுறை இந்தப் பணிகளைச் செய்ய உங்களுக்கு உதவும். இந்த கட்டுரையில், YOLO என்ன, அது எவ்வாறு செயல்படுகிறது, பல்வேறு மாறுபாடுகள் மற்றும் பலவற்றை உள்ளடக்கிய ஒரு நெருக்கமான தோற்றத்தை எடுப்போம்.
எனவே, YOLO என்றால் என்ன?
YOLO என்பது புகைப்படங்களில் நிகழ்நேர பொருள் அடையாளம் மற்றும் அங்கீகாரத்திற்கான ஒரு முறையாகும். யூ ஒன்லி லுக் ஒன்ஸ் என்பதன் சுருக்கம் இது. ரெட்மண்ட் மற்றும் பலர். கணினி பார்வை மற்றும் வடிவ அங்கீகாரம் (CVPR) பற்றிய IEEE/CVF மாநாட்டில் ஆரம்பத்தில் 2015 இல் வெளியிடப்பட்ட ஒரு கட்டுரையில் அணுகுமுறையை முன்மொழிந்தது.
ஓபன்சிவி பீப்பிள்ஸ் சாய்ஸ் விருது காகிதத்திற்கு வழங்கப்பட்டது. முந்தைய பொருள் அடையாள முறைகளைப் போலல்லாமல், வகைப்படுத்திகளை கண்டறிவதற்கு மறுபயன்பாடு செய்தது, YOLO ஒரு எண்ட்-டு-எண்ட் பயன்பாட்டை முன்மொழிகிறது. நரம்பு நெட்வொர்க் இது எல்லைப் பெட்டிகள் மற்றும் வகுப்பு நிகழ்தகவுகளை ஒரே நேரத்தில் முன்னறிவிக்கிறது.
YOLO, முந்தைய நிகழ்நேர பொருள் கண்டறிதல் முறைகளை எளிதாக விஞ்சி, பொருள் அங்கீகாரத்திற்கு அடிப்படையாக புதிய அணுகுமுறையை எடுத்துக்கொண்டு அதிநவீன முடிவுகளை உருவாக்குகிறது.
YOLO வேலை செய்கிறது
YOLO முறையானது படத்தை N கட்டங்களாகப் பிரிக்கிறது, ஒவ்வொன்றும் சம அளவிலான SxS பரிமாணத் துறையுடன். இந்த N கட்டங்கள் ஒவ்வொன்றும் அது கொண்டிருக்கும் பொருளைக் கண்டறிந்து அதைக் கண்டறியும் பொறுப்பில் உள்ளன.
இந்த கட்டங்கள், செல் ஆயத்தொகுப்புகளுடன் தொடர்புடைய B எல்லைப் பெட்டி ஆயங்களை முன்னறிவிக்கிறது, அத்துடன் பொருளின் பெயர் மற்றும் கலத்தில் இருக்கும் பொருளின் சாத்தியக்கூறுகள். பல செல்கள் வெவ்வேறு எல்லைப் பெட்டி கணிப்புகளுடன் ஒரே பொருளைக் கணிப்பதால், இந்த நுட்பம் கணக்கீட்டைக் கணிசமாகக் குறைக்கிறது, ஏனெனில் கண்டறிதல் மற்றும் அங்கீகாரம் இரண்டும் படத்திலிருந்து செல்களால் கையாளப்படுகின்றன.
இருப்பினும், இது நிறைய நகல் கணிப்புகளை உருவாக்குகிறது. இந்தச் சிக்கலைத் தீர்க்க, யோலோ அதிகபட்சம் அல்லாத அடக்கத்தைப் பயன்படுத்துகிறது. அதிகபட்சம் அல்லாத அடக்கத்தில் குறைந்த நிகழ்தகவு மதிப்பெண்களைக் கொண்ட அனைத்து எல்லைப் பெட்டிகளையும் YOLO அடக்குகிறது.
ஒவ்வொரு விருப்பத்துடனும் இணைக்கப்பட்ட நிகழ்தகவு மதிப்பெண்களை ஆராய்ந்து, அதிக மதிப்பெண் பெற்ற ஒன்றைத் தேர்ந்தெடுப்பதன் மூலம் YOLO இதைச் செய்கிறது. தற்போதைய உயர் நிகழ்தகவு எல்லைப் பெட்டியுடன் யூனியன் மீது மிகப்பெரிய குறுக்குவெட்டு கொண்ட எல்லைப் பெட்டிகள் பின்னர் அடக்கப்படுகின்றன.
எல்லைப் பெட்டிகள் முடிவடையும் வரை இந்த செயல்முறை தொடர்கிறது.
YOLO இன் பல்வேறு மாறுபாடுகள்
மிகவும் பொதுவான YOLO பதிப்புகளில் சிலவற்றைப் பார்ப்போம். ஆரம்பிக்கலாம்.
1. YOLov1
ஆரம்ப YOLO பதிப்பு 2015 இல் வெளியீட்டில் அறிவிக்கப்பட்டது "நீங்கள் ஒருமுறை மட்டும் பாருங்கள்: ஒருங்கிணைந்த, நிகழ்நேர பொருள் கண்டறிதல்”ஜோசப் ரெட்மோன், சந்தோஷ் திவ்வாலா, ரோஸ் கிர்ஷிக் மற்றும் அலி ஃபர்ஹாடி.
அதன் வேகம், துல்லியம் மற்றும் கற்றல் திறன் ஆகியவற்றின் காரணமாக, YOLO விரைவில் பொருள் அடையாளம் காணும் பகுதியில் ஆதிக்கம் செலுத்தியது மற்றும் மிகவும் பரவலாகப் பயன்படுத்தப்படும் அல்காரிதம் ஆனது. பொருள் கண்டறிதலை ஒரு வகைப்பாடு சிக்கலாகக் கருதுவதற்குப் பதிலாக, ஆசிரியர்கள் புவியியல் ரீதியாக பிரிக்கப்பட்ட எல்லைப் பெட்டிகள் மற்றும் தொடர்புடைய வகுப்பு நிகழ்தகவுகளுடன் ஒரு பின்னடைவு பிரச்சனையாக அணுகினர், அதை அவர்கள் ஒற்றைப் பயன்படுத்தி தீர்த்தனர். நரம்பு நெட்வொர்க்.
YOLOv1 ஆனது நிகழ்நேரத்தில் வினாடிக்கு 45 பிரேம்களில் புகைப்படங்களைச் செயலாக்கியது, அதேசமயம் சிறிய மாறுபாடு, ஃபாஸ்ட் யோலோ, வினாடிக்கு 155 பிரேம்களில் செயலாக்கப்பட்டு, மற்ற நிகழ்நேர கண்டுபிடிப்பாளர்களின் எம்ஏபியை விட இருமடங்கைப் பெற்றது.
2. YOLov2
ஒரு வருடம் கழித்து, 2016 இல், ஜோசப் ரெட்மோன் மற்றும் அலி ஃபர்ஹாடி ஆகியோர் YOLOv2 (YOLO9000 என்றும் அழைக்கப்படுகிறது) காகிதத்தில் வெளியிட்டனர்.YOLO9000: சிறந்தது, வேகமானது, வலிமையானது. "
நிகழ்நேரத்தில் இயங்கும் போது 9000 தனித்துவமான உருப்படி வகைகளைக் கூட முன்னறிவிக்கும் மாடலின் திறன் அதற்கு 9000 என்ற பெயரைப் பெற்றது. புதிய மாடல் பதிப்பு ஒரே நேரத்தில் பொருள் கண்டறிதல் மற்றும் வகைப்படுத்தல் தரவுத்தொகுப்புகளில் பயிற்சியளிக்கப்பட்டது மட்டுமல்லாமல், டார்க்நெட்-19 ஐ புதிய அடிப்படையாகவும் பெற்றது. மாதிரி.
YOLOv2 ஒரு பெரிய வெற்றியைப் பெற்றது மற்றும் விரைவில் அடுத்த அதிநவீன பொருள் அங்கீகார மாடலாக மாறியது, மற்ற பொறியாளர்கள் அல்காரிதத்துடன் பரிசோதனை செய்து தங்கள் தனித்துவமான YOLO பதிப்புகளை உருவாக்கத் தொடங்கினர். அவற்றில் சில கட்டுரையின் பல்வேறு புள்ளிகளில் விவாதிக்கப்படும்.
3. YOLov3
தாளில்"YOLOv3: ஒரு அதிகரிக்கும் முன்னேற்றம்,” ஜோசப் ரெட்மோன் மற்றும் அலி ஃபர்ஹாடி 2018 இல் அல்காரிதத்தின் புதிய பதிப்பை வெளியிட்டனர். இது டார்க்நெட்-53 கட்டிடக்கலையில் கட்டப்பட்டது. YOLOv3 இல் உள்ள softmax செயல்படுத்தும் பொறிமுறையை சுயாதீன லாஜிஸ்டிக் வகைப்படுத்திகள் மாற்றியமைத்தன.
பைனரி குறுக்கு-என்ட்ரோபி இழப்பு பயிற்சியின் போது பயன்படுத்தப்பட்டது. டார்க்நெட்-19 மேம்படுத்தப்பட்டு டார்க்நெட்-53 என மறுபெயரிடப்பட்டது, இது இப்போது 53 கன்வல்யூஷனல் அடுக்குகளைக் கொண்டுள்ளது. அதைத் தவிர, கணிப்புகள் மூன்று வெவ்வேறு அளவுகளில் செய்யப்பட்டன, இது YOLOv3 சிறிய விஷயங்களைக் கணிப்பதில் அதன் துல்லியத்தை மேம்படுத்த உதவியது.
YOLOv3 என்பது ஜோசப் ரெட்மனின் இறுதி YOLO பதிப்பாகும், ஏனெனில் அவர் தனது பணி உலகில் தீங்கு விளைவிப்பதைத் தவிர்ப்பதற்காக மேலும் YOLO மேம்பாடுகளில் (அல்லது கணினி பார்வை பகுதியில் கூட) வேலை செய்ய விரும்பவில்லை. தனித்துவமான பொருள்-கண்டறிதல் கட்டமைப்புகளை உருவாக்குவதற்கான தொடக்கப் புள்ளியாக இப்போது இது பெரும்பாலும் பயன்படுத்தப்படுகிறது.
4. யோலோவ்4
Alexey Bochkovskiy, Chien-Yao Wang, மற்றும் Hong-Yuan Mark Liao ஆகியோர் வெளியிட்டனர் "YOLov4: ஆப்ஜெக்ட் கண்டறிதலின் உகந்த வேகம் மற்றும் துல்லியம்” ஏப்ரல் 2020 இல், இது YOLO அல்காரிதத்தின் நான்காவது மறுமுறை ஆகும்.
எடையுள்ள எஞ்சிய இணைப்புகள், குறுக்கு-நிலை-பகுதி இணைப்புகள், குறுக்கு-மினி-தொகுதி இயல்பாக்கம், சுய-எதிர்ப்பு பயிற்சி, மிஷ் ஆக்டிவேஷன், டிராப் பிளாக் மற்றும் CIoU இழப்பு அனைத்தும் SPDarknet53 கட்டமைப்பின் ஒரு பகுதியாக அறிமுகப்படுத்தப்பட்டன.
YOLOv4 என்பது YOLO குடும்பத்தின் வழித்தோன்றல், இருப்பினும், இது தனி விஞ்ஞானிகளால் உருவாக்கப்பட்டது (ஜோசப் ரெட்மோன் மற்றும் அலி ஃபர்ஹாடி அல்ல). SPDarknet53 முதுகெலும்பு, ஸ்பேஷியல் பிரமிட் பூலிங், கழுமாக PANet பாதை-ஒருங்கிணைத்தல் மற்றும் YOLOv3 தலை ஆகியவை அதன் கட்டமைப்பை உருவாக்குகின்றன.
இதன் விளைவாக, அதன் பெற்றோரான YOLOv3 உடன் ஒப்பிடும் போது, YOLOv4 ஆனது 10% அதிக சராசரி துல்லியம் மற்றும் 12% சிறந்த பிரேம்கள் பெர் செகண்ட் பெறுகிறது.
5. YOLov5
YOLOv5 COCO தரவுத்தொகுப்பில் முன் பயிற்றுவிக்கப்பட்ட YOLO மாதிரியின் அடிப்படையில் பொருள் அடையாள மாதிரிகள் மற்றும் வழிமுறைகளின் வரம்பை உள்ளடக்கிய ஒரு திறந்த மூல திட்டமாகும்.
YOLOv5 என்பது கூட்டு அளவிலான பொருள் அடையாள மாதிரிகளின் தொகுப்பாகும் டிடிஏ, மாடல் அசெம்பிளி, ஹைப்பர்பாராமீட்டர் மேம்பாடு மற்றும் ONNX, CoreML மற்றும் TFLite க்கு ஏற்றுமதி செய்வதற்கான எளிதான திறன்களுடன், COCO தரவுத்தொகுப்பில் பயிற்சியளிக்கப்பட்டது. YOLOv5 எந்தவொரு தனித்துவமான அணுகுமுறையையும் செயல்படுத்தவில்லை அல்லது உருவாக்கவில்லை என்பதால், முறையான காகிதத்தை வெளியிட முடியவில்லை. இது வெறுமனே YOLOv3 இன் PyTorch நீட்டிப்பு.
Ultranytics அதன் ஸ்பான்சர்ஷிப்பின் கீழ் "புதிய YOLO" பதிப்பை விளம்பரப்படுத்த இந்த காட்சியைப் பயன்படுத்தியது. ஐந்து முன் பயிற்சியளிக்கப்பட்ட மாடல்களும் அணுகக்கூடியதாக இருப்பதால், YOLOv5 முகப்புப்பக்கம் மிகவும் நேரடியானது மற்றும் தொழில்ரீதியாக கட்டமைக்கப்பட்டு எழுதப்பட்டுள்ளது, YOLOv5 மாடல்களைப் பயிற்றுவிப்பதற்கும் பயன்படுத்துவதற்கும் பல பாடங்கள் மற்றும் பரிந்துரைகள் உள்ளன.
YOLO வரம்புகள்
YOLO தீர்வுக்கான சிறந்த நுட்பமாகத் தோன்றினாலும் பொருள் கண்டறிதல் சிக்கல்கள், இது பல குறைபாடுகளைக் கொண்டுள்ளது. ஒவ்வொரு கட்டமும் ஒரு பொருளை மட்டுமே அடையாளம் காண முடியும் என்பதால், YOLO ஆனது குழுக்களில் நிகழும் படங்களில் உள்ள சிறிய விஷயங்களைக் கண்டறிவது மற்றும் பிரிப்பது கடினம். எறும்புகளின் திரள் போன்ற திரள்களில் உள்ள சிறிய விஷயங்களை அடையாளம் கண்டு கண்டுபிடிப்பது YOLO க்கு கடினம்.
ஃபாஸ்ட் RCNN போன்ற குறிப்பிடத்தக்க மெதுவான பொருள் அடையாளம் காணும் முறைகளுடன் ஒப்பிடும் போது, YOLO குறைந்த துல்லியத்தால் வகைப்படுத்தப்படுகிறது.
YOLOv5 ஐப் பயன்படுத்தத் தொடங்குங்கள்
YOLOv5 செயலில் இருப்பதைப் பார்க்க நீங்கள் ஆர்வமாக இருந்தால், பார்க்கவும் அதிகாரப்பூர்வ GitHub மற்றும் PyTorch இல் YOLOv5.
தீர்மானம்
YOLOv5 இன் ஆரம்ப பதிப்பு மிகவும் விரைவானது, செயல்திறன் மிக்கது மற்றும் பயன்படுத்த எளிதானது. YOLOv5 ஆனது YOLO குடும்பத்தில் புதிய மாதிரி கட்டமைப்பை சேர்க்கவில்லை என்றாலும், இது ஒரு புதிய PyTorch பயிற்சி மற்றும் வரிசைப்படுத்தல் கட்டமைப்பை வழங்குகிறது, இது பொருள் கண்டுபிடிப்பாளர்களுக்கான கலையின் நிலையை மேம்படுத்துகிறது.
மேலும், YOLOv5 மிகவும் பயனர் நட்பு மற்றும் பெஸ்போக் பொருட்களில் பயன்படுத்த தயாராக உள்ளது.
ஒரு பதில் விடவும்