የነገር ፈልጎ ማግኘት የነርቭ ኔትወርክ በምስሉ ላይ ያሉትን ነገሮች አስቀድሞ የሚገምትበት እና በዙሪያቸው የማሰሪያ ሳጥኖችን የሚስልበት የምስል ምድብ አይነት ነው። ቀድሞ ከተቀመጡት የመማሪያ ክፍሎች ጋር የሚጣጣሙ ነገሮችን በምስሉ ውስጥ መፈለግ እና አካባቢያዊ ማድረግ የነገር ፈልጎ ማግኘት ይባላል።
የነገር ፈልጎ ማግኘት (እንዲሁም የነገር ማወቂያ በመባልም ይታወቃል) የኮምፒዩተር ቪዥን በጣም ጠቃሚ ንዑስ ጎራ ነው ምክንያቱም እንደ ማግኘት፣ መለየት እና አካባቢ ማድረግ ያሉ ተግባራት በገሃዱ ዓለም አውዶች ውስጥ ሰፊ መተግበሪያን ስለሚያገኙ ነው።
የ YOLO አካሄድ እነዚህን ስራዎች እንዲሰሩ ይረዳዎታል። በዚህ ጽሑፍ ውስጥ፣ YOLO ምን እንደሆነ፣ እንዴት እንደሚሰራ፣ የተለያዩ ልዩነቶችን እና ሌሎችንም ጨምሮ በጥልቀት እንመረምራለን።
ስለዚህ YOLO ምንድን ነው?
YOLO በፎቶግራፎች ውስጥ የእውነተኛ ጊዜ ነገሮችን የመለየት እና የማወቂያ ዘዴ ነው። ለአንተ ብቻ እይታ አንድ ጊዜ ምህጻረ ቃል ነው። ሬድመንድ እና ሌሎች. በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት እውቅና (CVPR) ላይ በመጀመሪያ በ2015 በታተመ ወረቀት ላይ አቀራረቡን አቅርቧል።
ለወረቀቱ የOpenCV Peoples Choice ሽልማት ተሰጥቷል። ክላሲፋየሮችን ፈልጎ ለማግኘት ከቀደመው የነገር መለያ ዘዴዎች በተለየ፣ YOLO ከጫፍ እስከ ጫፍ መጠቀምን ሃሳብ ያቀርባል የነርቭ ኔትወርክ የታሰሩ ሳጥኖችን እና የክፍል እድሎችን በአንድ ጊዜ የሚተነብይ።
YOLO የነገሮችን ለይቶ ማወቅን በተመለከተ አዲስ አቀራረብን በመከተል ከቀደምት የእውነተኛ ጊዜ የዕቃ መፈለጊያ ዘዴዎችን በቀላሉ በማለፍ ዘመናዊ ውጤቶችን ያስገኛል።
YOLO እየሰራ ነው።
የYOLO ዘዴ ስዕሉን ወደ N ፍርግርግ ይከፍላል፣ እያንዳንዱም እኩል መጠን ያለው SxS ልኬት ዘርፍ። እያንዳንዳቸው N ፍርግርግ በውስጡ የያዘውን ነገር የመለየት እና የማግኘት ኃላፊነት አለባቸው።
እነዚህ ፍርግርግዎች፣ በተራው፣ የB ማሰሪያ ሳጥን መጋጠሚያዎች ከሴል መጋጠሚያዎች አንጻር፣ እንዲሁም የነገሩን የንጥል ስም እና እድላቸውን በሕዋሱ ውስጥ ይገኛሉ። ብዙ ህዋሶች አንድ አይነት ንጥል ከተለያዩ የድንበር ሳጥን ትንበያዎች ጋር በመተንበይ ምክንያት ይህ ዘዴ ስሌትን በእጅጉ ይቀንሳል ምክንያቱም ሁለቱም ማወቂያ እና ማወቂያ በምስሉ ላይ ባሉ ህዋሶች ይያዛሉ።
ሆኖም ግን, ብዙ የተባዙ ትንበያዎችን ይፈጥራል. ይህንን ችግር ለመፍታት YOLO ከፍተኛ ያልሆነ ማፈንን ይጠቀማል። YOLO ሁሉንም የማሰሪያ ሳጥኖችን ዝቅተኛ የይሆናልነት ነጥብ ያላቸውን ከፍተኛ ባልሆነ አፈና ውስጥ ይገድባል።
YOLO ይህን የሚያደርገው ከእያንዳንዱ አማራጭ ጋር የተገናኙትን የይሁንታ ውጤቶች በመመርመር እና ከፍተኛ ነጥብ ያለውን በመምረጥ ነው። ከዩኒየን በላይ ትልቁ መገንጠያ ያለው የማሰሪያ ሳጥኖች አሁን ያለው ከፍተኛ እድል የማሰሪያ ሳጥን ይታገዳሉ።
የማሰሪያ ሳጥኖች እስኪጠናቀቁ ድረስ ይህ ሂደት ይቀጥላል.
የተለያዩ የ YOLO ልዩነቶች
አንዳንድ በጣም የተለመዱ የYOLO ስሪቶችን እንመለከታለን። እንጀምር.
1. YOLOv1
የመጀመሪያው YOLO እትም በ2015 በታተመው "አንድ ጊዜ ብቻ ነው የሚመለከቱት፡ የተዋሃደ፣ የእውነተኛ ጊዜ ነገር ማወቂያ” በጆሴፍ ሬድሞን፣ ሳንቶሽ ዲቭቫላ፣ ሮስ ጊርሺክ እና አሊ ፋርሃዲ።
በፍጥነቱ፣ ትክክለኛነት እና የመማር ችሎታው ምክንያት፣ YOLO የነገሮችን መለያ ቦታ በፍጥነት ተቆጣጠረ እና በብዛት ጥቅም ላይ የዋለው አልጎሪዝም ሆነ። ነገርን መለየትን እንደ ምደባ ጉዳይ ከማመልከት ይልቅ፣ ደራሲዎቹ እንደ ሪግሬሽን ችግር ቀርበው በጂኦግራፊያዊ የተነጣጠሉ የማሰሪያ ሳጥኖች እና ተዛማጅ የክፍል ፕሮባቢሊቲዎች አንድ ነጠላ በመጠቀም ፈትተዋል የነርቭ ኔትወርክ.
YOLOv1 ፎቶዎችን በሰከንድ በ45 ክፈፎች በቅጽበት ሰርቷል፣ ትንሽ ተለዋጭ ፈጣን YOLO ግን በ155 ክፈፎች በሰከንድ ተሰራ እና አሁንም የሌሎች የእውነተኛ ጊዜ መመርመሪያዎች በእጥፍ ማፒ አግኝቷል።
2. YOLOv2
ከአንድ ዓመት በኋላ፣ በ2016፣ ጆሴፍ ሬድሞን እና አሊ ፋርሃዲ YOLOv2 (በተጨማሪም YOLO9000 በመባልም የሚታወቀው) በጋዜጣው ላይ አውጥተዋል።YOLO9000: የተሻለ, ፈጣን, ጠንካራ. "
ሞዴሉ 9000 የሚደርሱ ልዩ ልዩ የንጥል ምድቦችን እንኳን የመተንበይ አቅም በእውነተኛ ጊዜ እየሄደ 9000 የሚል ስያሜ አግኝቷል። ሞዴል.
YOLOv2 እንዲሁ ትልቅ ስኬት ስለነበረ እና በፍጥነት ቀጣዩ ዘመናዊ የነገሮች ማወቂያ ሞዴል ስለሆነ ሌሎች መሐንዲሶች በአልጎሪዝም መሞከር ጀመሩ እና የራሳቸውን ልዩ የሆነ YOLO ስሪቶችን ማምረት ጀመሩ። አንዳንዶቹ በጽሁፉ ውስጥ በተለያዩ ነጥቦች ላይ ይብራራሉ.
3. YOLOv3
በወረቀቱ ውስጥ "YOLOv3፡ የመጨመር መሻሻል” ጆሴፍ ሬድሞን እና አሊ ፋርሃዲ አዲስ የአልጎሪዝም እትም በ2018 አሳትመዋል። የተገነባው በ Darknet-53 አርክቴክቸር ነው። ገለልተኛ የሎጂስቲክስ ክላሲፋየሮች የሶፍትማክስ ማግበር ዘዴን በYOLOv3 ተክተዋል።
የሁለትዮሽ ክሮስ-ኤንትሮፒ ኪሳራ በስልጠና ወቅት ጥቅም ላይ ውሏል. Darknet-19 ተሻሽሎ Darknet-53 ተብሎ ተሰይሟል፣ ስሙም አሁን 53 ኮንቮሉሽን ንብርብሮች አሉት። ከዚህ ውጪ፣ ትንበያዎቹ በሦስት የተለያዩ ሚዛኖች ተደርገዋል፣ ይህም YOLOv3 ጥቃቅን ነገሮችን በመተንበይ ላይ ያለውን ትክክለኛነት እንዲያሳድግ ረድቶታል።
YOLOv3 የጆሴፍ ሬድሞን የመጨረሻ YOLO እትም ነበር፣ ስራው በአለም ላይ ጎጂ ተጽእኖ እንዳያሳድር በማናቸውም ተጨማሪ የYOLO ማሻሻያዎች (ወይም በኮምፒዩተር እይታ አካባቢ) ላይ ላለመስራት ስለመረጠ። በአሁኑ ጊዜ በአብዛኛው ልዩ የሆኑ የነገሮችን ማወቂያ አርክቴክቸር ለመገንባት እንደ መነሻ ሆኖ ያገለግላል።
4. ዮሎቭ4
አሌክሲ ቦክኮቭስኪ፣ ቺያን-ያኦ ዋንግ እና ሆንግ-ዩዋን ማርክ ሊያኦ አሳትመዋልYOLOv4፡ ምርጥ ፍጥነት እና የነገር ፍለጋ ትክክለኛነት” በኤፕሪል 2020፣ እሱም አራተኛው የYOLO ስልተ ቀመር ነበር።
የተመዘኑ ቀሪ ግኑኝነቶች፣ ደረጃ አቋራጭ - ከፊል ግንኙነቶች፣ ሚኒ-ባች ኖርማልላይዜሽን፣ ራስን ተቃዋሚ ስልጠና፣ ሚሽ ማግበር፣ drop block እና CIoU መጥፋት ሁሉም እንደ SPDarknet53 አርክቴክቸር አስተዋውቀዋል።
YOLOv4 የ YOLO ቤተሰብ ዘር ነው፣ ሆኖም ግን፣ የተገነባው በተለየ ሳይንቲስቶች (ጆሴፍ ሬድሞን እና አሊ ፋርሃዲ ሳይሆን) ነው። SPDarknet53 የጀርባ አጥንት፣ የቦታ ፒራሚድ ገንዳ፣ የPANet ዱካ ማሰባሰብ እንደ አንገት፣ እና YOLOv3 ጭንቅላት የሕንፃውን ግንባታ ያካሂዳሉ።
በውጤቱም፣ ከወላጁ ጋር ሲወዳደር YOLOv3፣ YOLOv4 10% ከፍ ያለ አማካይ ትክክለኛነት እና 12% የተሻሉ ፍሬሞች በሰከንድ ሜትሪክስ አግኝቷል።
5. YOLOv5
YOLOv5 በCOCO ዳታ ስብስብ ላይ አስቀድሞ በሰለጠነው በ YOLO ሞዴል ላይ የተመሰረቱ የነገር መለያ ሞዴሎችን እና ስልተ ቀመሮችን ያካተተ ክፍት ምንጭ ፕሮጀክት ነው።
YOLOv5 የተዋሃዱ መጠን ያላቸው የነገር መለያ ሞዴሎች ስብስብ ነው። በCOCO ዳታ ስብስብ ላይ የሰለጠኑ፣ ለቲቲኤ ቀላል አቅም ያላቸው፣ የሞዴል ስብሰባ፣ የሃይፐርፓራሜትር ልማት እና ወደ ONNX፣ CoreML እና TFLite መላክ። YOLOv5 ምንም አይነት ልዩ አቀራረቦችን ስለማይተገበር መደበኛ ወረቀቱ ሊለቀቅ አልቻለም። በቀላሉ የYOLOv3's PyTorch ቅጥያ ነው።
Ultranytics ይህንን ሁኔታ ተጠቅሞ በስፖንሰርነቱ ስር ያለውን የ"አዲሱን YOLO" ስሪት ለህዝብ ይፋ አድርጓል። አምስት ቀድመው የሰለጠኑ ሞዴሎችም ተደራሽ ስለሆኑ፣ የYOLOv5 መነሻ ገጽ በጣም ቀጥተኛ እና በሙያዊ የተዋቀረ እና የተፃፈ ነው፣ በርካታ ትምህርቶችን እና የYOLOv5 ሞዴሎችን ስለማሰልጠን እና አጠቃቀም ላይ ምክሮችን ይዟል።
YOLO ገደቦች
ምንም እንኳን YOLO የመፍትሄው ትልቁ ዘዴ ቢሆንም ነገር መለየት ችግሮች, በርካታ ድክመቶች አሉት. እያንዳንዱ ፍርግርግ መለየት የሚችለው አንድ ንጥል ብቻ ስለሆነ፣ YOLO ጥቃቅን ነገሮችን በቡድን ሆነው በስዕሎች ውስጥ ለመለየት እና ለመለየት ይቸገራሉ። እንደ ጉንዳኖች መንጋ ያሉ ትናንሽ ነገሮች YOLO ለመለየት እና ለማግኘት አስቸጋሪ ናቸው።
እንደ ፈጣን RCNN ካሉ በጣም ቀርፋፋ የነገር መለያ ዘዴዎች ጋር ሲወዳደር YOLO በተመሳሳይ መልኩ በትንሽ ትክክለኛነት ይገለጻል።
YOLOv5 ን መጠቀም ይጀምሩ
YOLOv5ን በተግባር ለማየት ፍላጎት ካሎት፣ ይመልከቱ ኦፊሴላዊ GitHub ና YOLOv5 በፒቶርች ውስጥ.
መደምደሚያ
የYOLOv5 የመጀመሪያ ስሪት እጅግ በጣም ፈጣን፣ አፈጻጸም ያለው እና ለመጠቀም ቀላል ነው። YOLOv5 ምንም አይነት አዲስ የሞዴል አርክቴክቸር ለYOLO ቤተሰብ ባይጨምርም፣ ለነገር ፈላጊዎች የጥበብን ሁኔታ የሚያሻሽል አዲስ የPyTorch ስልጠና እና የማሰማራት ማዕቀፍ ይሰጣል።
ከዚህም በተጨማሪ YOLOv5 እጅግ በጣም ለተጠቃሚ ምቹ ነው እና "ከሳጥኑ ውስጥ" በተጠረጠሩ ነገሮች ላይ ለመጠቀም ዝግጁ ሆኖ ይመጣል።
መልስ ይስጡ