පටුන[සඟවන්න][පෙන්වන්න]
ගැඹුරු ඉගෙනීමේ සරලම නමුත් වඩාත්ම කුතුහලය දනවන අදහසක් වන්නේ වස්තු හඳුනාගැනීමයි. මූලික අදහස නම් සෑම අයිතමයක්ම සංසන්දනාත්මක ලක්ෂණ නියෝජනය කරන අනුප්රාප්තික පන්තිවලට බෙදීම සහ එය වටා පෙට්ටියක් ඇඳීමයි.
මෙම කැපී පෙනෙන ලක්ෂණ, ස්වරූපය හෝ වර්ණය වැනි සරල විය හැකි අතර, ඒවා වර්ගීකරණය කිරීමට අපට ඇති හැකියාවට උපකාරී වේ.
හි යෙදුම් වස්තුව හඳුනාගැනීම වෛද්ය විද්යාව, ස්වයංක්රීය රිය පැදවීම, ආරක්ෂක සහ හමුදා, රාජ්ය පරිපාලනය සහ තවත් බොහෝ ක්ෂේත්රවල පරිගණක දැක්ම සහ රූප සැකසීමේ සැලකිය යුතු වැඩිදියුණු කිරීම්වලට ස්තූතිවන්ත වෙමින් ඔවුන් බහුලව සේවයේ යෙදී සිටිති.
මෙන්න අපි Pytorch මත ගොඩනගා ඇති අපූරු විවෘත මූලාශ්ර වස්තු හඳුනාගැනීමේ මෙවලම් කට්ටලයක් වන MMDtetection ඇත. මෙම ලිපියෙන්, අපි MMDdetection සවිස්තරාත්මකව පරීක්ෂා කරන්නෙමු, එය සමඟ අත්වැල් බැඳගෙන, එහි විශේෂාංග සාකච්ඡා කරන්න, සහ තවත් බොහෝ දේ.
මොකක්ද MMD හඳුනාගැනීම?
එම MMD හඳුනාගැනීම මෙවලම් පෙට්ටිය නිර්මාණය කරන ලද්දේ පයිතන් කේත පදනමක් ලෙස විශේෂයෙන් වස්තු හඳුනාගැනීම සහ අවස්ථා ඛණ්ඩනය සම්බන්ධ ගැටළු සඳහා ය.
PyTorch ක්රියාත්මක කිරීම භාවිතා කරනු ලබන අතර, එය මොඩියුලර් ආකාරයෙන් නිර්මාණය කර ඇත. වස්තු හඳුනාගැනීම සහ නිදසුන් ඛණ්ඩනය සඳහා, පුළුල් පරාසයක ඵලදායි මාදිලි විවිධ ක්රමවේදවලට සම්පාදනය කර ඇත.
එය ඵලදායී අනුමාන සහ වේගවත් පුහුණුවක් ලබා දෙයි. අනෙක් අතට, මෙවලම් පෙට්ටියට පෙර පුහුණු වූ ජාල 200කට වැඩි බරක් ඇතුළත් වන අතර, එය වස්තු හඳුනාගැනීමේ ක්ෂේත්රයේ ඉක්මන් විසඳුමක් බවට පත් කරයි.
පවතින තාක්ෂණික ක්රම අනුවර්තනය කිරීමට හෝ පවතින මොඩියුල භාවිතයෙන් නව අනාවරකයක් නිර්මාණය කිරීමට ඇති හැකියාව සමඟින්, MMDdetection මිණුම් ලකුණක් ලෙස ක්රියා කරයි.
මෙවලම් පෙට්ටියේ ප්රධාන ලක්ෂණය වන්නේ එහි සාමාන්ය කොටස් වලින් සරල, මොඩියුලර් කොටස් ඇතුළත් කිරීමයි වස්තුව හඳුනාගැනීම අද්විතීය නල මාර්ග හෝ අද්විතීය ආකෘති නිර්මාණය කිරීමට භාවිතා කළ හැකි රාමුව.
මෙම මෙවලම් කට්ටලයේ මිණුම් සලකුණු කිරීමේ හැකියාව පවතින රාමුවක් මත නව අනාවරක රාමුවක් තැනීම සහ එහි ක්රියාකාරිත්වය සංසන්දනය කිරීම සරල කරයි.
විශේෂාංග
- වේගවත් RCNN, Mask RCNN, RetinaNet වැනි ජනප්රිය සහ නවීන හඳුනාගැනීමේ රාමු, මෙවලම් කට්ටලය මඟින් සෘජුවම සහාය දක්වයි.
- සියුම්-සුසර කිරීම සඳහා 360+ පෙර-පුහුණු ආකෘති භාවිතා කිරීම (හෝ නැවත පුහුණු කිරීම).
- COCO, Cityscapes, LVIS, සහ PASCAL VOC ඇතුළු සුප්රසිද්ධ දර්ශන දත්ත කට්ටල සඳහා.
- GPU වල, සියලුම මූලික bbox සහ මාස්ක් මෙහෙයුම් ක්රියාත්මක වේ. Detectron2, maskrcnn-benchmark, සහ SimpleDet වැනි අනෙකුත් කේත පදනම්, මෙයට වඩා වේගවත් වේගයකින් හෝ සමානව පුහුණු කළ හැක.
- පර්යේෂකයන් බිඳ දමයි වස්තුව හඳුනාගැනීම රාමුව මොඩියුල කිහිපයක් බවට පත් කරයි, පසුව එය අද්විතීය වස්තු හඳුනාගැනීමේ පද්ධතියක් නිර්මාණය කිරීමට ඒකාබද්ධ කළ හැකිය.
MMD හඳුනාගැනීමේ ගෘහ නිර්මාණ ශිල්පය
MMDtetection මගින් ඕනෑම ආකෘතියකට යෙදිය හැකි සාමාන්ය සැලසුමක් නියම කරයි, එය විවිධ පෙර-නිර්මාණය කරන ලද ආකෘති සහිත මෙවලම් පෙට්ටියක් වන අතර, ඒ සෑම එකක්ම තමන්ගේම ගෘහ නිර්මාණ ශිල්පයක් ඇත. පහත සඳහන් සංරචක මෙම සමස්ත ගෘහ නිර්මාණ ශිල්පය සාදයි:
- කොඳුනාරටිය: ResNet-50 වැනි අවසාන සම්පුර්ණයෙන්ම සම්බන්ධිත ස්තරය නොමැතිව Backbone යනු රූපයක් විශේෂාංග සිතියම් බවට පරිවර්තනය කරන සංරචකයයි.
- නහය: බෙල්ල යනු කොඳු ඇට පෙළ හිසට සම්බන්ධ කරන කොටසයි. කොඳු ඇට පෙළේ raw විශේෂාංග සිතියම් මත, එය යම් යම් ගැලපීම් හෝ නැවත සකස් කිරීම් සිදු කරයි. විශේෂාංග පිරමිඩ ජාලය එක් නිදර්ශනයකි (FPN).
- ඝන හිස (AnchorHead/AnchorFreeHead): එය RPNHead, RetinaHead, සහ FCOSHead වැනි AnchorHead සහ AnchorFreeHead වැනි විශේෂාංග සිතියම්වල ඝන ප්රදේශ මත ක්රියාත්මක වන සංරචකයයි.
- RoIExtractor: RoIPooling වැනි ක්රියාකරුවන් භාවිතයෙන්, එය RoIwise විශේෂාංග තනි හෝ විශේෂාංග සිතියම් එකතුවකින් ඇද ගන්නා කොටසයි. SingleRoIExtractor නියැදිය විශේෂාංග පිරමිඩවල ගැළපෙන මට්ටමේ සිට RoI විශේෂාංග උපුටා ගනී.
- RoIHead (BBoxHead/MaskHead): එය RoI ලක්ෂණ ආදානයක් ලෙස භාවිතා කරන පද්ධතියේ කොටස වන අතර මායිම් කොටු වර්ගීකරණය/ප්රතිගමනය සහ වෙස් පුරෝකථනය වැනි RoI-පාදක කාර්ය-විශේෂිත අනාවැකි ජනනය කරයි.
තනි-අදියර සහ ද්වි-අදියර අනාවරක ඉදිකිරීම ඉහත සඳහන් කළ සංකල්ප භාවිතයෙන් නිරූපණය කෙරේ. නැවුම් කොටස් කිහිපයක් සෑදීමෙන් සහ පවතින සමහර ඒවා ඒකාබද්ධ කිරීමෙන් අපට අපගේම ක්රියා පටිපාටි දියුණු කළ හැකිය.
MMDetection හි ඇතුළත් මාදිලි ලැයිස්තුව
MMDdetection ප්රසිද්ධ මාදිලි කිහිපයක් සහ කාර්ය-නැඹුරු මොඩියුල සඳහා ඉහළම මට්ටමේ කේත පදනම සපයයි. MMDetection මෙවලම් පෙට්ටිය සමඟ භාවිතා කළ හැකි කලින් සාදන ලද ආකෘති සහ අනුවර්තනය කළ හැකි ක්රම පහත ලැයිස්තුගත කර ඇත. තවත් ආකෘති සහ ක්රම එකතු කරන විට ලැයිස්තුව වර්ධනය වේ.
- වේගවත් R-CNN
- වේගවත් R-CNN
- මාස්ක් R-CNN
- RetinaNet
- ඩී.සී.එන්
- DCNv2
- කැස්කැඩ් R-CNN
- M2Det
- ජීඑච්එම්
- ScratchDet
- ද්විත්ව හිස R-CNN
- ජාලක R-CNN
- FSAF
- ලිබ්රා ආර්-සීඑන්එන්
- GCNet
- HRNet
- මාස්ක් ලකුණු R-CNN
- FCOS
- SSD
- R-FCN
- මිශ්ර නිරවද්යතා පුහුණුව
- බර ප්රමිතිකරණය
- Hybrid Task Cascade
- මාර්ගෝපදේශ නැංගුරම් ලෑම
- සාමාන්ය අවධානය
MMDetection භාවිතයෙන් වස්තු හඳුනාගැනීමේ ආකෘතිය ගොඩනැගීම
මෙම නිබන්ධනයේදී, එය සැකසීමට සහ භාවිතා කිරීමට පහසු නිසා අපි Google collab සටහන් පොත වනු ඇත.
ස්ථාපනය
අපට අවශ්ය සියල්ල ස්ථාපනය කිරීමට, අපි පළමුව අවශ්ය පුස්තකාල ස්ථාපනය කර MMdetection GitHub ව්යාපෘතිය ක්ලෝන කරමු.
env ආනයනය කිරීම
අපගේ ව්යාපෘතිය සඳහා පරිසරය දැන් ගබඩාවෙන් ආනයනය කරනු ලැබේ.
පුස්තකාල සහ MMdetection ආනයනය කිරීම
අපි දැන් MMdetection පාඨමාලාව සමඟ අවශ්ය පුස්තකාල ආනයනය කරන්නෙමු.
පෙර පුහුණු මුරපොල බාගන්න
MMdetection වෙතින් පූර්ව-පුහුණු ආදර්ශ මුරපොල තවදුරටත් ගැලපීම් සහ අනුමාන කිරීම සඳහා දැන් බාගත කළ යුතුය.
ගොඩනැගිලි ආකෘතිය
අපි දැන් ආකෘතිය ගොඩනඟා දත්ත කට්ටලයට මුරපොලවල් යොදන්නෙමු.
අනාවරකය අනුමාන කරන්න
දැන් ආකෘතිය නිවැරදිව ගොඩනඟා පටවා ඇති අතර, එය කෙතරම් විශිෂ්ට දැයි පරීක්ෂා කර බලමු. අපි MMDtetection හි ඉහළ මට්ටමේ API අනුමාන අනාවරකය භාවිතා කරමු. මෙම API නිර්මාණය කර ඇත්තේ අනුමාන ක්රියාවලිය පහසු කිරීමටය.
ප්රතිඵල
අපි බලමු ප්රතිඵල ගැන.
නිගමනය
අවසාන වශයෙන්, MMDetection මෙවලම් පෙට්ටිය මෑතකදී නිකුත් කරන ලද SimpleDet, Detectron, සහ Maskrcnn-benchmark වැනි කේත පදනම් අභිබවා යයි. විශාල මාදිලි එකතුවක් සමඟ,
MMDdetection දැන් අති නවීන තාක්ෂණයයි. MMDdetection කාර්යක්ෂමතාව සහ කාර්ය සාධනය අනුව අනෙකුත් සියලුම කේත පදනම අභිබවා යයි.
MMdetection පිළිබඳ හොඳම දේ නම්, ඔබට දැන් වෙනස් වින්යාස ගොනුවක් වෙත යොමු කිරීමට, වෙනත් මුරපොලක් බාගත කිරීමට සහ ඔබට ආකෘති වෙනස් කිරීමට අවශ්ය නම් එම කේතය ක්රියාත්මක කිරීමට හැකි වීමයි.
මම ඔවුන් දෙස බැලීමට උපදෙස් දෙමි උපදෙස් ඔබට කිසියම් අදියරක් සමඟ ගැටලු ඇති වුවහොත් හෝ ඒවායින් සමහරක් වෙනස් ආකාරයකින් සිදු කිරීමට කැමති නම්.
ඔබමයි