სარჩევი[დამალვა][ჩვენება]
ღრმა სწავლის ერთ-ერთი უმარტივესი, მაგრამ ყველაზე დამაინტრიგებელი იდეა არის ობიექტების ამოცნობა. ფუნდამენტური იდეა არის თითოეული ელემენტის დაყოფა თანმიმდევრულ კლასებად, რომლებიც წარმოადგენენ შესადარებელ მახასიათებლებს და შემდეგ დახაზოთ ყუთი მის გარშემო.
ეს განმასხვავებელი მახასიათებლები შეიძლება იყოს ისეთივე მარტივი, როგორც ფორმა ან ფერი, რაც გვეხმარება მათი კატეგორიზაციის უნარში.
აპლიკაციები ობიექტის ამოცნობა ისინი ფართოდ არიან დასაქმებულნი სამედიცინო მეცნიერებებში, ავტონომიურ მართვაში, თავდაცვისა და სამხედრო სფეროში, საჯარო ადმინისტრაციაში და ბევრ სხვა სფეროებში, კომპიუტერული ხედვისა და გამოსახულების დამუშავების მნიშვნელოვანი გაუმჯობესების წყალობით.
აქ გვაქვს MMDetection, ფანტასტიკური ღია კოდის ობიექტების ამოცნობის ხელსაწყოების ნაკრები, რომელიც აგებულია Pytorch-ზე. ამ სტატიაში ჩვენ დეტალურად განვიხილავთ MMDetection-ს, განვიხილავთ მის მახასიათებლებს და ბევრ სხვას.
რა არის MMDection?
ის MMDection ხელსაწყოთა ყუთი შეიქმნა, როგორც პითონის კოდების ბაზა, სპეციალურად ობიექტების იდენტიფიკაციისა და ინსტანციის სეგმენტაციის პრობლემებისთვის.
PyTorch-ის იმპლემენტაცია გამოიყენება და ის იქმნება მოდულური გზით. ობიექტების ამოცნობისა და მაგალითების სეგმენტაციისთვის, ეფექტური მოდელების ფართო სპექტრი შედგენილია სხვადასხვა მეთოდოლოგიაში.
ის იძლევა ეფექტურ დასკვნას და სწრაფ ვარჯიშს. მეორეს მხრივ, ხელსაწყოთა ყუთში შედის წონა 200-ზე მეტი წინასწარ მომზადებული ქსელისთვის, რაც მას სწრაფ გამოსწორებას ხდის ობიექტის იდენტიფიკაციის ველში.
არსებული ტექნიკის ადაპტაციის ან ხელმისაწვდომი მოდულების გამოყენებით ახალი დეტექტორის შექმნის შესაძლებლობით, MMDetection ფუნქციონირებს როგორც საორიენტაციო ნიშანი.
ხელსაწყოთა ყუთის მთავარი მახასიათებელია მისი ჩართვა ჩვეულებრივი მოდულარული ნაწილებისგან ობიექტის გამოვლენა ჩარჩო, რომელიც შეიძლება გამოყენებულ იქნას უნიკალური მილსადენების ან უნიკალური მოდელების შესაქმნელად.
ამ ინსტრუმენტთა ნაკრების ბენჩმარკინგის შესაძლებლობები გაადვილებს ახალი დეტექტორის ჩარჩოს შექმნას არსებული ჩარჩოს თავზე და მისი მუშაობის შედარება.
მისი მახასიათებლებია;
- პოპულარული და თანამედროვე გამოვლენის ჩარჩოები, როგორიცაა Faster RCNN, Mask RCNN, RetinaNet და ა.შ., უშუალოდ არის მხარდაჭერილი ინსტრუმენტთა ნაკრების მიერ.
- 360+ წინასწარ გაწვრთნილი მოდელების გამოყენება დახვეწისთვის (ან თავიდან ვარჯიშისთვის).
- ცნობილი ხედვის მონაცემთა ნაკრებისთვის, მათ შორის COCO, Cityscapes, LVIS და PASCAL VOC.
- GPU-ებზე ყველა ძირითადი bbox და mask ოპერაცია შესრულებულია. სხვა კოდების ბაზები, როგორიცაა Detectron2, maskrcnn-benchmark და SimpleDet, შეიძლება ივარჯიშონ უფრო სწრაფი ტემპით, ვიდრე ეს.
- მკვლევარები არღვევენ ობიექტის გამოვლენა ჩარჩო რამდენიმე მოდულში, რომლებიც შემდეგ შეიძლება გაერთიანდეს ობიექტის აღმოჩენის უნიკალური სისტემის შესაქმნელად.
MMDetection არქიტექტურა
MMDetection განსაზღვრავს ზოგად დიზაინს, რომელიც შეიძლება გამოყენებულ იქნას ნებისმიერ მოდელზე, რადგან ეს არის ხელსაწყოების ყუთი სხვადასხვა წინასწარ ჩაშენებული მოდელებით, რომელთაგან თითოეულს აქვს საკუთარი არქიტექტურა. შემდეგი კომპონენტები ქმნიან ამ მთლიან არქიტექტურას:
- ხერხემალი: ხერხემალი, როგორიცაა ResNet-50 საბოლოო სრულად დაკავშირებული შრის გარეშე, არის კომპონენტი, რომელიც გარდაქმნის სურათს ფუნქციურ რუქებად.
- Neck: კისერი არის სეგმენტი, რომელიც აკავშირებს ხერხემალს თავებთან. ხერხემლის ნედლეული ფუნქციების რუქებზე ის აკეთებს გარკვეულ კორექტირებას ან რეკონფიგურაციას. ფუნქცია პირამიდის ქსელი არის ერთი ილუსტრაცია (FPN).
- მკვრივი თავი (AnchorHead/AnchorFreeHead): ეს არის კომპონენტი, რომელიც მოქმედებს მხატვრული რუქების მკვრივ უბნებზე, როგორიცაა AnchorHead და AnchorFreeHead, როგორიცაა RPNHead, RetinaHead და FCOSHead.
- RoIE ექსტრაქტორი: RoIPooling-ის მსგავსი ოპერატორების გამოყენებით, ეს არის განყოფილება, რომელიც ამოიღებს RoIwise ფუნქციებს ერთი ან ფუნქციების რუქებიდან. SingleRoIExtractor-ის ნიმუში ამოიღებს RoI მახასიათებლებს ფუნქციების პირამიდების შესატყვისი დონისგან.
- RoIHead (BBoxHead/MaskHead): ეს არის სისტემის ნაწილი, რომელიც იყენებს RoI მახასიათებლებს, როგორც შეყვანას და აგენერირებს RoI-ზე დაფუძნებულ ამოცანის სპეციფიკურ პროგნოზებს, როგორიცაა შეზღუდვის ველების კლასიფიკაცია/რეგრესია და ნიღბის პროგნოზირება.
ერთსაფეხურიანი და ორსაფეხურიანი დეტექტორების აგება ილუსტრირებულია ზემოაღნიშნული კონცეფციების გამოყენებით. ჩვენ შეგვიძლია განვავითაროთ საკუთარი პროცედურები უბრალოდ რამდენიმე ახალი ნაწილის აგებით და არსებულის კომბინაციით.
MMDetection-ში შეტანილი მოდელების სია
MMDetection უზრუნველყოფს უმაღლესი დონის კოდების ბაზებს რამდენიმე ცნობილი მოდელისთვის და დავალებაზე ორიენტირებული მოდულისთვის. ადრე შემუშავებული მოდელები და ადაპტირებადი მეთოდები, რომლებიც შეიძლება გამოყენებულ იქნას MMDetection ხელსაწყოთა ყუთთან ერთად, ჩამოთვლილია ქვემოთ. სია იზრდება, რაც უფრო მეტი მოდელები და მეთოდები ემატება.
- სწრაფი R-CNN
- უფრო სწრაფი R-CNN
- ნიღაბი R-CNN
- RetinaNet
- DCN
- DCNv2
- კასკადი R-CNN
- M2Det
- GHM
- ScratchDet
- ორთავიანი R-CNN
- ბადე R-CNN
- FSAF
- სასწორი R-CNN
- GCNet
- HRNet
- ნიღბის ქულა R-CNN
- FCOS
- SSD
- R-FCN
- შერეული სიზუსტის ვარჯიში
- წონის სტანდარტიზაცია
- ჰიბრიდული დავალების კასკადი
- მართვადი ანკორინგი
- განზოგადებული ყურადღება
ობიექტის აღმოჩენის მოდელის აგება MMDetection-ის გამოყენებით
ამ სახელმძღვანელოში ჩვენ ვიქნებით Google collab-ის ნოუთბუქი, რადგან მისი დაყენება და გამოყენება მარტივია.
მონტაჟი
იმისათვის, რომ დავაინსტალიროთ ყველაფერი, რაც გვჭირდება, ჯერ დავაინსტალირებთ საჭირო ბიბლიოთეკებს და კლონირებს MMdetection GitHub პროექტს.
იმპორტირებული env
ჩვენი პროექტის გარემო ახლა იმპორტირებული იქნება საცავიდან.
ბიბლიოთეკების იმპორტი და MM-დეტექცია
ჩვენ ახლა შემოვიტანთ საჭირო ბიბლიოთეკებს, რა თქმა უნდა MM-ის აღმოჩენასთან ერთად.
ჩამოტვირთეთ წინასწარ მომზადებული საგუშაგოები
წინასწარ გაწვრთნილი მოდელის საგუშაგოები MMdetection-დან ახლა უნდა იყოს გადმოწერილი შემდგომი კორექტირებისთვის და დასკვნებისთვის.
შენობის მოდელი
ჩვენ ახლა ავაშენებთ მოდელს და გამოვიყენებთ საკონტროლო პუნქტებს მონაცემთა ბაზაში.
დეტექტორის დასკვნა
ახლა, როდესაც მოდელი სწორად არის აშენებული და დატვირთული, მოდით შევამოწმოთ რამდენად შესანიშნავია. ჩვენ ვიყენებთ MMDetection-ის მაღალი დონის API დასკვნის დეტექტორს. ეს API შექმნილია იმისთვის, რომ დასკვნის პროცესი გაადვილდეს.
შედეგი
მოდით შევხედოთ შედეგებს.
დასკვნა
დასასრულს, MMDetection ხელსაწყოთა ყუთი აჭარბებს ახლახან გამოშვებულ კოდების ბაზებს, როგორიცაა SimpleDet, Detectron და Maskrcnn-benchmark. მოდელების დიდი კოლექციით,
MMDetection ახლა უახლესი ტექნოლოგიაა. MMDetection აჯობებს ყველა სხვა კოდის ბაზას ეფექტურობისა და შესრულების თვალსაზრისით.
MMdetection-ის ერთ-ერთი საუკეთესო რამ არის ის, რომ ახლა შეგიძლიათ უბრალოდ მიუთითოთ სხვა კონფიგურაციის ფაილზე, ჩამოტვირთოთ სხვა საგუშაგო და გაუშვათ იგივე კოდი, თუ გსურთ მოდელების შეცვლა.
გირჩევ მათ გადახედო ინსტრუქციების თუ თქვენ შეგექმნათ პრობლემები რომელიმე ეტაპზე ან გსურთ განახორციელოთ ზოგიერთი მათგანი სხვაგვარად.
დატოვე პასუხი