Автомат жолоодлоготой машин улаан гэрлээр зогсохыг хэрхэн мэддэг вэ, эсвэл таны утас таны царайг хэрхэн таньдаг талаар та асууж байсан уу?
Эндээс Convolutional Neural Network буюу CNN товчоор орж ирдэг.
CNN-ийг хүний тархитай харьцуулж болохуйц зураг дээр юу болж байгааг тодорхойлох боломжтой. Эдгээр сүлжээнүүд нь хүмүүсийн анзаардаггүй зүйлсийг илрүүлж чадна!
Энэ нийтлэлд бид CNN-ийг судлах болно гүн гүнзгий суралцах контекст. Энэхүү сэтгэл хөдөлгөм бүс бидэнд юу санал болгож болохыг харцгаая!
Гүнзгий суралцах гэж юу вэ?
Гүнзгий суралцах нь нэг төрөл юм хиймэл оюун. Энэ нь компьютерт суралцах боломжийг олгодог.
Гүнзгий сургалт нь нарийн төвөгтэй математик загваруудыг ашиглан өгөгдлийг боловсруулдаг. Ингэснээр компьютер хэв маягийг илрүүлж, өгөгдлийг ангилж чадна.
Олон жишээн дээр сургасны дараа шийдвэр гаргах боломжтой.
Бид яагаад гүн гүнзгий суралцах CNN-ийг сонирхож байна вэ?
Convolutional Neural Network (CNN) нь гүнзгий суралцах чухал бүрэлдэхүүн хэсэг юм.
Эдгээр нь компьютерт зураг болон бусад зүйлийг ойлгох боломжийг олгодог харааны өгөгдөл. Бид CNN-ийг гүнзгий суралцахад ашигласнаар хэв маягийг илрүүлж, "харж буй" зүйл дээрээ үндэслэн объектуудыг тодорхойлоход компьютеруудыг сургаж чадна.
CNN нь гүн гүнзгий суралцах нүд болж, компьютерт хүрээлэн буй орчныг ойлгоход тусалдаг!
Тархины архитектураас санаа авсан
CNN-үүд тархи мэдээллийг хэрхэн тайлбарлаж байгаагаас санаа авдаг. CNN-ийн хиймэл мэдрэлийн эсүүд буюу зангилаанууд нь тархины мэдрэлийн эсүүд биеийн бүх хэсэгт ажилладаг шиг оролтыг хүлээн авч, боловсруулж, үр дүнг гаралт болгон хүргэдэг.
Оролтын давхарга
Стандартын оролтын давхарга мэдрэлийн сүлжээ зургийн пиксел гэх мэт массив хэлбэрээр оролтыг хүлээн авдаг. CNN-д зургийг оролтын давхаргад оруулдаг.
Нуугдсан давхаргууд
CNN-д хэд хэдэн далд давхаргууд байдаг бөгөөд тэдгээр нь математикийн тусламжтайгаар зургаас онцлог шинж чанаруудыг гаргаж авдаг. Бүрэн холбосон, шулуун шугаман нэгж, нэгтгэх, эргүүлэх давхарга зэрэг хэд хэдэн төрлийн давхарга байдаг.
Хувиралтын давхарга
Оруулсан зургаас онцлог шинж чанаруудыг гаргаж авах эхний давхарга нь конволюцийн давхарга юм. Оруулсан зураг нь шүүлтүүрт хамрагдах бөгөөд үр дүн нь зургийн гол элементүүдийг тодруулсан функцийн газрын зураг юм.
Дараа нь нэгтгэх
Нэгтгэх давхарга нь газрын зургийн хэмжээг багасгахад ашиглагддаг. Энэ нь оролтын зургийн байршлыг өөрчлөх загварын эсэргүүцлийг бэхжүүлдэг.
Шулуутгагдсан шугаман нэгж давхарга (ReLU)
Загварыг шугаман бус болгохын тулд ReLU давхаргыг ашигладаг. Өмнөх давхаргын гаралтыг энэ давхарга идэвхжүүлдэг.
Бүрэн холбогдсон давхарга
Бүрэн холбогдсон давхарга нь тухайн зүйлийг ангилж, гаралтын давхаргад өвөрмөц ID-г өгдөг бөгөөд энэ нь бүрэн холбогдсон давхарга юм.
CNN нь Feedforward Networks юм
Өгөгдөл нь зөвхөн нэг аргаар оролтоос гаралт руу урсдаг. Тэдний архитектур нь үндсэн болон боловсронгуй эсүүдийн ээлжлэн давхаргуудаас бүрддэг тархины харааны бор гадаргаас санаа авчээ.
CNN хэрхэн бэлтгэгдсэн бэ?
Та муурыг танихын тулд компьютерт заахыг оролдож байна гэж бодоорой.
Та "Энд муур байна" гэж хэлэх зуураа муурны олон зургийг үзүүлнэ. Муурны хангалттай зургийг үзсэний дараа компьютер шовх чих, сахал зэрэг шинж чанаруудыг таньж эхэлдэг.
CNN-ийн үйл ажиллагаа нь үүнтэй төстэй юм. Хэд хэдэн гэрэл зургийг компьютер дээр харуулах бөгөөд зураг болгон дээрх зүйлсийн нэрийг өгсөн болно.
Гэсэн хэдий ч CNN зургуудыг бүс нутаг гэх мэт жижиг хэсгүүдэд хуваадаг. Мөн энэ нь зургийг бүхэлд нь харахын оронд тухайн бүс нутгийн онцлог шинж чанарыг тодорхойлж сурдаг.
Тиймээс CNN-ийн эхний давхарга нь зөвхөн ирмэг эсвэл булан гэх мэт үндсэн шинж чанарыг илрүүлж чадна. Дараа нь дараагийн давхарга нь хэлбэр, бүтэц гэх мэт илүү нарийвчилсан шинж чанаруудыг танихын тулд үүн дээр тулгуурладаг.
Компьютер илүү олон зураг үзэхийн хэрээр давхаргууд эдгээр чанарыг тохируулж, сайжруулсаар байна. Энэ нь муур, нүүр царай эсвэл өөр ямар ч зүйл дээр сургагдсан бүх зүйлээ таних чадвартай болох хүртэл үргэлжилнэ.
Гүн гүнзгий суралцах хүчирхэг хэрэгсэл: CNN зураг танихыг хэрхэн өөрчилсөн бэ?
CNN-үүд зураг дээрх хэв маягийг тодорхойлж, утга учиртай болгосноор дүрс таних чадварыг өөрчилсөн. Эдгээр нь өндөр нарийвчлалтай үр дүнг өгдөг тул CNN нь дүрс ангилах, хайх, илрүүлэх програмуудад хамгийн үр дүнтэй архитектур юм.
Тэд ихэвчлэн маш сайн үр дүнг өгдөг. Мөн тэд бодит амьдрал дээрх зураг дээрх объектуудыг нарийн тодорхойлж, тодорхойлдог.
Зургийн аль ч хэсгээс хэв маягийг олох
Зурган дээрх хээ хаана ч харагдахаас үл хамааран CNN үүнийг таних зориулалттай. Тэд зургийн аль ч газраас харааны шинж чанарыг автоматаар гаргаж авах боломжтой.
Энэ нь тэдний "орон зайн өөрчлөгдөөгүй" чадварын ачаар боломжтой юм. Процессыг хялбаршуулснаар CNN-үүд хүний онцлогийг задлах шаардлагагүйгээр шууд зурагнаасаа суралцах боломжтой.
Илүү их боловсруулах хурд, бага санах ой ашигладаг
CNN нь зургийг уламжлалт процессоос илүү хурдан бөгөөд илүү үр дүнтэй боловсруулдаг. Энэ нь зургийг боловсруулахад шаардагдах параметрийн тоог бууруулдаг давхаргын нэгдлүүдийн үр дүн юм.
Ингэснээр тэд санах ойн хэрэглээ болон боловсруулалтын зардлыг бууруулдаг. Олон газар CNN ашигладаг, тухайлбал; царайг таних, видеоны ангилал, зургийн дүн шинжилгээ. Тэд бүр дассан галактикуудыг ангилах.
Бодит жишээнүүд
Google зураг Энэ нь зураг дээрх хүмүүс болон объектуудыг танихад ашигладаг CNN-ийн бодит ертөнцөд нэг хэрэглээ юм. Түүнээс гадна, Azure болон Амазоны CNN ашиглан объектуудыг тэмдэглэж, таних дүрсийг таних API-аар хангана.
Өгөгдлийн багц ашиглан мэдрэлийн сүлжээг сургах онлайн интерфэйс, түүний дотор зураг таних даалгавруудыг гүнзгий сургалтын платформоор хангадаг. NVIDIA цифрүүд.
Эдгээр програмууд нь CNN-ийг жижиг хэмжээний арилжааны хэрэглээнээс авахуулаад гэрэл зургуудаа цэгцлэх хүртэл янз бүрийн ажилд хэрхэн ашиглаж болохыг харуулдаг. Өөр олон жишээг дурдаж болно.
Хувиралт мэдрэлийн сүлжээ хэрхэн хөгжих вэ?
Эрүүл мэндийн салбар бол CNN-д ихээхэн нөлөө үзүүлэх сонирхолтой салбар юм. Жишээлбэл, тэдгээрийг рентген болон MRI сканнер гэх мэт эмнэлгийн зургийг үнэлэхэд ашиглаж болно. Тэд өвчнийг илүү хурдан бөгөөд үнэн зөв оношлоход эмч нарт тусалж чадна.
Өөрөө жолооддог автомашин бол CNN-ийг объектыг танихад ашиглаж болох өөр нэг сонирхолтой програм юм. Энэ нь тээврийн хэрэгсэл хүрээлэн буй орчныг хэрхэн ойлгож, хариу үйлдэл үзүүлэхийг сайжруулж чадна.
Түүнчлэн хөдөлгөөнт CNN гэх мэт илүү хурдан бөгөөд үр дүнтэй CNN бүтцийг бий болгох сонирхолтой хүмүүсийн тоо нэмэгдэж байна. Эдгээрийг ухаалаг гар утас, зүүдэг төхөөрөмж гэх мэт бага чадалтай хэрэгсэлд ашиглах төлөвтэй байна.
хариу үлдээх