Питали ли сте се някога как самоуправляващата се кола знае кога да спре на червен светофар или как телефонът ви може да разпознае лицето ви?
Тук се намесва Конволюционната невронна мрежа или накратко CNN.
CNN е сравним с човешки мозък, който може да анализира изображения, за да определи какво се случва в тях. Тези мрежи могат дори да открият неща, които хората биха пренебрегнали!
В тази публикация ще проучим CNN в дълбоко учене контекст. Нека да видим какво може да ни предложи тази вълнуваща област!
Какво е дълбоко обучение?
Дълбокото обучение е вид изкуствен интелект. Позволява на компютрите да учат.
Дълбокото обучение обработва данни с помощта на сложни математически модели. Така че компютърът може да открие модели и да категоризира данните.
След обучение с много примери, то също може да взема решения.
Защо се интересуваме от CNN в Deep Learning?
Конволюционните невронни мрежи (CNN) са важен компонент на дълбокото обучение.
Те позволяват на компютрите да разбират картини и други визуални данни. Можем да обучим компютри да откриват модели и да идентифицират обекти въз основа на това, което „виждат“, като използваме CNN в задълбочено обучение.
CNN действат като очи на задълбочено обучение, помагайки на компютрите да разберат околната среда!
Вдъхновение от Brain's Architecture
CNN се вдъхновяват от това как мозъкът интерпретира информацията. Изкуствените неврони или възли в CNN приемат входове, обработват ги и доставят резултата като изход, точно както го правят мозъчните неврони в цялото тяло.
Входен слой
Входният слой на стандарт невронна мрежа получава входни данни под формата на масиви, като например пиксели на картината. В CNN картината се доставя като вход към входния слой.
Скрити слоеве
Има няколко скрити слоя в CNN, които използват математика, за да извлекат характеристики от картината. Има няколко вида слоеве, включително напълно свързани, ректифицирани линейни единици, обединяване и слоеве за навиване.
Конволюционен слой
Първият слой за извличане на характеристики от входна картина е слоят за навиване. Входното изображение се подлага на филтриране и резултатът е карта на характеристиките, която подчертава ключовите елементи на изображението.
Обединяване по-късно
Слоят за обединяване се използва за свиване на размера на картата на характеристиките. Той засилва устойчивостта на модела към изместване на местоположението на входната картина.
Ректифициран линеен слой (ReLU)
Слоят ReLU се използва, за да даде на модела нелинейност. Резултатът от предходния слой се активира от този слой.
Напълно свързан слой
Напълно свързаният слой категоризира елемента и му присвоява уникален идентификатор в изходния слой е напълно свързаният слой.
CNN са Feedforward мрежи
Данните преминават от входове към изходи само по един начин. Тяхната архитектура е вдъхновена от зрителната кора на мозъка, която се състои от редуващи се слоеве от основни и сложни клетки.
Как се обучават CNN?
Помислете, че се опитвате да научите компютър да идентифицира котка.
Показвате му много изображения на котки, докато казвате „Ето котка“. След като прегледа достатъчно изображения на котки, компютърът започва да разпознава характеристики като заострени уши и мустаци.
Начинът, по който работи CNN, е доста подобен. На компютъра се показват няколко снимки и се дават имената на нещата на всяка снимка.
CNN обаче разделя изображенията на по-малки части, като региони. И се научава да идентифицира характеристиките в тези региони, вместо просто да разглежда изображенията като цяло.
Така че първоначалният слой на CNN може да открие само основни характеристики като ръбове или ъгли. След това следващият слой се основава на това, за да разпознава по-подробни характеристики като форми или текстури.
Слоевете продължават да коригират и усъвършенстват тези качества, докато компютърът разглежда повече изображения. Продължава, докато стане много опитен в идентифицирането на каквото и да е бил обучен, независимо дали са котки, лица или нещо друго.
Мощен инструмент за задълбочено обучение: Как CNN трансформират разпознаването на изображения
Чрез идентифициране и осмисляне на модели в изображенията, CNN трансформираха разпознаването на изображения. Тъй като предоставят резултати с висока степен на точност, CNN са най-ефективната архитектура за приложения за класифициране на изображения, извличане и откриване.
Те често дават отлични резултати. И те прецизно определят и идентифицират обекти в снимки в приложения от реалния свят.
Намиране на модели във всяка част от картина
Без значение къде се появява модел в картината, CNN са проектирани да го разпознават. Те могат автоматично да извличат визуални характеристики от всяко място в картината.
Това е възможно благодарение на тяхната способност, известна като „пространствена инвариантност“. Чрез опростяване на процеса, CNN могат да се учат направо от снимки, без да е необходимо извличане на човешки функции.
По-голяма скорост на обработка и по-малко използвана памет
CNN обработват снимки по-бързо и по-ефективно от традиционните процеси. Това е резултат от групираните слоеве, които намаляват броя на параметрите, необходими за обработка на картина.
По този начин те намаляват използването на памет и разходите за обработка. Много области използват CNN, като например; разпознаване на лица, видео категоризация и анализ на снимки. Дори са свикнали класифицира галактиките.
Примери от реалния живот
Google Картини е едно използване на CNN в реалния свят, което ги използва за идентифициране на хора и обекти в снимки. Освен това, Лазурен намлява Амазонка предоставят API за разпознаване на изображения, които маркират и идентифицират обекти с помощта на CNN.
Онлайн интерфейс за обучение на невронни мрежи, използващи набори от данни, включително задачи за разпознаване на картини, се предоставя от платформата за дълбоко обучение Цифри на NVIDIA.
Тези приложения показват как CNN могат да се използват за различни задачи, от малки случаи на комерсиална употреба до организиране на нечии снимки. Могат да се измислят още много примери.
Как ще се развият конволюционните невронни мрежи?
Здравеопазването е очарователна индустрия, в която се очаква CNN да имат значително влияние. Например, те могат да се използват за оценка на медицински снимки като рентгенови лъчи и MRI сканирания. Те могат да помогнат на клиницистите за по-бързо и точно диагностициране на заболявания.
Самоуправляващите се автомобили са друго интересно приложение, при което CNN могат да се използват за идентификация на обекти. Може да подобри колко добре превозните средства разбират и реагират на заобикалящата ги среда.
Все по-голям брой хора също се интересуват от създаването на CNN структури, които са по-бързи и по-ефективни, включително мобилни CNN. Очаква се те да се използват на джаджи с ниска мощност като смартфони и носими устройства.
Оставете коментар