Ar kada nors klausėte, kaip savarankiškai važiuojantis automobilis žino, kada sustoti degant raudonam šviesoforo signalui arba kaip jūsų telefonas gali atpažinti jūsų veidą?
Čia atsiranda konvoliucinis neuronų tinklas arba trumpiau CNN.
CNN yra panašus į žmogaus smegenis, kurios gali analizuoti vaizdus, kad nustatytų, kas juose vyksta. Šie tinklai netgi gali aptikti dalykus, kurių žmonės nepastebėtų!
Šiame įraše mes tyrinėsime CNN gilus mokymasis kontekste. Pažiūrėkime, ką ši įdomi sritis gali mums pasiūlyti!
Kas yra gilusis mokymasis?
Gilus mokymasis yra savotiškas dirbtinis intelektas. Tai leidžia kompiuteriams mokytis.
Gilus mokymasis apdoroja duomenis naudojant sudėtingus matematinius modelius. Kad kompiuteris galėtų aptikti šablonus ir suskirstyti duomenis į kategorijas.
Išmokęs daug pavyzdžių, jis taip pat gali priimti sprendimus.
Kodėl mus domina giluminio mokymosi CNN?
Konvoliuciniai neuroniniai tinklai (CNN) yra svarbi gilaus mokymosi dalis.
Jie leidžia kompiuteriams suprasti paveikslėlius ir kt vizualiniai duomenys. Mes galime išmokyti kompiuterius aptikti modelius ir identifikuoti objektus pagal tai, ką jie „mato“, naudodami CNN giliame mokyme.
CNN veikia kaip gilaus mokymosi akys, padedančios kompiuteriams suprasti aplinką!
Įkvėpimas iš „Brain's Architecture“.
CNN įkvėpimo semiasi iš to, kaip smegenys interpretuoja informaciją. Dirbtiniai neuronai arba mazgai, esantys CNN, priima įvestis, juos apdoroja ir pateikia rezultatą kaip išvestį, lygiai taip, kaip smegenų neuronai daro visame kūne.
Įvesties sluoksnis
Standarto įvesties sluoksnis neuroninis tinklas priima įvestis masyvų pavidalu, pvz., vaizdo pikselius. CNN paveikslėlis pateikiamas kaip įvestis į įvesties sluoksnį.
Paslėpti sluoksniai
CNN yra keletas paslėptų sluoksnių, kurie naudoja matematiką, kad ištrauktų ypatybes iš paveikslėlio. Yra keletas sluoksnių rūšių, įskaitant visiškai susietus, ištaisytus linijinius vienetus, telkimo ir konvoliucijos sluoksnius.
Konvoliucijos sluoksnis
Pirmasis sluoksnis, išskiriantis funkcijas iš įvesties paveikslėlio, yra konvoliucijos sluoksnis. Įvesties vaizdas filtruojamas, o rezultatas yra funkcijų žemėlapis, išryškinantis pagrindinius vaizdo elementus.
Sujungimas vėliau
Sujungimo sluoksnis naudojamas objektų žemėlapio dydžiui sumažinti. Tai sustiprina modelio atsparumą įvesties vaizdo vietos keitimui.
Ištaisytas tiesinis vieneto sluoksnis (ReLU)
ReLU sluoksnis naudojamas modeliui suteikti netiesiškumą. Šis sluoksnis suaktyvina ankstesnio sluoksnio išvestį.
Visiškai sujungtas sluoksnis
Visiškai prijungtas sluoksnis suskirsto elementą į kategorijas ir priskiria jam unikalų ID išvesties sluoksnyje yra visiškai prijungtas sluoksnis.
CNN yra grįžtamojo ryšio tinklai
Duomenys iš įvesties į išvestį perduodami tik vienu būdu. Jų architektūra įkvėpta smegenų regos žievės, kurią sudaro kintantys pagrindinių ir sudėtingų ląstelių sluoksniai.
Kaip mokomi CNN?
Pagalvokite, kad bandote išmokyti kompiuterį atpažinti katę.
Rodote jai daugybę kačių atvaizdų sakydami: „Štai katė“. Peržiūrėjęs pakankamai kačių vaizdų, kompiuteris pradeda atpažinti tokias savybes kaip smailios ausys ir ūsai.
CNN veikimo būdas yra gana panašus. Kompiuteryje rodomos kelios nuotraukos, o kiekvienoje nuotraukoje pateikiami daiktų pavadinimai.
Tačiau CNN padalija vaizdus į mažesnes dalis, pavyzdžiui, regionus. Be to, jis išmoksta nustatyti tų regionų ypatybes, o ne tik žiūrėti vaizdus kaip visumą.
Taigi, pradinis CNN sluoksnis gali aptikti tik pagrindines charakteristikas, tokias kaip kraštai ar kampai. Tada kitas sluoksnis yra grindžiamas tuo, kad atpažintų detalesnes funkcijas, pvz., formas ar tekstūras.
Sluoksniai nuolat koreguoja ir gerina šias savybes, kai kompiuteris peržiūri daugiau vaizdų. Tai tęsiasi tol, kol įgyja labai įgudę atpažinti tai, ko buvo išmokyta, ar tai būtų katės, veidai ar dar kas nors.
Galingas giluminio mokymosi įrankis: kaip CNN transformavo vaizdo atpažinimą
Nustatydami ir įprasmindami vaizdų modelius, CNN pakeitė vaizdo atpažinimą. Kadangi CNN pateikia aukšto tikslumo rezultatus, jie yra efektyviausia vaizdų klasifikavimo, paieškos ir aptikimo programų architektūra.
Jie dažnai duoda puikių rezultatų. Be to, jie tiksliai nustato ir identifikuoja objektus nuotraukose realiose programose.
Raštų bet kurioje paveikslėlio dalyje radimas
Nesvarbu, kur paveikslėlyje yra raštas, CNN yra sukurtas jį atpažinti. Jie gali automatiškai išgauti vaizdines charakteristikas iš bet kurios nuotraukos vietos.
Tai įmanoma dėl jų gebėjimo, žinomo kaip „erdvinis nekintamumas“. Supaprastinus procesą, CNN gali mokytis tiesiai iš nuotraukų, nereikalaujant žmogaus savybių išskleidimo.
Didesnis apdorojimo greitis ir mažiau naudojama atminties
CNN apdoroja nuotraukas greičiau ir efektyviau nei tradiciniai procesai. Taip yra dėl sujungimo sluoksnių, dėl kurių sumažėja parametrų, reikalingų paveikslėliui apdoroti, skaičius.
Tokiu būdu jie sumažina atminties naudojimo ir apdorojimo išlaidas. Daugelyje sričių naudojami CNN, pvz.; veido atpažinimas, vaizdo įrašų skirstymas į kategorijas ir paveikslėlių analizė. Jie netgi pripratę klasifikuoti galaktikas.
Realaus gyvenimo pavyzdžiai
„Google“ nuotraukos yra vienas iš CNN naudojimo būdų realiame pasaulyje, kuriame jie naudojami žmonėms ir objektams nuotraukose identifikuoti. Be to, Žydras ir Amazonė pateikti vaizdo atpažinimo API, kurios žymi ir identifikuoja objektus naudojant CNN.
Gilaus mokymosi platforma suteikia internetinę sąsają, skirtą neuroniniams tinklams mokyti naudojant duomenų rinkinius, įskaitant vaizdo atpažinimo užduotis NVIDIA skaitmenys.
Šios programos parodo, kaip CNN gali būti naudojamas įvairioms užduotims, nuo nedidelio masto komercinio naudojimo atvejų iki nuotraukų tvarkymo. Galima sugalvoti daug daugiau pavyzdžių.
Kaip vystysis konvoliuciniai neuroniniai tinklai?
Sveikatos priežiūra yra patraukli pramonė, kurioje tikimasi, kad CNN turės didelę įtaką. Pavyzdžiui, jie gali būti naudojami medicininėms nuotraukoms, tokioms kaip rentgeno ir MRT, įvertinti. Jie gali padėti gydytojams greičiau ir tiksliau diagnozuoti ligas.
Savarankiškai važiuojantys automobiliai yra dar viena įdomi programa, kurioje CNN gali būti naudojamas objektų identifikavimui. Tai gali pagerinti transporto priemonių supratimą ir reagavimą į aplinką.
Vis daugiau žmonių taip pat domisi greitesnių ir efektyvesnių CNN struktūrų kūrimu, įskaitant mobiliuosius CNN. Tikimasi, kad jie bus naudojami mažos galios įtaisuose, pavyzdžiui, išmaniuosiuose telefonuose ir nešiojamuosiuose įrenginiuose.
Palikti atsakymą