Har du nogensinde stillet spørgsmålstegn ved, hvordan en selvkørende bil ved, hvornår den skal stoppe ved rødt lys, eller hvordan din telefon kan identificere dit ansigt?
Det er her Convolutional Neural Network eller kort sagt CNN kommer ind.
Et CNN kan sammenlignes med en menneskelig hjerne, der kan analysere billeder for at bestemme, hvad der sker i dem. Disse netværk kan endda opdage ting, som mennesker ville overse!
I dette indlæg vil vi udforske CNN i dyb læring sammenhæng. Lad os se, hvad dette spændende område kan tilbyde os!
Hvad er Deep Learning?
Deep learning er en slags kunstig intelligens. Det gør det muligt for computere at lære.
Deep learning behandler data ved hjælp af komplicerede matematiske modeller. Så en computer kan registrere mønstre og kategorisere data.
Efter træning med mange eksempler kan den også træffe beslutninger.
Hvorfor er vi interesserede i CNN'er i Deep Learning?
Convolutional Neural Networks (CNN'er) er en vigtig komponent i dyb læring.
De giver computere mulighed for at forstå billeder og andet visuelle data. Vi kan træne computere til at opdage mønstre og identificere objekter baseret på, hvad de "ser" ved at anvende CNN'er i dyb læring.
CNN'er fungerer som deep learning's øjne, der hjælper computere med at forstå miljøet!
Inspiration fra Brain's Architecture
CNN'er henter deres inspiration fra, hvordan hjernen fortolker information. Kunstige neuroner eller noder i CNN'er accepterer input, behandler dem og leverer resultatet som output, præcis som hjerneneuroner gør i hele kroppen.
Input lag
En standards inputlag neurale netværk modtager input i form af arrays, såsom billedpixel. I CNN'er leveres et billede som input til inputlaget.
Skjulte lag
Der er flere skjulte lag i CNN'er, som bruger matematik til at udtrække funktioner fra billedet. Der er flere slags lag, inklusive fuldstændigt forbundne, ensrettede lineære enheder, pooling og foldningslag.
Konvolutionslag
Det første lag til at udtrække funktioner fra et inputbillede er foldningslaget. Inputbilledet udsættes for filtrering, og resultatet er et feature map, der fremhæver nøgleelementerne i billedet.
Pooling senere
Poolinglaget bruges til at formindske størrelsen af featurekortet. Det styrker modellens modstand mod at flytte placeringen af inputbilledet.
Rectified Linear Unit Layer (ReLU)
ReLU-laget anvendes til at give modellen ulinearitet. Outputtet fra det foregående lag aktiveres af dette lag.
Fuldt forbundet lag
Det fuldt forbundne lag kategoriserer elementet og tildeler det et unikt ID i outputlaget er det fuldstændigt forbundne lag.
CNN'er er feedforward-netværk
Data flyder kun fra input til output på én måde. Deres arkitektur er inspireret af hjernens visuelle cortex, som består af skiftende lag af basale og sofistikerede celler.
Hvordan trænes CNN'er?
Overvej, at du forsøger at lære en computer at identificere en kat.
Du viser den mange billeder af katte, mens du siger: "Her er en kat." Efter at have set nok billeder af katte, begynder computeren at genkende egenskaber som spidse ører og knurhår.
Måden CNN fungerer på er ret ens. Der vises flere fotografier på computeren, og navnene på tingene på hvert billede er angivet.
CNN deler dog billederne op i mindre stykker, såsom regioner. Og den lærer at identificere karakteristika i disse regioner i stedet for blot at se billederne som en helhed.
Så CNN's indledende lag kan kun opdage grundlæggende karakteristika som kanter eller hjørner. Derefter bygger det næste lag på det for at genkende mere detaljerede funktioner som former eller teksturer.
Lagene bliver ved med at justere og finpudse disse kvaliteter, efterhånden som computeren ser flere billeder. Det fortsætter, indtil det bliver meget dygtigt til at identificere, hvad det end er trænet i, om det er katte, ansigter eller andet.
Et kraftfuldt Deep Learning-værktøj: Hvordan CNN'er transformerede billedgenkendelse
Ved at identificere og give mening med mønstre i billeder har CNN'er transformeret billedgenkendelse. Da de giver resultater med en høj grad af nøjagtighed, er CNN'er den mest effektive arkitektur til billedklassificering, genfinding og detektionsapplikationer.
De giver ofte fremragende resultater. Og de lokaliserer og identificerer præcist objekter på fotos i applikationer fra den virkelige verden.
Find mønstre i enhver del af et billede
Uanset hvor et mønster vises i et billede, er CNN'er designet til at genkende det. De kan automatisk udtrække visuelle karakteristika fra ethvert sted i et billede.
Dette er muligt takket være deres evne kendt som "rumlig invarians." Ved at forenkle processen kan CNN'er lære direkte fra fotos uden behov for udtræk af menneskelige funktioner.
Mere behandlingshastighed og mindre hukommelse brugt
CNN'er behandler billeder hurtigere og mere effektivt end traditionelle processer. Dette er et resultat af pooling-lagene, som sænker antallet af parametre, der kræves for at behandle et billede.
På denne måde sænker de hukommelsesforbrug og behandlingsomkostninger. Mange områder bruger CNN'er, såsom; ansigtsgenkendelse, videokategorisering og billedanalyse. De er endda vant til klassificere galakser.
Eksempler fra det virkelige liv
Google Billeder er en brug af CNN'er i den virkelige verden, der beskæftiger dem til at identificere personer og genstande på billeder. I øvrigt, Azure , Amazon leverer billedgenkendelses-API'er, der mærker og identificerer objekter ved hjælp af CNN'er.
En online grænseflade til træning af neurale netværk ved hjælp af datasæt, inklusive billedgenkendelsesopgaver, leveres af deep learning platformen NVIDIA-cifre.
Disse applikationer viser, hvordan CNN'er kan bruges til en række forskellige opgaver, fra små kommercielle brugssager til at organisere ens fotos. Der kan tænkes mange flere eksempler.
Hvordan vil konvolutionelle neurale netværk udvikle sig?
Sundhedspleje er en fascinerende industri, hvor CNN'er forventes at have en betydelig indflydelse. For eksempel kan de bruges til at evaluere medicinske billeder som røntgenbilleder og MR-scanninger. De kan hjælpe klinikere med hurtigere og mere præcist at diagnosticere sygdomme.
Selvkørende biler er en anden interessant applikation, hvor CNN'er kan bruges til objektidentifikation. Det kan forbedre, hvor godt køretøjerne forstår og reagerer på deres omgivelser.
Et stigende antal mennesker er også interesserede i at skabe CNN-strukturer, der er hurtigere og mere effektive, herunder mobile CNN'er. De forventes at blive brugt på energibesparende gadgets som smartphones og wearables.
Giv en kommentar