Har du noen gang stilt spørsmål ved hvordan en selvkjørende bil vet når den skal stoppe ved rødt lys, eller hvordan telefonen din kan identifisere ansiktet ditt?
Det er her Convolutional Neural Network eller CNN for kort kommer inn.
Et CNN kan sammenlignes med en menneskelig hjerne som kan analysere bilder for å finne ut hva som skjer i dem. Disse nettverkene kan til og med oppdage ting som mennesker ville oversett!
I dette innlegget vil vi utforske CNN i dyp læring kontekst. La oss se hva dette spennende området kan tilby oss!
Hva er Deep Learning?
Dyplæring er en slags kunstig intelligens. Det gjør det mulig for datamaskiner å lære.
Deep learning behandler data ved hjelp av kompliserte matematiske modeller. Slik at en datamaskin kan oppdage mønstre og kategorisere data.
Etter å ha trent med mange eksempler, kan den også ta avgjørelser.
Hvorfor er vi interessert i CNN i dyp læring?
Convolutional Neural Networks (CNN) er en viktig komponent i dyp læring.
De lar datamaskiner forstå bilder og annet visuelle data. Vi kan trene datamaskiner til å oppdage mønstre og identifisere objekter basert på hva de "ser" ved å bruke CNN i dyp læring.
CNN-er fungerer som dype læringsøyner, og hjelper datamaskiner med å forstå miljøet!
Inspirasjon fra Brain's Architecture
CNN-er henter inspirasjon fra hvordan hjernen tolker informasjon. Kunstige nevroner, eller noder, i CNN-er, aksepterer input, behandler dem og leverer resultatet som output, akkurat slik hjerneneuroner gjør i hele kroppen.
Inndatalag
Inndatalaget til en standard nevrale nettverket mottar innganger i form av arrays, for eksempel bildepiksler. I CNN-er leveres et bilde som input til input-laget.
Skjulte lag
Det er flere skjulte lag i CNN, som bruker matematikk for å trekke ut funksjoner fra bildet. Det finnes flere typer lag, inkludert fullstendig koblede, korrigerte lineære enheter, sammenslåing og konvolusjonslag.
Konvolusjonslag
Det første laget som trekker ut funksjoner fra et inngangsbilde er konvolusjonslaget. Inndatabildet utsettes for filtrering, og resultatet er et funksjonskart som fremhever nøkkelelementene i bildet.
Samling senere
Sammenslåingslaget brukes til å krympe størrelsen på funksjonskartet. Det styrker modellens motstand mot å flytte plasseringen av inngangsbildet.
Rettet lineært enhetslag (ReLU)
ReLU-laget brukes for å gi modellen ikke-linearitet. Utgangen fra det foregående laget aktiveres av dette laget.
Fullt tilkoblet lag
Det fullt tilkoblede laget kategoriserer elementet og tildeler det en unik ID i utdatalaget er det fullstendig tilkoblede laget.
CNN-er er feedforward-nettverk
Data flyter kun fra innganger til utganger på én måte. Arkitekturen deres er inspirert av hjernens visuelle cortex, som består av vekslende lag med grunnleggende og sofistikerte celler.
Hvordan trenes CNN-er?
Tenk på at du prøver å lære en datamaskin å identifisere en katt.
Du viser den mange bilder av katter mens du sier: "Her er en katt." Etter å ha sett nok bilder av katter, begynner datamaskinen å gjenkjenne egenskaper som spisse ører og værhår.
Måten CNN opererer på er ganske lik. Flere bilder vises på datamaskinen, og navnene på tingene på hvert bilde er gitt.
Imidlertid deler CNN bildene i mindre biter, for eksempel regioner. Og den lærer å identifisere egenskaper i disse regionene i stedet for bare å se bildene som en helhet.
Så, CNNs første lag kan bare oppdage grunnleggende egenskaper som kanter eller hjørner. Deretter bygger neste lag på det for å gjenkjenne mer detaljerte funksjoner som skjemaer eller teksturer.
Lagene fortsetter å justere og finpusse disse egenskapene etter hvert som datamaskinen ser på flere bilder. Det fortsetter til det blir veldig dyktig til å identifisere hva det er trent på, enten det er katter, ansikter eller noe annet.
Et kraftig verktøy for dyp læring: Hvordan CNNs transformerte bildegjenkjenning
Ved å identifisere og gi mening om mønstre i bilder, har CNN-er transformert bildegjenkjenning. Siden de gir resultater med høy grad av nøyaktighet, er CNN-er den mest effektive arkitekturen for bildeklassifisering, gjenfinning og deteksjonsapplikasjoner.
De gir ofte gode resultater. Og de identifiserer og identifiserer objekter på bilder nøyaktig i virkelige applikasjoner.
Finne mønstre i alle deler av et bilde
Uansett hvor et mønster vises i et bilde, er CNN-er designet for å gjenkjenne det. De kan automatisk trekke ut visuelle egenskaper fra et hvilket som helst sted i et bilde.
Dette er mulig takket være deres evne kjent som "romlig invarians." Ved å forenkle prosessen kan CNN-er lære rett fra bilder uten behov for utvinning av menneskelige funksjoner.
Mer prosesseringshastighet og mindre minne brukt
CNN-er behandler bilder raskere og mer effektivt enn tradisjonelle prosesser. Dette er et resultat av sammenslåingslagene, som senker antallet parametere som kreves for å behandle et bilde.
På denne måten reduserer de minnebruk og prosesseringskostnader. Mange områder bruker CNN, for eksempel; ansiktsgjenkjenning, videokategorisering og bildeanalyse. De er til og med vant til klassifisere galakser.
Eksempler fra det virkelige liv
Google Bilder er en bruk av CNN i den virkelige verden som bruker dem til å identifisere personer og gjenstander i bilder. Dessuten, Azure og Amazon gi bildegjenkjennings-APIer som merker og identifiserer objekter ved hjelp av CNN-er.
Et nettbasert grensesnitt for opplæring av nevrale nettverk ved å bruke datasett, inkludert bildegjenkjenningsoppgaver, leveres av dyplæringsplattformen NVIDIA-siffer.
Disse applikasjonene viser hvordan CNN-er kan brukes til en rekke oppgaver, fra småskala kommersielle brukssaker til organisering av bildene. Det kan tenkes mange flere eksempler.
Hvordan vil konvolusjonelle nevrale nettverk utvikle seg?
Helsetjenester er en fascinerende bransje der CNN-er forventes å ha en betydelig innflytelse. For eksempel kan de brukes til å evaluere medisinske bilder som røntgen og MR-skanninger. De kan hjelpe klinikere med raskere og mer nøyaktig diagnostisering av sykdommer.
Selvkjørende biler er en annen interessant applikasjon der CNN-er kan brukes for objektidentifikasjon. Det kan forbedre hvor godt kjøretøyene forstår og reagerer på omgivelsene.
Et økende antall mennesker er også interessert i å lage CNN-strukturer som er raskere og mer effektive, inkludert mobile CNN-er. De forventes å bli brukt på enheter med lav effekt som smarttelefoner og bærbare enheter.
Legg igjen en kommentar