Har du någonsin ifrågasatt hur en självkörande bil vet när den ska stanna vid rött ljus eller hur din telefon kan identifiera ditt ansikte?
Det är här Convolutional Neural Network eller förkortat CNN kommer in.
Ett CNN är jämförbart med en mänsklig hjärna som kan analysera bilder för att avgöra vad som händer i dem. Dessa nätverk kan till och med upptäcka saker som människor skulle förbise!
I det här inlägget kommer vi att utforska CNN i djupt lärande sammanhang. Låt oss se vad detta spännande område kan erbjuda oss!
Vad är Deep Learning?
Djup inlärning är ett slags artificiell intelligens. Det gör det möjligt för datorer att lära sig.
Deep learning bearbetar data med hjälp av komplicerade matematiska modeller. Så att en dator kan upptäcka mönster och kategorisera data.
Efter träning med många exempel kan den också fatta beslut.
Varför är vi intresserade av CNN i Deep Learning?
Convolutional Neural Networks (CNN) är en viktig komponent i djupinlärning.
De tillåter datorer att förstå bilder och annat visuella data. Vi kan träna datorer att upptäcka mönster och identifiera objekt baserat på vad de "ser" genom att använda CNN i djupinlärning.
CNN fungerar som djupinlärningsögon och hjälper datorer att förstå miljön!
Inspiration från Brain's Architecture
CNN:s hämtar sin inspiration från hur hjärnan tolkar information. Artificiella neuroner, eller noder, i CNN, accepterar indata, bearbetar dem och levererar resultatet som utdata, precis som hjärnneuroner gör i hela kroppen.
Indatalager
Inmatningsskiktet för en standard neurala nätverk tar emot indata i form av arrayer, såsom bildpixlar. I CNN:er tillförs en bild som input till inmatningsskiktet.
Dolda lager
Det finns flera dolda lager i CNN, som använder matematik för att extrahera funktioner från bilden. Det finns flera typer av lager, inklusive helt länkade, likriktade linjära enheter, pooling och faltningslager.
Konvolutionslager
Det första lagret som extraherar funktioner från en ingångsbild är faltningsskiktet. Ingångsbilden utsätts för filtrering, och resultatet är en funktionskarta som framhäver bildens nyckelelement.
Poolning senare
Poolskiktet används för att krympa storleken på kartan. Det stärker modellens motstånd mot att flytta ingångsbildens placering.
Rectified Linear Unit Layer (ReLU)
ReLU-skiktet används för att ge modellen olinjäritet. Utgången från det föregående lagret aktiveras av detta lager.
Fullt anslutet lager
Det helt anslutna lagret kategoriserar objektet och tilldelar det ett unikt ID i utdatalagret är det helt anslutna lagret.
CNN är feedforward-nätverk
Data flödar bara från ingångar till utgångar på ett sätt. Deras arkitektur är inspirerad av hjärnans visuella cortex, som består av omväxlande lager av grundläggande och sofistikerade celler.
Hur utbildas CNN?
Tänk på att du försöker lära en dator att identifiera en katt.
Du visar många bilder av katter samtidigt som du säger "Här är en katt." Efter att ha sett tillräckligt många bilder av katter börjar datorn känna igen egenskaper som spetsiga öron och morrhår.
Sättet som CNN fungerar på är ganska likt. Flera fotografier visas på datorn och namnen på sakerna på varje bild anges.
CNN delar dock upp bilderna i mindre bitar, till exempel regioner. Och den lär sig att identifiera egenskaper i dessa regioner snarare än att bara se bilderna som en helhet.
Så, CNN:s första lager kanske bara upptäcker grundläggande egenskaper som kanter eller hörn. Sedan bygger nästa lager på det för att känna igen mer detaljerade funktioner som former eller texturer.
Lagren fortsätter att justera och finslipa dessa egenskaper när datorn ser fler bilder. Det fortsätter tills det blir mycket skickligt på att identifiera vad det än tränades på, oavsett om det är katter, ansikten eller något annat.
Ett kraftfullt verktyg för djupinlärning: Hur CNN:s förvandlade bildigenkänning
Genom att identifiera och förstå mönster i bilder har CNN:er förvandlat bildigenkänning. Eftersom de ger resultat med en hög grad av noggrannhet är CNN:er den mest effektiva arkitekturen för bildklassificering, hämtning och detekteringstillämpningar.
De ger ofta utmärkta resultat. Och de preciserar och identifierar objekt i foton i verkliga applikationer.
Hitta mönster i valfri del av en bild
Oavsett var ett mönster förekommer i en bild, är CNNs designade för att känna igen det. De kan automatiskt extrahera visuella egenskaper från vilken plats som helst i en bild.
Detta är möjligt tack vare deras förmåga som kallas "spatial invarians." Genom att förenkla processen kan CNN:er lära sig direkt från foton utan att behöva extrahera mänskliga funktioner.
Mer bearbetningshastighet och mindre minne används
CNN:er bearbetar bilder snabbare och mer effektivt än traditionella processer. Detta är ett resultat av poolingslagren, som minskar antalet parametrar som krävs för att bearbeta en bild.
På så sätt sänker de minnesanvändning och bearbetningskostnader. Många områden använder CNN, såsom; ansiktsigenkänning, videokategorisering och bildanalys. De är till och med vana vid klassificera galaxer.
Verkliga exempel
Google Bilder är en användning av CNN i den verkliga världen som använder dem för att identifiera människor och föremål i bilder. Dessutom, Azure och amason tillhandahålla API:er för bildigenkänning som taggar och identifierar objekt med hjälp av CNN.
Ett onlinegränssnitt för att träna neurala nätverk med hjälp av datauppsättningar, inklusive uppgifter för bildigenkänning, tillhandahålls av plattformen för djupinlärning NVIDIA-siffror.
Dessa applikationer visar hur CNN kan användas för en mängd olika uppgifter, från småskaliga kommersiella användningsfall till att organisera sina foton. Många fler exempel kan tänkas.
Hur kommer konvolutionella neurala nätverk att utvecklas?
Sjukvård är en fascinerande bransch där CNN förväntas ha ett betydande inflytande. Till exempel kan de användas för att utvärdera medicinska bilder som röntgen och MRI. De kan hjälpa läkare att diagnostisera sjukdomar snabbare och mer exakt.
Självkörande bilar är en annan intressant applikation där CNN kan användas för objektidentifiering. Det kan förbättra hur väl fordonen förstår och reagerar på sin omgivning.
Ett ökande antal människor är också intresserade av att skapa CNN-strukturer som är snabbare och mer effektiva, inklusive mobila CNN. De förväntas användas på lågeffektprylar som smartphones och bärbara enheter.
Kommentera uppropet