Hefur þú einhvern tíma velt því fyrir þér hvernig sjálfkeyrandi bíll veit hvenær hann á að stoppa á rauðu ljósi eða hvernig síminn þinn getur borið kennsl á andlit þitt?
Þetta er þar sem Convolutional Neural Network eða CNN í stuttu máli kemur inn.
CNN er sambærilegt við mannsheila sem getur greint myndir til að ákvarða hvað er að gerast í þeim. Þessi net geta jafnvel greint hluti sem menn myndu horfa framhjá!
Í þessari færslu munum við kanna CNN í djúpt nám samhengi. Við skulum sjá hvað þetta spennandi svæði getur boðið okkur!
Hvað er djúpt nám?
Djúpnám er eins konar gervigreind. Það gerir tölvum kleift að læra.
Djúpnám vinnur úr gögnum með flóknum stærðfræðilíkönum. Svo að tölva geti greint mynstur og flokkað gögn.
Eftir þjálfun með mörgum dæmum getur það líka tekið ákvarðanir.
Af hverju höfum við áhuga á CNN í djúpu námi?
Convolutional Neural Networks (CNN) eru mikilvægur þáttur í djúpnámi.
Þeir gera tölvum kleift að skilja myndir og annað sjónræn gögn. Við getum þjálfað tölvur til að greina mynstur og bera kennsl á hluti út frá því sem þeir „sjá“ með því að nota CNN í djúpnámi.
CNNs virka eins og djúpt nám og aðstoða tölvur við að skilja umhverfið!
Innblástur frá Brain's Architecture
CNNs sækja innblástur sinn frá því hvernig heilinn túlkar upplýsingar. Gervi taugafrumur, eða hnútar, í CNN, samþykkja inntak, vinna úr þeim og skila niðurstöðunni sem úttak, alveg eins og heilataugar gera um allan líkamann.
Inntakslag
Inntakslag staðals tauga net tekur á móti inntakum í formi fylkinga, eins og myndpixla. Í CNN er mynd afhent sem inntak í inntakslagið.
Falin lög
Það eru nokkur falin lög í CNN, sem nota stærðfræði til að draga eiginleika úr myndinni. Það eru til nokkrar tegundir af lögum, þar á meðal algjörlega tengdar, leiðréttar línulegar einingar, sameining og falllög.
Convolution Layer
Fyrsta lagið til að draga út eiginleika úr inntaksmynd er falllag. Inntaksmyndin er háð síun og útkoman er eiginleikakort sem undirstrikar helstu þætti myndarinnar.
Samstarf síðar
Samlagslagið er notað til að minnka stærð eiginleikakortsins. Það styrkir viðnám líkansins við að færa staðsetningu inntaksmyndarinnar.
Leiðrétt línuleg einingslag (ReLU)
ReLU lagið er notað til að gefa líkaninu ólínuleika. Úttak fyrra lagsins er virkjað af þessu lagi.
Alveg tengt lag
Fulltengda lagið flokkar hlutinn og úthlutar því einstakt auðkenni í framleiðslulaginu sem er algjörlega tengda lagið.
CNN eru Feedforward Networks
Gögn streyma aðeins frá inntak til úttaks á einn hátt. Arkitektúr þeirra er innblásinn af sjónberki heilans, sem er gerður úr lögum af grunn- og háþróuðum frumum til skiptis.
Hvernig eru CNN þjálfaðir?
Íhugaðu að þú sért að reyna að kenna tölvu að bera kennsl á kött.
Þú sýnir það margar myndir af köttum á meðan þú segir: "Hér er köttur." Eftir að hafa skoðað nógu margar myndir af köttum byrjar tölvan að þekkja einkenni eins og oddhvass eyru og hárhönd.
Starfshætti CNN er nokkuð svipað. Nokkrar ljósmyndir eru sýndar í tölvunni og nöfn hlutanna á hverri mynd gefin upp.
Hins vegar skiptir CNN myndunum í smærri hluta, eins og svæði. Og það lærir að bera kennsl á einkenni á þessum svæðum frekar en að skoða myndirnar í heild sinni.
Svo, upphafslag CNN getur aðeins greint grunneiginleika eins og brúnir eða horn. Síðan byggir næsta lag á því til að þekkja ítarlegri eiginleika eins og form eða áferð.
Lögin halda áfram að stilla og skerpa þessa eiginleika eftir því sem tölvan skoðar fleiri myndir. Það heldur áfram þar til það verður mjög fært í að bera kennsl á hvað sem það var þjálfað í, hvort sem það eru kettir, andlit eða eitthvað annað.
Öflugt djúpnámstæki: Hvernig CNN breytti myndgreiningu
Með því að bera kennsl á og gera grein fyrir mynstrum í myndum hafa CNN breytt myndgreiningu. Þar sem þeir veita niðurstöður með mikilli nákvæmni eru CNN skilvirkasta arkitektúrinn fyrir myndflokkun, sókn og uppgötvunarforrit.
Þeir skila oft frábærum árangri. Og þeir finna nákvæmlega og bera kennsl á hluti á myndum í raunverulegum forritum.
Að finna mynstur í hvaða hluta mynd sem er
Sama hvar mynstur birtist á mynd, CNN eru hönnuð til að þekkja það. Þeir geta sjálfkrafa dregið út sjónræna eiginleika frá hvaða stað sem er í mynd.
Þetta er mögulegt þökk sé hæfileika þeirra sem kallast „rýmisóbreytni“. Með því að einfalda ferlið geta CNNs lært beint af myndum án þess að þurfa að draga úr mannlegum eiginleikum.
Meiri vinnsluhraði og minna minni notað
CNNs vinna myndir hraðar og skilvirkari en hefðbundin ferli. Þetta er afleiðing af sameiningu laganna, sem lækka fjölda breytu sem þarf til að vinna mynd.
Þannig lækka þeir minnisnotkun og vinnslukostnað. Mörg svæði nota CNN, svo sem; andlitsþekking, flokkun myndbanda og myndgreiningu. Þeir eru meira að segja vanir flokka vetrarbrautir.
Raunveruleg dæmi
Google myndir er ein notkun CNN í hinum raunverulega heimi sem notar þá til að bera kennsl á fólk og hluti á myndum. Þar að auki, Azure og Amazon veita myndgreiningarforritaskil sem merkja og auðkenna hluti með CNN.
Netviðmót til að þjálfa taugakerfi með því að nota gagnasöfn, þar á meðal myndgreiningarverkefni, er veitt af djúpnámsvettvangi NVIDIA tölustafir.
Þessi forrit sýna hvernig hægt er að nota CNN í margvíslegum verkefnum, allt frá smærri viðskiptalegum notkunarmálum til að skipuleggja myndirnar manns. Mörg fleiri dæmi má hugsa sér.
Hvernig munu taugakerfi þróast?
Heilbrigðisþjónusta er heillandi iðnaður þar sem búist er við að CNN hafi veruleg áhrif. Til dæmis væri hægt að nota þær til að meta læknisfræðilegar myndir eins og röntgenmyndir og segulómun. Þeir geta aðstoðað lækna við að greina sjúkdóma hraðar og nákvæmari.
Sjálfkeyrandi bifreiðar eru annað áhugavert forrit þar sem hægt er að nota CNN til að bera kennsl á hluti. Það getur bætt hversu vel ökutækin skilja og bregðast við umhverfi sínu.
Vaxandi fjöldi fólks hefur einnig áhuga á að búa til CNN mannvirki sem eru fljótvirkari og skilvirkari, þar á meðal farsíma CNN. Gert er ráð fyrir að þær verði notaðar á orkusnauðar græjur eins og snjallsíma og wearables.
Skildu eftir skilaboð