Alguna vegada t'has preguntat com un cotxe autònom sap quan s'ha d'aturar davant d'un semàfor vermell o com el teu telèfon pot identificar la teva cara?
Aquí és on entra la xarxa neuronal convolucional o CNN per abreujar-se.
Una CNN és comparable a un cervell humà que pot analitzar imatges per determinar què hi passa. Aquestes xarxes poden fins i tot detectar coses que els humans passarien per alt!
En aquesta publicació, explorarem CNN al aprenentatge profund context. A veure què ens pot oferir aquesta apassionant zona!
Què és l'aprenentatge profund?
L'aprenentatge profund és una mena de intel·ligència artificial. Permet que els ordinadors aprenguin.
L'aprenentatge profund processa dades mitjançant models matemàtics complicats. Així, un ordinador pot detectar patrons i categoritzar les dades.
Després d'entrenar amb molts exemples, també pot prendre decisions.
Per què ens interessen les CNN en aprenentatge profund?
Les xarxes neuronals convolucionals (CNN) són un component important de l'aprenentatge profund.
Permeten als ordinadors comprendre imatges i altres dades visuals. Podem entrenar ordinadors per detectar patrons i identificar objectes en funció del que "veuen" mitjançant l'ús de CNN en l'aprenentatge profund.
Les CNN actuen com a ulls d'aprenentatge profund, ajudant els ordinadors a entendre l'entorn!
Inspiració de l'arquitectura del cervell
Les CNN s'inspiren en com el cervell interpreta la informació. Les neurones artificials, o nodes, a les CNN, accepten les entrades, les processen i proporcionen el resultat com a sortida, tal com ho fan les neurones cerebrals a tot el cos.
Capa d'entrada
La capa d'entrada d'un estàndard xarxa neural rep entrades en forma de matrius, com ara píxels d'imatge. A les CNN, es subministra una imatge com a entrada a la capa d'entrada.
Capes ocultes
Hi ha diverses capes ocultes a les CNN, que utilitzen les matemàtiques per extreure característiques de la imatge. Hi ha diversos tipus de capes, com ara unitats lineals rectificades completament enllaçades, agrupacions i capes de convolució.
Capa de convolució
La primera capa per extreure característiques d'una imatge d'entrada és la capa de convolució. La imatge d'entrada està sotmesa a filtratge i el resultat és un mapa de característiques que destaca els elements clau de la imatge.
Agrupació més tard
La capa de agrupació s'utilitza per reduir la mida del mapa de característiques. Reforça la resistència del model a canviar la ubicació de la imatge d'entrada.
Capa d'unitat lineal rectificada (ReLU)
La capa ReLU s'utilitza per donar al model no linealitat. La sortida de la capa anterior s'activa per aquesta capa.
Capa totalment connectada
La capa completament connectada categoritza l'element i li assigna un identificador únic a la capa de sortida és la capa completament connectada.
Les CNN són xarxes Feedforward
Les dades només flueixen de les entrades a les sortides d'una manera. La seva arquitectura està inspirada en l'escorça visual del cervell, que està formada per capes alternes de cèl·lules bàsiques i sofisticades.
Com es formen les CNN?
Considereu que esteu intentant ensenyar a un ordinador a identificar un gat.
Li mostres moltes imatges de gats mentre dius: "Aquí hi ha un gat". Després de veure prou imatges de gats, l'ordinador comença a reconèixer característiques com les orelles punxegudes i els bigotis.
La manera com opera CNN és bastant semblant. Es mostren diverses fotografies a l'ordinador i es donen els noms de les coses de cada imatge.
Tanmateix, CNN divideix les imatges en peces més petites, com ara regions. I, aprèn a identificar les característiques d'aquestes regions en lloc de veure les imatges com un tot.
Per tant, la capa inicial de la CNN només pot detectar característiques bàsiques com vores o cantonades. Aleshores, la següent capa es basa en això per reconèixer característiques més detallades com ara formes o textures.
Les capes segueixen ajustant i perfeccionant aquestes qualitats a mesura que l'ordinador veu més imatges. Continua fins que arriba a ser molt habilitat per identificar tot allò en què s'ha entrenat, ja siguin gats, cares o qualsevol altra cosa.
Una potent eina d'aprenentatge profund: com les CNN van transformar el reconeixement d'imatges
En identificar i donar sentit als patrons de les imatges, les CNN han transformat el reconeixement d'imatges. Com que proporcionen resultats amb un alt grau de precisió, les CNN són l'arquitectura més eficient per a aplicacions de classificació, recuperació i detecció d'imatges.
Sovint donen resultats excel·lents. A més, localitzen i identifiquen amb precisió els objectes de les fotos en aplicacions del món real.
Trobar patrons en qualsevol part d'una imatge
No importa on aparegui un patró en una imatge, les CNN estan dissenyades per reconèixer-lo. Poden extreure automàticament característiques visuals de qualsevol lloc d'una imatge.
Això és possible gràcies a la seva capacitat coneguda com a "invariància espacial". Simplificant el procés, les CNN poden aprendre directament de les fotos sense necessitat d'extracció de característiques humanes.
Més velocitat de processament i menys memòria utilitzada
Les CNN processen imatges de manera més ràpida i eficient que els processos tradicionals. Aquest és el resultat de les capes d'agrupació, que redueixen el nombre de paràmetres necessaris per processar una imatge.
D'aquesta manera, redueixen l'ús de la memòria i els costos de processament. Moltes àrees utilitzen CNN, com ara; reconeixement facial, categorització de vídeos i anàlisi d'imatges. Fins i tot estan acostumats classificar les galàxies.
Exemples de la vida real
Google Fotos és un ús de les CNN al món real que les empra per identificar persones i objectes en imatges. A més, Azur i Amazon proporcionar API de reconeixement d'imatges que etiqueten i identifiquen objectes mitjançant CNN.
La plataforma d'aprenentatge profund proporciona una interfície en línia per entrenar xarxes neuronals mitjançant conjunts de dades, incloses tasques de reconeixement d'imatges. Dígits de NVIDIA.
Aquestes aplicacions mostren com les CNN es poden utilitzar per a una varietat de tasques, des de casos d'ús comercial a petita escala fins a l'organització de les fotos. Es poden pensar molts més exemples.
Com evolucionaran les xarxes neuronals convolucionals?
La sanitat és una indústria fascinant on s'espera que les CNN tinguin una influència significativa. Per exemple, es podrien utilitzar per avaluar imatges mèdiques com ara radiografies i ressonàncies magnètiques. Poden ajudar els metges a diagnosticar les malalties amb més rapidesa i precisió.
Els automòbils amb conducció autònoma són una altra aplicació interessant on les CNN es poden utilitzar per a la identificació d'objectes. Pot millorar com els vehicles entenen i reaccionen al seu entorn.
Un nombre creixent de persones també està interessada a crear estructures de CNN que siguin més ràpides i efectives, incloses les CNN mòbils. S'espera que s'utilitzin en aparells de baix consum, com ara telèfons intel·ligents i dispositius portàtils.
Deixa un comentari