Vous êtes-vous déjà demandé comment une voiture autonome sait quand s'arrêter à un feu rouge ou comment votre téléphone peut identifier votre visage ?
C'est là qu'intervient le réseau de neurones convolutifs ou CNN en abrégé.
Un CNN est comparable à un cerveau humain qui peut analyser des images pour déterminer ce qui s'y passe. Ces réseaux peuvent même détecter des choses que les humains négligeraient !
Dans cet article, nous explorerons CNN dans le l'apprentissage en profondeur contexte. Voyons ce que ce domaine passionnant peut nous offrir !
Qu'est-ce que le Deep Learning?
L'apprentissage en profondeur est une sorte de intelligence artificielle. Il permet aux ordinateurs d'apprendre.
L'apprentissage en profondeur traite les données à l'aide de modèles mathématiques complexes. Ainsi, un ordinateur peut détecter des modèles et catégoriser les données.
Après s'être entraîné avec de nombreux exemples, il peut aussi prendre des décisions.
Pourquoi sommes-nous intéressés par les CNN dans le Deep Learning ?
Les réseaux de neurones convolutifs (CNN) sont une composante importante de l'apprentissage en profondeur.
Ils permettent aux ordinateurs de comprendre des images et d'autres données visuelles. Nous pouvons entraîner des ordinateurs à détecter des modèles et à identifier des objets en fonction de ce qu'ils "voient" en utilisant des CNN dans l'apprentissage en profondeur.
Les CNN agissent comme les yeux de l'apprentissage en profondeur, aidant les ordinateurs à comprendre l'environnement !
Inspiration de l'architecture du cerveau
Les CNN s'inspirent de la façon dont le cerveau interprète les informations. Les neurones artificiels, ou nœuds, dans les CNN, acceptent les entrées, les traitent et délivrent le résultat en sortie, exactement comme les neurones du cerveau le font dans tout le corps.
Couche d'entrée
La couche d'entrée d'une norme Réseau neuronal reçoit des entrées sous la forme de tableaux, tels que des pixels d'image. Dans les CNN, une image est fournie en entrée à la couche d'entrée.
Couches masquées
Il existe plusieurs couches cachées dans les CNN, qui utilisent les mathématiques pour extraire les caractéristiques de l'image. Il existe plusieurs types de couches, y compris des unités linéaires rectifiées complètement liées, des couches de regroupement et de convolution.
Couche de convolution
La première couche pour extraire les caractéristiques d'une image d'entrée est la couche de convolution. L'image d'entrée est soumise à un filtrage et le résultat est une carte des caractéristiques qui met en évidence les éléments clés de l'image.
Mise en commun plus tard
La couche de regroupement est utilisée pour réduire la taille de la carte d'entités. Il renforce la résistance du modèle au déplacement de l'emplacement de l'image d'entrée.
Couche d'unité linéaire rectifiée (ReLU)
La couche ReLU est utilisée pour donner au modèle une non-linéarité. La sortie de la couche précédente est activée par cette couche.
Couche entièrement connectée
La couche entièrement connectée catégorise l'élément et lui attribue un ID unique dans la couche de sortie est la couche complètement connectée.
Les CNN sont des réseaux Feedforward
Les données ne circulent des entrées aux sorties que dans un seul sens. Leur architecture s'inspire du cortex visuel du cerveau, composé d'une alternance de couches de cellules basiques et sophistiquées.
Comment les CNN sont-ils formés ?
Considérez que vous essayez d'apprendre à un ordinateur à identifier un chat.
Vous lui affichez de nombreuses images de chats en disant : « Voici un chat ». Après avoir visionné suffisamment d'images de chats, l'ordinateur commence à reconnaître des caractéristiques comme les oreilles pointues et les moustaches.
Le fonctionnement de CNN est assez similaire. Plusieurs photographies sont affichées sur l'ordinateur, et les noms des choses dans chaque image sont donnés.
Cependant, CNN divise les images en plus petits morceaux, tels que les régions. Et, il apprend à identifier les caractéristiques de ces régions plutôt que de simplement visualiser les images dans leur ensemble.
Ainsi, la couche initiale du CNN ne peut détecter que les caractéristiques de base comme les bords ou les coins. Ensuite, la couche suivante s'appuie sur celle-ci pour reconnaître des fonctionnalités plus détaillées telles que des formes ou des textures.
Les calques continuent d'ajuster et d'affiner ces qualités au fur et à mesure que l'ordinateur visualise davantage d'images. Il continue jusqu'à ce qu'il devienne très compétent pour identifier tout ce sur quoi il a été entraîné, que ce soit des chats, des visages ou autre chose.
Un puissant outil d'apprentissage en profondeur : comment les CNN ont transformé la reconnaissance d'images
En identifiant et en donnant un sens aux modèles dans les images, les CNN ont transformé la reconnaissance d'images. Puisqu'ils fournissent des résultats avec un degré élevé de précision, les CNN constituent l'architecture la plus efficace pour les applications de classification, de récupération et de détection d'images.
Ils donnent souvent d'excellents résultats. De plus, ils localisent et identifient avec précision les objets sur les photos dans des applications du monde réel.
Trouver des motifs dans n'importe quelle partie d'une image
Peu importe où un motif apparaît dans une image, les CNN sont conçus pour le reconnaître. Ils peuvent extraire automatiquement les caractéristiques visuelles de n'importe quel endroit d'une image.
Ceci est possible grâce à leur capacité connue sous le nom « d'invariance spatiale ». En simplifiant le processus, les CNN peuvent apprendre directement à partir des photos sans avoir besoin d'extraction de caractéristiques humaines.
Plus de vitesse de traitement et moins de mémoire utilisée
Les CNN traitent les images plus rapidement et plus efficacement que les processus traditionnels. Ceci est le résultat des couches de regroupement, qui réduisent le nombre de paramètres requis pour traiter une image.
De cette façon, ils réduisent l'utilisation de la mémoire et les coûts de traitement. De nombreux domaines utilisent des CNN, tels que; reconnaissance de visage, catégorisation vidéo et analyse d'images. Ils sont même habitués à classer les galaxies.
Exemples concrets
Google Images est une utilisation des CNN dans le monde réel qui les emploie pour identifier des personnes et des objets sur des images. De plus, Azure ainsi que Amazon fournissent des API de reconnaissance d'images qui marquent et identifient des objets à l'aide de CNN.
Une interface en ligne pour la formation de réseaux de neurones à l'aide d'ensembles de données, y compris des tâches de reconnaissance d'images, est fournie par la plateforme d'apprentissage en profondeur Chiffres NVIDIA.
Ces applications montrent comment les CNN peuvent être utilisés pour une variété de tâches, des cas d'utilisation commerciale à petite échelle à l'organisation de ses photos. De nombreux autres exemples peuvent être imaginés.
Comment les réseaux de neurones convolutifs vont-ils évoluer ?
La santé est une industrie fascinante où les CNN devraient avoir une influence significative. Par exemple, ils pourraient être utilisés pour évaluer des images médicales telles que des radiographies et des IRM. Ils peuvent aider les cliniciens à diagnostiquer plus rapidement et plus précisément les maladies.
Les automobiles autonomes sont une autre application intéressante où les CNN peuvent être utilisés pour l'identification d'objets. Cela peut améliorer la façon dont les véhicules comprennent et réagissent à leur environnement.
Un nombre croissant de personnes sont également intéressées par la création de structures CNN plus rapides et plus efficaces, y compris les CNN mobiles. Ils devraient être utilisés sur des gadgets à faible consommation d'énergie tels que les smartphones et les appareils portables.
Soyez sympa! Laissez un commentaire