Introduction aux réseaux de neurones

Table des matières[Cacher][Montrer]

Qu'est-ce qu'un réseau de neurones ?
Comment fonctionnent les réseaux de neurones ?
Types de réseau de neurones+-
Applications
Avantages
Inconvénients
Conclusion

L'intelligence artificielle (IA) était à l'origine considérée comme un rêve lointain, une technologie d'avenir, mais ce n'est plus le cas.

Ce qui était autrefois un sujet de recherche explose maintenant dans le monde réel. L'IA se trouve maintenant dans une variété d'endroits, y compris votre lieu de travail, votre école, votre banque, vos hôpitaux et même votre téléphone.

Ce sont les yeux des véhicules autonomes, les voix de Siri et d'Alexa, les esprits derrière les prévisions météorologiques, les mains derrière la chirurgie assistée par robot, et plus encore.

intelligence artificielle (IA) devient une caractéristique courante de la vie moderne. Au cours des dernières années, l'IA est devenue un acteur majeur dans un large éventail de technologies informatiques.

Enfin, le réseau de neurones est utilisé par l'IA pour apprendre de nouvelles choses.

Aujourd'hui, nous allons donc en apprendre davantage sur les réseaux de neurones, leur fonctionnement, leurs types, leurs applications et bien plus encore.

Qu'est-ce qu'un réseau de neurones ?

In machine learning, un réseau de neurones est un réseau programmé par logiciel de neurones artificiels. Il essaie d'imiter le cerveau humain en ayant de nombreuses couches de «neurones», qui sont similaires aux neurones de notre cerveau.

La première couche de neurones acceptera les photos, la vidéo, le son, le texte et d'autres entrées. Ces données circulent à travers tous les niveaux, la sortie d'une couche se déversant dans la suivante. Ceci est essentiel pour les tâches les plus difficiles, telles que le traitement du langage naturel pour l'apprentissage automatique.

Cependant, dans d'autres cas, viser la compression du système pour réduire la taille du modèle tout en maintenant la précision et l'efficacité est préférable. L'élagage d'un réseau de neurones est une méthode de compression qui comprend la suppression des poids d'un modèle appris. Considérez un réseau de neurones d'intelligence artificielle qui a été formé pour distinguer les humains des animaux.

Réseau neuronal

L'image sera divisée en parties claires et sombres par la première couche de neurones. Ces données seront transmises au calque suivant, qui déterminera où se trouvent les bords.

La couche suivante essaiera de reconnaître les formes générées par la combinaison des arêtes. Selon les données sur lesquelles il a été formé, les données traverseront de nombreuses couches de manière similaire pour déterminer si l'image que vous avez présentée est celle d'un humain ou d'un animal.

Lorsque des données sont transmises à un réseau de neurones, celui-ci commence à les traiter. Après cela, les données sont traitées via ses niveaux pour obtenir le résultat souhaité. Un réseau de neurones est une machine qui apprend à partir d'entrées structurées et affiche les résultats. Il existe trois types d'apprentissage qui peuvent avoir lieu dans les réseaux de neurones :

Apprentissage supervisé - Les entrées et les sorties sont données aux algorithmes à l'aide de données étiquetées. Après avoir appris à analyser les données, ils prévoient le résultat escompté.
Apprentissage non supervisé - Un ANN apprend sans l'aide d'un humain. Il n'y a pas de données étiquetées et la sortie est décidée par des modèles trouvés dans les données de sortie.
Apprentissage par renforcement c'est quand un réseau apprend des commentaires qu'il reçoit.

Comment fonctionnent les réseaux de neurones ?

Les neurones artificiels sont utilisés dans les réseaux de neurones, qui sont des systèmes sophistiqués. Les neurones artificiels, également appelés perceptrons, sont constitués des composants suivants :

Entrée
Poids
Préjugé
Fonction d'activation
Sortie

Les couches de neurones qui composent les réseaux de neurones. Un réseau de neurones se compose de trois couches :

Couche d'entrée
Couche cachée
Couche de sortie

Les données sous la forme d'une valeur numérique sont envoyées à la couche d'entrée. Les couches cachées du réseau sont celles qui effectuent le plus de calculs. La couche de sortie, last but not least, prévoit le résultat. Les neurones se dominent dans un réseau de neurones. Les neurones sont utilisés pour construire chaque couche. Les données sont acheminées vers la couche masquée une fois que la couche d'entrée les a reçues.

Des pondérations sont appliquées à chaque entrée. Dans les couches cachées d'un réseau de neurones, le poids est une valeur qui traduit les données entrantes. Les pondérations fonctionnent en multipliant les données d'entrée par la valeur de pondération dans la couche d'entrée.

Il commence alors la valeur du premier calque masqué. Les données d'entrée sont transformées et transmises à l'autre couche via les couches masquées. La couche de sortie est responsable de la génération du résultat final. Les entrées et les poids sont multipliés et le résultat est transmis aux neurones de la couche cachée sous forme de somme. Chaque neurone reçoit un biais. Pour calculer le total, chaque neurone additionne les entrées qu'il reçoit.

Réseau de neurones fonctionnant

Après cela, la valeur passe par la fonction d'activation. Le résultat de la fonction d'activation détermine si un neurone est activé ou non. Lorsqu'un neurone est actif, il envoie des informations aux autres couches. Les données sont créées dans le réseau jusqu'à ce que le neurone atteigne la couche de sortie en utilisant cette méthode. La propagation vers l'avant est un autre terme pour cela.

La technique consistant à introduire des données dans un nœud d'entrée et à obtenir la sortie via un nœud de sortie est connue sous le nom de propagation par anticipation. Lorsque les données d'entrée sont acceptées par la couche cachée, une propagation par anticipation se produit. Il est traité conformément à la fonction d'activation, puis transmis à la sortie.

Le résultat est projeté par le neurone dans la couche de sortie avec la probabilité la plus élevée. La rétropropagation se produit lorsque la sortie est incorrecte. Les poids sont initialisés à chaque entrée lors de la création d'un réseau de neurones. La rétropropagation est le processus de réajustement des poids de chaque entrée pour réduire les erreurs et fournir une sortie plus précise.

Types de réseau de neurones

1. Perceptrons

Le modèle de perceptron de Minsky-Papert est l'un des modèles de neurones les plus simples et les plus anciens. C'est la plus petite unité d'un réseau de neurones qui effectue certains calculs afin de découvrir des caractéristiques ou une intelligence économique dans les données entrantes. Il prend des entrées pondérées et applique la fonction d'activation pour obtenir le résultat final. TLU (unité logique de seuil) est un autre nom pour perceptron.

perceptron

Perceptron est un classificateur binaire qui est un système d'apprentissage supervisé qui divise les données en deux groupes. Des portes logiques tels que AND, OR et NAND peuvent être implémentés avec des perceptrons.

2. Réseau de neurones feed-forward

La version la plus basique des réseaux neuronaux, dans laquelle les données d'entrée circulent exclusivement dans une direction, passent par des nœuds neuronaux artificiels et sortent par des nœuds de sortie. Les couches d'entrée et de sortie sont présentes à des endroits où les couches cachées peuvent ou non être présentes. Ils peuvent être caractérisés comme un réseau de neurones à anticipation monocouche ou multicouche basé sur cela.

Le nombre de couches utilisées est déterminé par la complexité de la fonction. Il ne se propage qu'en avant dans une seule direction et ne se propage pas en arrière. Ici, les poids restent constants. Les entrées sont multipliées par des poids pour alimenter une fonction d'activation. Une fonction d'activation de classification ou une fonction d'activation d'étape est utilisée pour ce faire.

3. Perceptron multicouche

Une introduction à la sophistication réseaux de neurones, dans lequel les données d'entrée sont acheminées via de nombreuses couches de neurones artificiels. C'est un réseau neuronal complètement lié, puisque chaque nœud est connecté à tous les neurones de la couche suivante. Plusieurs couches cachées, c'est-à-dire au moins trois couches ou plus, sont présentes dans les couches d'entrée et de sortie.

Perceptron multicouche

Il possède une propagation bidirectionnelle, ce qui signifie qu'il peut se propager à la fois vers l'avant et vers l'arrière. Les entrées sont multipliées par des poids et envoyées à la fonction d'activation, où elles sont modifiées par rétropropagation pour minimiser la perte.

Les poids sont des valeurs apprises par les machines à partir des réseaux de neurones, pour le dire simplement. En fonction de l'écart entre les résultats attendus et les apports de formation, ils s'auto-ajustent. Softmax est utilisé comme fonction d'activation de la couche de sortie après les fonctions d'activation non linéaires.

4. Réseau de neurones convolutionnels

Contrairement au réseau bidimensionnel traditionnel, un réseau de neurones à convolution a une configuration tridimensionnelle de neurones. La première couche est connue sous le nom de couche convolutive. Chaque neurone de la couche convolutionnelle ne traite que les informations d'une partie limitée du champ visuel. Comme un filtre, les entités en entrée sont prises en mode batch.

Le réseau comprend les images en sections et peut effectuer ces actions plusieurs fois pour terminer le traitement complet de l'image.

Réseau neuronal convolutif

L'image est convertie de RVB ou HSI en niveaux de gris pendant le traitement. D'autres variations de la valeur des pixels aideront à détecter les contours et les images peuvent être triées en plusieurs groupes. La propagation unidirectionnelle se produit lorsqu'un CNN contient une ou plusieurs couches de convolution suivies d'un regroupement, et la propagation bidirectionnelle se produit lorsque la sortie de la couche de convolution est envoyée à un réseau neuronal entièrement connecté pour la classification des images.

Pour extraire certains éléments d'une image, des filtres sont utilisés. Dans MLP, les entrées sont pondérées et fournies à la fonction d'activation. RELU est utilisé en convolution, tandis que MLP utilise une fonction d'activation non linéaire suivie de softmax. Dans la reconnaissance d'images et de vidéos, l'analyse sémantique et la détection de paraphrases, les réseaux de neurones convolutionnels produisent d'excellents résultats.

5. Réseau de polarisation radiale

Un vecteur d'entrée est suivi d'une couche de neurones RBF et d'une couche de sortie avec un nœud pour chaque catégorie dans un réseau de fonction de base radiale. L'entrée est classée en la comparant aux points de données de l'ensemble d'apprentissage, où chaque neurone conserve un prototype. Ceci est l'un des exemples de l'ensemble de formation.

Réseau de polarisation radiale

Chaque neurone calcule la distance euclidienne entre l'entrée et son prototype lorsqu'un nouveau vecteur d'entrée [le vecteur à n dimensions que vous essayez de catégoriser] doit être classé. Si nous avons deux classes, la classe A et la classe B, la nouvelle entrée à catégoriser ressemble plus aux prototypes de classe A qu'aux prototypes de classe B.

En conséquence, il pourrait être étiqueté ou classé dans la classe A.

6. Réseau neuronal récurrent

Les réseaux de neurones récurrents sont conçus pour enregistrer la sortie d'une couche, puis la réinjecter dans l'entrée pour aider à prévoir le résultat de la couche. Un feed-back Réseau neuronal est généralement la couche initiale, suivie d'une couche de réseau de neurones récurrente, où une fonction de mémoire se souvient d'une partie des informations dont elle disposait au pas de temps précédent.

Réseau neuronal récurrent

Ce scénario utilise la propagation vers l'avant. Il enregistre les données qui seront nécessaires à l'avenir. Dans le cas où la prédiction est incorrecte, le taux d'apprentissage est utilisé pour effectuer des ajustements mineurs. En conséquence, au fur et à mesure que la rétropropagation progresse, elle deviendra de plus en plus précise.

Applications

Les réseaux de neurones sont utilisés pour gérer les problèmes de données dans diverses disciplines ; quelques exemples sont présentés ci-dessous.

Reconnaissance faciale – Les solutions de reconnaissance faciale servent de systèmes de surveillance efficaces. Les systèmes de reconnaissance relient les photos numériques aux visages humains. Ils sont utilisés dans les bureaux pour une entrée sélective. Ainsi, les systèmes vérifient un visage humain et le comparent à une liste d'identifiants stockés dans sa base de données.
Prédiction des actions – Les investissements sont exposés aux risques du marché. Il est pratiquement difficile de prévoir l'évolution future d'un marché boursier extrêmement volatil. Avant les réseaux de neurones, les phases haussières et baissières en constante évolution étaient imprévisibles. Mais, qu'est-ce qui a tout changé ? Bien sûr, nous parlons de réseaux de neurones… Un Perceptron MLP multicouche (un type de système d'intelligence artificielle à anticipation) est utilisé pour créer une prévision de stock réussie en temps réel.
Réseaux Sociaux - Peu importe à quel point cela peut sembler ringard, les médias sociaux ont changé le chemin banal de l'existence. Le comportement des utilisateurs de médias sociaux est étudié à l'aide de réseaux de neurones artificiels. Pour l'analyse concurrentielle, les données fournies quotidiennement via des interactions virtuelles sont entassées et examinées. Les actions des utilisateurs des médias sociaux sont reproduites par les réseaux de neurones. Les comportements des individus peuvent être liés aux habitudes de dépenses des gens une fois que les données sont analysées via les réseaux de médias sociaux. Les données des applications de médias sociaux sont extraites à l'aide de Multilayer Perceptron ANN.
Soins de santé – Dans le monde d'aujourd'hui, les individus profitent des avantages de la technologie dans le secteur des soins de santé. Dans le secteur de la santé, les réseaux neuronaux convolutifs sont utilisés pour la détection par rayons X, les tomodensitogrammes et les ultrasons. Les données d'imagerie médicale reçues des tests susmentionnés sont évaluées et évaluées à l'aide de modèles de réseaux neuronaux, car CNN est utilisé dans le traitement d'images. Dans le développement de systèmes de reconnaissance vocale, le réseau neuronal récurrent (RNN) est également utilisé.
Bulletin météorologique - Avant la mise en œuvre de l'intelligence artificielle, les projections du service météorologique n'étaient jamais précises. Les prévisions météorologiques sont faites en grande partie pour prévoir les conditions météorologiques qui se produiront à l'avenir. Les prévisions météorologiques sont utilisées pour anticiper la probabilité de catastrophes naturelles à l'époque moderne. Les prévisions météorologiques sont effectuées à l'aide du perceptron multicouche (MLP), des réseaux de neurones convolutifs (CNN) et des réseaux de neurones récurrents (RNN).
Défense - La logistique, l'analyse des agressions armées et la localisation des objets utilisent tous des réseaux de neurones. Ils sont également employés dans des patrouilles aériennes et maritimes, ainsi que pour gérer des drones autonomes. L'intelligence artificielle donne à l'industrie de la défense le coup de pouce dont elle a tant besoin pour développer sa technologie. Pour détecter l'existence de mines sous-marines, des réseaux neuronaux convolutifs (CNN) sont utilisés.

Avantages

Même si quelques neurones d'un réseau de neurones ne fonctionnent pas correctement, les réseaux de neurones généreront toujours des sorties.
Les réseaux de neurones ont la capacité d'apprendre en temps réel et de s'adapter à leurs paramètres changeants.
Les réseaux de neurones peuvent apprendre à effectuer diverses tâches. Fournir le résultat correct sur la base des données fournies.
Les réseaux de neurones ont la force et la capacité de gérer plusieurs tâches en même temps.

Inconvénients

Les réseaux de neurones sont utilisés pour résoudre des problèmes. Il ne divulgue pas l'explication derrière "pourquoi et comment" il a porté ses jugements en raison de la complexité des réseaux. En conséquence, la confiance du réseau peut être érodée.
Les composants d'un réseau de neurones sont interdépendants les uns des autres. C'est-à-dire que les réseaux de neurones exigent (ou sont extrêmement dépendants) des ordinateurs dotés d'une puissance de calcul suffisante.
Un processus de réseau neuronal n'a pas de règle spécifique (ou de règle empirique). Dans une technique d'essai et d'erreur, une structure de réseau correcte est établie en essayant le réseau optimal. C'est une procédure qui demande beaucoup d'ajustements.

Conclusion

Le domaine de les réseaux de neurones est en pleine expansion. Il est essentiel d'apprendre et de comprendre les concepts de ce secteur afin d'être en mesure de les traiter.

Les nombreux types de réseaux de neurones ont été couverts dans cet article. Vous pouvez utiliser les réseaux de neurones pour résoudre des problèmes de données dans d'autres domaines si vous en apprenez plus sur cette discipline.

Introduction aux réseaux de neurones

Qu'est-ce qu'un réseau de neurones ?

Comment fonctionnent les réseaux de neurones ?