Introdución ás redes neuronais

Índice analítico[Ocultar][Mostrar]

Que é a rede neuronal?
Como funcionan as redes neuronais?
Tipos de redes neuronais+-
aplicacións
vantaxes
Desvantaxes
Conclusión

Orixinalmente pensouse que a Intelixencia Artificial (IA) era un soño afastado, unha tecnoloxía para o futuro, pero xa non é así.

O que antes era un tema de investigación agora está a explotar no mundo real. Agora a IA atópase en diversos lugares, incluíndo o teu lugar de traballo, a escola, a banca, os hospitais e ata o teu teléfono.

Son os ollos dos vehículos autónomos, as voces de Siri e Alexa, as mentes detrás da previsión meteorolóxica, as mans detrás da cirurxía asistida por robots e moito máis.

intelixencia artificial (AI) estase a converter nunha característica común da vida moderna. Nos últimos anos, a IA emerxeu como un actor importante nunha ampla gama de tecnoloxías de TI.

Finalmente, a rede neuronal é usada pola IA para aprender cousas novas.

Así que hoxe aprenderemos sobre as redes neuronais, como funcionan, os seus tipos, aplicacións e moito máis.

Que é a rede neuronal?

In aprendizaxe de máquina, unha rede neuronal é unha rede de neuronas artificiais programada por software. Tenta imitar o cerebro humano tendo numerosas capas de "neuronas", que son similares ás neuronas do noso cerebro.

A primeira capa de neuronas aceptará fotos, vídeos, sons, texto e outras entradas. Estes datos flúen a través de todos os niveis, coa saída dunha capa fluíndo á seguinte. Isto é fundamental para as tarefas máis difíciles, como o procesamento da linguaxe natural para a aprendizaxe automática.

Non obstante, noutros casos, é preferible buscar a compresión do sistema para reducir o tamaño do modelo mantendo a precisión e a eficiencia. A poda dunha rede neuronal é un método de compresión que inclúe a eliminación de pesos dun modelo aprendido. Considere unha rede neuronal de intelixencia artificial que foi adestrada para distinguir as persoas dos animais.

redes neurais

A imaxe dividirase en partes brillantes e escuras pola primeira capa de neuronas. Estes datos pasaranse á seguinte capa, que determinará onde están os bordos.

A seguinte capa tentará recoñecer as formas que xerou a combinación de bordos. Segundo os datos nos que foi adestrado, os datos pasarán por numerosas capas dun xeito similar para determinar se a imaxe que presentaches é dun humano ou dun animal.

Cando os datos son introducidos nunha rede neuronal, comeza a procesalos. Despois diso, os datos son procesados a través dos seus niveis para obter o resultado desexado. Unha rede neuronal é unha máquina que aprende das entradas estruturadas e mostra os resultados. Existen tres tipos de aprendizaxe que poden ter lugar nas redes neuronais:

Aprendizaxe supervisada: as entradas e saídas entréganse aos algoritmos mediante datos etiquetados. Despois de ensinarlles a analizar os datos, prevén o resultado previsto.
Aprendizaxe sen supervisión: unha ANN aprende sen a axuda dun humano. Non hai datos etiquetados e a saída decídese polos patróns atopados nos datos de saída.
Aprendizaxe de reforzo é cando unha rede aprende dos comentarios que recibe.

Como funcionan as redes neuronais?

As neuronas artificiais utilízanse nas redes neuronais, que son sistemas sofisticados. As neuronas artificiais, tamén coñecidas como perceptrons, están formadas polos seguintes compoñentes:

Entrada
peso
Viés
Función de activación
Saída

As capas de neuronas que forman as redes neuronais. Unha rede neuronal consta de tres capas:

Capa de entrada
Capa oculta
Capa de saída

Os datos en forma de valor numérico envíanse á capa de entrada. As capas ocultas da rede son as que máis cálculos fan. A capa de saída, por último, pero non menos importante, prevé o resultado. As neuronas dominan entre si nunha rede neuronal. As neuronas utilízanse para construír cada capa. Os datos envíanse á capa oculta despois de que a capa de entrada os obteña.

Aplícanse pesos a cada entrada. Dentro das capas ocultas dunha rede neuronal, o peso é un valor que traduce os datos entrantes. Os pesos funcionan multiplicando os datos de entrada polo valor de peso na capa de entrada.

A continuación, inicia o valor da primeira capa oculta. Os datos de entrada transfórmanse e pásanse á outra capa a través das capas ocultas. A capa de saída encárgase de xerar o resultado final. As entradas e os pesos multiplícanse e o resultado entrégase ás neuronas da capa oculta como unha suma. Cada neurona recibe un sesgo. Para calcular o total, cada neurona suma as entradas que recibe.

Funcionamento da rede neuronal

Despois diso, o valor pasa a través da función de activación. O resultado da función de activación determina se se activa ou non unha neurona. Cando unha neurona está activa, envía información ás outras capas. Os datos créanse na rede ata que a neurona chega á capa de saída mediante este método. A propagación cara adiante é outro termo para isto.

A técnica de introducir datos nun nodo de entrada e obter a saída a través dun nodo de saída coñécese como propagación por avance. Cando os datos de entrada son aceptados pola capa oculta, prodúcese a propagación de feed-forward. Procédese segundo a función de activación e despois pásase á saída.

O resultado é proxectado pola neurona na capa de saída con maior probabilidade. A retropropagación ocorre cando a saída é incorrecta. Os pesos inícianse en cada entrada mentres se crea unha rede neuronal. A retropropagación é o proceso de reaxustar os pesos de cada entrada para reducir os erros e proporcionar unha saída máis precisa.

Tipos de redes neuronais

1. Perceptrón

O modelo de perceptrón de Minsky-Papert é un dos modelos de neuronas máis sinxelos e antigos. É a unidade máis pequena dunha rede neuronal que realiza determinados cálculos para descubrir características ou intelixencia empresarial nos datos entrantes. Leva entradas ponderadas e aplica a función de activación para obter o resultado final. TLU (unidade lóxica de limiar) é outro nome para perceptron.

Perceptrón

Perceptron é un clasificador binario que é un sistema de aprendizaxe supervisada que divide os datos en dous grupos. Portas lóxicas como AND, OR e NAND pódense implementar con perceptrons.

2. Rede neuronal de avance

A versión máis básica das redes neuronais, na que os datos de entrada flúen exclusivamente nunha dirección, pasa por nós neuronais artificiais e saen polos nodos de saída. As capas de entrada e saída están presentes nos lugares onde as capas ocultas poden estar presentes ou non. Pódense caracterizar como unha rede neuronal de avance dunha soa capa ou de varias capas en función desta.

O número de capas utilizadas vén determinado pola complexidade da función. Só se propaga cara adiante nunha dirección e non cara atrás. Aquí, os pesos permanecen constantes. As entradas multiplícanse por pesos para alimentar unha función de activación. Para iso utilízase unha función de activación de clasificación ou de activación de pasos.

3. Perceptrón multicapa

Unha introdución ao sofisticado redes neuronais, no que os datos de entrada envíanse a través de moitas capas de neuronas artificiais. É unha rede neuronal completamente ligada, xa que cada nodo está conectado a todas as neuronas da seguinte capa. Nas capas de entrada e saída están presentes varias capas ocultas, é dicir, polo menos tres ou máis capas.

Perceptrón multicapa

Posúe propagación bidireccional, o que significa que pode propagarse tanto cara adiante como cara atrás. As entradas multiplícanse por pesos e envíanse á función de activación, onde se cambian mediante a propagación inversa para minimizar a perda.

Os pesos son valores aprendidos pola máquina das Redes Neuronais, por dicilo de forma sinxela. Dependendo da disparidade entre os resultados esperados e as entradas de formación, autoaxustanse. Softmax úsase como función de activación da capa de saída despois das funcións de activación non lineais.

4. Rede neuronal convolucional

En contraste coa matriz bidimensional tradicional, unha rede neuronal de convolución ten unha configuración tridimensional de neuronas. A primeira capa coñécese como capa convolucional. Cada neurona da capa convolucional só procesa información dunha parte limitada do campo visual. Como un filtro, as funcións de entrada tómanse en modo por lotes.

A rede comprende as imaxes en seccións e pode realizar estas accións varias veces para rematar todo o procesamento da imaxe.

Rede neuronal convolucional

A imaxe convértese de RGB ou HSI a escala de grises durante o procesamento. Outras variacións no valor do píxel axudarán a detectar bordos e as imaxes pódense clasificar en varios grupos. A propagación unidireccional prodúcese cando unha CNN contén unha ou máis capas convolucionais seguidas de agrupación, e a propagación bidireccional prodúcese cando a saída da capa de convolución se envía a unha rede neuronal totalmente conectada para a clasificación de imaxes.

Para extraer determinados elementos dunha imaxe, utilízanse filtros. En MLP, as entradas son ponderadas e entréganse á función de activación. RELU úsase na convolución, mentres que MLP emprega unha función de activación non lineal seguida de softmax. No recoñecemento de imaxes e vídeos, análise semántica e detección de paráfrases, as redes neuronais convolucionais producen excelentes resultados.

5. Rede de polarización radial

Un vector de entrada é seguido por unha capa de neuronas RBF e unha capa de saída cun nodo para cada categoría nunha Rede de funcións de base radial. A entrada clasifícase comparándoa con puntos de datos do conxunto de adestramento, onde cada neurona mantén un prototipo. Este é un dos exemplos do conxunto de formación.

Rede de polarización radial

Cada neurona calcula a distancia euclidiana entre a entrada e o seu prototipo cando hai que clasificar un vector de entrada novo [o vector n-dimensional que estás a categorizar]. Se temos dúas clases, Clase A e Clase B, a nova entrada a categorizar é máis semellante aos prototipos de clase A que aos prototipos de clase B.

Como resultado, pode ser etiquetado ou categorizado como clase A.

6. Rede neuronal recorrente

As redes neuronais recorrentes están deseñadas para gardar a saída dunha capa e, a continuación, alimentala de novo na entrada para axudar a previr o resultado da capa. Un feed-forward rede neural adoita ser a capa inicial, seguida dunha capa de rede neuronal recorrente, onde unha función de memoria lembra parte da información que tiña no paso de tempo anterior.

Rede neuronal recorrente

Este escenario usa a propagación cara adiante. Garda os datos que serán necesarios no futuro. No caso de que a predición sexa incorrecta, a taxa de aprendizaxe utilízase para facer pequenos axustes. Como resultado, a medida que progresa a retropropagación, será cada vez máis precisa.

aplicacións

As redes neuronais utilízanse para tratar problemas de datos nunha variedade de disciplinas; a continuación móstranse algúns exemplos.

Recoñecemento facial: as solucións de recoñecemento facial serven como sistemas de vixilancia eficaces. Os sistemas de recoñecemento relacionan fotos dixitais con rostros humanos. Utilízanse nas oficinas para a entrada selectiva. Así, os sistemas verifican un rostro humano e compárao cunha lista de identificacións almacenadas na súa base de datos.
Predición de accións: os investimentos están expostos a riscos de mercado. É practicamente difícil prever desenvolvementos futuros no mercado de accións extremadamente volátil. Antes das redes neuronais, as fases alcistas e baixistas en constante cambio eran impredicibles. Pero, que cambiou todo? Por suposto, estamos a falar de redes neuronais... Un Perceptron MLP multicapa (un tipo de sistema de intelixencia artificial feedforward) utilízase para crear unha previsión de stock exitosa en tempo real.
Redes sociais – Por moi cursi que soe, as redes sociais cambiaron o camiño mundano da existencia. O comportamento dos usuarios das redes sociais estúdase mediante as Redes Neuronais Artificiais. Para a análise competitiva, os datos que se proporcionan diariamente mediante interaccións virtuais son acumulados e examinados. As accións dos usuarios das redes sociais son replicadas polas redes neuronais. Os comportamentos dos individuos pódense conectar cos patróns de gasto das persoas unha vez que se analizan os datos a través das redes sociais. Os datos das aplicacións de redes sociais extráense mediante Multilayer Perceptron ANN.
Asistencia sanitaria: os individuos do mundo actual están facendo uso dos beneficios da tecnoloxía no sector da saúde. No sector da saúde, as redes neuronais convolucionais utilízanse para a detección de raios X, tomografías computarizadas e ultrasóns. Os datos de imaxes médicas recibidos das probas mencionadas son avaliados e valorados mediante modelos de redes neuronais, xa que CNN utilízase no procesamento de imaxes. No desenvolvemento de sistemas de recoñecemento de voz tamén se utiliza a rede neuronal recorrente (RNN).
Informe meteorolóxico: antes da implantación da intelixencia artificial, as proxeccións do departamento meteorolóxico nunca eran precisas. A predición do tempo realízase en gran medida para prever as condicións meteorolóxicas que se producirán no futuro. As predicións meteorolóxicas están a ser utilizadas para prever a probabilidade de desastres naturais no período moderno. A predición do tempo realízase mediante un perceptrón multicapa (MLP), redes neuronais convolucionais (CNN) e redes neuronais recorrentes (RNN).
Defensa: a loxística, a análise de asaltos armados e a localización dos elementos empregan redes neuronais. Tamén están empregados en patrullas aéreas e marítimas, así como para xestionar drons autónomos. A intelixencia artificial está dando á industria da defensa o impulso que necesita para ampliar a súa tecnoloxía. Para detectar a existencia de minas submarinas utilízanse as Redes Neuronais Convolucionais (CNN).

vantaxes

Aínda que algunhas neuronas dunha rede neuronal non funcionen correctamente, as redes neuronais aínda xerarán saídas.
As redes neuronais teñen a capacidade de aprender en tempo real e adaptarse á súa configuración cambiante.
As redes neuronais poden aprender a facer unha variedade de tarefas. Proporcionar o resultado correcto a partir dos datos proporcionados.
As redes neuronais teñen a forza e a capacidade de manexar varias tarefas ao mesmo tempo.

Desvantaxes

As redes neuronais utilízanse para resolver problemas. Non revela a explicación detrás de "por que e como" fixo os xuízos que fixo debido á complexidade das redes. Como resultado, a confianza na rede pode verse erosionada.
Os compoñentes dunha rede neuronal son interdependentes entre si. É dicir, as redes neuronais demandan (ou dependen en gran medida de) ordenadores con potencia informática suficiente.
Un proceso de rede neuronal non ten ningunha regra específica (ou regra xeral). Nunha técnica de proba e erro, establécese unha estrutura de rede correcta intentando a rede óptima. É un procedemento que require moito axuste.

Conclusión

O campo de redes neuronales está en expansión rapidamente. É fundamental aprender e comprender os conceptos deste sector para poder manexalos.

Neste artigo cubríronse os moitos tipos de redes neuronais. Podes usar redes neuronais para abordar problemas de datos noutros campos se aprendes máis sobre esta disciplina.

Introdución ás redes neuronais

Que é a rede neuronal?

Como funcionan as redes neuronais?