Sommario[Nascondere][Spettacolo]
Inizialmente si pensava che l'Intelligenza Artificiale (AI) fosse un sogno lontano, una tecnologia per il futuro, ma non è più così.
Quello che una volta era un argomento di ricerca sta ora esplodendo nel mondo reale. L'intelligenza artificiale ora si trova in una varietà di luoghi, inclusi il posto di lavoro, la scuola, le banche, gli ospedali e persino il telefono.
Sono gli occhi dei veicoli a guida autonoma, le voci di Siri e Alexa, le menti dietro le previsioni del tempo, le mani dietro la chirurgia robotica e altro ancora.
L'intelligenza artificiale (AI) sta diventando una caratteristica comune della vita moderna. Negli ultimi anni, l'IA è emersa come uno dei principali attori in un'ampia gamma di tecnologie IT.
Infine, la rete neurale viene utilizzata dall'IA per apprendere nuove cose.
Quindi oggi impareremo a conoscere le reti neurali, come funzionano, i loro tipi, applicazioni e molto altro.
Cos'è la rete neurale?
In machine learning, una rete neurale è una rete di neuroni artificiali programmata da software. Cerca di imitare il cervello umano avendo numerosi strati di "neuroni", che sono simili ai neuroni nel nostro cervello.
Il primo livello di neuroni accetterà foto, video, suoni, testo e altri input. Questi dati fluiscono attraverso tutti i livelli, con l'output di un livello che scorre nel successivo. Questo è fondamentale per le attività più difficili, come l'elaborazione del linguaggio naturale per l'apprendimento automatico.
Tuttavia, in altri casi, è preferibile puntare alla compressione del sistema per ridurre le dimensioni del modello mantenendo la precisione e l'efficienza. L'eliminazione di una rete neurale è un metodo di compressione che include la rimozione dei pesi da un modello appreso. Considera una rete neurale di intelligenza artificiale che è stata addestrata per distinguere le persone dagli animali.
L'immagine sarà divisa in parti chiare e scure dal primo strato di neuroni. Questi dati verranno passati al livello successivo, che determinerà dove si trovano i bordi.
Il livello successivo proverà a riconoscere le forme generate dalla combinazione dei bordi. In base ai dati su cui sono stati addestrati, i dati passeranno attraverso numerosi livelli in modo simile per determinare se l'immagine che hai presentato è di un essere umano o di un animale.
Quando i dati vengono immessi in una rete neurale, inizia a elaborarli. Successivamente, i dati vengono elaborati tramite i suoi livelli per ottenere il risultato desiderato. Una rete neurale è una macchina che apprende da input strutturati e visualizza i risultati. Ci sono tre tipi di apprendimento che possono aver luogo nelle reti neurali:
- Apprendimento supervisionato: input e output vengono forniti agli algoritmi utilizzando dati etichettati. Dopo aver imparato come analizzare i dati, prevedono il risultato previsto.
- Apprendimento non supervisionato: una RNA apprende senza l'assistenza di un essere umano. Non ci sono dati etichettati e l'output è deciso dai modelli trovati nei dati di output.
- Insegnamento rafforzativo è quando una rete impara dal feedback che riceve.
Come funzionano le reti neurali?
I neuroni artificiali sono utilizzati nelle reti neurali, che sono sistemi sofisticati. I neuroni artificiali, noti anche come percettron, sono costituiti dai seguenti componenti:
- Ingresso
- Peso
- Pregiudizio
- Funzione di attivazione
- Uscita
Gli strati di neuroni che compongono le reti neurali. Una rete neurale è composta da tre strati:
- Livello di input
- Strato nascosto
- Livello di output
I dati sotto forma di valore numerico vengono inviati al livello di input. I livelli nascosti della rete sono quelli che eseguono più calcoli. Il livello di output, ultimo ma non meno importante, prevede il risultato. I neuroni si dominano a vicenda in una rete neurale. I neuroni sono usati per costruire ogni strato. I dati vengono instradati al livello nascosto dopo che il livello di input li ha ricevuti.
I pesi vengono applicati a ciascun ingresso. All'interno degli strati nascosti di una rete neurale, il peso è un valore che traduce i dati in entrata. I pesi funzionano moltiplicando i dati di input per il valore del peso nel livello di input.
Quindi avvia il valore del primo livello nascosto. I dati di input vengono trasformati e passati all'altro livello tramite i livelli nascosti. Il livello di output è responsabile della generazione del risultato finale. Gli input e i pesi vengono moltiplicati e il risultato viene consegnato ai neuroni dello strato nascosto come somma. Ad ogni neurone viene assegnato un bias. Per calcolare il totale, ogni neurone somma gli input che riceve.
Successivamente, il valore passa tramite la funzione di attivazione. Il risultato della funzione di attivazione determina se un neurone è attivato o meno. Quando un neurone è attivo, invia informazioni agli altri livelli. I dati vengono creati nella rete fino a quando il neurone raggiunge il livello di output utilizzando questo metodo. Propagazione in avanti è un altro termine per questo.
La tecnica di alimentazione dei dati in un nodo di input e di ottenere l'output tramite un nodo di output è nota come propagazione feed-forward. Quando i dati di input vengono accettati dal livello nascosto, si verifica la propagazione feed-forward. Viene elaborato in base alla funzione di attivazione e quindi passato all'uscita.
Il risultato è proiettato dal neurone nello strato di output con la probabilità più alta. La backpropagation si verifica quando l'output non è corretto. I pesi vengono inizializzati su ciascun input durante la creazione di una rete neurale. La backpropagation è il processo di riaggiustamento dei pesi di ciascun input per ridurre gli errori e fornire un output più accurato.
Tipi di rete neurale
1. Percettrone
Il modello percettronico di Minsky-Papert è uno dei modelli di neuroni più semplici e antichi. È l'unità più piccola di una rete neurale che esegue determinati calcoli per scoprire caratteristiche o business intelligence nei dati in entrata. Prende input ponderati e applica la funzione di attivazione per ottenere il risultato finale. TLU (unità logica di soglia) è un altro nome per perceptron.
Perceptron è un classificatore binario che è un sistema di apprendimento supervisionato che divide i dati in due gruppi. Porte logiche come AND, OR e NAND possono essere implementati con perceptron.
2. Rete neurale feed-forward
La versione più elementare delle reti neurali, in cui i dati di input fluiscono esclusivamente in una direzione, passa attraverso nodi neurali artificiali ed esce attraverso nodi di output. I livelli di input e output sono presenti in luoghi in cui i livelli nascosti possono essere o meno presenti. Possono essere caratterizzati come una rete neurale feed-forward a strato singolo o multistrato basata su questo.
Il numero di livelli utilizzati è determinato dalla complessità della funzione. Si propaga solo in avanti in una direzione e non si propaga all'indietro. Qui i pesi rimangono costanti. Gli ingressi vengono moltiplicati per i pesi per alimentare una funzione di attivazione. A tale scopo viene utilizzata una funzione di attivazione della classificazione o una funzione di attivazione del passo.
3. Perceptron multistrato
Un'introduzione alla sofisticata reti neurali, in cui i dati di input vengono instradati tramite molti strati di neuroni artificiali. È una rete neurale completamente collegata, poiché ogni nodo è connesso a tutti i neuroni nel livello successivo. Più livelli nascosti, cioè almeno tre o più livelli, sono presenti nei livelli di input e di output.
Possiede una propagazione bidirezionale, il che significa che può propagarsi sia in avanti che all'indietro. Gli input vengono moltiplicati per pesi e inviati alla funzione di attivazione, dove vengono modificati tramite backpropagation per ridurre al minimo la perdita.
I pesi sono valori appresi dalla macchina dalle reti neurali, per dirla semplicemente. A seconda della disparità tra i risultati attesi e gli input di formazione, si autoregolano. Softmax viene utilizzato come funzione di attivazione del livello di output dopo le funzioni di attivazione non lineare.
4. Rete neurale convoluzionale
In contrasto con la tradizionale matrice bidimensionale, una rete neurale di convoluzione ha una configurazione tridimensionale di neuroni. Il primo strato è noto come strato convoluzionale. Ogni neurone nello strato convoluzionale elabora solo le informazioni da una porzione limitata del campo visivo. Come un filtro, le funzioni di input vengono acquisite in modalità batch.
La rete comprende le immagini in sezioni e può eseguire queste azioni numerose volte per completare l'intera elaborazione dell'immagine.
L'immagine viene convertita da RGB o HSI a scala di grigi durante l'elaborazione. Ulteriori variazioni nel valore dei pixel aiuteranno a rilevare i bordi e le immagini possono essere ordinate in diversi gruppi. La propagazione unidirezionale si verifica quando una CNN contiene uno o più livelli convoluzionali seguiti dal raggruppamento e la propagazione bidirezionale si verifica quando l'output del livello di convoluzione viene inviato a una rete neurale completamente connessa per la classificazione delle immagini.
Per estrarre determinati elementi di un'immagine, vengono utilizzati dei filtri. In MLP, gli input vengono pesati e inseriti nella funzione di attivazione. RELU viene utilizzato nella convoluzione, mentre MLP impiega una funzione di attivazione non lineare seguita da softmax. Nel riconoscimento di immagini e video, nell'analisi semantica e nel rilevamento di parafrasi, le reti neurali convoluzionali producono risultati eccellenti.
5. Rete di polarizzazione radiale
Un vettore di input è seguito da uno strato di neuroni RBF e da uno strato di output con un nodo per ciascuna categoria in una rete di funzioni a base radiale. L'input viene classificato confrontandolo con i punti dati del set di addestramento, in cui ogni neurone mantiene un prototipo. Questo è uno degli esempi del training set.
Ogni neurone calcola la distanza euclidea tra l'input e il suo prototipo quando un nuovo vettore di input [il vettore n-dimensionale che stai cercando di classificare] deve essere classificato. Se abbiamo due classi, Classe A e Classe B, il nuovo input da classificare è più simile ai prototipi di classe A che ai prototipi di classe B.
Di conseguenza, potrebbe essere etichettato o classificato come classe A.
6. Rete neurale ricorrente
Le reti neurali ricorrenti sono progettate per salvare l'output di un livello e quindi reinserirlo nell'input per aiutare a prevedere il risultato del livello. Un feed-forward rete neurale è solitamente lo strato iniziale, seguito da uno strato di rete neurale ricorrente, in cui una funzione di memoria ricorda parte delle informazioni che aveva nel passaggio temporale precedente.
Questo scenario usa la propagazione in avanti. Salva i dati che saranno necessari in futuro. Nel caso in cui la previsione non sia corretta, il tasso di apprendimento viene utilizzato per apportare piccole modifiche. Di conseguenza, con il progredire della backpropagation, diventerà sempre più accurata.
Applicazioni
Le reti neurali vengono utilizzate per gestire problemi relativi ai dati in una varietà di discipline; alcuni esempi sono mostrati di seguito.
- Riconoscimento facciale: le soluzioni di riconoscimento facciale fungono da efficaci sistemi di sorveglianza. I sistemi di riconoscimento mettono in relazione le foto digitali con i volti umani. Sono utilizzati negli uffici per l'ingresso selettivo. Pertanto, i sistemi verificano un volto umano e lo confrontano con un elenco di ID archiviati nel suo database.
- Stock Prediction – Gli investimenti sono esposti ai rischi di mercato. È praticamente difficile prevedere gli sviluppi futuri del mercato azionario estremamente volatile. Prima delle reti neurali, le fasi rialzista e ribassista in costante mutamento erano imprevedibili. Ma cosa ha alterato tutto? Naturalmente, stiamo parlando di reti neurali... Un Perceptron MLP multistrato (un tipo di sistema di intelligenza artificiale feedforward) viene utilizzato per creare una previsione di borsa di successo in tempo reale.
- Media sociali – Indipendentemente da quanto possa sembrare banale, i social media hanno cambiato il percorso mondano dell'esistenza. Il comportamento degli utenti dei social media viene studiato utilizzando le reti neurali artificiali. Per l'analisi competitiva, i dati forniti quotidianamente tramite interazioni virtuali vengono accumulati ed esaminati. Le azioni degli utenti dei social media sono replicate dalle reti neurali. I comportamenti degli individui possono essere collegati ai modelli di spesa delle persone una volta che i dati vengono analizzati tramite i social network. I dati dalle applicazioni dei social media vengono estratti utilizzando Multilayer Perceptron ANN.
- Sanità – Gli individui nel mondo di oggi stanno facendo uso dei vantaggi della tecnologia nel settore sanitario. Nel settore sanitario, le reti neurali convoluzionali vengono utilizzate per il rilevamento dei raggi X, le scansioni TC e gli ultrasuoni. I dati di imaging medico ricevuti dai suddetti test vengono valutati e valutati utilizzando modelli di rete neurale, poiché la CNN viene utilizzata nell'elaborazione delle immagini. Nello sviluppo di sistemi di riconoscimento vocale viene utilizzata anche la rete neurale ricorrente (RNN).
- Bollettino meteorologico – Prima dell'implementazione dell'intelligenza artificiale, le proiezioni del dipartimento meteorologico non erano mai precise. Le previsioni meteorologiche sono fatte principalmente per prevedere le condizioni meteorologiche che si verificheranno in futuro. Le previsioni meteorologiche vengono utilizzate per anticipare la probabilità di disastri naturali nel periodo moderno. Le previsioni meteorologiche vengono eseguite utilizzando percettrone multistrato (MLP), reti neurali convoluzionali (CNN) e reti neurali ricorrenti (RNN).
- Difesa: la logistica, l'analisi degli attacchi armati e la posizione degli oggetti utilizzano tutte reti neurali. Sono anche impiegati nel pattugliamento aereo e marittimo, nonché nella gestione di droni autonomi. L'intelligenza artificiale sta dando all'industria della difesa la spinta tanto necessaria di cui ha bisogno per aumentare la sua tecnologia. Per rilevare l'esistenza di mine sottomarine, vengono utilizzate le reti neurali convoluzionali (CNN).
Vantaggi
- Anche se alcuni neuroni in una rete neurale non funzionano correttamente, le reti neurali genereranno comunque output.
- Le reti neurali hanno la capacità di apprendere in tempo reale e adattarsi alle loro mutevoli impostazioni.
- Le reti neurali possono imparare a svolgere una varietà di compiti. Fornire il risultato corretto sulla base dei dati forniti.
- Le reti neurali hanno la forza e la capacità di gestire più compiti contemporaneamente.
Svantaggi
- Le reti neurali vengono utilizzate per risolvere i problemi. Non rivela la spiegazione dietro "perché e come" ha espresso i giudizi che ha fatto a causa della complessità delle reti. Di conseguenza, la fiducia della rete potrebbe essere erosa.
- I componenti di una rete neurale sono interdipendenti l'uno dall'altro. Vale a dire, le reti neurali richiedono (o dipendono estremamente da) computer con una potenza di calcolo sufficiente.
- Un processo di rete neurale non ha regole specifiche (o regole pratiche). In una tecnica per tentativi ed errori, viene stabilita una struttura di rete corretta tentando la rete ottimale. È una procedura che richiede molta messa a punto.
Conclusione
Il campo di reti neurali è in rapida espansione. È fondamentale imparare e comprendere i concetti in questo settore per poterli affrontare.
I molti tipi di reti neurali sono stati trattati in questo articolo. Puoi utilizzare le reti neurali per affrontare problemi di dati in altri campi se impari di più su questa disciplina.
Lascia un Commento