Table di cuntinutu[Piattà][Mostra]
U mondu hè cambiatu rapidamente per via di l'intelligenza artificiale è l'apprendimentu automaticu, chì hà un impattu annantu à ogni aspettu di a nostra vita di ogni ghjornu.
Da l'assistenti vocali chì utilizanu NLP è machine learning per riservà appuntamenti, cercà l'avvenimenti in u nostru calendariu, è ghjucà musica à i dispositi chì sò cusì precisi chì ponu anticipà i nostri bisogni prima ancu di cunsiderà.
L'urdinatori ponu ghjucà à scacchi, fà cirurgia, è sviluppà in macchine più intelligenti è più umane cù l'aiutu di algoritmi d'apprendimentu automaticu.
Semu in un tempu di avanzamentu tecnologicu cuntinuu, è videndu cumu l'urdinatori anu sviluppatu cù u tempu, pudemu fà predizioni nantu à ciò chì succede in u futuru.
A demucratizazione di l'arnesi è i metudi di l'informatica hè unu di l'aspetti chjave di sta rivoluzione chì si distingue. Scienziati di dati Hanu creatu computer putenti di crunching di dati durante l'ultimi cinque anni implementendu senza sforzu metodologie d'avanguardia. I risultati sò maravigghiusu.
In questu post, guardemu attentamente machine learning l'algoritmi è tutte e so variazioni.
Allora, chì sò l'algoritmi di Machine Learning?
L'approcciu utilizatu da u sistema AI per realizà u so compitu - in generale, predichendu i valori di output da dati di input dati - hè cunnisciutu cum'è algoritmu d'apprendimentu machine.
Un algoritmu di machine learning hè un prucessu chì utilizeghja dati è hè utilizatu per creà mudelli di machine learning chì sò pronti per a produzzione. Se l'apprendimentu di a macchina hè u trenu chì porta un travagliu, allora l'algoritmi di l'apprendimentu di a macchina sò e locomotive chì movenu u travagliu.
U megliu approcciu di l'apprendimentu automaticu per utilizà serà determinatu da u prublema cummerciale chì pruvate d'indirizzà, u tipu di dataset chì stai utilizendu, è e risorse chì avete dispunibule.
L'algoritmi di machine learning sò quelli chì trasformanu un set di dati in un mudellu. Sicondu u tipu di prublema chì pruvate à risponde, a putenza di trasfurmazioni dispunibule, è u tipu di dati chì avete, l'algoritmi di apprendimentu supervisati, senza supervisione o di rinforzu ponu esse realizatu bè.
Allora, avemu parlatu di l'apprendimentu tutelatu, senza supervisione è di rinforzu, ma chì sò? Esploremu elli.
Apprendimentu Supervisatu, Unsurvegliatu è Rinfurzatu
Apprendimentu Supervisu
In l'apprendimentu supervisatu, u mudellu AI hè sviluppatu basatu annantu à l'input chì hè statu furnitu è l'etichetta chì rapprisenta u risultatu previstu. Basatu nantu à l'inputs è l'outputs, u mudellu sviluppa una equazione di mappatura, è utilizendu quella equazione di mappatura, prevede l'etichetta di l'inputs in u futuru.
Dicemu chì avemu bisognu di creà un mudellu chì pò distingue trà un cane è un gattu. Diversi ritratti di misgi è cani sò alimentati in u mudellu cù etichette chì indicanu s'ellu sò misgi o cani per furmà u mudellu.
U mudellu cerca di stabilisce una equazione chì rilancià l'etichette nantu à e fotografie di input à quelli imagine. Ancu s'è u mudellu ùn hà mai vistu l'imaghjini prima, dopu à a furmazione, pò identificà s'ellu hè di un gattu o un cane.
Apprendimentu senza supervisione
L'apprendimentu senza supervisione implica a furmazione di un mudellu AI solu nantu à l'input senza etichettarli. U mudellu divide i dati di input in gruppi cù caratteristiche rilativi.
L'etiqueta futura di l'input hè allora prevista, secondu quantu i so attributi currispondenu à una di e classificazioni. Cunsiderate a situazione induve duvemu dividisce un gruppu di boli rossi è blu in duie categurie.
Assumimu chì l'altri caratteristiche di e boli sò idèntici, cù l'eccezzioni di u culore. In a basa di cumu si pò dividisce i boli in dui classi, u mudellu cerca e caratteristiche chì sò diffirenti trà e boli.
Dui gruppi di boli - una blu è una rossa - sò pruduciuti quandu e boli sò spartuti in dui gruppi basati nantu à a so tonalità.
Apprendimentu di rinfurzamentu
In l'apprendimentu di rinfurzamentu, u mudellu AI cerca di maximizà u prufittu generale per agisce bè cumu pò in una circustanza particulare. Feedback nantu à i so risultati prima aiuta u mudellu à amparà.
Pensate à u scenariu quandu un robot hè urdinatu per selezziunà una strada trà i punti A è B. U robot prima sceglie unu di i corsi perchè ùn hà micca sperienza previa.
U robot riceve input nantu à a strada chì piglia è guadagna cunniscenze da ellu. U robot pò utilizà input per risolve u prublema a prossima volta chì scontra una circustanza simili.
Per esempiu, se u robot sceglie l'opzione B è riceve una ricumpensa, cum'è un feedback pusitivu, capisce sta volta chì deve selezziunà u modu B per aumentà a so ricumpensa.
Avà infine ciò chì tutti aspittà, sò l'algoritmi.
Algoritmi principali di Machine Learning
1. Regressione Linear
L'approcciu di apprendimentu automaticu più simplice chì devia da l'apprendimentu supervisatu hè a regressione lineare. Cù a cunniscenza di variabili indipendenti, hè soprattuttu utilizatu per risolve i prublemi di regressione è creà predizioni nantu à variabili dipendenti continui.
Truvà a linea di u megliu adattatu, chì pò aiutà à predichendu u risultatu per e variàbili dipindenti continui, hè u scopu di a regressione lineale. I prezzi di a casa, l'età è i salari sò alcuni esempi di valori cuntinui.
Un mudellu cunnisciutu cum'è regressione lineale simplice usa una linea recta per calculà l'associazione trà una variabile indipindente è una variabile dipendente. Ci hè più di duie variàbili indipendenti in regressione lineale multipla.
Un mudellu di regressione lineale hà quattru ipotesi sottostanti:
- Linearità: Ci hè una cunnessione lineale trà X è a media di Y.
- Omoscedasticità: Per ogni valore di X, a varianza residuale hè a stessa.
- Indipendenza: L'osservazioni sò indipendenti l'una di l'altru in quantu à l'indipendenza.
- Normalità: Quandu X hè fissatu, Y hè normalment distribuitu.
A regressione lineare rende admirabilmente per e dati chì ponu esse siparati longu e linee. Pò cuntrullà l'overfitting usendu tecniche di regularizazione, validazione incruciata è riduzzione di dimensionalità. Tuttavia, ci sò casi induve l'ingegneria estensiva di e funzioni hè necessaria, chì pò occasionalmente risultatu in overfitting è rumore.
2. Regressione Logistica
A regressione logistica hè una altra tecnica d'apprendimentu automaticu chì parte da l'apprendimentu supervisatu. U so usu maiò hè a classificazione, mentre chì pò ancu esse utilizatu per i prublemi di regressione.
A regressione logistica hè aduprata per previsione a variabile dipendente categurica utilizendu l'infurmazioni da i fatturi indipendenti. L'obiettivu hè di classificà i outputs, chì ponu solu falà trà 0 è 1.
U totale ponderatu di l'inputs hè processatu da a funzione sigmoide, una funzione d'attivazione chì cunverte i valori trà 0 è 1.
A basa di a regressione logistica hè l'estimazione di a massima probabilità, un metudu per calculà i paràmetri di una distribuzione di probabilità assunta datu dati specifichi osservati.
3. Arbulu di decisione
Un altru metudu di apprendimentu di macchina chì si sparghje di l'apprendimentu supervisatu hè l'arbre di decisione. Per i prublemi di classificazione è di regressione, l'approcciu di l'arburu di decisione pò esse impiegatu.
Stu strumentu di decisione, chì s'assumiglia à un arbre, usa rapprisintazioni visuale per vede i risultati prospettivi, i costi è e ripercussioni di l'azzioni. Dividendu i dati in porzioni separati, l'idea hè analoga à a mente umana.
I dati sò stati divisi in parti distinte quantu pudemu granulà. L'ughjettu principalu di l'Arbulu di Decisione hè di custruisce un mudellu di furmazione chì pò esse usatu per previsione a classa di a variabile di destinazione. I valori mancanti ponu esse trattati automaticamente cù l'Arburu di Decisione.
Ùn ci hè micca esigenza per una codificazione in un colpu, variabili manichi, o altri passi di pretrattamentu di dati. Hè rigidu in u sensu chì hè difficiule di aghjunghje dati freschi. Se avete dati etichettati supplementari, avete da ricuperà l'arburu nantu à tuttu u dataset.
In u risultatu, l'arbureti di decisione sò una scelta povera per qualsiasi applicazione chì esige un cambiamentu di mudellu dinamicu.
Basatu nantu à u tipu di variabile di destinazione, l'arburi di decisione sò classificate in dui tipi:
- Variabile categurica: Un arbre di decisione in quale a variabile di u scopu hè categuricu.
- Variabile Continua: Un Arbulu di Decisione in quale a variabile di u scopu hè Continuu.
4. Random Forest
U Metudu Random Forest hè a prossima tecnica di apprendimentu di macchina è hè un algoritmu d'apprendimentu di macchina cuntrullatu utilizatu largamente in i prublemi di classificazione è regressione. Hè ancu un metudu basatu à l'arburu, simile à un arbulu di decisione.
Un boscu d'arburi, o assai arburi di decisione, hè utilizatu da u metudu di furesta aleatoriu per fà ghjudizii. Quandu si trattava i travaglii di classificazione, u metudu di fureste aleatoriu impiegava variàbili categurichi mentre manipulava i travaglii di regressione cù datasets chì cuntenenu variabili cuntinui.
Un inseme, o mischju di parechji mudelli, hè ciò chì face u metudu di furesta aleatoriu, chì significa chì e previsioni sò fatte cù un gruppu di mudelli invece di solu unu.
A capacità di esse aduprata per i prublemi di classificazione è di regressione, chì custituiscenu a maiò parte di i sistemi moderni di apprendimentu automaticu, hè un benefiziu chjave di u boscu aleatoriu.
Dui strategii diffirenti sò usati da Ensemble:
- Bagging: Facendu questu, più dati sò pruduciuti per u dataset di furmazione. Per diminuisce a variazione di e previsioni, questu hè fattu.
- Boosting hè u prucessu di cumminà i studienti debuli cù i studienti forti custruendu mudelli successivi, risultatu in u mudellu finali cù a massima precisione.
5. Bayes ingenu
Un prublema di classificazione binaria (due classi) è multi-classe pò esse risolta cù a tecnica Naive Bayes. Quandu u metudu hè spiegatu cù valori di input binari o categurie, hè più simplice per capisce. Una supposizione fatta da un classificatore Naive Bayes hè chì l'esistenza di una funzione in una classa ùn hà micca influenza nantu à a presenza di altre caratteristiche.
A formula sopra indica:
- P(H): A probabilità chì l'ipotesi H hè curretta. A probabilità prima hè riferita cum'è questu.
- P(E): A probabilità di l'evidenza
- P(E | H): A probabilità chì l'ipotesi hè sustinuta da l'evidenza.
- P(H | E): A probabilità chì l'ipotesi hè vera, datu l'evidenza.
Un classificatore Naive Bayes piglià in contu ognuna di queste caratteristiche individualmente quandu determina a probabilità di un certu risultatu, ancu s'ellu sti attributi sò cunnessi l'un à l'altru. Un mudellu Bayesian Naive hè simplice di custruisce è efficace per i grandi datasets.
Hè cunnisciutu per fà megliu cà ancu i tecnichi di categurizazione più cumplessi mentre esse basi. Hè una cullizzioni di algoritmi chì sò tutti basati nantu à u Teorema di Bayes, invece di un solu metudu.
6. K-Nearest Neighbours
A tecnica K-nearest neighbors (kNN) hè un subset di l'apprendimentu automaticu supervisatu chì pò esse usatu per affruntà i prublemi di classificazione è regressione. L'algoritmu KNN presume chì l'uggetti paragunabili ponu esse truvati vicinu.
Mi ricordu cum'è una riunione di individui simili. kNN sfrutta l'idea di somiglianza trà altri punti di dati utilizendu a vicinanza, a vicinanza o a distanza. Per etichettate e dati invisibili basatu annantu à i punti di dati osservabili più vicini, un metudu matematicu hè impiegatu per determinà a separazione trà i punti nantu à un graficu.
Duvete determinà a distanza trà i punti di dati per identificà i lochi paragunabili più vicini. Misurazioni di distanza, cum'è a distanza euclidea, a distanza di Hamming, a distanza di Manhattan, è a distanza di Minkowski ponu esse usate per questu. U K hè cunnisciutu com'è u numeru vicinu più vicinu, è hè spessu un numeru imparu.
KNN pò esse appiicata à i prublemi di classificazione è regressione. A prediczione fatta quandu KNN hè utilizatu per i prublemi di regressione hè basatu annantu à a media o mediana di l'occurrence K-più simili.
U risultatu di un algoritmu di classificazione basatu nantu à KNN pò esse determinatu cum'è a classa cù a freccia più alta trà e K occurrenze più simili. Ogni istanza vota essenzialmente un votu per a so classe, è a predizione appartene à a classe chì riceve u più voti.
7. K-significa
Hè una tecnica per l'apprendimentu senza supervisione chì affronta i prublemi di clustering. I setti di dati sò divisi in un certu nùmeru di clusters-call let's it K-in tale manera chì i punti di dati di ogni cluster sò omogenei è distinti da quelli in l'altri clusters.
Metodologia di clustering K-means:
- Per ogni cluster, l'algoritmu K-means sceglie k centroids, o punti.
- Cù i centroidi più vicini o K clusters, ogni puntu di dati forma un cluster.
- Avà, novi centroidi sò pruduciuti secondu i membri di u cluster chì sò digià prisenti.
- A distanza più vicina per ogni puntu di dati hè calculata utilizendu sti centroidi aghjurnati. Finu à chì i centroidi ùn cambianu micca, stu prucessu hè ripetutu.
Hè più veloce, più affidabile è più simplice di capiscenu. Se ci sò prublemi, l'adattabilità di k-means rende l'aghjustamenti simplici. Quandu i datasets sò distinti o ben isolati l'una di l'altru, i risultati sò megliu. Ùn pò micca gestisce dati erratici o outliers.
8. Support Vector Machines
Quandu s'utilice a tecnica SVM per classificà e dati, i dati crudi sò indicati cum'è punti in un spaziu n-dimensionale (induve n hè u numeru di funziunalità chì avete). I dati ponu esse facilmente classificati perchè u valore di ogni funzione hè cunnessu à una coordenada specifica.
Per separà e dati è mette nantu à un graficu, impiegà e linee cunnisciute cum'è classificatori. Stu approcciu traccia ogni puntu di dati cum'è un puntu in un spaziu n-dimensionale, induve n hè u numeru di funziunalità chì avete è u valore di ogni funzione hè un valore di coordenada specificu.
Avemu da truvà avà una linea chì divide i dati in dui gruppi di dati chì sò stati categurizzati in modu diversu. E distanze da i punti più vicini in ognuna di i dui gruppi seranu i più alluntanati in questa linea.
Siccomu i dui punti più vicini sò quelli chì sò più distanti da a linea in l'esempiu sopra, a linea chì divide i dati in i dui gruppi chì sò categurizzati in modu diversu hè a linea media. U nostru classificatore hè sta linea.
9. Riduzzione di dimensione
Utilizendu l'approcciu di riduzzione di dimensionalità, i dati di furmazione puderanu avè menu variabili di input. In termini simplici, si riferisce à u prucessu di riduzzione di a dimensione di u vostru set di funzioni. Imaginemu chì u vostru dataset hà 100 colonne; a riduzzione di dimensionalità diminuirà quella quantità à 20 colonne.
U mudellu cresce automaticamente più sufisticatu è hà un risicu più grande di overfitting cum'è u numeru di funzioni aumenta. U più grande prublema cù u travagliu cù dati in dimensioni più grande hè ciò chì hè cunnisciutu com'è "malidizzioni di dimensionalità", chì si trova quandu i vostri dati cuntenenu un numeru eccessivu di caratteristiche.
I seguenti elementi ponu esse aduprati per rializà a riduzione di dimensionalità:
- Per truvà è sceglie e caratteristiche pertinenti, a selezzione di funziunalità hè impiegata.
- Utilizendu e funzioni già esistenti, l'ingegneria di e funzioni crea manualmente novi funzioni.
cunchiusioni
L'apprendimentu automaticu senza supervisione o supervisatu hè pussibule. Sceglite l'apprendimentu supervisatu se i vostri dati sò menu abbundanti è ben marcati per a furmazione.
Grandi seti di dati sò spessu eseguite è pruduceranu risultati megliu cù l'apprendimentu senza supervisione. Deep learning i metudi sò megliu s'è vo avete una cullizzioni di dati sizable chì hè prontu disponibile.
Imparazione di rinfurzamentu è l'apprendimentu di rinfurzamentu prufondu sò alcuni temi chì avete studiatu. E caratteristiche, l'usi è e limitazioni di e rete neurali sò avà chjaru per voi. Infine, ma micca menu, avete cunsideratu l'opzioni per diverse lingue di prugrammazione, IDE è piattaforme quandu si tratta di creà u vostru propiu. mudelli di apprendimentu machine.
A prossima cosa chì duvete fà hè di cumincià à studià è aduprà ognunu machine learning avvicinamentu. Ancu s'è u sughjettu hè largu, ogni tema pò esse capitu in uni pochi d'ora si fucalizza nantu à a so prufundità. Ogni sughjettu hè solu da l'altri.
Avete da pensà à un prublema à u tempu, studià, mette in pratica, è aduprà una lingua di a vostra scelta per implementà l'algoritmu (s) in questu.
Lascia un Audiolibro