Hè rassicurante di sapè chì avemu riisciutu à imbui i robots cù e nostre capacità innate per amparà cù l'esempiu è percive u so circondu. A sfida fundamentale hè quelli chì insegnanu l'urdinatori à "vede" cum'è l'omu avarianu bisognu di più tempu è sforzu.
Tuttavia, quandu avemu cunsideratu u valore praticu chì sta cumpetenza furnisce attualmente à l'urganisazioni è l'imprese, u sforzu vale a pena. In questu articulu, amparate nantu à a classificazione di l'imaghjini, cumu funziona, è a so implementazione pratica. Cuminciamu.
Chì ghjè a classificazione di l'imaghjini?
U travagliu di alimentà una maghjina in un reta neurale è avè fattu una certa forma di etichetta per quella stampa hè cunnisciuta cum'è ricunniscenza di l'imaghjini. L'etichetta di output di a rete currisponde à una classa predefinita.
Ci ponu esse numerosi classi assignati à a stampa, o solu unu. Quandu ci hè una sola classa, u terminu "ricunniscenza" hè spessu usatu, mentri quandu ci sò parechje classi, u terminu "classificazione" hè spessu usatu.
Rilevamentu di l'ughjettu hè un subset di classificazione di l'imaghjini in quale casi particulari di l'uggetti sò rilevati cum'è appartenenti à una classe data cum'è animali, veiculi o umani.
Cumu funziona a classificazione di l'imaghjini?
Una maghjina in forma di pixel hè analizata da un computer. Hè rializatu questu trattendu a stampa cum'è una cullizzioni di matrici, a dimensione di quale hè determinata da a risoluzione di l'imaghjini. Simply speaking, a classificazione di l'imaghjini hè u studiu di dati statistichi chì utilizanu algoritmi da a perspettiva di l'urdinatore.
A classificazione di l'imaghjini hè realizatu in u processu di l'imaghjini digitale raggruppendu pixel in gruppi predeterminati, o "classi". L'algoritmi dividenu l'imaghjini in una successione di caratteristiche notevuli, chì riduce a carica per u classificatore finali.
Queste qualità informanu u classificatore nantu à u significatu di l'imaghjini è a classificazione potenziale. Perchè u restu di i prucessi in a classificazione di una stampa sò dipendenu da questu, u metudu d'estrazione caratteristiche hè a fase più critica.
lu dati furniti à l'algoritmu hè ancu cruciale in a classificazione di l'imaghjini, in particulare a classificazione supervisata. In paragunà à un terribili dataset cù un sbilanciu di dati basatu nantu à a classe è a bassa qualità di stampa è annotazione, un dataset di classificazione ben ottimizzata funziona admirabilmente.
Classificazione di l'imaghjini cù Tensorflow & Keras in python
Avemu aduprà u CIFAR-10 dataset (chì include aviò, aviò, uccelli, è altre 7 cose).
1. Installazione Requisiti
U codice sottu installà tutti i prerequisites.
2. Importing dependencies
Fate un schedariu train.py in Python. U codice quì sottu impurtarà e dipendenze di Tensorflow è Keras.
3. Initializing paràmetri
CIFAR-10 include solu 10 categurie di stampa, dunque num classi si riferite solu à u numeru di categurie da classificà.
4. Loading the dataset
A funzione usa u modulu Tensorflow Datasets per carricà u dataset, è avemu stabilitu cù infurmazioni à True per ottene qualchì infurmazione nantu à questu. Pudete stampà per vede quali campi è i so valori sò, è avemu aduprà l'infurmazioni per ricuperà u numeru di campioni in i setti di furmazione è di prova.
5. Crià u mudellu
Avà custruiremu trè strati, ognuna composta da dui ConvNets cù una funzione max-pooling è attivazione ReLU, seguita da un sistema di 1024 unità cumpletamente cunnessu. In paragone à ResNet50 o Xception, chì sò mudelli di punta, questu puderia esse un mudellu comparativamente chjucu.
6. Training u mudellu
Aghju utilizatu Tensorboard per misurà a precisione è a perdita in ogni epoca è ci furnisce una bella visualizazione dopu avè impurtatu e dati è generatu u mudellu. Eseguite u codice seguente; sicondu u vostru CPU / GPU, a furmazione durà parechji minuti.
Per utilizà tensorboard, basta à scrive u cumandimu seguitu in u terminal o prompt di cumanda in u cartulare attuale:
You Mulateri Di L'vede chì a perdita di validazione hè riduzzione è a precisione cresce à circa 81%. Hè fantasticu!
Pruducendu u mudellu
Quandu a furmazione hè finita, u mudellu finali è i pesi sò salvati in u cartulare di i risultati, chì ci permettenu di furmà una volta è di fà predizioni ogni volta chì scegliemu. Segui u codice in un novu schedariu python chjamatu test.py.
7. Importà l'utilità per a prova
8. Fà un repertoriu python
Fate un dizziunariu Python chì traduce ogni valore interu à l'etichetta adatta di u dataset:
9. Loading test dati & mudellu
U codice siquenti carcà i dati di prova è u mudellu.
10. Valutazione & Previsione
U codice seguente valuterà è farà predizioni nantu à l'imaghjini di rana.
11. Risultati
U mudellu hà preditu a rana cù una precisione di 80.62%.
cunchiusioni
Va bè, avemu finitu cù sta lezzione. Mentre chì 80.62% ùn hè micca bonu per un pocu CNN, vi cunsigliu assai di cambià u mudellu o di fighjà ResNet50, Xception, o altri mudelli di punta per risultati megliu.
Avà chì avete custruitu a vostra prima reta di ricunniscenza di l'imaghjini in Keras, duvete sperimentà cù u mudellu per scopre cumu diverse paràmetri influenzanu u so rendiment.
Lascia un Audiolibro