Inhaltsverzeechnes[Verstoppen][Show]
Et ass berouegend ze wëssen datt mir et fäerdeg bruecht hunn Roboter mat eise gebiertege Fäegkeeten z'erreechen fir mam Beispill ze léieren an hir Ëmgéigend z'erkennen. Déi fundamental Erausfuerderung ass déi Computeren léieren ze "gesinn" wéi d'Mënschen vill méi Zäit an Effort brauchen.
Wéi och ëmmer, wa mir de praktesche Wäert berécksiichtegen deen dës Fäegkeet momentan Organisatiounen an Entreprisen ubitt, ass den Effort derwäert. An dësem Artikel léiert Dir iwwer Bildklassifikatioun, wéi et funktionnéiert a seng praktesch Ëmsetzung. Loosst eis ufänken.
Wat ass Bild Klassifikatioun?
D'Aarbecht vun engem fidderen engem Bild an engem neural Netz an datt se eng Form vu Label fir dat Bild erausginn ass bekannt als Bilderkennung. Den Ausgangslabel vum Netz entsprécht enger virdefinéierter Klass.
Et kënne vill Klassen op d'Bild zougewisen ginn, oder einfach eng. Wann et nëmmen eng Klass gëtt, gëtt de Begrëff "Unerkennung" dacks benotzt, wärend wann et méi Klassen gëtt, gëtt de Begrëff "Klassifikatioun" dacks benotzt.
Objekterkennung ass en Ënnerdeel vun der Bildklassifizéierung, an där bestëmmte Fäll vun Objete festgestallt ginn, déi zu enger bestëmmter Klass gehéieren, wéi Déieren, Gefierer oder Mënschen.
Wéi funktionéiert Bildklassifikatioun?
E Bild a Form vu Pixel gëtt vun engem Computer analyséiert. Et erreecht dëst andeems d'Bild als eng Sammlung vu Matrizen behandelt gëtt, d'Gréisst vun deenen duerch d'Bildopléisung bestëmmt gëtt. Einfach geschwat, Bildklassifikatioun ass d'Studie vu statisteschen Donnéeën mat Algorithmen aus der Perspektiv vun engem Computer.
Bildklassifikatioun gëtt an der digitaler Bildveraarbechtung erreecht andeems Pixel a virbestëmmte Gruppen oder "Klassen" gruppéiert ginn. D'Algorithmen trennen d'Bild an eng Rei vu bemierkenswäerte Charakteristiken, wat d'Belaaschtung fir de finalen Klassifizéierer reduzéiert.
Dës Qualitéiten informéieren de Klassifizéierer iwwer d'Bedeitung vum Bild a potenziell Klassifikatioun. Well de Rescht vun de Prozesser bei der Klassifikatioun vun engem Bild dovun ofhängeg sinn, ass déi charakteristesch Extraktiounsmethod déi kriteschst Phase.
d' Donnéeë geliwwert dem Algorithmus ass och entscheedend an der Bildklassifikatioun, besonnesch iwwerwaacht Klassifikatioun. Am Verglach zu engem schrecklechen Datesaz mat Datonbalance baséiert op Klass a gerénger Bild- an Annotatiounsqualitéit, funktionéiert e gutt optimiséierte Klassifikatiouns-Datet bewonnert.
Bildklassifikatioun mat Tensorflow & Keras am Python
Mir wäerten de CIFAR-10 Dataset (wat Fligeren, Fligeren, Villercher an aner 7 Saachen enthält).
1. Installatioun Ufuerderunge
De Code hei ënnen wäert all Viraussetzunge installéieren.
2. Import Ofhängegkeeten
Maacht eng train.py Datei am Python. De Code hei drënner importéiert Tensorflow a Keras Ofhängegkeeten.
3. Parameteren initialiséieren
CIFAR-10 enthält just 10 Bildkategorien, dofir bezéien num Klassen einfach op d'Zuel vun de Kategorien fir ze klassifizéieren.
4. Luede der Datesaz
D'Funktioun benotzt den Tensorflow Datasets Modul fir den Dataset ze lueden, a mir setzen mat Info op True fir e puer Informatioun doriwwer ze kréien. Dir kënnt et ausdrécken fir ze kucken wat Felder an hir Wäerter sinn, a mir benotze d'Info fir d'Zuel vun de Proben an den Trainings- an Testsets ze recuperéieren.
5. Schafen de Modell
Elo wäerte mir dräi Schichten bauen, all besteet aus zwee ConvNets mat enger Max-Pooling a ReLU Aktivéierungsfunktioun, gefollegt vun engem voll verbonnen 1024-Eenheet System. Am Verglach zu ResNet50 oder Xception, déi modernste Modeller sinn, kann dëst e relativ klenge Modell sinn.
6. Training de Modell
Ech hunn Tensorboard benotzt fir d'Genauegkeet an d'Verloscht an all Epoch ze moossen an eis e schéine Display ze bidden nodeems ech d'Daten importéiert an de Modell generéiert hunn. Run de folgende Code; je Är CPU / GPU, Training dauert e puer Minutten.
Fir Tensorboard ze benotzen, gitt just de folgende Kommando am Terminal oder Kommandoprompt am aktuellen Verzeechnes:
Dir gesitt datt de Validatiounsverloscht reduzéiert gëtt an d'Genauegkeet op ongeféier 81% eropgeet. Dat ass fantastesch!
Test vum Modell
Wann d'Ausbildung fäerdeg ass, ginn de finalen Modell a Gewiichter am Resultater Dossier gespäichert, wat et eis erlaabt eemol ze trainéieren an Prognosen ze maachen wa mir wielen. Follegt de Code an enger neier Python Datei mam Numm test.py.
7. Import vun den Utilities fir Testen
8. Maacht e Python-Verzeichnis
Maacht e Python-Wörterbuch, deen all Ganzzuelwäert op de passende Label vum Datesaz iwwersetzt:
9. Luede Test Daten & Modell
De folgende Code lued d'Testdaten a Modell.
10. Evaluatioun & Prediction
De folgende Code wäert d'Prognosen iwwer d'Fräschbiller evaluéieren a maachen.
11. Resultater
De Modell huet de Fräsch mat 80.62% Genauegkeet virausgesot.
Konklusioun
Okay, mir si fäerdeg mat dëser Lektioun. Wärend 80.62% net gutt ass fir e bësse CNN, roden ech Iech staark de Modell z'änneren oder ResNet50, Xception oder aner modernste Modeller fir besser Resultater ze kucken.
Elo datt Dir Äert éischt Bilderkennungsnetz zu Keras gebaut hutt, sollt Dir mam Modell experimentéieren fir ze entdecken wéi verschidde Parameteren hir Leeschtung beaflossen.
Hannerlooss eng Äntwert