Werrej[Aħbi][Uri]
- X'inhi l-klassifikazzjoni tal-immaġni?
- Kif taħdem il-klassifikazzjoni tal-immaġini?
Klassifikazzjoni tal-immaġni bl-użu ta' Tensorflow & Keras f'python+-
- 1. Installazzjoni Rekwiżiti
- 2. Dipendenzi li jimportaw
- 3. Parametri tal-bidu
- 4. Tagħbija tas-sett tad-dejta
- 5. Il-ħolqien tal-mudell
- 6. It-taħriġ tal-mudell
- Ittestjar tal-mudell
- 7. L-importazzjoni tal-utilitajiet għall-ittestjar
- 8. Nagħmlu direttorju python
- 9. Tagħbija tad-dejta tat-test u l-mudell
- 10. Evalwazzjoni u Tbassir
- 11. Riżultati
- konklużjoni
Huwa serħan il-moħħ li tkun taf li rnexxielna ndaħħlu lir-robots bil-kapaċitajiet intrinsiċi tagħna biex jitgħallmu bl-eżempju u jipperċepixxu l-madwar. L-isfida fundamentali hija dawk li jgħallmu lill-kompjuters biex "jaraw" bħallikieku l-bnedmin ikollhom bżonn ħafna aktar ħin u sforz.
Madankollu, meta nikkunsidraw il-valur prattiku li din il-ħila tipprovdi bħalissa lill-organizzazzjonijiet u l-intrapriżi, l-isforz huwa utli. F'dan l-artikolu, int ser titgħallem dwar il-klassifikazzjoni tal-immaġni, kif taħdem, u l-implimentazzjoni prattika tagħha. Nibdew.
X'inhi l-klassifikazzjoni tal-immaġni?
Ix-xogħol ta' għalf ta' immaġni f'a newrali netwerk u li toħroġ xi forma ta 'tikketta għal dik l-istampa hija magħrufa bħala rikonoxximent tal-immaġni. It-tikketta tal-output tan-netwerk se tikkorrispondi għal klassi definita minn qabel.
Jista' jkun hemm bosta klassijiet assenjati lill-istampa, jew sempliċiment waħda. Meta jkun hemm klassi waħda biss, it-terminu "rikonoxximent" jintuża ta' spiss, filwaqt li meta jkun hemm bosta klassijiet, it-terminu "klassifikazzjoni" jintuża ta' spiss.
Sejbien ta' oġġetti huwa subsett ta' klassifikazzjoni ta' stampi li fih każijiet partikolari ta' oġġetti jinstabu bħala li jappartjenu għal klassi partikolari bħal annimali, vetturi jew bnedmin.
Kif taħdem il-klassifikazzjoni tal-immaġini?
Immaġini fil-forma ta 'pixels hija analizzata minn kompjuter. Dan iwettaq billi jittratta l-istampa bħala ġabra ta 'matriċi, li d-daqs tagħhom huwa determinat mir-riżoluzzjoni tal-immaġni. Sempliċement, il-klassifikazzjoni tal-istampa hija l-istudju ta 'dejta statistika li tuża algoritmi mill-perspettiva ta' kompjuter.
Il-klassifikazzjoni tal-immaġini titwettaq fl-ipproċessar tal-immaġni diġitali billi tiġbor il-pixels fi gruppi predeterminati, jew "klassijiet." L-algoritmi jaqsmu l-immaġni f'suċċessjoni ta 'karatteristiċi notevoli, li jnaqqas il-piż għall-klassifikatur finali.
Dawn il-kwalitajiet jinfurmaw lill-klassifikatur dwar it-tifsira tal-immaġni u l-klassifikazzjoni potenzjali. Minħabba li l-bqija tal-proċessi fil-klassifikazzjoni ta 'stampa huma dipendenti fuqha, il-metodu ta' estrazzjoni karatteristika huwa l-aktar fażi kritika.
il data pprovduta għall-algoritmu huwa wkoll kruċjali fil-klassifikazzjoni tal-immaġni, speċjalment klassifikazzjoni sorveljata. Meta mqabbel ma 'sett ta' dejta terribbli bi żbilanċ ta 'dejta bbażat fuq klassi u kwalità baxxa ta' stampa u annotazzjoni, sett ta 'dejta ta' klassifikazzjoni ottimizzat tajjeb jaħdem b'mod ammirevoli.
Klassifikazzjoni tal-immaġni bl-użu ta' Tensorflow & Keras f'python
Se nkunu qed nużaw il- CIFAR-10 dataset (li jinkludi ajruplani, ajruplani, għasafar, u 7 affarijiet oħra).
1. Installazzjoni Rekwiżiti
Il-kodiċi hawn taħt se jinstalla l-prerekwiżiti kollha.
2. Dipendenzi li jimportaw
Agħmel fajl train.py f'Python. Il-kodiċi ta 'hawn taħt se jimporta d-dipendenzi ta' Tensorflow u Keras.
3. Parametri tal-bidu
CIFAR-10 jinkludi biss 10 kategoriji ta' stampi, għalhekk numru ta' klassijiet sempliċement jirreferu għan-numru ta' kategoriji li għandhom jiġu kklassifikati.
4. Tagħbija tas-sett tad-dejta
Il-funzjoni tuża l-modulu Tensorflow Datasets biex tagħbija s-sett tad-data, u aħna nissettjaw b'informazzjoni għal Veru biex niksbu xi informazzjoni dwarha. Tista 'tipprintjaha biex tara x'oqsma u l-valuri tagħhom huma, u aħna ser nużaw l-informazzjoni biex irkupraw in-numru ta' kampjuni fis-settijiet ta 'taħriġ u ttestjar.
5. Il-ħolqien tal-mudell
Issa aħna ser nibnu tliet saffi, kull wieħed jikkonsisti f'żewġ ConvNets b'max-pooling u funzjoni ta 'attivazzjoni ReLU, segwiti minn sistema ta' 1024-unit konnessa bis-sħiħ. Meta mqabbel ma 'ResNet50 jew Xception, li huma mudelli ta' l-aħħar teknoloġija, dan jista 'jkun mudell komparattivament ċkejken.
6. It-taħriġ tal-mudell
Jien użajt Tensorboard biex tkejjel l-eżattezza u t-telf f'kull epoka u tagħtina wirja sabiħa wara li importajt id-dejta u ġġenerajt il-mudell. Mexxi l-kodiċi li ġej; skond is-CPU/GPU tiegħek, it-taħriġ jieħu diversi minuti.
Biex tuża tensorboard, ittajpja l-kmand li ġej fit-terminal jew fil-pront tal-kmand fid-direttorju attwali:
Int ser tara li t-telf tal-validazzjoni qed jonqos u l-eżattezza qed tiżdied għal madwar 81%. Dak meraviljuż!
Ittestjar tal-mudell
Meta t-taħriġ ikun lest, il-mudell finali u l-piżijiet jiġu ffrankati fil-folder tar-riżultati, li jippermettilna nitħarrġu darba u nagħmlu tbassir kull meta nagħżlu. Segwi l-kodiċi f'fajl python ġdid bl-isem test.py.
7. L-importazzjoni tal-utilitajiet għall-ittestjar
8. Nagħmlu direttorju python
Agħmel dizzjunarju Python li jittraduċi kull valur sħiħ għat-tikketta xierqa tad-dataset:
9. Tagħbija tad-dejta tat-test u l-mudell
Il-kodiċi li ġej se jgħabbi d-dejta tat-test u l-mudell.
10. Evalwazzjoni u Tbassir
Il-kodiċi li ġej se jevalwa u jagħmel tbassir fuq l-immaġini taż-żrinġijiet.
11. Riżultati
Il-mudell bassar iż-żrinġ bi preċiżjoni ta '80.62%.
konklużjoni
Tajjeb, spiċċajna b’din il-lezzjoni. Filwaqt li 80.62% mhix tajba għal ftit CNN, nagħtik parir bil-qawwa biex tbiddel il-mudell jew tħares lejn ResNet50, Xception, jew mudelli oħra avvanzati għal riżultati aħjar.
Issa li bnejt l-ewwel netwerk ta’ rikonoxximent tal-immaġini tiegħek f’Keras, għandek tesperimenta bil-mudell biex tiskopri kif parametri differenti jaffettwaw il-prestazzjoni tiegħu.
Ħalli Irrispondi