Orodha ya Yaliyomo[Ficha][Onyesha]
Inatia moyo kujua kwamba tumeweza kujaza roboti na uwezo wetu wa kuzaliwa kujifunza kwa mfano na kutambua mazingira yao. Changamoto ya kimsingi ni zile zinazofundisha kompyuta "kuona" kama wanadamu wangehitaji wakati na bidii zaidi.
Hata hivyo, tunapozingatia thamani ya vitendo ambayo ujuzi huu hutoa kwa mashirika na makampuni ya biashara kwa sasa, jitihada hizo zinafaa. Katika makala hii, utajifunza kuhusu uainishaji wa picha, jinsi inavyofanya kazi, na utekelezaji wake wa vitendo. Hebu tuanze.
Uainishaji wa picha ni nini?
Kazi ya kulisha picha kuwa a neural mtandao na kuifanya kutoa aina fulani ya lebo kwa picha hiyo inajulikana kama utambuzi wa picha. Lebo ya pato la mtandao italingana na darasa lililobainishwa mapema.
Kunaweza kuwa na madarasa mengi yaliyopewa picha, au moja tu. Wakati kuna darasa moja tu, neno "kutambua" hutumiwa mara kwa mara, ambapo wakati kuna madarasa mengi, neno "uainishaji" hutumiwa mara kwa mara.
Utambuzi wa kitu ni sehemu ndogo ya uainishaji wa picha ambapo matukio mahususi ya vitu hutambuliwa kuwa ya aina fulani kama vile wanyama, magari au binadamu.
Uainishaji wa picha hufanyaje kazi?
Picha katika mfumo wa saizi inachambuliwa na kompyuta. Inatimiza hili kwa kutibu picha kama mkusanyiko wa matrices, saizi yake ambayo imedhamiriwa na azimio la picha. Kwa kusema tu, uainishaji wa picha ni utafiti wa data ya takwimu kwa kutumia algoriti kutoka kwa mtazamo wa kompyuta.
Uainishaji wa picha unakamilishwa katika uchakataji wa picha dijitali kwa kupanga saizi katika vikundi vilivyoamuliwa mapema, au "madarasa." Algorithms hugawanya picha katika mfululizo wa sifa muhimu, ambayo hupunguza mzigo kwa kiainishi cha mwisho.
Sifa hizi hufahamisha kiainishi kuhusu maana ya picha na uainishaji unaowezekana. Kwa sababu michakato mingine yote katika kuainisha picha inategemea hiyo, mbinu ya uchimbaji wa tabia ndio awamu muhimu zaidi.
The data iliyotolewa kwa algoriti pia ni muhimu katika uainishaji wa picha, haswa uainishaji unaosimamiwa. Ikilinganishwa na mkusanyiko mbaya wa data na usawa wa data kulingana na darasa na picha ya chini na ubora wa ufafanuzi, seti ya data ya uainishaji iliyoboreshwa vizuri hufanya kazi vizuri.
Uainishaji wa picha kwa kutumia Tensorflow & Keras kwenye python
Tutatumia CIFAR-10 hifadhidata (inayojumuisha ndege, ndege, ndege, na vitu vingine 7).
1. Kufunga Mahitaji
Msimbo ulio hapa chini utasakinisha sharti zote.
2. Kuagiza tegemezi
Tengeneza faili ya train.py kwenye Python. Nambari iliyo hapa chini italeta tegemezi za Tensorflow na Keras.
3. Kuanzisha vigezo
CIFAR-10 inajumuisha kategoria 10 tu za picha, kwa hivyo madarasa ya nambari hurejelea tu idadi ya kategoria za kuainisha.
4. Inapakia mkusanyiko wa data
Chaguo hili la kukokotoa hutumia sehemu ya Tensorflow Datasets kupakia mkusanyiko wa data, na tunaweka pamoja na maelezo kuwa Kweli ili kupata taarifa fulani kuihusu. Unaweza kuichapisha ili kuona ni sehemu gani na thamani zake, na tutatumia maelezo kupata idadi ya sampuli katika seti za mafunzo na majaribio.
5. Kuunda mfano
Sasa tutaunda tabaka tatu, kila moja ikijumuisha ConvNets mbili zilizo na ujumuishaji wa hali ya juu na kitendakazi cha kuwezesha ReLU, ikifuatiwa na mfumo uliounganishwa kikamilifu wa 1024. Kwa kulinganisha na ResNet50 au Xception, ambazo ni modeli za hali ya juu, hii inaweza kuwa modeli ndogo sana.
6. Kufundisha mfano
Nilitumia Tensorboard kupima usahihi na hasara katika kila enzi na kutupa onyesho la kupendeza baada ya kuleta data na kutoa modeli. Endesha nambari ifuatayo; kulingana na CPU/GPU yako, mafunzo yatachukua dakika kadhaa.
Ili kutumia tensorboard, chapa tu amri ifuatayo kwenye terminal au amri ya haraka kwenye saraka ya sasa:
Utaona kwamba hasara ya uthibitishaji inapungua na usahihi unaongezeka hadi takriban 81%. Hiyo ni ya ajabu!
Kupima mfano
Mafunzo yanapokamilika, muundo wa mwisho na uzani huhifadhiwa kwenye folda ya matokeo, na kuturuhusu kutoa mafunzo mara moja na kufanya ubashiri wakati wowote tunapochagua. Fuata nambari katika faili mpya ya python inayoitwa test.py.
7. Kuagiza huduma kwa ajili ya majaribio
8. Kutengeneza saraka ya chatu
Tengeneza kamusi ya Python ambayo hutafsiri kila thamani kamili kwa lebo inayofaa ya hifadhidata:
9. Inapakia data ya jaribio na muundo
Nambari ifuatayo itapakia data ya jaribio na muundo.
10. Tathmini & Utabiri
Nambari ifuatayo itatathmini na kufanya utabiri kwenye picha za chura.
11. Matokeo
Mfano huo ulitabiri chura kwa usahihi wa 80.62%.
Hitimisho
Sawa, tumemaliza somo hili. Ingawa 80.62% si nzuri kwa CNN kidogo, ninakushauri sana ubadilishe muundo au uangalie ResNet50, Xception, au miundo mingine ya kisasa kwa matokeo bora.
Kwa kuwa sasa umeunda mtandao wako wa kwanza wa utambuzi wa picha huko Keras, unapaswa kufanya majaribio na muundo huo ili kugundua jinsi vigezo tofauti huathiri utendakazi wake.
Acha Reply