પાયથોન - હેશડોર્કમાં ટેન્સરફ્લો અને કેરા સાથે ડીપ લર્નિંગ ઇમેજ ક્લાસિફિકેશન

સામગ્રીનું કોષ્ટક[છુપાવો][બતાવો]

છબી વર્ગીકરણ શું છે?
છબી વર્ગીકરણ કેવી રીતે કાર્ય કરે છે?
અજગરમાં ટેન્સરફ્લો અને કેરાસનો ઉપયોગ કરીને છબીનું વર્ગીકરણ+-
ઉપસંહાર

તે જાણીને આશ્વાસન આપનારું છે કે અમે રોબોટ્સને દાખલા દ્વારા શીખવાની અને તેમની આસપાસના વાતાવરણને સમજવાની અમારી જન્મજાત ક્ષમતાઓથી પ્રભાવિત કરવામાં સફળ થયા છીએ. મૂળભૂત પડકાર એ છે કે જેઓ કમ્પ્યુટરને "જોવા" શીખવે છે જેમ કે મનુષ્યોને વધુ સમય અને પ્રયત્નોની જરૂર પડશે.

જો કે, જ્યારે આપણે વ્યવહારિક મૂલ્યને ધ્યાનમાં લઈએ છીએ કે આ કૌશલ્ય હાલમાં સંસ્થાઓ અને સાહસોને પ્રદાન કરે છે, ત્યારે પ્રયાસ સાર્થક છે. આ લેખમાં, તમે છબી વર્ગીકરણ, તે કેવી રીતે કાર્ય કરે છે અને તેના વ્યવહારુ અમલીકરણ વિશે શીખી શકશો. ચાલો શરુ કરીએ.

છબી વર્ગીકરણ શું છે?

એમાં ઇમેજ ફીડ કરવાનું કામ મજ્જાતંતુકીય નેટવર્ક અને તે ચિત્ર માટે અમુક સ્વરૂપનું લેબલ આઉટપુટ કરાવવું એ ઇમેજ રેકગ્નિશન તરીકે ઓળખાય છે. નેટવર્કનું આઉટપુટ લેબલ પૂર્વ-નિર્ધારિત વર્ગને અનુરૂપ હશે.

ચિત્ર માટે અસંખ્ય વર્ગો અસાઇન કરી શકાય છે, અથવા ફક્ત એક. જ્યારે માત્ર એક જ વર્ગ હોય, ત્યારે "માન્યતા" શબ્દનો વારંવાર ઉપયોગ થાય છે, જ્યારે બહુવિધ વર્ગો હોય ત્યારે, "વર્ગીકરણ" શબ્દનો વારંવાર ઉપયોગ થાય છે.

ઑબ્જેક્ટ શોધ ચિત્ર વર્ગીકરણનો સબસેટ છે જેમાં પદાર્થોના ચોક્કસ ઉદાહરણો પ્રાણીઓ, વાહનો અથવા મનુષ્યો જેવા આપેલા વર્ગ સાથે જોડાયેલા હોવાનું જાણવા મળે છે.

છબી વર્ગીકરણ કેવી રીતે કાર્ય કરે છે?

કમ્પ્યુટર દ્વારા પિક્સેલના સ્વરૂપમાં એક છબીનું વિશ્લેષણ કરવામાં આવે છે. તે ચિત્રને મેટ્રિસિસના સંગ્રહ તરીકે ગણીને આ પરિપૂર્ણ કરે છે, જેનું કદ ઇમેજ રિઝોલ્યુશન દ્વારા નક્કી કરવામાં આવે છે. સરળ શબ્દોમાં કહીએ તો, ચિત્ર વર્ગીકરણ એ કમ્પ્યુટરના પરિપ્રેક્ષ્યમાં અલ્ગોરિધમનો ઉપયોગ કરીને આંકડાકીય માહિતીનો અભ્યાસ છે.

પૂર્વનિર્ધારિત જૂથો અથવા "વર્ગો" માં પિક્સેલને જૂથબદ્ધ કરીને ડિજિટલ ઇમેજ પ્રોસેસિંગમાં છબી વર્ગીકરણ પૂર્ણ થાય છે. એલ્ગોરિધમ્સ ઇમેજને નોંધપાત્ર લાક્ષણિકતાઓના ઉત્તરાધિકારમાં વિભાજિત કરે છે, જે અંતિમ વર્ગીકરણ માટે બોજ ઘટાડે છે.

આ ગુણો વર્ગીકરણકર્તાને છબીના અર્થ અને સંભવિત વર્ગીકરણ વિશે જાણ કરે છે. કારણ કે ચિત્રને વર્ગીકૃત કરવાની બાકીની પ્રક્રિયાઓ તેના પર નિર્ભર છે, લાક્ષણિક નિષ્કર્ષણ પદ્ધતિ એ સૌથી નિર્ણાયક તબક્કો છે.

આ ડેટા પ્રદાન કરે છે ઇમેજ વર્ગીકરણમાં પણ એલ્ગોરિધમ મહત્ત્વપૂર્ણ છે, ખાસ કરીને દેખરેખ હેઠળનું વર્ગીકરણ. વર્ગ અને નિમ્ન ચિત્ર અને ટીકા ગુણવત્તા પર આધારિત ડેટા અસંતુલન સાથેના ભયંકર ડેટાસેટની સરખામણીમાં, સારી રીતે ઑપ્ટિમાઇઝ કરેલ વર્ગીકરણ ડેટાસેટ પ્રશંસનીય કામગીરી કરે છે.

અજગરમાં ટેન્સરફ્લો અને કેરાસનો ઉપયોગ કરીને છબીનું વર્ગીકરણ

અમે નો ઉપયોગ કરીશું CIFAR-10 ડેટાસેટ (જેમાં એરક્રાફ્ટ, એરોપ્લેન, પક્ષીઓ અને અન્ય 7 વસ્તુઓનો સમાવેશ થાય છે).

1. ઇન્સ્ટોલ કરવાની આવશ્યકતાઓ

નીચેનો કોડ તમામ પૂર્વજરૂરીયાતોને ઇન્સ્ટોલ કરશે.

ઇન્સ્ટોલ કરવાની આવશ્યકતાઓ 1

2. આયાત અવલંબન

Python માં train.py ફાઇલ બનાવો. નીચેનો કોડ ટેન્સરફ્લો અને કેરાસ નિર્ભરતાને આયાત કરશે.

આયાત અવલંબન 1

3. પ્રારંભિક પરિમાણો

CIFAR-10 માં માત્ર 10 ચિત્ર શ્રેણીઓનો સમાવેશ થાય છે, તેથી સંખ્યા વર્ગો વર્ગીકરણ કરવા માટેની શ્રેણીઓની સંખ્યાનો સંદર્ભ આપે છે.

પરિમાણો શરૂ કરી રહ્યા છીએ

4. ડેટાસેટ લોડ કરી રહ્યું છે

ડેટાસેટ લોડ કરવા માટે ફંક્શન ટેન્સરફ્લો ડેટાસેટ્સ મોડ્યુલનો ઉપયોગ કરે છે, અને અમે તેના વિશે કેટલીક માહિતી મેળવવા માટે માહિતી સાથે ટ્રુ પર સેટ કરીએ છીએ. ફીલ્ડ્સ અને તેમના મૂલ્યો શું છે તે જોવા માટે તમે તેને છાપી શકો છો અને અમે તાલીમ અને પરીક્ષણ સેટમાં નમૂનાઓની સંખ્યા પુનઃપ્રાપ્ત કરવા માટે માહિતીનો ઉપયોગ કરીશું.

5. મોડેલ બનાવવું

હવે અમે ત્રણ સ્તરો બનાવીશું, જેમાં દરેકમાં મહત્તમ-પૂલિંગ અને ReLU એક્ટિવેશન ફંક્શન સાથે બે કન્વનેટનો સમાવેશ થાય છે, ત્યારબાદ સંપૂર્ણ રીતે જોડાયેલ 1024-યુનિટ સિસ્ટમ હશે. ResNet50 અથવા Xception ની સરખામણીમાં, જે અદ્યતન મોડલ છે, આ તુલનાત્મક રીતે નાનું મોડેલ હોઈ શકે છે.

મોડલ બનાવવું 1

6. મોડેલને તાલીમ આપવી

મેં દરેક યુગમાં સચોટતા અને નુકસાનને માપવા માટે ટેન્સરબોર્ડનો ઉપયોગ કર્યો અને ડેટા આયાત કર્યા પછી અને મોડેલ જનરેટ કર્યા પછી અમને સુંદર ડિસ્પ્લે પ્રદાન કર્યું. નીચેનો કોડ ચલાવો; તમારા CPU/GPU પર આધાર રાખીને, તાલીમમાં થોડી મિનિટો લાગશે.

મોડેલને તાલીમ આપવી

ટેન્સરબોર્ડનો ઉપયોગ કરવા માટે, ટર્મિનલ અથવા વર્તમાન ડિરેક્ટરીમાં કમાન્ડ પ્રોમ્પ્ટમાં ફક્ત નીચેનો આદેશ લખો:

ટેન્સરબોર્ડ 1

તમે જોશો કે માન્યતાની ખોટ ઘટી રહી છે અને ચોકસાઈ લગભગ 81% સુધી વધી રહી છે. તે વિચિત્ર છે!

માન્યતા ચોકસાઈ

માન્યતા નુકશાન

મોડેલ પરીક્ષણ

જ્યારે તાલીમ સમાપ્ત થાય છે, ત્યારે અંતિમ મોડલ અને વજન પરિણામોના ફોલ્ડરમાં સાચવવામાં આવે છે, જેનાથી અમને એકવાર તાલીમ આપવામાં આવે છે અને જ્યારે પણ અમે પસંદ કરીએ ત્યારે આગાહીઓ કરી શકીએ છીએ. test.py નામની નવી પાયથોન ફાઇલમાં કોડને અનુસરો.

7. પરીક્ષણ માટે ઉપયોગિતાઓને આયાત કરવી

પરીક્ષણ માટે જરૂરી ઉપયોગિતાઓ આયાત કરવી

8. પાયથોન ડિરેક્ટરી બનાવવી

પાયથોન શબ્દકોશ બનાવો જે દરેક પૂર્ણાંક મૂલ્યને ડેટાસેટના યોગ્ય લેબલમાં અનુવાદિત કરે છે:

પાયથોન ડિરેક્ટરી બનાવવી 1

9. ટેસ્ટ ડેટા અને મોડેલ લોડ કરી રહ્યું છે

નીચેનો કોડ ટેસ્ટ ડેટા અને મોડેલ લોડ કરશે.

10. મૂલ્યાંકન અને અનુમાન

નીચેનો કોડ દેડકાની છબીઓનું મૂલ્યાંકન કરશે અને આગાહીઓ કરશે.

મૂલ્યાંકન અનુમાન 1

11. પરિણામો

મોડેલે 80.62% ચોકસાઈ સાથે દેડકાની આગાહી કરી હતી.

પરિણામો

ઉપસંહાર

ઠીક છે, અમે આ પાઠ પૂરો કર્યો. જ્યારે 80.62% એ નાના CNN માટે સારું નથી, હું તમને મોડેલમાં ફેરફાર કરવા અથવા સારા પરિણામો માટે ResNet50, Xception અથવા અન્ય અદ્યતન મોડલ્સ જોવાની ભારપૂર્વક સલાહ આપું છું.

હવે તમે કેરાસમાં તમારું પહેલું ઇમેજ રેકગ્નિશન નેટવર્ક બનાવ્યું છે, તમારે મોડેલ સાથે પ્રયોગ કરવો જોઈએ કે તે શોધવા માટે કે વિવિધ પરિમાણો તેના પ્રદર્શનને કેવી રીતે અસર કરે છે.

પાયથોનમાં ટેન્સરફ્લો અને કેરા સાથે ડીપ લર્નિંગ ઇમેજ ક્લાસિફિકેશન

છબી વર્ગીકરણ શું છે?

છબી વર્ગીકરણ કેવી રીતે કાર્ય કરે છે?