સામગ્રીનું કોષ્ટક[છુપાવો][બતાવો]
તે જાણીને આશ્વાસન આપનારું છે કે અમે રોબોટ્સને દાખલા દ્વારા શીખવાની અને તેમની આસપાસના વાતાવરણને સમજવાની અમારી જન્મજાત ક્ષમતાઓથી પ્રભાવિત કરવામાં સફળ થયા છીએ. મૂળભૂત પડકાર એ છે કે જેઓ કમ્પ્યુટરને "જોવા" શીખવે છે જેમ કે મનુષ્યોને વધુ સમય અને પ્રયત્નોની જરૂર પડશે.
જો કે, જ્યારે આપણે વ્યવહારિક મૂલ્યને ધ્યાનમાં લઈએ છીએ કે આ કૌશલ્ય હાલમાં સંસ્થાઓ અને સાહસોને પ્રદાન કરે છે, ત્યારે પ્રયાસ સાર્થક છે. આ લેખમાં, તમે છબી વર્ગીકરણ, તે કેવી રીતે કાર્ય કરે છે અને તેના વ્યવહારુ અમલીકરણ વિશે શીખી શકશો. ચાલો શરુ કરીએ.
છબી વર્ગીકરણ શું છે?
એમાં ઇમેજ ફીડ કરવાનું કામ મજ્જાતંતુકીય નેટવર્ક અને તે ચિત્ર માટે અમુક સ્વરૂપનું લેબલ આઉટપુટ કરાવવું એ ઇમેજ રેકગ્નિશન તરીકે ઓળખાય છે. નેટવર્કનું આઉટપુટ લેબલ પૂર્વ-નિર્ધારિત વર્ગને અનુરૂપ હશે.
ચિત્ર માટે અસંખ્ય વર્ગો અસાઇન કરી શકાય છે, અથવા ફક્ત એક. જ્યારે માત્ર એક જ વર્ગ હોય, ત્યારે "માન્યતા" શબ્દનો વારંવાર ઉપયોગ થાય છે, જ્યારે બહુવિધ વર્ગો હોય ત્યારે, "વર્ગીકરણ" શબ્દનો વારંવાર ઉપયોગ થાય છે.
ઑબ્જેક્ટ શોધ ચિત્ર વર્ગીકરણનો સબસેટ છે જેમાં પદાર્થોના ચોક્કસ ઉદાહરણો પ્રાણીઓ, વાહનો અથવા મનુષ્યો જેવા આપેલા વર્ગ સાથે જોડાયેલા હોવાનું જાણવા મળે છે.
છબી વર્ગીકરણ કેવી રીતે કાર્ય કરે છે?
કમ્પ્યુટર દ્વારા પિક્સેલના સ્વરૂપમાં એક છબીનું વિશ્લેષણ કરવામાં આવે છે. તે ચિત્રને મેટ્રિસિસના સંગ્રહ તરીકે ગણીને આ પરિપૂર્ણ કરે છે, જેનું કદ ઇમેજ રિઝોલ્યુશન દ્વારા નક્કી કરવામાં આવે છે. સરળ શબ્દોમાં કહીએ તો, ચિત્ર વર્ગીકરણ એ કમ્પ્યુટરના પરિપ્રેક્ષ્યમાં અલ્ગોરિધમનો ઉપયોગ કરીને આંકડાકીય માહિતીનો અભ્યાસ છે.
પૂર્વનિર્ધારિત જૂથો અથવા "વર્ગો" માં પિક્સેલને જૂથબદ્ધ કરીને ડિજિટલ ઇમેજ પ્રોસેસિંગમાં છબી વર્ગીકરણ પૂર્ણ થાય છે. એલ્ગોરિધમ્સ ઇમેજને નોંધપાત્ર લાક્ષણિકતાઓના ઉત્તરાધિકારમાં વિભાજિત કરે છે, જે અંતિમ વર્ગીકરણ માટે બોજ ઘટાડે છે.
આ ગુણો વર્ગીકરણકર્તાને છબીના અર્થ અને સંભવિત વર્ગીકરણ વિશે જાણ કરે છે. કારણ કે ચિત્રને વર્ગીકૃત કરવાની બાકીની પ્રક્રિયાઓ તેના પર નિર્ભર છે, લાક્ષણિક નિષ્કર્ષણ પદ્ધતિ એ સૌથી નિર્ણાયક તબક્કો છે.
આ ડેટા પ્રદાન કરે છે ઇમેજ વર્ગીકરણમાં પણ એલ્ગોરિધમ મહત્ત્વપૂર્ણ છે, ખાસ કરીને દેખરેખ હેઠળનું વર્ગીકરણ. વર્ગ અને નિમ્ન ચિત્ર અને ટીકા ગુણવત્તા પર આધારિત ડેટા અસંતુલન સાથેના ભયંકર ડેટાસેટની સરખામણીમાં, સારી રીતે ઑપ્ટિમાઇઝ કરેલ વર્ગીકરણ ડેટાસેટ પ્રશંસનીય કામગીરી કરે છે.
અજગરમાં ટેન્સરફ્લો અને કેરાસનો ઉપયોગ કરીને છબીનું વર્ગીકરણ
અમે નો ઉપયોગ કરીશું CIFAR-10 ડેટાસેટ (જેમાં એરક્રાફ્ટ, એરોપ્લેન, પક્ષીઓ અને અન્ય 7 વસ્તુઓનો સમાવેશ થાય છે).
1. ઇન્સ્ટોલ કરવાની આવશ્યકતાઓ
નીચેનો કોડ તમામ પૂર્વજરૂરીયાતોને ઇન્સ્ટોલ કરશે.
2. આયાત અવલંબન
Python માં train.py ફાઇલ બનાવો. નીચેનો કોડ ટેન્સરફ્લો અને કેરાસ નિર્ભરતાને આયાત કરશે.
3. પ્રારંભિક પરિમાણો
CIFAR-10 માં માત્ર 10 ચિત્ર શ્રેણીઓનો સમાવેશ થાય છે, તેથી સંખ્યા વર્ગો વર્ગીકરણ કરવા માટેની શ્રેણીઓની સંખ્યાનો સંદર્ભ આપે છે.
4. ડેટાસેટ લોડ કરી રહ્યું છે
ડેટાસેટ લોડ કરવા માટે ફંક્શન ટેન્સરફ્લો ડેટાસેટ્સ મોડ્યુલનો ઉપયોગ કરે છે, અને અમે તેના વિશે કેટલીક માહિતી મેળવવા માટે માહિતી સાથે ટ્રુ પર સેટ કરીએ છીએ. ફીલ્ડ્સ અને તેમના મૂલ્યો શું છે તે જોવા માટે તમે તેને છાપી શકો છો અને અમે તાલીમ અને પરીક્ષણ સેટમાં નમૂનાઓની સંખ્યા પુનઃપ્રાપ્ત કરવા માટે માહિતીનો ઉપયોગ કરીશું.
5. મોડેલ બનાવવું
હવે અમે ત્રણ સ્તરો બનાવીશું, જેમાં દરેકમાં મહત્તમ-પૂલિંગ અને ReLU એક્ટિવેશન ફંક્શન સાથે બે કન્વનેટનો સમાવેશ થાય છે, ત્યારબાદ સંપૂર્ણ રીતે જોડાયેલ 1024-યુનિટ સિસ્ટમ હશે. ResNet50 અથવા Xception ની સરખામણીમાં, જે અદ્યતન મોડલ છે, આ તુલનાત્મક રીતે નાનું મોડેલ હોઈ શકે છે.
6. મોડેલને તાલીમ આપવી
મેં દરેક યુગમાં સચોટતા અને નુકસાનને માપવા માટે ટેન્સરબોર્ડનો ઉપયોગ કર્યો અને ડેટા આયાત કર્યા પછી અને મોડેલ જનરેટ કર્યા પછી અમને સુંદર ડિસ્પ્લે પ્રદાન કર્યું. નીચેનો કોડ ચલાવો; તમારા CPU/GPU પર આધાર રાખીને, તાલીમમાં થોડી મિનિટો લાગશે.
ટેન્સરબોર્ડનો ઉપયોગ કરવા માટે, ટર્મિનલ અથવા વર્તમાન ડિરેક્ટરીમાં કમાન્ડ પ્રોમ્પ્ટમાં ફક્ત નીચેનો આદેશ લખો:
તમે જોશો કે માન્યતાની ખોટ ઘટી રહી છે અને ચોકસાઈ લગભગ 81% સુધી વધી રહી છે. તે વિચિત્ર છે!
મોડેલ પરીક્ષણ
જ્યારે તાલીમ સમાપ્ત થાય છે, ત્યારે અંતિમ મોડલ અને વજન પરિણામોના ફોલ્ડરમાં સાચવવામાં આવે છે, જેનાથી અમને એકવાર તાલીમ આપવામાં આવે છે અને જ્યારે પણ અમે પસંદ કરીએ ત્યારે આગાહીઓ કરી શકીએ છીએ. test.py નામની નવી પાયથોન ફાઇલમાં કોડને અનુસરો.
7. પરીક્ષણ માટે ઉપયોગિતાઓને આયાત કરવી
8. પાયથોન ડિરેક્ટરી બનાવવી
પાયથોન શબ્દકોશ બનાવો જે દરેક પૂર્ણાંક મૂલ્યને ડેટાસેટના યોગ્ય લેબલમાં અનુવાદિત કરે છે:
9. ટેસ્ટ ડેટા અને મોડેલ લોડ કરી રહ્યું છે
નીચેનો કોડ ટેસ્ટ ડેટા અને મોડેલ લોડ કરશે.
10. મૂલ્યાંકન અને અનુમાન
નીચેનો કોડ દેડકાની છબીઓનું મૂલ્યાંકન કરશે અને આગાહીઓ કરશે.
11. પરિણામો
મોડેલે 80.62% ચોકસાઈ સાથે દેડકાની આગાહી કરી હતી.
ઉપસંહાર
ઠીક છે, અમે આ પાઠ પૂરો કર્યો. જ્યારે 80.62% એ નાના CNN માટે સારું નથી, હું તમને મોડેલમાં ફેરફાર કરવા અથવા સારા પરિણામો માટે ResNet50, Xception અથવા અન્ય અદ્યતન મોડલ્સ જોવાની ભારપૂર્વક સલાહ આપું છું.
હવે તમે કેરાસમાં તમારું પહેલું ઇમેજ રેકગ્નિશન નેટવર્ક બનાવ્યું છે, તમારે મોડેલ સાથે પ્રયોગ કરવો જોઈએ કે તે શોધવા માટે કે વિવિધ પરિમાણો તેના પ્રદર્શનને કેવી રીતે અસર કરે છે.
એક જવાબ છોડો