مواد جي جدول[لڪ][ڏسو]
اهو ڄاڻڻ لاءِ اطمينان بخش آهي ته اسان روبوٽس کي پنهنجي فطري صلاحيتن سان گڏ مثال طور سکڻ ۽ انهن جي ماحول کي سمجهڻ ۾ ڪامياب ڪيو آهي. بنيادي چئلينج اهو آهي ته ڪمپيوٽرن کي ”ڏسڻ“ سيکارڻ جهڙوڪ انسانن کي وڌيڪ وقت ۽ ڪوشش جي ضرورت پوندي.
بهرحال، جڏهن اسان عملي قدر تي غور ڪريون ٿا ته هي مهارت هن وقت تنظيمن ۽ ادارن کي مهيا ڪري ٿي، ڪوشش قابل قدر آهي. هن آرٽيڪل ۾، توهان سکندا سين ته تصوير جي درجه بندي بابت، اهو ڪيئن ڪم ڪري ٿو، ۽ ان جي عملي عمل کي. اچو ته شروع ڪريون.
تصوير جي درجه بندي ڇا آهي؟
تصوير کي فيڊ ڪرڻ جو ڪم a نظرياتي نيٽورڪ ۽ ان کي ان تصوير لاءِ ليبل جي ڪجهه شڪل ڏيڻ کي تصوير جي سڃاڻپ طور سڃاتو وڃي ٿو. نيٽ ورڪ جو آئوٽ پٽ ليبل اڳئين بيان ڪيل طبقي سان ملندو.
ٿي سگھي ٿو ڪيترن ئي طبقن کي لڳايو ويو تصوير تي، يا صرف هڪ. جڏهن صرف هڪ طبقو آهي، اصطلاح "سڃاڻپ" کي اڪثر استعمال ڪيو ويندو آهي، جڏهن ته ڪيترائي طبقا آهن، اصطلاح "درجه بندي" اڪثر استعمال ڪيو ويندو آهي.
اعتراض جي ڳولا تصويرن جي درجه بندي جو هڪ ذيلي سيٽ آهي جنهن ۾ شين جا خاص مثال معلوم ڪيا ويا آهن جيئن ته ڏنل طبقي سان تعلق رکن ٿا جهڙوڪ جانور، گاڏيون، يا انسان.
تصوير جي درجه بندي ڪيئن ڪم ڪندو آهي؟
ڪمپيوٽر ذريعي پکسلز جي شڪل ۾ تصوير جو تجزيو ڪيو ويندو آهي. اهو مڪمل ڪري ٿو تصوير کي علاج ڪندي ميٽرڪس جي مجموعن جي طور تي، جنهن جي سائيز تصوير جي قرارداد طرفان طئي ڪئي وئي آهي. بس ڳالهائڻ، تصوير جي درجه بندي شمارياتي ڊيٽا جو مطالعو آهي جيڪو ڪمپيوٽر جي نقطه نظر کان الگورتھم استعمال ڪري ٿو.
تصويري درجه بندي ڊجيٽل تصويري پروسيسنگ ۾ مڪمل ڪئي وئي آهي پکسلز کي اڳواٽ مقرر ڪيل گروپن ۾ گروپ ڪندي، يا "ڪلاس." الگورتھم تصوير کي قابل ذڪر خاصيتن جي تسلسل ۾ ورهائي ٿو، جيڪو آخري درجه بندي لاء بوجھ گھٽائي ٿو.
اهي خاصيتون درجه بندي ڪندڙ کي تصوير جي معني ۽ امڪاني درجه بندي بابت ڄاڻ ڏين ٿيون. ڇاڪاڻ ته تصوير جي درجه بندي ۾ باقي عمل ان تي منحصر آهن، خاصيت ڪڍڻ جو طريقو سڀ کان وڌيڪ نازڪ مرحلو آهي.
هن مهيا ڪيل ڊيٽا الورورٿم کي تصوير جي درجه بندي ۾ پڻ اهم آهي، خاص طور تي نگراني ڪيل درجه بندي. ڪلاس ۽ گهٽ تصوير ۽ تشريح جي معيار جي بنياد تي ڊيٽا جي عدم توازن سان گڏ هڪ خوفناڪ ڊيٽا سيٽ جي مقابلي ۾، هڪ چڱي طرح بهتر ڪيل درجه بندي ڊيٽا سيٽ شاندار طور تي انجام ڏئي ٿو.
Python ۾ Tensorflow ۽ Keras استعمال ڪندي تصويري درجه بندي
اسان استعمال ڪنداسين CIFAR-10 ڊيٽا سيٽ (جنهن ۾ جهاز، هوائي جهاز، پکي ۽ ٻيون 7 شيون شامل آهن).
1. انسٽال ڪرڻ جي گهرج
هيٺ ڏنل ڪوڊ سڀني شرطن کي انسٽال ڪندو.
2. درآمد انحصار
Python ۾ هڪ train.py فائل ٺاهيو. هيٺ ڏنل ڪوڊ Tensorflow ۽ Keras انحصار درآمد ڪندو.
3. شروعاتي پيٽرولر
CIFAR-10 ۾ صرف 10 تصويرن جا ڀاڱا شامل آھن، تنھنڪري ڳڻپيوڪر طبقن کي صرف درجه بندي ڪرڻ لاءِ ڪلاسن جي تعداد جو حوالو ڏنو ويو آھي.
4. ڊيٽا سيٽ لوڊ ڪندي
فنڪشن ڊيٽا سيٽ کي لوڊ ڪرڻ لاءِ Tensorflow Datasets ماڊل استعمال ڪري ٿو، ۽ اسان ان جي باري ۾ ڪجهه معلومات حاصل ڪرڻ لاءِ صحيح کي معلومات سان سيٽ ڪيو. توھان ان کي پرنٽ ڪري سگھوٿا اھو ڏسڻ لاءِ ته ڪھڙا شعبا ۽ انھن جا قدر آھن، ۽ اسين معلومات کي استعمال ڪنداسين ته جيئن تربيت ۽ ٽيسٽنگ سيٽن ۾ نمونن جو تعداد حاصل ڪجي.
5. ماڊل ٺاهڻ
ھاڻي اسين ٽي پرت ٺاھينداسين، ھر ھڪ ٻن ڪنوي نيٽ تي مشتمل ھوندي جنھن ۾ وڌ ۾ وڌ پولنگ ۽ ReLU ايڪٽيويشن فنڪشن ھوندو، جنھن کانپوءِ مڪمل طور تي ڳنڍيل 1024-يونٽ سسٽم ھوندو. ResNet50 يا Xception جي مقابلي ۾، جيڪي جديد ترين ماڊل آهن، اهو ٿي سگهي ٿو نسبتاً ننڍو ماڊل.
6. ماڊل جي تربيت
مون ٽينسر بورڊ استعمال ڪيو هر دور ۾ درستگي ۽ نقصان کي ماپڻ لاءِ ۽ ڊيٽا درآمد ڪرڻ ۽ ماڊل ٺاهڻ کان پوءِ اسان کي هڪ خوبصورت ڊسپلي فراهم ڪيو. ھيٺ ڏنل ڪوڊ کي هلائڻ؛ توهان جي CPU/GPU تي منحصر ڪري، ٽريننگ ڪيترن ئي منٽن وٺي ويندي.
ٽينسر بورڊ استعمال ڪرڻ لاءِ، صرف ٽرمينل ۾ ھيٺ ڏنل حڪم ٽائيپ ڪريو يا موجوده ڊاريڪٽري ۾ ڪمانڊ پرامٽ:
توهان ڏسندا ته تصديق جو نقصان گهٽجي رهيو آهي ۽ درستگي 81 سيڪڙو تائين وڌي رهي آهي. اهو شاندار آهي!
نموني جاچ پڙتال
جڏهن ٽريننگ ختم ٿي ويندي آهي، فائنل ماڊل ۽ وزن محفوظ ڪيا ويندا آهن نتيجن جي فولڊر ۾، اسان کي هڪ ڀيرو ٽريننگ ڪرڻ جي اجازت ڏئي ٿي ۽ جڏهن به اسان چونڊون ٿا اڳڪٿيون ڪيون. ٽيسٽ.py نالي هڪ نئين پٿون فائل ۾ ڪوڊ کي فالو ڪريو.
7. جانچ لاءِ يوٽيلٽيز درآمد ڪرڻ
8. پٿون ڊاريڪٽري ٺاهڻ
Python ڊڪشنري ٺاهيو جيڪو هر انٽيجر جي قيمت کي ڊيٽا سيٽ جي مناسب ليبل تي ترجمو ڪري ٿو:
9. لوڊ ڪندي ٽيسٽ ڊيٽا ۽ ماڊل
هيٺ ڏنل ڪوڊ ٽيسٽ ڊيٽا ۽ ماڊل لوڊ ڪندو.
10. اڀياس ۽ اڳڪٿي
هيٺ ڏنل ڪوڊ ڏيڏر جي تصويرن تي اندازو لڳائيندو ۽ اڳڪٿيون ڪندو.
11. نتيجا
ماڊل 80.62٪ درستگي سان ڏيڏر جي اڳڪٿي ڪئي.
ٿڪل
ٺيڪ، اسان هن سبق سان ڪيو آهي. جڏهن ته 80.62٪ ٿورڙي CNN لاءِ سٺو ناهي، مان توهان کي سختي سان صلاح ڏيان ٿو ته ماڊل کي تبديل ڪريو يا بهتر نتيجن لاءِ ResNet50، Xception، يا ٻيا جديد ماڊل ڏسو.
ھاڻي جڏھن توھان ٺاھيو آھي پنھنجو پھريون تصويري سڃاڻپ نيٽ ورڪ ڪيراس ۾، توھان کي ماڊل سان تجربو ڪرڻ گھرجي ته ڪيئن مختلف پيٽرولر ان جي ڪارڪردگي کي متاثر ڪن ٿا.
جواب ڇڏي وڃو