کی میز کے مندرجات[چھپائیں][دکھائیں]
یہ جان کر یقین دلایا جا رہا ہے کہ ہم نے مثال کے طور پر سیکھنے اور ان کے اردگرد کے ماحول کو سمجھنے کے لیے اپنی فطری صلاحیتوں سے روبوٹس کو متاثر کرنے میں کامیاب ہو گئے ہیں۔ بنیادی چیلنج وہ ہے جو کمپیوٹر کو "دیکھنے" کی تعلیم دیتے ہیں جیسے انسانوں کو بہت زیادہ وقت اور کوشش کی ضرورت ہوگی۔
تاہم، جب ہم اس عملی قدر پر غور کرتے ہیں جو یہ ہنر فی الحال تنظیموں اور کاروباری اداروں کو فراہم کرتا ہے، تو کوشش قابل قدر ہے۔ اس مضمون میں، آپ تصویر کی درجہ بندی، یہ کیسے کام کرتا ہے، اور اس کے عملی نفاذ کے بارے میں جانیں گے۔ چلو شروع کریں.
تصویر کی درجہ بندی کیا ہے؟
ایک تصویر میں کھانا کھلانے کا کام a عصبی نیٹ ورک اور اس تصویر کے لیے کسی قسم کے لیبل کو آؤٹ پٹ کرنا تصویر کی شناخت کے نام سے جانا جاتا ہے۔ نیٹ ورک کا آؤٹ پٹ لیبل پہلے سے طے شدہ کلاس کے مطابق ہوگا۔
تصویر کے لیے متعدد کلاسیں تفویض کی جا سکتی ہیں، یا صرف ایک۔ جب صرف ایک کلاس ہو تو، اصطلاح "تسلیم" کثرت سے استعمال ہوتی ہے، جب کہ جب ایک سے زیادہ کلاسیں ہوں، تو "درجہ بندی" کی اصطلاح کثرت سے استعمال ہوتی ہے۔
آبجیکٹ کا پتہ لگانا تصویر کی درجہ بندی کا ایک ذیلی سیٹ ہے جس میں اشیاء کی مخصوص مثالوں کا پتہ لگایا جاتا ہے کہ وہ کسی مخصوص طبقے سے تعلق رکھتے ہیں جیسے کہ جانور، گاڑیاں یا انسان۔
تصویر کی درجہ بندی کیسے کام کرتی ہے؟
کمپیوٹر کے ذریعے پکسلز کی شکل میں ایک تصویر کا تجزیہ کیا جاتا ہے۔ یہ تصویر کو میٹرکس کے مجموعے کے طور پر علاج کر کے اسے پورا کرتا ہے، جس کا سائز تصویری ریزولوشن سے طے ہوتا ہے۔ سیدھے الفاظ میں، تصویر کی درجہ بندی کمپیوٹر کے نقطہ نظر سے الگورتھم کو استعمال کرتے ہوئے شماریاتی ڈیٹا کا مطالعہ ہے۔
تصویری درجہ بندی ڈیجیٹل امیج پروسیسنگ میں پکسلز کو پہلے سے طے شدہ گروپس، یا "کلاسز" میں گروپ کرکے مکمل کیا جاتا ہے۔ الگورتھم تصویر کو قابل ذکر خصوصیات کے یکے بعد دیگرے تقسیم کرتے ہیں، جس سے حتمی درجہ بندی کرنے والے کے لیے بوجھ کم ہوتا ہے۔
یہ خصوصیات درجہ بندی کرنے والے کو تصویر کے معنی اور ممکنہ درجہ بندی سے آگاہ کرتی ہیں۔ چونکہ تصویر کی درجہ بندی کرنے کے باقی عمل اس پر منحصر ہیں، خصوصیت نکالنے کا طریقہ سب سے اہم مرحلہ ہے۔
۔ فراہم کردہ ڈیٹا تصویر کی درجہ بندی، خاص طور پر زیر نگرانی درجہ بندی میں الگورتھم بھی اہم ہے۔ کلاس اور کم تصویر اور تشریح کے معیار پر مبنی ڈیٹا کے عدم توازن کے ساتھ ایک خوفناک ڈیٹاسیٹ کے مقابلے میں، ایک اچھی طرح سے بہتر درجہ بندی ڈیٹاسیٹ قابل تعریف کارکردگی کا مظاہرہ کرتا ہے۔
python میں Tensorflow اور Keras کا استعمال کرتے ہوئے تصویر کی درجہ بندی
ہم استعمال کریں گے CIFAR-10 ڈیٹا سیٹ (جس میں ہوائی جہاز، ہوائی جہاز، پرندے اور دیگر 7 چیزیں شامل ہیں)۔
1. تنصیب کی ضروریات
نیچے دیا گیا کوڈ تمام شرائط کو انسٹال کر دے گا۔
2. انحصار درآمد کرنا
Python میں ایک train.py فائل بنائیں۔ نیچے کا کوڈ Tensorflow اور Keras انحصار درآمد کرے گا۔
3. ابتدائی پیرامیٹرز
CIFAR-10 میں صرف 10 تصویری زمرے شامل ہیں، اس لیے نمبر کلاسز صرف درجہ بندی کے لیے زمروں کی تعداد کا حوالہ دیتے ہیں۔
4. ڈیٹاسیٹ لوڈ کرنا
فنکشن ڈیٹاسیٹ کو لوڈ کرنے کے لیے Tensorflow Datasets ماڈیول کا استعمال کرتا ہے، اور ہم اس کے بارے میں کچھ معلومات حاصل کرنے کے لیے معلومات کے ساتھ True پر سیٹ کرتے ہیں۔ آپ اسے پرنٹ آؤٹ کر کے دیکھ سکتے ہیں کہ فیلڈز اور ان کی اقدار کیا ہیں، اور ہم معلومات کو تربیت اور ٹیسٹنگ سیٹوں میں نمونوں کی تعداد کو بازیافت کرنے کے لیے استعمال کریں گے۔
5. ماڈل بنانا
اب ہم تین پرتیں بنائیں گے، ہر ایک میکس پولنگ اور ReLU ایکٹیویشن فنکشن کے ساتھ دو ConvNets پر مشتمل ہوگا، جس کے بعد ایک مکمل طور پر منسلک 1024-یونٹ سسٹم ہوگا۔ ResNet50 یا Xception کے مقابلے میں، جو کہ جدید ترین ماڈل ہیں، یہ نسبتاً چھوٹا ماڈل ہو سکتا ہے۔
6. ماڈل کی تربیت
میں نے ہر دور میں درستگی اور نقصان کی پیمائش کرنے کے لیے Tensorboard کا استعمال کیا اور ڈیٹا درآمد کرنے اور ماڈل بنانے کے بعد ہمیں ایک خوبصورت ڈسپلے فراہم کیا۔ درج ذیل کوڈ کو چلائیں؛ آپ کے CPU/GPU پر منحصر ہے، تربیت میں کئی منٹ لگیں گے۔
ٹینسر بورڈ استعمال کرنے کے لیے، صرف ٹرمینل میں درج ذیل کمانڈ کو ٹائپ کریں یا موجودہ ڈائرکٹری میں کمانڈ پرامپٹ:
آپ دیکھیں گے کہ توثیق کا نقصان کم ہو رہا ہے اور درستگی تقریباً 81% تک بڑھ رہی ہے۔ یہ شاندار ہے!
ماڈل کی جانچ ہو رہی ہے۔
جب تربیت ختم ہو جاتی ہے، حتمی ماڈل اور وزن نتائج کے فولڈر میں محفوظ ہو جاتے ہیں، جس سے ہمیں ایک بار تربیت دینے اور جب بھی ہم انتخاب کرتے ہیں پیشین گوئیاں کر سکتے ہیں۔ test.py نامی ایک نئی ازگر فائل میں کوڈ کو فالو کریں۔
7. جانچ کے لیے یوٹیلیٹیز درآمد کرنا
8. ازگر کی ڈائرکٹری بنانا
ایک Python ڈکشنری بنائیں جو ڈیٹاسیٹ کے مناسب لیبل میں ہر عددی قدر کا ترجمہ کرے:
9. ٹیسٹ ڈیٹا اور ماڈل لوڈ ہو رہا ہے۔
درج ذیل کوڈ ٹیسٹ ڈیٹا اور ماڈل کو لوڈ کرے گا۔
10. تشخیص اور پیشن گوئی
درج ذیل کوڈ مینڈک کی تصویروں کا جائزہ لے گا اور پیشین گوئیاں کرے گا۔
11. نتائج
ماڈل نے 80.62 فیصد درستگی کے ساتھ مینڈک کی پیش گوئی کی۔
نتیجہ
ٹھیک ہے، ہم نے اس سبق کو مکمل کر لیا ہے۔ جبکہ 80.62% تھوڑا سا CNN کے لیے اچھا نہیں ہے، میں آپ کو سختی سے مشورہ دیتا ہوں کہ ماڈل کو تبدیل کریں یا بہتر نتائج کے لیے ResNet50، Xception، یا دیگر جدید ماڈلز کو دیکھیں۔
اب جب کہ آپ نے اپنا پہلا تصویری شناخت کا نیٹ ورک Keras میں بنایا ہے، آپ کو ماڈل کے ساتھ تجربہ کرنا چاہیے تاکہ یہ دریافت کیا جا سکے کہ مختلف پیرامیٹرز اس کی کارکردگی کو کیسے متاثر کرتے ہیں۔
جواب دیجئے