کی میز کے مندرجات[چھپائیں][دکھائیں]
جعلی تصاویر اور ویڈیوز کا ہونا کوئی نئی بات نہیں ہے۔ انٹرنیٹ کے بڑے پیمانے پر استعمال کے بعد سے، جب سے تصاویر اور فلمیں بنی ہیں، لوگ بیوقوف بنانے یا دل لگی کرنے کے لیے جعلسازی بنا رہے ہیں۔
تاہم، ایک نئی قسم کی مشین سے تیار کردہ جعلی ہیں جو شاید کسی دن ہمارے لیے حقیقت کو فکشن سے الگ کرنا مشکل بنا دیں۔
یہ جعلی تصاویر فوٹوشاپ جیسے سافٹ ویئر کی تدوین یا ماضی کی چالاکی سے ہیرا پھیری کی گئی فلموں سے پیدا ہونے والی سادہ تصویری ہیرا پھیری سے مختلف ہیں۔
ڈیپ فیکس "مصنوعی میڈیا" کی سب سے مشہور مثال ہیں—تصاویر، آوازیں، اور ویڈیوز جو بظاہر روایتی طریقوں سے تیار کی گئی ہیں لیکن واقعی جدید ترین سافٹ ویئر کا استعمال کرتے ہوئے بنائی گئی ہیں۔
ڈیپ فیکس کچھ عرصے سے موجود ہیں، اور جب کہ ان کی سب سے مقبول ایپلی کیشن اب تک فحش فلموں میں اداکاروں کے جسموں پر مشہور لوگوں کے سر ڈالنا ہے، وہ کہیں بھی، کسی بھی شخص کے کچھ بھی کرنے کی قائل کرنے والی فوٹیج تیار کرنے کی صلاحیت رکھتے ہیں۔
اس پوسٹ میں، ہم ڈیپ فیکس کو دیکھیں گے، یہ کیسے کام کرتا ہے، آپ انہیں خود کیسے بنا سکتے ہیں، اور بہت کچھ۔
تو، ڈیپ فیک کیا ہے؟
ڈیپ فیک - ڈیپ لرننگ اور فیک کے فقرے کا ایک ٹکڑا ہے مصنوعی میڈیا جس میں پہلے سے موجود تصویر یا ویڈیو میں کسی دوسرے شخص کی مشابہت کو تبدیل کرنے کے لیے استعمال کیا جاتا ہے۔
ڈیپ فیکس بصری اور آڈیو معلومات کو تبدیل کرنے اور تخلیق کرنے کے لیے جدید ترین مشین لرننگ اور مصنوعی ذہانت کی تکنیکوں کا استعمال کرتے ہیں جس میں دھوکہ دہی کی بہت زیادہ صلاحیت ہوتی ہے۔
ڈیپ فیک پروڈکشن (GAN) کے لیے گہری سیکھنے کے طریقے جیسے آٹو اینکوڈرز اور جنریٹیو ایڈورسریل نیٹ ورکس بنیادی طریقہ کار ہیں۔
یہ ماڈل کسی شخص کے چہرے کے جذبات اور حرکات کا تجزیہ کرنے اور موازنہ کے تاثرات اور حرکات کی نمائش کرنے والے دوسرے لوگوں کے چہرے کی تصویروں کی ترکیب کے لیے استعمال کیے جاتے ہیں۔
مشہور شخصیات کی فحش ویڈیوز، جعلی خبروں، دھوکہ دہی اور مالی فراڈ میں ڈیپ فیکس کے استعمال نے کافی توجہ مبذول کرائی ہے۔ صنعت اور حکومت دونوں نے انہیں تلاش کرنے اور ان کے استعمال کو محدود کرنے کی کوشش کرتے ہوئے جواب دیا ہے۔
پہلا آرڈر موشن ماڈل
جب ماضی میں گہری جعلی تیار کرنے کی کوشش کی گئی تھی، تو مسئلہ یہ تھا کہ ان طریقوں کو کام کرنے کے لیے ہمیں کسی قسم کے اضافی علم، یا پہلے کی ضرورت ہے۔
مثال کے طور پر، اگر ہم سر کی حرکت کو ٹریس کرنا چاہتے ہیں تو چہرے کے نشانات کی ضرورت ہوتی ہے۔ اگر ہم پورے جسم کی حرکت کا نقشہ بنانا چاہتے ہیں تو پوز کا تخمینہ ضروری تھا۔
یہ پچھلے سال نیور آئی پی ایس کانفرنس میں تبدیل ہوا جب ٹورنٹو یونیورسٹی کی تحقیقی ٹیم نے اپنا کام پیش کیا، "تصویری حرکت پذیری کے لیے پہلا آرڈر موشن ماڈل".
اس نقطہ نظر کے لئے حرکت پذیری کے مزید علم کی ضرورت نہیں ہے۔ اس کے علاوہ، اس ماڈل کی تربیت کے بعد، اسے ٹرانسفر لرننگ کے لیے استعمال کیا جا سکتا ہے اور اسی زمرے میں آنے والی کسی بھی چیز پر لاگو کیا جا سکتا ہے۔
آئیے اس طریقہ کار کے عمل کو تھوڑا آگے دیکھتے ہیں۔ موشن ایکسٹریکشن اور جنریشن پورے عمل کا پہلا نصف حصہ بناتے ہیں۔ ڈرائیونگ ویڈیو اور سورس پکچرز کو ان پٹ کے طور پر استعمال کیا جاتا ہے۔
فرسٹ آرڈر موشن کی نمائندگی کو نکالنے کے لیے، جو کہ ویرل کلیدی پوائنٹس اور لوکل ایفائن ٹرانسفارمیشنز پر مشتمل ہوتا ہے، ایک موشن ایکسٹریکٹر کلیدی پوائنٹس کی شناخت کے لیے آٹو اینکوڈر کا استعمال کرتا ہے۔
گھنے موشن نیٹ ورک کے ساتھ ایک گھنے آپٹیکل فلو اور اوکلوژن میپ بنانے کے لیے، ان کو ڈرائیونگ ویڈیو کے ساتھ استعمال کیا جاتا ہے۔ پھر جنریٹر گھنے موشن نیٹ ورک اور سورس امیج کے آؤٹ پٹس کا استعمال کرتے ہوئے ہدف کی تصویر پیش کرتا ہے۔
پورے بورڈ میں، یہ کام اسٹیٹ آف دی آرٹ سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔ اس میں ایسی خصوصیات بھی ہیں جو دوسرے ماڈلز میں نہیں ہیں۔ یہ تصویر کی کئی اقسام پر کام کرتا ہے، لہذا آپ اسے چہرے، جسم، کارٹونز وغیرہ کی تصاویر پر لاگو کر سکتے ہیں، جو کہ بہت عمدہ ہے۔
اس سے بہت سے نئے مواقع پیدا ہوتے ہیں۔ ہماری حکمت عملی کا ایک اور اہم پہلو یہ ہے کہ یہ اب آپ کو ٹارگٹ آبجیکٹ کی صرف ایک تصویر کا استعمال کرتے ہوئے اعلیٰ معیار کے ڈیپ فیکس بنانے کی اجازت دیتا ہے، جیسا کہ ہم اس کے ساتھ کرتے ہیں۔ اعتراض کے لیے YOLO تسلیم.
ڈیپ فیک ماڈل بنانے کا عمل
ڈیپ فیک جنریشن کے لیے تین عمل ضروری ہیں: نکالنا، تربیت اور تخلیق۔ ان مراحل میں سے ہر ایک کے اہم نکات اور ان کا مجموعی عمل سے کیا تعلق ہے اس سیکشن میں احاطہ کیا جائے گا۔
نکالنے
ڈیپ فیکس چہروں کو تبدیل کرنے کے لیے گہرے اعصابی نیٹ ورکس کا استعمال کرتے ہیں اور درست طریقے سے اور یقین سے کام کرنے کے لیے بہت زیادہ ڈیٹا (تصاویر) کی ضرورت ہوتی ہے۔ نکالنے کا عمل وہ مرحلہ ہے جس میں ویڈیو کلپس سے تمام فریم نکالے جاتے ہیں، چہروں کو پہچان لیا جاتا ہے، اور پھر چہروں کو زیادہ سے زیادہ کارکردگی کے لیے سیدھ میں کیا جاتا ہے۔
ٹریننگ
تربیتی مرحلے میں، عصبی نیٹ ورک ایک چہرہ دوسرے میں بدل سکتا ہے۔ پریکٹس سیٹ اور ٹریننگ گیجٹ کے سائز پر منحصر ہے، ٹریننگ میں کئی گھنٹے یا دن بھی لگ سکتے ہیں۔
ٹریننگ کو صرف ایک بار ختم کرنا ہوتا ہے، بالکل اسی طرح جیسے کہ دیگر نیورل نیٹ ورک ٹریننگ۔ تربیت کے بعد، ماڈل ایک شخص A سے شخص B میں چہرہ تبدیل کرنے کے قابل ہو جائے گا۔
تخلیق
ماڈل کی تربیت کے بعد، ایک ڈیپ فیک تیار کیا جا سکتا ہے۔ فریم ایک ویڈیو سے لیے جاتے ہیں اور پھر تمام چہروں کے ساتھ منسلک ہوتے ہیں۔ تربیت یافتہ نیورل نیٹ ورک پھر ہر فریم کو تبدیل کرنے کے لیے استعمال ہوتا ہے۔
تبدیل شدہ چہرے کو آخری مرحلے کے طور پر اصل فریم کے ساتھ ضم کرنا ضروری ہے۔
ڈیپ فیک ڈیٹیکشن ماڈل بنانا
GitHub Repo کو بڑھانا اور کلون کرنا
Colab میں کام کرتے ہوئے مفت میں Google کے GPUs کا استعمال کرنے کے قابل ہونا اس کے لیے فائدہ مند ہے۔ گہری سیکھنے. ایک اضافی فائدہ کلاؤڈ ورچوئل مشین (VM) پر گوگل ڈرائیو کو نصب کرنے کی صلاحیت ہے۔
اس کی تمام چیزوں تک آسان رسائی کے ساتھ، صارف فعال ہے۔ کلاؤڈ میں گوگل ڈرائیو کو ورچوئل مشین پر ماؤنٹ کرنے کے لیے درکار پروگرام اس سیکشن میں مل جائے گا۔
ماڈیولز درآمد کرنا
اب، ہم تمام ضروری ماڈیولز درآمد کریں گے۔
ماڈل پر عمل درآمد
ہم ایک مثال استعمال کریں گے جس میں پوتن کی تصویر (ذریعہ تصویر) کو اوباما کی ویڈیو کے ساتھ ملایا گیا ہے۔ نتیجہ پیوٹن کی بات کرنے اور اشارہ کرنے کی ویڈیو ہے بالکل وہی چہرے کے تاثرات کے ساتھ جو اوباما نے ڈرائیونگ کے دوران استعمال کیا تھا۔
ماڈل کا نتیجہ ظاہر کرنے سے پہلے، میڈیا کو لوڈ کیا جائے گا اور افعال کا اعلان کیا جائے گا۔ اس کے بعد چیک پوائنٹس کو لوڈ کیا جائے گا اور ماڈل بنایا جائے گا۔ ڈیپ فیک بنانے کے بعد، اینیمیشن کے دو مختلف انداز دکھائے جائیں گے۔
پوتن اوبامہ کی نقل و حرکت سے متحرک ہے جس میں رشتہ دار کلی پوائنٹ کی نقل مکانی کا استعمال کیا جاتا ہے۔ اوباما کے چہرے کے جذبات اور باڈی لینگویج کو جس طرح سے ان کی ویڈیوز کے دوران پوتن کے لیے خوبصورتی اور واضح طور پر دکھایا گیا ہے وہ حیران کن ہے۔
کچھ خوردبینی غلطیاں ہیں، خاص طور پر جب اوباما اپنی بھنویں اٹھاتے ہیں اور آنکھیں جھپکتے ہیں۔ یہ تاثرات پوٹن کے فریموں میں بالکل نقل نہیں کیے گئے ہیں۔
ڈیپ فیک بیک ڈراپ کے بغیر، پیوٹن کی فلم کافی معتبر اور مستند دکھائی دے گی اگر اسے ٹی وی پر دیکھا جائے یا سوشل میڈیا.
ماڈل کی تخلیق
اب، ہم ایک مکمل ماڈل بنانے کے لیے پہلے سے تربیت یافتہ چوکیوں کا استعمال کریں گے۔
ڈیپ فیک کا پتہ لگانا
متعلقہ کلی پوائنٹ کی نقل مکانی ذیل میں سیل میں آئٹمز کو متحرک کرنے کے لیے استعمال کی جاتی ہے۔ اگلا سیل اس کے بجائے مطلق نقاط کا استعمال کرتا ہے، لیکن تمام اشیاء کے تناسب کو اس انداز میں ڈرائیونگ ویڈیو سے لیا جائے گا۔
مطلق نقاط کا استعمال کرتے ہوئے آؤٹ پٹ کو بڑھانا
آپ اس طریقے سے ڈیپ فیک کا پتہ لگانے کے قابل ہو جائیں گے۔
ڈیپ فیک ٹیکنالوجی کے خطرات کیا ہیں؟
ڈیپ فیک ویڈیوز اب اپنے نئے پن کی وجہ سے دیکھنے کے لیے دلکش اور دل لگی ہیں۔ تاہم، ایک خطرہ ہے جو اس بظاہر مضحکہ خیز ٹیکنالوجی کی سطح کے نیچے پڑے قابو سے باہر ہو سکتا ہے۔
جعلی اور اصلی ویڈیوز کے درمیان فرق کرنا یقیناً مشکل ہوگا۔ ڈیف ٹیک ٹیکنالوجی آگے بڑھنا جاری ہے. ممتاز شخصیات اور مشہور شخصیات کے لیے، خاص طور پر، اس کے شدید اثرات ہو سکتے ہیں۔ ڈیپ فیکس جو جان بوجھ کر بدسلوکی کرتے ہیں ان میں کیریئر اور زندگیوں کو مکمل طور پر نقصان پہنچانے کی صلاحیت ہوتی ہے۔
ہو سکتا ہے کہ ان کا استعمال بد نیتی کے ساتھ کوئی شخص دوسروں تک پہنچانے اور اپنے دوستوں، رشتہ داروں اور ساتھی کارکنوں سے فائدہ اٹھانے کے لیے کرے۔ وہ غیر ملکی رہنماؤں کی جعلی فلموں کا استعمال کرتے ہوئے دنیا بھر میں تنازعات اور یہاں تک کہ جنگیں بھڑکانے کی بھی صلاحیت رکھتے ہیں۔
نتیجہ
خلاصہ یہ کہ ہم ایک عجیب دور اور غیر معمولی ماحول میں ہیں۔ جھوٹی خبریں اور فلمیں بنانا اور انہیں پھیلانا پہلے سے کہیں زیادہ آسان ہے۔ کیا سچ ہے اور کیا نہیں یہ سمجھنا مشکل ہوتا جا رہا ہے۔
آج، یہ ظاہر ہوتا ہے، ہم مزید اپنے حواس پر بھروسہ نہیں کر سکتے۔
اس حقیقت کے باوجود کہ جھوٹے ویڈیو ڈٹیکٹر تیار کیے گئے ہیں، یہ صرف وقت کی بات ہے اس سے پہلے کہ معلومات کا فرق اتنا تنگ ہو جائے کہ بہترین جعلی ڈیٹیکٹر بھی اس بات کا تعین کرنے سے قاصر ہوں گے کہ ویڈیو اصلی ہے یا نہیں۔
جواب دیجئے