کی میز کے مندرجات[چھپائیں][دکھائیں]
ارے، کیا آپ جانتے ہیں کہ NVIDIA کے انسٹنٹ NeRF نیورل رینڈرنگ ماڈل کے ساتھ سیکنڈوں میں 3D ڈیٹا ان پٹ سے ایک 2D سین بنایا جا سکتا ہے، اور اس منظر کی تصویریں ملی سیکنڈز میں پیش کی جا سکتی ہیں؟
الٹا رینڈرنگ کے نام سے جانی جانے والی تکنیک کا استعمال کرتے ہوئے اسٹیل فوٹوز کے مجموعے کو تیزی سے ڈیجیٹل 3D ماحول میں تبدیل کرنا ممکن ہے، جو کہ AI کی نقل کرنے کے قابل بناتا ہے کہ حقیقی دنیا میں روشنی کیسے کام کرتی ہے۔
یہ اپنی نوعیت کے پہلے ماڈلز میں سے ایک ہے جو انتہائی تیز نیورل نیٹ ورک ٹریننگ اور فوری رینڈرنگ کو یکجا کر سکتا ہے، ایک ایسی تکنیک کی بدولت جسے NVIDIA کی تحقیقی ٹیم نے وضع کیا جو آپریشن کو ناقابل یقین حد تک تیزی سے مکمل کرتا ہے – تقریباً فوری طور پر۔
یہ مضمون NVIDIA کے NeRF کا گہرائی سے جائزہ لے گا، بشمول اس کی رفتار، استعمال کے معاملات اور دیگر عوامل۔
تو، کیا ہے این آر ایف?
NeRF کا مطلب عصبی تابکاری کے شعبوں کا ہے، جس سے مراد پیچیدہ مناظر کے انوکھے نظارے تخلیق کرنے کی ایک تکنیک ہے جس سے ان پٹ ویوز کی ایک چھوٹی سی تعداد کا استعمال کرتے ہوئے ایک بنیادی مسلسل والیومیٹرک سین فنکشن کو بہتر بنایا جاتا ہے۔
جب ان پٹ کے طور پر 2D تصاویر کا مجموعہ دیا جاتا ہے، تو NVIDIA کے NeRFs کام کرتے ہیں۔ نیند نیٹ ورک 3D مناظر کی نمائندگی اور تخلیق کرنے کے لیے۔
علاقے کے ارد گرد مختلف زاویوں سے تصاویر کی ایک چھوٹی سی تعداد کی ضرورت ہے عصبی نیٹ ورکہر فریم میں کیمرے کے مقام کے ساتھ۔
یہ تصویریں جتنی جلدی لی جائیں، اتنا ہی بہتر، خاص طور پر حرکت پذیر اداکاروں یا اشیاء کے ساتھ مناظر میں۔
اگر 3D تصویر لینے کے طریقہ کار کے دوران بہت زیادہ حرکت ہوتی ہے تو AI سے تیار کردہ 2D منظر کو دھندلا دیا جائے گا۔
3D ماحول میں کسی بھی مقام سے ہر سمت میں نکلنے والی روشنی کے رنگ کی پیشین گوئی کر کے، NeRF پوری تصویر کی تعمیر کے لیے اس ڈیٹا کے ذریعے چھوڑے گئے خلا کو مؤثر طریقے سے پُر کرتا ہے۔
چونکہ NeRF مناسب ان پٹ حاصل کرنے کے بعد چند ملی سیکنڈ میں ایک 3D منظر تیار کر سکتا ہے، یہ آج تک کا سب سے تیز ترین NeRF نقطہ نظر ہے۔
NeRF اتنی تیزی سے کام کرتا ہے کہ یہ عملی طور پر فوری ہے، اس لیے اس کا نام ہے۔ اگر معیاری 3D نمائندگی جیسے کثیرالاضلاع میشز ویکٹر تصویریں ہیں، تو NeRFs بٹ میپ امیجز ہیں: وہ کسی شے سے یا کسی منظر کے اندر سے روشنی کے نکلنے کے طریقے کو گھنے طور پر پکڑتی ہیں۔
فوری این آر ایف 3D کے لیے ضروری ہے کیونکہ ڈیجیٹل کیمرے اور JPEG کمپریشن 2D فوٹوگرافی کے لیے رہے ہیں، جس سے 3D کیپچر اور شیئرنگ کی رفتار، سہولت اور رسائی میں ڈرامائی طور پر اضافہ ہوتا ہے۔
Instant NeRF کو ورچوئل دنیا کے لیے اوتار یا یہاں تک کہ پورے مناظر تیار کرنے کے لیے استعمال کیا جا سکتا ہے۔
پولرائڈ فوٹوز کے ابتدائی دنوں کو خراج عقیدت پیش کرنے کے لیے، NVIDIA ریسرچ ٹیم نے فوری تصویر لینے والے اینڈی وارہول کا ایک مشہور شاٹ دوبارہ بنایا اور فوری NeRF کا استعمال کرتے ہوئے اسے 3D منظر میں تبدیل کر دیا۔
کیا یہ واقعی 1,000 گنا تیز ہے؟
ایک 3D منظر کو NeRF سے پہلے بنانے میں گھنٹے لگ سکتے ہیں، اس کی پیچیدگی اور معیار پر منحصر ہے۔
AI نے اس عمل کو بہت تیز کر دیا، لیکن ابھی بھی مناسب طریقے سے تربیت میں گھنٹے لگ سکتے ہیں۔ ملٹی ریزولوشن ہیش انکوڈنگ نامی طریقہ کا استعمال کرتے ہوئے، NVIDIA کے ذریعے پیش کیا گیا، Instant NeRF رینڈر کے اوقات کو 1,000 کے عنصر سے کم کرتا ہے۔
ٹنی CUDA نیورل نیٹ ورکس پیکیج اور NVIDIA CUDA ٹول کٹ کو ماڈل بنانے کے لیے استعمال کیا گیا تھا۔ NVIDIA کے مطابق، کیونکہ یہ ایک ہلکا پھلکا نیورل نیٹ ورک ہے، اس لیے اسے ایک ہی NVIDIA GPU پر تربیت اور استعمال کیا جا سکتا ہے، جس میں NVIDIA Tensor Core کارڈز تیز رفتاری سے کام کرتے ہیں۔
کیس کا استعمال کریں
سیلف ڈرائیونگ آٹوموبائل اس ٹیکنالوجی کی سب سے اہم ایپلی کیشنز میں سے ایک ہیں۔ یہ گاڑیاں زیادہ تر اپنے اردگرد کا تصور کرتے ہوئے چلتی ہیں۔
تاہم، آج کی ٹیکنالوجی کے ساتھ مسئلہ یہ ہے کہ یہ اناڑی ہے اور اس میں بہت زیادہ وقت لگتا ہے۔
تاہم، Instant NeRF کا استعمال کرتے ہوئے، حقیقی دنیا کی اشیاء کی جسامت اور شکل کا اندازہ لگانے/سمجھنے کے لیے خود سے چلنے والی کار کے لیے جو کچھ درکار ہوتا ہے وہ ہے ساکن تصویریں کھینچنا، انہیں 3D میں تبدیل کرنا، اور پھر اس معلومات کو استعمال کرنا۔
میٹاورس یا میں اب بھی ایک اور استعمال ہوسکتا ہے۔ ویڈیو گیم پیداواری صنعتیں
چونکہ Instant NeRF آپ کو اوتار یا یہاں تک کہ پوری ورچوئل دنیا کو تیزی سے بنانے کی اجازت دیتا ہے، یہ سچ ہے۔
تقریباً کم 3D کردار ماڈلنگ کی ضرورت ہوگی کیونکہ آپ کو صرف نیورل نیٹ ورک کو چلانے کی ضرورت ہوگی، اور یہ آپ کے لیے ایک کردار تیار کرے گا۔
اس کے علاوہ، NVIDIA ابھی بھی مشین لرننگ سے متعلقہ اضافی ایپلی کیشنز کے لیے اس ٹیکنالوجی کو استعمال کرنے کی تلاش کر رہا ہے۔
مثال کے طور پر، اس کا استعمال پہلے سے زیادہ درست طریقے سے زبانوں کا ترجمہ کرنے اور عام مقصد کو بڑھانے کے لیے کیا جا سکتا ہے۔ گہری سیکھنے الگورتھم اب کاموں کی ایک وسیع رینج کے لیے استعمال میں ہیں۔
نتیجہ
گرافکس کے بہت سے مسائل مسئلے کی ہمواری یا کمیت کو استعمال کرنے کے لیے کام کے لیے مخصوص ڈیٹا ڈھانچے پر انحصار کرتے ہیں۔
NVIDIA کے ملٹی ریزولوشن ہیش انکوڈنگ کے ذریعہ پیش کردہ عملی سیکھنے پر مبنی متبادل کام کے بوجھ سے قطع نظر خود بخود متعلقہ تفصیلات پر توجہ مرکوز کرتا ہے۔
اس بارے میں مزید جاننے کے لیے کہ چیزیں اندر سے کیسے چلتی ہیں، اہلکار کو دیکھیں GitHub کے ذخیرہ.
جواب دیجئے