विषय - सूची[छिपाना][प्रदर्शन]
अरे, क्या आप जानते हैं कि NVIDIA के इंस्टेंट एनईआरएफ न्यूरल रेंडरिंग मॉडल के साथ सेकंड में 3D डेटा इनपुट से एक 2D दृश्य बनाया जा सकता है, और उस दृश्य की तस्वीरों को मिलीसेकंड में प्रस्तुत किया जा सकता है?
इनवर्स रेंडरिंग नामक तकनीक का उपयोग करके स्थिर तस्वीरों के संग्रह को डिजिटल 3D वातावरण में त्वरित रूप से परिवर्तित करना संभव है, जो AI को वास्तविक दुनिया में प्रकाश के काम करने की नकल करने में सक्षम बनाता है।
यह अपनी तरह का पहला मॉडल है जो अल्ट्रा-फास्ट न्यूरल नेटवर्क प्रशिक्षण और त्वरित प्रतिपादन को जोड़ सकता है, एक तकनीक के लिए धन्यवाद जो एनवीआईडीआईए की शोध टीम ने तैयार की है जो ऑपरेशन को अविश्वसनीय रूप से तेज़ी से पूरा करती है - लगभग तुरंत।
यह लेख एनवीआईडीआईए के एनईआरएफ की गहराई से जांच करेगा, जिसमें इसकी गति, उपयोग के मामले और अन्य कारक शामिल हैं।
तो क्या है एनईआरएफ?
एनईआरएफ का मतलब न्यूरल रेडियंस फील्ड है, जो कम संख्या में इनपुट व्यू का उपयोग करके एक अंतर्निहित निरंतर वॉल्यूमेट्रिक दृश्य फ़ंक्शन को परिष्कृत करके जटिल दृश्यों के अद्वितीय दृश्य बनाने की तकनीक को संदर्भित करता है।
जब इनपुट के रूप में 2डी तस्वीरों का संग्रह दिया जाता है, तो एनवीआईडीआईए के एनईआरएफ काम करते हैं तंत्रिका जाल 3D दृश्यों का प्रतिनिधित्व करने और उत्पन्न करने के लिए।
क्षेत्र के चारों ओर विभिन्न कोणों से कम संख्या में फ़ोटो की आवश्यकता होती है तंत्रिका नेटवर्क, प्रत्येक फ्रेम में कैमरे के स्थान के साथ।
जितनी जल्दी ये तस्वीरें ली जाती हैं, उतना ही बेहतर होता है, खासकर चलती अभिनेताओं या वस्तुओं के दृश्यों में।
3डी पिक्चर कैप्चरिंग प्रक्रिया के दौरान बहुत अधिक गति होने पर एआई-जनरेटेड 2डी सीन खराब हो जाएगा।
3डी वातावरण में किसी भी स्थान से हर दिशा में निकलने वाले प्रकाश के रंग की भविष्यवाणी करके, एनईआरएफ पूरी छवि के निर्माण के लिए इस डेटा द्वारा छोड़े गए अंतराल को प्रभावी ढंग से भर देता है।
चूंकि एनईआरएफ उचित इनपुट प्राप्त करने के बाद कुछ मिलीसेकंड में एक 3डी दृश्य उत्पन्न कर सकता है, यह अब तक का सबसे तेज एनईआरएफ दृष्टिकोण है।
एनईआरएफ इतनी जल्दी काम करता है कि यह वस्तुतः तात्कालिक है, इसलिए इसका नाम है। यदि पॉलीगोनल मेश जैसे मानक 3D निरूपण वेक्टर चित्र हैं, तो NeRF बिटमैप छवियां हैं: वे किसी वस्तु से या किसी दृश्य के अंदर प्रकाश के निकलने के तरीके को सघनता से पकड़ते हैं।
तत्काल एनईआरएफ 3D के लिए आवश्यक है क्योंकि डिजिटल कैमरा और JPEG संपीड़न 2D फोटोग्राफी के लिए है, नाटकीय रूप से 3D कैप्चर और साझा करने की गति, सुविधा और पहुंच को बढ़ाता है।
तत्काल एनईआरएफ का उपयोग आभासी दुनिया के लिए अवतार या संपूर्ण दृश्य बनाने के लिए किया जा सकता है।
पोलेरॉइड तस्वीरों के शुरुआती दिनों को श्रद्धांजलि देने के लिए, एनवीआईडीआईए रिसर्च टीम ने एंडी वारहोल के एक प्रसिद्ध शॉट को एक इंस्टेंट फोटो लेते हुए फिर से बनाया और इसे इंस्टेंट एनईआरएफ का उपयोग करके एक 3 डी दृश्य में बदल दिया।
क्या यह वास्तव में 1,000 गुना तेज है?
एनईआरएफ से पहले एक 3डी दृश्य बनाने में घंटों लग सकते हैं, जो इसकी जटिलता और गुणवत्ता पर निर्भर करता है।
एआई ने इस प्रक्रिया को बहुत तेज कर दिया, लेकिन इसे ठीक से प्रशिक्षित होने में अभी भी घंटों लग सकते हैं। NVIDIA द्वारा अग्रणी बहु-रिज़ॉल्यूशन हैश एन्कोडिंग नामक एक विधि का उपयोग करते हुए, इंस्टेंट एनईआरएफ 1,000 के कारक द्वारा रेंडर समय को कम करता है।
मॉडल बनाने के लिए छोटे CUDA तंत्रिका नेटवर्क पैकेज और NVIDIA CUDA टूलकिट का उपयोग किया गया था। NVIDIA के अनुसार, क्योंकि यह एक हल्का तंत्रिका नेटवर्क है, इसे प्रशिक्षित किया जा सकता है और इसे एक NVIDIA GPU पर इस्तेमाल किया जा सकता है, जिसमें NVIDIA Tensor Core कार्ड सबसे तेज गति से काम करते हैं।
उदाहरण
सेल्फ-ड्राइविंग ऑटोमोबाइल इस तकनीक के सबसे महत्वपूर्ण अनुप्रयोगों में से एक हैं। ये वाहन चलते-चलते अपने परिवेश की कल्पना करके बड़े पैमाने पर काम करते हैं।
हालाँकि, आज की तकनीक के साथ समस्या यह है कि यह अनाड़ी है और इसमें थोड़ा अधिक समय लगता है।
हालांकि, इंस्टेंट एनईआरएफ का उपयोग करते हुए, एक सेल्फ-ड्राइविंग कार के लिए वास्तविक दुनिया की वस्तुओं के आकार और आकार का अनुमान लगाने/समझने के लिए जो कुछ भी आवश्यक है, वह है स्थिर तस्वीरों को कैप्चर करना, उन्हें 3 डी में बदलना और फिर उस जानकारी का उपयोग करना।
मेटावर्स में अभी भी एक और उपयोग हो सकता है या वीडियो खेल उत्पादन उद्योग।
क्योंकि इंस्टेंट एनईआरएफ आपको जल्दी से अवतार या पूरी आभासी दुनिया बनाने की अनुमति देता है, यह सच है।
लगभग थोड़ा 3 डी चरित्र मॉडलिंग की आवश्यकता होगी क्योंकि आपको केवल तंत्रिका नेटवर्क चलाने की आवश्यकता होगी, और यह आपके लिए एक चरित्र उत्पन्न करेगा।
इसके अलावा, NVIDIA अभी भी अतिरिक्त मशीन लर्निंग-संबंधित अनुप्रयोगों के लिए इस तकनीक को लागू करने की खोज कर रहा है।
उदाहरण के लिए, इसका उपयोग पहले की तुलना में भाषाओं का अधिक सटीक अनुवाद करने और सामान्य-उद्देश्य को बढ़ाने के लिए किया जा सकता है ध्यान लगा के पढ़ना या सीखना एल्गोरिदम अब कार्यों की एक विस्तृत श्रृंखला के लिए उपयोग में हैं।
निष्कर्ष
कई ग्राफ़िक्स समस्याएँ समस्या की सुगमता या विरलता का उपयोग करने के लिए कार्य-विशिष्ट डेटा संरचनाओं पर निर्भर करती हैं।
NVIDIA के बहु-रिज़ॉल्यूशन हैश एन्कोडिंग द्वारा पेश किया गया व्यावहारिक शिक्षण-आधारित विकल्प स्वचालित रूप से कार्यभार की परवाह किए बिना प्रासंगिक विवरण पर केंद्रित होता है।
अंदर चीजें कैसे काम करती हैं, इसके बारे में अधिक जानने के लिए, अधिकारी देखें GitHub भंडार।
एक जवाब लिखें