अनुक्रमणिका[लपवा][दाखवा]
अहो, तुम्हाला माहीत आहे का, की NVIDIA च्या इन्स्टंट NeRF न्यूरल रेंडरिंग मॉडेलसह 3D डेटा इनपुटमधून 2D दृश्य काही सेकंदात तयार केले जाऊ शकते आणि त्या दृश्याची छायाचित्रे मिलिसेकंदांमध्ये रेंडर केली जाऊ शकतात?
इन्व्हर्स रेंडरिंग म्हणून ओळखले जाणारे तंत्र वापरून स्थिर छायाचित्रांचा संग्रह डिजिटल 3D वातावरणात त्वरीत रूपांतरित करणे शक्य आहे, जे AI ला वास्तविक जगात प्रकाश कसे कार्य करते याची नक्कल करण्यास सक्षम करते.
हे अशा प्रकारचे पहिले मॉडेल आहे जे अल्ट्रा-फास्ट न्यूरल नेटवर्क प्रशिक्षण आणि द्रुत रेंडरिंग एकत्र करू शकते, NVIDIA च्या संशोधन कार्यसंघाने तयार केलेल्या तंत्रामुळे धन्यवाद जे ऑपरेशन आश्चर्यकारकपणे द्रुतपणे पूर्ण करते - जवळजवळ तात्काळ.
हा लेख NVIDIA च्या NeRF ची गती, वापर प्रकरणे आणि इतर घटकांसह सखोल परीक्षण करेल.
तर, काय आहे NeRF?
NeRF म्हणजे न्यूरल रेडिएन्स फील्ड, जे कमी संख्येने इनपुट दृश्यांचा वापर करून अंतर्निहित सतत व्हॉल्यूमेट्रिक सीन फंक्शन परिष्कृत करून क्लिष्ट दृश्यांचे अद्वितीय दृश्य तयार करण्याच्या तंत्राचा संदर्भ देते.
इनपुट म्हणून 2D फोटोंचा संग्रह दिल्यावर, NVIDIA चे NeRF वापरतात न्यूरल नेटवर्क 3D दृश्यांचे प्रतिनिधित्व करण्यासाठी आणि व्युत्पन्न करण्यासाठी.
साठी परिसराच्या विविध कोनातून थोड्या संख्येने फोटो आवश्यक आहेत मज्जासंस्थेसंबंधीचा नेटवर्क, प्रत्येक फ्रेममधील कॅमेराच्या स्थानासह.
ही चित्रे जितक्या लवकर घेतली जातील तितके चांगले, विशेषत: हलणारे कलाकार किंवा वस्तू असलेल्या दृश्यांमध्ये.
3D पिक्चर कॅप्चरिंग प्रक्रियेदरम्यान जास्त हालचाल झाल्यास AI-व्युत्पन्न 2D सीन धुळीला मिळेल.
3D वातावरणातील कोणत्याही ठिकाणाहून प्रत्येक दिशेने निघणाऱ्या प्रकाशाच्या रंगाचा अंदाज घेऊन, संपूर्ण प्रतिमा तयार करण्यासाठी NeRF या डेटाद्वारे सोडलेली पोकळी प्रभावीपणे भरते.
योग्य इनपुट मिळाल्यानंतर NeRF काही मिलिसेकंदांमध्ये 3D दृश्य निर्माण करू शकत असल्याने, हा आजपर्यंतचा सर्वात जलद NeRF दृष्टिकोन आहे.
NeRF इतक्या लवकर कार्य करते की ते अक्षरशः तात्काळ होते, म्हणून त्याचे नाव. जर मानक 3D प्रस्तुतीकरणे जसे की बहुभुज जाळी वेक्टर चित्रे असतील, तर NeRF बिटमॅप प्रतिमा आहेत: ते एखाद्या वस्तूतून किंवा दृश्याच्या आतील प्रकाशाचा मार्ग घनतेने कॅप्चर करतात.
झटपट NeRF 3D साठी आवश्यक आहे कारण डिजिटल कॅमेरे आणि JPEG कॉम्प्रेशन 2D फोटोग्राफीसाठी आहे, 3D कॅप्चर आणि शेअरिंगची गती, सुविधा आणि पोहोच नाटकीयरित्या वाढवते.
झटपट NeRF चा वापर व्हर्च्युअल जगासाठी अवतार किंवा संपूर्ण दृश्ये तयार करण्यासाठी केला जाऊ शकतो.
पोलरॉइड फोटोंच्या सुरुवातीच्या दिवसांना आदरांजली वाहण्यासाठी, NVIDIA संशोधन कार्यसंघाने अँडी वॉरहोलचा झटपट फोटो घेणारा प्रसिद्ध शॉट पुन्हा तयार केला आणि इन्स्टंट NeRF वापरून 3D दृश्यात रूपांतरित केले.
ते खरोखर 1,000 पट वेगवान आहे का?
3D देखावा त्याच्या गुंतागुंतीच्या आणि गुणवत्तेवर अवलंबून, NeRF पूर्वी तयार होण्यासाठी काही तास लागू शकतात.
AI ने प्रक्रियेला मोठ्या प्रमाणात गती दिली, परंतु तरीही योग्यरित्या प्रशिक्षित होण्यासाठी काही तास लागू शकतात. मल्टी-रिझोल्यूशन हॅश एन्कोडिंग नावाच्या पद्धतीचा वापर करून, NVIDIA द्वारे अग्रगण्य, Instant NeRF 1,000 च्या घटकाने रेंडर वेळा कमी करते.
मॉडेल तयार करण्यासाठी Tiny CUDA Neural Networks पॅकेज आणि NVIDIA CUDA टूलकिट वापरण्यात आले. NVIDIA च्या मते, हे हलके न्यूरल नेटवर्क असल्यामुळे, ते प्रशिक्षित केले जाऊ शकते आणि एका NVIDIA GPU वर वापरले जाऊ शकते, NVIDIA टेन्सर कोअर कार्ड जलद गतीने कार्य करतात.
केस वापरा
सेल्फ-ड्रायव्हिंग ऑटोमोबाईल्स हे या तंत्रज्ञानाच्या सर्वात लक्षणीय अनुप्रयोगांपैकी एक आहेत. ही वाहने मोठ्या प्रमाणावर जाताना त्यांच्या सभोवतालची कल्पना करून चालतात.
तथापि, आजच्या तंत्रज्ञानाची समस्या अशी आहे की ती अनाड़ी आहे आणि थोडा जास्त वेळ लागतो.
तथापि, Instant NeRF वापरून, वास्तविक-जगातील वस्तूंचा आकार आणि आकार अंदाजे/समजण्यासाठी स्वयं-ड्रायव्हिंग कारसाठी आवश्यक असलेले सर्व म्हणजे स्थिर छायाचित्रे कॅप्चर करणे, त्यांना 3D मध्ये बदलणे आणि नंतर ती माहिती वापरणे.
मेटाव्हर्स किंवा मध्ये अजून एक वापर असू शकतो व्हिडिओ गेम उत्पादन उद्योग.
कारण Instant NeRF तुम्हाला अवतार किंवा अगदी संपूर्ण आभासी जग त्वरीत तयार करण्यास अनुमती देते, हे खरे आहे.
जवळजवळ थोडे 3 डी वर्ण मॉडेलिंग आवश्यक असेल कारण तुम्हाला फक्त न्यूरल नेटवर्क चालवायचे आहे आणि ते तुमच्यासाठी एक वर्ण तयार करेल.
याव्यतिरिक्त, NVIDIA अजूनही अतिरिक्त मशीन लर्निंग-संबंधित अनुप्रयोगांसाठी हे तंत्रज्ञान लागू करण्याचा शोध घेत आहे.
उदाहरणार्थ, पूर्वीपेक्षा अधिक अचूकपणे भाषा अनुवादित करण्यासाठी आणि सामान्य हेतू वाढविण्यासाठी याचा वापर केला जाऊ शकतो खोल शिकणे अल्गोरिदम आता कार्यांच्या विस्तृत श्रेणीसाठी वापरात आहेत.
निष्कर्ष
अनेक ग्राफिक्स समस्या समस्येच्या गुळगुळीतपणा किंवा विरळपणाचा वापर करण्यासाठी कार्य-विशिष्ट डेटा संरचनांवर अवलंबून असतात.
NVIDIA च्या मल्टी-रिझोल्यूशन हॅश एन्कोडिंगद्वारे ऑफर केलेला व्यावहारिक शिक्षण-आधारित पर्याय वर्कलोडची पर्वा न करता आपोआप योग्य तपशीलांवर लक्ष केंद्रित करतो.
गोष्टी आत कशा चालतात याबद्दल अधिक जाणून घेण्यासाठी, अधिकारी पहा GitHub भांडार.
प्रत्युत्तर द्या