विषयसूची[लुकाउनुहोस्][देखाउनु]
हे, के तपाइँलाई थाहा छ, NVIDIA को तत्काल NeRF न्यूरल रेन्डरिङ मोडेलको साथ 3D डाटा इनपुटहरूबाट सेकेन्डमा 2D दृश्य सिर्जना गर्न सकिन्छ, र त्यो दृश्यका फोटोहरू मिलिसेकेन्डमा रेन्डर गर्न सकिन्छ?
इन्भर्स रेन्डरिङ भनेर चिनिने प्रविधिको प्रयोग गरेर स्थिर तस्बिरहरूको संग्रहलाई डिजिटल थ्रीडी वातावरणमा तुरुन्तै रूपान्तरण गर्न सम्भव छ, जसले AI लाई वास्तविक संसारमा प्रकाशले कसरी काम गर्छ भन्ने नक्कल गर्न सक्षम बनाउँछ।
यो अल्ट्रा-फास्ट न्यूरल नेटवर्क प्रशिक्षण र द्रुत रेन्डरिङ संयोजन गर्न सक्ने आफ्नो प्रकारको पहिलो मोडेल हो, NVIDIA को अनुसन्धान टोलीले निर्माण गरेको प्रविधिको लागि धन्यवाद जसले अपरेशनलाई अविश्वसनीय रूपमा चाँडै पूरा गर्दछ - लगभग तुरुन्तै।
यस लेखले NVIDIA को NRF को गहिराइमा जाँच गर्नेछ, यसको गति, प्रयोग केसहरू, र अन्य कारकहरू सहित।
त्यसो भए, के हो एनआरएफ?
NeRF भनेको न्यूरल रेडिएन्स फिल्डहरू हो, जसले सानो संख्यामा इनपुट दृश्यहरू प्रयोग गरेर अन्तर्निहित निरन्तर भोल्युमेट्रिक दृश्य प्रकार्यलाई परिष्कृत गरेर जटिल दृश्यहरूको अद्वितीय दृश्यहरू सिर्जना गर्ने प्रविधिलाई जनाउँछ।
जब इनपुटको रूपमा 2D तस्बिरहरूको सङ्कलन दिइन्छ, NVIDIA को NeRF हरू काम गर्छन् तंत्रिका सञ्जालहरू प्रतिनिधित्व गर्न र 3D दृश्यहरू उत्पन्न गर्न।
क्षेत्र वरिपरि विभिन्न कोणबाट फोटो को एक सानो संख्या को लागी आवश्यक छ तंत्रिका सञ्जाल, प्रत्येक फ्रेममा क्यामेराको स्थान सहित।
यी तस्बिरहरू जति चाँडो लिइन्छ, त्यति नै राम्रो, विशेष गरी चलिरहेको अभिनेता वा वस्तुहरू भएका दृश्यहरूमा।
3D तस्विर खिच्ने प्रक्रियामा धेरै गति भएमा एआई-उत्पन्न थ्रीडी दृश्य धमिलो हुनेछ।
थ्रीडी वातावरणमा कुनै पनि स्थानबाट हर दिशामा निस्कने प्रकाशको रङको भविष्यवाणी गरेर, एनआरएफले सम्पूर्ण छवि निर्माण गर्न यस डाटाले छोडेको खाली ठाउँलाई प्रभावकारी रूपमा भर्छ।
NERF ले उचित इनपुटहरू प्राप्त गरेपछि केही मिलिसेकेन्डमा 3D दृश्य उत्पन्न गर्न सक्ने हुनाले, यो अहिलेसम्मको सबैभन्दा छिटो NRF दृष्टिकोण हो।
NeRF यति चाँडो काम गर्दछ कि यो लगभग तात्कालिक छ, त्यसैले यसको नाम। यदि मानक 3D प्रतिनिधित्वहरू जस्तै बहुभुज जालहरू भेक्टर चित्रहरू हुन् भने, NeRF हरू बिटम्याप छविहरू हुन्: तिनीहरूले वस्तु वा दृश्य भित्रबाट प्रकाश निस्कने तरिकालाई सघन रूपमा खिच्छन्।
तत्काल NeRF 3D को लागी आवश्यक छ किनकि डिजिटल क्यामेरा र JPEG कम्प्रेसन 2D फोटोग्राफीमा भएको छ, नाटकीय रूपमा गति, सुविधा, र 3D क्याप्चर र साझेदारीको पहुँच बढाउँदै।
तत्काल NeRF अवतारहरू वा भर्चुअल संसारहरूको लागि सम्पूर्ण दृश्यहरू उत्पादन गर्न प्रयोग गर्न सकिन्छ।
पोलारोइड तस्बिरहरूको प्रारम्भिक दिनहरूलाई श्रद्धांजलि दिनको लागि, NVIDIA अनुसन्धान टोलीले एन्डी वारहोलको तत्काल फोटो खिचेको प्रसिद्ध शट पुन: सिर्जना गर्यो र तत्काल NeRF प्रयोग गरेर यसलाई 3D दृश्यमा रूपान्तरण गर्यो।
के यो साँच्चै 1,000 गुणा छिटो छ?
3D दृश्यले यसको जटिलता र गुणस्तरमा निर्भर गर्दै, NeRF अघि सिर्जना गर्न घण्टा लाग्न सक्छ।
AI ले प्रक्रियालाई धेरै गतिमा बढायो, तर यसले अझै पनि राम्रोसँग तालिम लिन घण्टा लाग्न सक्छ। NVIDIA द्वारा अग्रगामी, बहु-रिजोल्युसन ह्यास एन्कोडिङ भनिने विधि प्रयोग गरेर, Instant NeRF ले रेन्डर समयलाई 1,000 को कारकले घटाउँछ।
सानो CUDA न्यूरल नेटवर्क प्याकेज र NVIDIA CUDA टूलकिट मोडेल सिर्जना गर्न प्रयोग गरियो। NVIDIA का अनुसार, यो हल्का तौल न्यूरल नेटवर्क भएकोले, यसलाई प्रशिक्षित गर्न सकिन्छ र एकल NVIDIA GPU मा प्रयोग गर्न सकिन्छ, NVIDIA Tensor Core कार्डहरू छिटो गतिमा सञ्चालन हुन्छन्।
प्रकरण प्रयोग गर्नुहोस्
सेल्फ-ड्राइभिङ अटोमोबाइलहरू यस प्रविधिको सबैभन्दा महत्त्वपूर्ण अनुप्रयोगहरू मध्ये एक हो। यी सवारीसाधनहरू प्रायः आफ्नो वरपरको परिवेशको कल्पना गरेर चल्छन्।
यद्यपि, आजको प्रविधिको समस्या यो अनाड़ी छ र अलि धेरै समय लाग्छ।
यद्यपि, Instant NeRF प्रयोग गरेर, वास्तविक-विश्व वस्तुहरूको आकार र आकार अनुमानित/बुझ्नको लागि सेल्फ-ड्राइभिङ कारको लागि आवश्यक पर्ने सबै भनेको स्थिर तस्बिरहरू खिच्नु हो, तिनीहरूलाई 3D मा परिणत गर्नुहोस्, र त्यसपछि त्यो जानकारी प्रयोग गर्नुहोस्।
त्यहाँ अझै पनि metaverse वा मा अर्को प्रयोग हुन सक्छ भिडियो गेम उत्पादन उद्योगहरु।
किनभने Instant NeRF ले तपाईंलाई अवतारहरू वा सम्पूर्ण भर्चुअल संसारहरू तुरुन्तै निर्माण गर्न अनुमति दिन्छ, यो सत्य हो।
लगभग थोरै थ्रीडी चरित्र मोडलिङ आवश्यक पर्नेछ किनभने तपाईले गर्नु पर्ने भनेको न्यूरल नेटवर्क चलाउनु हो, र यसले तपाईको लागि क्यारेक्टर उत्पन्न गर्नेछ।
थप रूपमा, NVIDIA अझै पनि थप मेसिन लर्निंग-सम्बन्धित अनुप्रयोगहरूको लागि यो प्रविधि लागू गर्ने अन्वेषण गरिरहेको छ।
उदाहरणका लागि, यो पहिलेको भन्दा बढी सही भाषाहरू अनुवाद गर्न र सामान्य-उद्देश्य बढाउन प्रयोग गर्न सकिन्छ। गहिरो शिक्षा एल्गोरिदमहरू अब कार्यहरूको फराकिलो दायराको लागि प्रयोगमा छन्।
निष्कर्ष
धेरै ग्राफिक्स मुद्दाहरू समस्याको सहजता वा स्पेर्सिटीको प्रयोग गर्न कार्य-विशिष्ट डेटा संरचनाहरूमा निर्भर हुन्छन्।
NVIDIA को बहु-रिजोल्युसन ह्यास एन्कोडिङद्वारा प्रस्ताव गरिएको व्यावहारिक सिकाइ-आधारित विकल्पले कार्यभारको पर्वाह नगरी, स्वचालित रूपमा प्रासंगिक विवरणहरूमा केन्द्रित हुन्छ।
चीजहरू भित्र कसरी काम गर्छन् भन्ने बारे थप जान्नको लागि, आधिकारिक जाँच गर्नुहोस् GitHub भण्डार।
जवाफ छाड्नुस्