कैसे न्यूरल रेंडरिंग कंप्यूटर ग्राफिक्स में क्रांति ला रहा है

विषय - सूची[छिपाना][प्रदर्शन]

शास्त्रीय प्रतिपादन क्या है?+-
तंत्रिका प्रतिपादन के अनुप्रयोग+-
- उपन्यास दृश्य संश्लेषण
- फोटो-यथार्थवादी अवतार
निष्कर्ष

तंत्रिका प्रतिपादन गहरी शिक्षा में एक उभरती हुई तकनीक है जिसका उद्देश्य तंत्रिका नेटवर्क के साथ कंप्यूटर ग्राफिक्स की शास्त्रीय पाइपलाइन को बढ़ाना है।

एक तंत्रिका प्रतिपादन एल्गोरिदम को एक ही दृश्य के विभिन्न कोणों का प्रतिनिधित्व करने वाली छवियों के एक सेट की आवश्यकता होगी। इन छवियों को एक मॉडल बनाने के लिए एक तंत्रिका नेटवर्क में खिलाया जाएगा जो एक ही दृश्य के नए कोणों को आउटपुट कर सकता है।

न्यूरल रेंडरिंग के पीछे की प्रतिभा इस बात में निहित है कि कैसे यह शास्त्रीय तरीकों पर भरोसा किए बिना विस्तृत फोटोरिअलिस्टिक दृश्यों को सटीक रूप से फिर से बना सकता है जो अधिक कम्प्यूटेशनल रूप से मांग कर सकते हैं।

न्यूरल रेंडरिंग कैसे काम करता है, इस पर गोता लगाने से पहले, आइए शास्त्रीय रेंडरिंग की मूल बातों पर ध्यान दें।

शास्त्रीय प्रतिपादन क्या है?

आइए पहले क्लासिकल रेंडरिंग में उपयोग की जाने वाली विशिष्ट विधियों को समझें।

शास्त्रीय प्रतिपादन एक त्रि-आयामी दृश्य की 2 डी छवि बनाने के लिए उपयोग की जाने वाली तकनीकों के सेट को संदर्भित करता है। छवि संश्लेषण के रूप में भी जाना जाता है, शास्त्रीय प्रतिपादन विभिन्न प्रकार की वस्तुओं के साथ प्रकाश कैसे इंटरैक्ट करता है, यह अनुकरण करने के लिए विभिन्न एल्गोरिदम का उपयोग करता है।

उदाहरण के लिए, एक ठोस ईंट को प्रस्तुत करने के लिए छाया की स्थिति या दीवार के दोनों ओर कितनी अच्छी तरह से रोशनी होगी, यह निर्धारित करने के लिए एल्गोरिदम के एक विशेष सेट की आवश्यकता होगी। इसी तरह, वस्तुएँ जो प्रकाश को परावर्तित या अपवर्तित करती हैं, जैसे कि दर्पण, चमकदार वस्तु, या पानी का पिंड, उन्हें अपनी तकनीक की भी आवश्यकता होगी।

शास्त्रीय प्रतिपादन आमतौर पर बहुभुज जाल का उपयोग करता है

शास्त्रीय प्रतिपादन में, प्रत्येक संपत्ति को बहुभुज जाल के साथ दर्शाया जाता है। एक शेडर प्रोग्राम तब बहुभुज का उपयोग इनपुट के रूप में यह निर्धारित करने के लिए करेगा कि निर्दिष्ट प्रकाश और कोण को देखते हुए वस्तु कैसी दिखेगी।

यथार्थवादी प्रतिपादन के लिए बहुत अधिक संगणना शक्ति की आवश्यकता होगी क्योंकि हमारी संपत्ति में इनपुट के रूप में उपयोग करने के लिए लाखों बहुभुज हैं। हॉलीवुड ब्लॉकबस्टर्स में आम तौर पर कंप्यूटर जनित आउटपुट को प्रस्तुत करने में हफ्तों या महीनों का समय लगता है और इसकी कीमत लाखों डॉलर हो सकती है।

किरण अनुरेखण दृष्टिकोण विशेष रूप से महंगा है क्योंकि अंतिम छवि में प्रत्येक पिक्सेल को प्रकाश स्रोत से वस्तु और कैमरे तक ले जाने वाले पथ प्रकाश की गणना की आवश्यकता होती है।

साइबरपंक 2077 में रे ट्रेसिंग

हार्डवेयर में प्रगति ने ग्राफिक्स रेंडरिंग को उपयोगकर्ताओं के लिए अधिक सुलभ बना दिया है। उदाहरण के लिए, कई नवीनतम वीडियो गेम जब तक उनका हार्डवेयर कार्य करने के लिए है, तब तक फोटो-यथार्थवादी प्रतिबिंब और छाया जैसे किरण-निशान प्रभावों की अनुमति दें।

नवीनतम जीपीयू (ग्राफिक प्रोसेसिंग यूनिट) विशेष रूप से सीपीयू को फोटो-यथार्थवादी ग्राफिक्स प्रस्तुत करने के लिए आवश्यक अत्यधिक जटिल गणनाओं को संभालने में मदद करने के लिए बनाए गए हैं।

तंत्रिका प्रतिपादन का उदय

तंत्रिका प्रतिपादन एक अलग तरीके से प्रतिपादन की समस्या से निपटने का प्रयास करता है। प्रकाश वस्तुओं के साथ कैसे इंटरैक्ट करता है, यह अनुकरण करने के लिए एल्गोरिदम का उपयोग करने के बजाय, क्या होगा यदि हमने एक मॉडल बनाया है जो सीखता है कि एक निश्चित कोण से एक दृश्य कैसे दिखना चाहिए?

आप इसे फोटो-यथार्थवादी दृश्य बनाने के शॉर्टकट के रूप में सोच सकते हैं। तंत्रिका प्रतिपादन के साथ, हमें यह गणना करने की आवश्यकता नहीं है कि प्रकाश किसी वस्तु के साथ कैसे संपर्क करता है, हमें केवल पर्याप्त प्रशिक्षण डेटा की आवश्यकता है।

यह दृष्टिकोण शोधकर्ताओं को प्रदर्शन किए बिना जटिल दृश्यों के उच्च-गुणवत्ता वाले रेंडर बनाने की अनुमति देता है

तंत्रिका क्षेत्र क्या हैं?

जैसा कि पहले उल्लेख किया गया है, अधिकांश 3D रेंडर प्रत्येक वस्तु के आकार और बनावट पर डेटा संग्रहीत करने के लिए बहुभुज जाल का उपयोग करते हैं।

हालांकि, त्रि-आयामी वस्तुओं का प्रतिनिधित्व करने के वैकल्पिक तरीके के रूप में तंत्रिका क्षेत्र लोकप्रियता प्राप्त कर रहे हैं। बहुभुज जालों के विपरीत, तंत्रिका क्षेत्र भिन्न और निरंतर होते हैं।

जब हम कहते हैं कि तंत्रिका क्षेत्र अलग-अलग हैं तो हमारा क्या मतलब है?

तंत्रिका चमक आरेख

एक तंत्रिका क्षेत्र से एक 2D आउटपुट को अब केवल तंत्रिका नेटवर्क के वजन को समायोजित करके फोटोरिअलिस्टिक बनने के लिए प्रशिक्षित किया जा सकता है।

तंत्रिका क्षेत्रों का उपयोग करते हुए, हमें अब किसी दृश्य को प्रस्तुत करने के लिए प्रकाश की भौतिकी का अनुकरण करने की आवश्यकता नहीं है। अंतिम रेंडर कैसे प्रकाशित होगा, इसका ज्ञान अब हमारे वजन के अंदर निहित रूप से संग्रहीत है तंत्रिका नेटवर्क.

यह हमें केवल कुछ फ़ोटो या वीडियो फ़ुटेज से अपेक्षाकृत तेज़ी से नई छवियां और वीडियो बनाने देता है.

तंत्रिका क्षेत्र को कैसे प्रशिक्षित करें?

अब जब हम मूल बातें जानते हैं कि एक तंत्रिका क्षेत्र कैसे काम करता है, आइए एक नज़र डालते हैं कि शोधकर्ता एक तंत्रिका चमक क्षेत्र को कैसे प्रशिक्षित कर सकते हैं या एनईआरएफ.

तंत्रिका चमक क्षेत्र का उपयोग करके तंत्रिका प्रतिपादन

सबसे पहले, हमें एक दृश्य के यादृच्छिक निर्देशांक का नमूना लेना होगा और उन्हें एक तंत्रिका नेटवर्क में फीड करना होगा। यह नेटवर्क तब फील्ड मात्रा का उत्पादन करने में सक्षम होगा।

उत्पादित क्षेत्र की मात्रा को उस दृश्य के वांछित पुनर्निर्माण डोमेन से नमूने माना जाता है जिसे हम बनाना चाहते हैं।

फिर हमें वास्तविक 2D छवियों के पुनर्निर्माण को मैप करने की आवश्यकता होगी। एक एल्गोरिथ्म तब पुनर्निर्माण त्रुटि की गणना करेगा। यह त्रुटि दृश्य के पुनर्निर्माण की क्षमता को अनुकूलित करने के लिए तंत्रिका नेटवर्क का मार्गदर्शन करेगी।

तंत्रिका प्रतिपादन के अनुप्रयोग

उपन्यास दृश्य संश्लेषण

नॉवेल व्यू सिंथेसिस सीमित संख्या में दृष्टिकोण से डेटा का उपयोग करके नए कोणों से कैमरा परिप्रेक्ष्य बनाने के कार्य को संदर्भित करता है।

न्यूरल रेंडरिंग तकनीक डेटासेट में प्रत्येक छवि के लिए कैमरे की सापेक्ष स्थिति का अनुमान लगाने की कोशिश करती है और उस डेटा को न्यूरल नेटवर्क में फीड करती है।

तंत्रिका नेटवर्क तब दृश्य का एक 3D प्रतिनिधित्व बनाएगा जहां 3D अंतरिक्ष में प्रत्येक बिंदु का एक संबद्ध रंग और घनत्व है।

गूगल मैप्स नेरफ उदाहरण

एनईआरएफ का एक नया कार्यान्वयन गूगल स्ट्रीट व्यू उपयोगकर्ताओं को वास्तविक दुनिया के स्थानों का पता लगाने की अनुमति देने के लिए उपन्यास दृश्य संश्लेषण का उपयोग करता है जैसे कि वे वीडियो लेने वाले कैमरे को नियंत्रित कर रहे हों। यह पर्यटकों को किसी विशिष्ट साइट की यात्रा करने का निर्णय लेने से पहले एक गहन तरीके से गंतव्यों का पता लगाने की अनुमति देता है।

फोटो-यथार्थवादी अवतार

तंत्रिका प्रतिपादन में उन्नत तकनीकें भी अधिक यथार्थवादी डिजिटल अवतारों का मार्ग प्रशस्त कर सकती हैं। इन अवतारों का उपयोग तब विभिन्न भूमिकाओं जैसे आभासी सहायकों या ग्राहक सेवा के लिए किया जा सकता है, या उपयोगकर्ताओं के लिए अपनी समानता को सम्मिलित करने के तरीके के रूप में किया जा सकता है। वीडियो खेल या नकली रेंडर।

न्यूरल रेंडरिंग डिजिटल अवतार

उदाहरण के लिए, काग़ज़ मार्च 2023 में प्रकाशित वीडियो फुटेज के कुछ मिनटों के बाद फोटो-यथार्थवादी अवतार बनाने के लिए न्यूरल रेंडरिंग तकनीकों का उपयोग करने का सुझाव देता है।

निष्कर्ष

तंत्रिका प्रतिपादन अध्ययन का एक रोमांचक क्षेत्र है जिसमें संपूर्ण कंप्यूटर ग्राफिक्स उद्योग को बदलने की क्षमता है।

तकनीक 3D संपत्तियों के निर्माण के लिए प्रवेश की बाधा को कम कर सकती है। विजुअल इफेक्ट्स टीमों को अब कुछ मिनट के फोटो-यथार्थवादी ग्राफिक्स को रेंडर करने के लिए दिनों का इंतजार नहीं करना पड़ सकता है।

मौजूदा वीआर और एआर अनुप्रयोगों के साथ प्रौद्योगिकी का संयोजन भी डेवलपर्स को अधिक immersive अनुभव बनाने की अनुमति दे सकता है।

आपको क्या लगता है कि तंत्रिका प्रतिपादन की वास्तविक क्षमता क्या है?

कैसे तंत्रिका प्रतिपादन कंप्यूटर ग्राफिक्स में क्रांति ला रहा है