មាតិកា[លាក់][បង្ហាញ]
ហេ តើអ្នកដឹងទេថា ឈុតឆាក 3D អាចត្រូវបានបង្កើតពីការបញ្ចូលទិន្នន័យ 2D ក្នុងរយៈពេលប៉ុន្មានវិនាទីជាមួយនឹងគំរូបង្ហាញសរសៃប្រសាទ NVIDIA's Instant NeRF ហើយរូបថតនៃឈុតនោះអាចបង្ហាញជាមិល្លីវិនាទី?
វាអាចទៅរួចក្នុងការបំប្លែងបណ្តុំនៃរូបថតបន្តទៅជាបរិស្ថាន 3D ឌីជីថលយ៉ាងឆាប់រហ័សដោយប្រើបច្ចេកទេសដែលគេស្គាល់ថាជាការបង្ហាញបញ្ច្រាស ដែលអាចឱ្យ AI ធ្វើត្រាប់តាមរបៀបដែលពន្លឺដំណើរការនៅក្នុងពិភពជាក់ស្តែង។
វាគឺជាគំរូមួយក្នុងចំណោមម៉ូដែលដំបូងគេដែលអាចរួមបញ្ចូលគ្នានូវការបណ្តុះបណ្តាលបណ្តាញសរសៃប្រសាទដែលមានល្បឿនលឿនបំផុត និងការបង្ហាញរហ័ស សូមអរគុណចំពោះបច្ចេកទេសដែលក្រុមស្រាវជ្រាវរបស់ NVIDIA បានបង្កើតដែលបញ្ចប់ប្រតិបត្តិការយ៉ាងឆាប់រហ័សមិនគួរឱ្យជឿ - ស្ទើរតែភ្លាមៗ។
អត្ថបទនេះនឹងពិនិត្យមើលស៊ីជម្រៅ NeRF របស់ NVIDIA រួមទាំងល្បឿនរបស់វា ករណីប្រើប្រាស់ និងកត្តាផ្សេងៗទៀត។
ដូច្នេះអ្វីទៅ ណេអេហ្វ?
NeRF តំណាងឱ្យវាលរស្មីសរសៃប្រសាទ ដែលសំដៅលើបច្ចេកទេសសម្រាប់បង្កើតទិដ្ឋភាពប្លែកៗនៃឈុតឆាកស្មុគស្មាញ ដោយធ្វើការកែលម្អមុខងារនៃឈុតឆាកកម្រិតសំឡេងជាបន្តបន្ទាប់ដោយប្រើទិដ្ឋភាពបញ្ចូលមួយចំនួនតូច។
នៅពេលដែលបានផ្តល់ការប្រមូលរូបថត 2D ជាការបញ្ចូល NeRFs របស់ NVIDIA ប្រើប្រាស់ បណ្តាញសរសៃប្រសាទ ដើម្បីតំណាង និងបង្កើតឈុតឆាក 3D ។
រូបថតមួយចំនួនតូចពីមុំផ្សេងៗជុំវិញតំបន់គឺត្រូវការសម្រាប់ បណ្តាញសរសៃប្រសាទរួមជាមួយនឹងទីតាំងរបស់កាមេរ៉ាក្នុងស៊ុមនីមួយៗ។
រូបភាពទាំងនេះត្រូវបានថតបានលឿនជាងមុន ជាពិសេសនៅក្នុងឈុតឆាកដែលមានចលនា ឬវត្ថុផ្សេងៗ។
ឈុត 3D ដែលបង្កើតដោយ AI នឹងត្រូវបានប្រឡាក់ប្រសិនបើមានចលនាខ្លាំងពេកក្នុងអំឡុងពេលដំណើរការថតរូបភាព 2D។
តាមរយៈការទស្សន៍ទាយពណ៌នៃពន្លឺដែលបញ្ចេញនៅគ្រប់ទិសទីពីទីតាំងណាមួយនៅក្នុងបរិយាកាស 3D នោះ NeRF មានប្រសិទ្ធភាពបំពេញចន្លោះប្រហោងដែលនៅសល់ដោយទិន្នន័យនេះដើម្បីបង្កើតរូបភាពទាំងមូល។
ដោយសារ NeRF អាចបង្កើតឈុត 3D ក្នុងរយៈពេលពីរបីមិល្លីវិនាទី បន្ទាប់ពីទទួលបានធាតុបញ្ចូលត្រឹមត្រូវ វាគឺជាវិធីសាស្រ្ត NeRF លឿនបំផុតរហូតមកដល់បច្ចុប្បន្ន។
NeRF ដំណើរការយ៉ាងលឿនដែលវាស្ទើរតែភ្លាមៗ ដូច្នេះឈ្មោះរបស់វា។ ប្រសិនបើតំណាង 3D ស្ដង់ដារដូចជាសំណាញ់ពហុកោណគឺជារូបភាពវ៉ិចទ័រ នោះ NeRFs គឺជារូបភាពផែនទីប៊ីត៖ ពួកវាចាប់យកយ៉ាងក្រាស់នូវរបៀបដែលពន្លឺបញ្ចេញចេញពីវត្ថុមួយ ឬនៅខាងក្នុងកន្លែងកើតហេតុ។
NeRF បន្ទាន់ មានសារៈសំខាន់ចំពោះ 3D ព្រោះថាកាមេរ៉ាឌីជីថល និងការបង្ហាប់ JPEG បានទៅដល់ការថតរូប 2D ដែលបង្កើនល្បឿន ភាពងាយស្រួល និងឈានដល់ការចាប់យក និងការចែករំលែក 3D យ៉ាងខ្លាំង។
Instant NeRF អាចត្រូវបានប្រើដើម្បីផលិតរូបតំណាង ឬសូម្បីតែទេសភាពទាំងមូលសម្រាប់ពិភពនិម្មិត។
ដើម្បីឧទ្ទិសដល់ថ្ងៃដំបូងនៃរូបថត Polaroid ក្រុមស្រាវជ្រាវ NVIDIA បានបង្កើតឡើងវិញនូវរូបថតដ៏ល្បីល្បាញរបស់ Andy Warhol ថតរូបភ្លាមៗ ហើយបំប្លែងវាទៅជាឈុត 3D ដោយប្រើ Instant NeRF ។
តើវាពិតជាលឿនជាង 1,000 ដងមែនទេ?
ឈុត 3D អាចចំណាយពេលរាប់ម៉ោងដើម្បីបង្កើតមុនពេល NeRF អាស្រ័យលើភាពស្មុគ្រស្មាញ និងគុណភាពរបស់វា។
AI បានបង្កើនល្បឿនដំណើរការនេះយ៉ាងខ្លាំង ប៉ុន្តែវានៅតែអាចចំណាយពេលរាប់ម៉ោងដើម្បីហ្វឹកហាត់ឱ្យបានត្រឹមត្រូវ។ ដោយប្រើវិធីសាស្ត្រមួយហៅថា Multi-resolution hash encoding ដែលត្រួសត្រាយដោយ NVIDIA Instant NeRF កាត់បន្ថយពេលវេលាបង្ហាញដោយកត្តា 1,000។
កញ្ចប់តូច CUDA Neural Networks និង NVIDIA CUDA Toolkit ត្រូវបានប្រើដើម្បីបង្កើតគំរូ។ យោងតាម NVIDIA ដោយសារតែវាជាបណ្តាញសរសៃប្រសាទទម្ងន់ស្រាល វាអាចត្រូវបានបណ្តុះបណ្តាល និងប្រើប្រាស់នៅលើ NVIDIA GPU តែមួយ ជាមួយនឹងកាត NVIDIA Tensor Core ដំណើរការក្នុងល្បឿនលឿនបំផុត។
ករណីការប្រើប្រាស់
រថយន្តបើកបរដោយខ្លួនឯងគឺជាកម្មវិធីដ៏សំខាន់បំផុតមួយនៃបច្ចេកវិទ្យានេះ។ យានជំនិះទាំងនេះភាគច្រើនដំណើរការដោយការស្រមៃជុំវិញខ្លួននៅពេលពួកគេទៅ។
ទោះជាយ៉ាងណាក៏ដោយ បញ្ហាជាមួយនឹងបច្ចេកវិទ្យានាពេលបច្ចុប្បន្ននេះគឺថាវាច្របូកច្របល់ និងចំណាយពេលយូរបន្តិច។
ទោះបីជាយ៉ាងណាក៏ដោយ ដោយប្រើ Instant NeRF អ្វីៗទាំងអស់ដែលតម្រូវឱ្យរថយន្តបើកបរដោយខ្លួនឯងដើម្បីប៉ាន់ស្មាន/យល់អំពីទំហំ និងរូបរាងរបស់វត្ថុក្នុងពិភពពិតគឺការថតរូបភាព បង្វែរវាទៅជា 3D ហើយបន្ទាប់មកប្រើប្រាស់ព័ត៌មាននោះ។
វានៅតែអាចប្រើមួយផ្សេងទៀតនៅក្នុង metaverse ឬ ហ្គេមវីឌីអូ ឧស្សាហកម្មផលិតកម្ម។
ដោយសារតែ Instant NeRF អនុញ្ញាតឱ្យអ្នកបង្កើត avatars ឬសូម្បីតែពិភពនិម្មិតទាំងមូលយ៉ាងឆាប់រហ័ស នេះជាការពិត។
ស្ទើរតែតិចតួច តួអក្សរ 3D ការធ្វើគំរូនឹងត្រូវបានទាមទារ ពីព្រោះអ្វីដែលអ្នកត្រូវធ្វើគឺដំណើរការបណ្តាញសរសៃប្រសាទ ហើយវានឹងបង្កើតតួអក្សរសម្រាប់អ្នក។
លើសពីនេះទៀត NVIDIA នៅតែស្វែងរកការអនុវត្តបច្ចេកវិទ្យានេះសម្រាប់កម្មវិធីបន្ថែមទាក់ទងនឹងការរៀនម៉ាស៊ីន។
ឧទាហរណ៍ វាអាចនឹងត្រូវបានប្រើដើម្បីបកប្រែភាសាឱ្យបានត្រឹមត្រូវជាងមុន និងពង្រឹងគោលបំណងទូទៅ ការរៀនសូត្រជ្រៅ ឥឡូវនេះក្បួនដោះស្រាយត្រូវបានប្រើសម្រាប់កិច្ចការដ៏ទូលំទូលាយ។
សន្និដ្ឋាន
បញ្ហាក្រាហ្វិកជាច្រើនពឹងផ្អែកលើរចនាសម្ព័ន្ធទិន្នន័យជាក់លាក់នៃកិច្ចការ ដើម្បីប្រើប្រាស់ភាពរលូន ឬកម្រិតនៃបញ្ហា។
ជម្មើសជំនួសផ្អែកលើការរៀនសូត្រជាក់ស្តែងដែលផ្តល់ជូនដោយការអ៊ិនកូដ hash ដំណោះស្រាយច្រើនរបស់ NVIDIA ផ្តោតដោយស្វ័យប្រវត្តិលើព័ត៌មានលម្អិតដែលពាក់ព័ន្ធ ដោយមិនគិតពីបន្ទុកការងារ។
ដើម្បីស្វែងយល់បន្ថែមអំពីរបៀបដែលអ្វីៗដំណើរការនៅខាងក្នុង សូមពិនិត្យមើលជាផ្លូវការ GitHub ឃ្លាំង។
សូមផ្ដល់យោបល់