Хөөе, NVIDIA-ийн Instant NeRF мэдрэлийн дүрслэлийг ашиглан секундын дотор 3D өгөгдлийн оролтоор 2D дүр зураг үүсгэж, тэрхүү үзэгдлийн гэрэл зургийг миллисекундэд үзүүлэх боломжтой гэдгийг та мэдэх үү?
Урвуу дүрслэл гэж нэрлэгддэг техникийг ашиглан хөдөлгөөнгүй гэрэл зургийн цуглуулгыг хурдан дижитал 3D орчин болгон хувиргах боломжтой бөгөөд энэ нь хиймэл оюун ухаанд гэрэл бодит ертөнцөд хэрхэн ажилладагийг дуурайх боломжийг олгодог.
Энэ нь NVIDIA-ийн судалгааны багийнхны зохион бүтээсэн техникийн ачаар мэдрэлийн сүлжээний хэт хурдан сургалт болон хурдан дүрслэлийг хослуулж чаддаг анхны загваруудын нэг бөгөөд энэ нь үйл ажиллагааг бараг агшин зуурт гайхалтай хурдан гүйцэтгэдэг.
Энэ нийтлэл нь NVIDIA-ийн NeRF-ийн хурд, ашиглалтын тохиолдол болон бусад хүчин зүйлсийг нарийвчлан судлах болно.
Тэгэхээр юу вэ NeRF?
NeRF нь мэдрэлийн цацрагийн талбаруудын товчлол бөгөөд энэ нь цөөн тооны оролтын харагдац ашиглан үндсэн тасралтгүй эзлэхүүний үзэгдлийн функцийг сайжруулах замаар төвөгтэй үзэгдлүүдийн өвөрмөц дүр төрхийг бий болгох арга техникийг хэлдэг.
2D зургийн цуглуулгыг оролт болгон өгөхөд NVIDIA-ийн NeRF-ууд ашигладаг мэдрэлийн сүлжээ 3D үзэгдлийг дүрслэх, үүсгэх.
Талбайн эргэн тойронд янз бүрийн өнцгөөс цөөн тооны гэрэл зураг хэрэгтэй мэдрэлийн сүлжээ, хүрээ тус бүрийн камерын байршлын хамт.
Эдгээр зургуудыг хэдий чинээ хурдан авна, ялангуяа хөдөлгөөнт жүжигчид эсвэл объекттой үзэгдэлд төдий чинээ сайн.
Хэрэв 3D зураг авах явцад хэт их хөдөлгөөн байвал хиймэл оюун ухаанаар үүсгэсэн 2D дүр зураг бүдгэрнэ.
NeRF нь 3D орчны аль ч газраас чиглэл бүрт цацарч буй гэрлийн өнгийг урьдчилан таамагласнаар энэ өгөгдлөөс үлдсэн хоосон зайг үр дүнтэй нөхөж, зургийг бүхэлд нь бүтээдэг.
NeRF нь зохих оролтыг хүлээн авсны дараа хэдхэн миллисекундын дотор 3D дүр зургийг үүсгэж чаддаг тул энэ нь өнөөг хүртэл хамгийн хурдан NeRF арга юм.
NeRF нь маш хурдан ажилладаг тул бараг л агшин зуурт ажилладаг тул нэр нь ийм байдаг. Хэрэв олон өнцөгт торон гэх мэт стандарт 3D дүрслэл нь вектор зураг бол NeRF нь битмап зураг юм: тэдгээр нь объектоос эсвэл үзэгдэл доторх гэрэл хэрхэн ялгарч байгааг нягт нямбай авдаг.
Шуурхай NeRF Дижитал камер болон JPEG шахалт нь 3D гэрэл зургийн хувьд 2D зураг авах, хуваалцах хурд, ая тухтай байдал, хүртээмжийг эрс сайжруулсан тул 3D-д зайлшгүй шаардлагатай.
Instant NeRF-ийг виртуал ертөнцөд аватар, тэр байтугай бүхэл бүтэн үзэгдлүүдийг бүтээхэд ашиглаж болно.
NVIDIA судалгааны баг Polaroid гэрэл зургийн эхний үеийг хүндэтгэхийн тулд Энди Уорхолын агшин зуурын зураг авч буй алдартай зургийг дахин бүтээж, Instant NeRF ашиглан 3D дүр зураг болгон хувиргасан.
Энэ үнэхээр 1,000 дахин хурдан юм болов уу?
3D дүр зураг нь нарийн төвөгтэй байдал, чанараас хамааран NeRF-ээс өмнө бүтээхэд хэдэн цаг зарцуулдаг.
AI энэ үйл явцыг ихээхэн хурдасгасан боловч зохих ёсоор сургахад хэдэн цаг шаардагдана. NVIDIA-ийн анхлан гаргасан олон нарийвчлалтай хэш кодчилол хэмээх аргыг ашиглан Instant NeRF нь үзүүлэх хугацааг 1,000 дахин багасгадаг.
Загвар бүтээхэд Tiny CUDA Neural Networks багц болон NVIDIA CUDA Toolkit ашигласан. NVIDIA-ийн мэдээлснээр, энэ нь хөнгөн мэдрэлийн сүлжээ учраас үүнийг нэг NVIDIA GPU дээр сургаж, ашиглах боломжтой, NVIDIA Tensor Core картууд нь хамгийн хурдан хурдтай ажилладаг.
Кейс ашиглах
Өөрийгөө жолооддог автомашинууд нь энэ технологийн хамгийн чухал хэрэглээний нэг юм. Эдгээр тээврийн хэрэгсэл нь ихэвчлэн эргэн тойрондоо эргэн тойрондоо төсөөлж ажилладаг.
Гэсэн хэдий ч өнөөгийн технологийн асуудал бол болхи, хэтэрхий удаан байдаг.
Гэсэн хэдий ч Instant NeRF ашиглан өөрөө жолооддог машинд бодит ертөнцийн объектуудын хэмжээ, хэлбэрийг ойролцоогоор/ойлгохын тулд шаардлагатай бүх зүйл бол хөдөлгөөнгүй гэрэл зургийг авч, 3D болгон хувиргаж, дараа нь тэр мэдээллийг ашиглах явдал юм.
Метаверст эсвэл өөр хэрэглээ байж болно видео тоглоом үйлдвэрлэлийн салбарууд.
Instant NeRF нь аватар эсвэл бүхэл бүтэн виртуал ертөнцийг хурдан бүтээх боломжийг олгодог тул энэ нь үнэн юм.
Бараг бага 3D тэмдэгт Загвар хийх шаардлагатай, учир нь таны хийх зүйл бол мэдрэлийн сүлжээг ажиллуулах бөгөөд энэ нь танд тэмдэгт үүсгэх болно.
Нэмж дурдахад, NVIDIA энэ технологийг машин сурахтай холбоотой нэмэлт програмуудад ашиглах талаар судалж байна.
Жишээлбэл, хэлийг өмнөхөөсөө илүү нарийвчлалтай орчуулж, ерөнхий зорилгоо сайжруулахад ашиглаж болно гүн гүнзгий суралцах алгоритмууд одоо илүү өргөн хүрээний даалгаварт ашиглагдаж байна.
Дүгнэлт
Графикийн олон асуудал нь асуудлын гөлгөр эсвэл сийрэг байдлыг ашиглахын тулд даалгаварт зориулсан өгөгдлийн бүтцэд тулгуурладаг.
NVIDIA-ийн олон нягтралтай хэш кодчилолын санал болгож буй практик сургалтанд суурилсан хувилбар нь ажлын ачааллаас үл хамааран холбогдох нарийн ширийн зүйлийг автоматаар төвлөрүүлдэг.
Дотор зүйлс хэрхэн ажилладаг талаар илүү ихийг мэдэхийг хүсвэл албан ёсны төлөөлөгчийг шалгана уу GitHub хадгалах газар.
хариу үлдээх