Orodha ya Yaliyomo[Ficha][Onyesha]
Hujambo, je, unajua, kwamba tukio la 3D linaweza kuundwa kutoka kwa data ya 2D kwa sekunde kwa modeli ya uwasilishaji ya neural ya papo hapo ya NVIDIA ya NeRF, na picha za tukio hilo zinaweza kutolewa kwa milisekunde?
Inawezekana kubadilisha kwa haraka mkusanyiko wa picha tulizo kuwa mazingira ya dijitali ya 3D kwa kutumia mbinu inayojulikana kama uwasilishaji kinyume, ambayo huwezesha AI kuiga jinsi mwanga hufanya kazi katika ulimwengu halisi.
Ni mojawapo ya miundo ya kwanza ya aina yake inayoweza kuchanganya mafunzo ya mtandao wa neva wa kasi zaidi na uwasilishaji wa haraka, kutokana na mbinu ambayo timu ya utafiti ya NVIDIA ilibuni ambayo inakamilisha utendakazi haraka sana - karibu papo hapo.
Makala haya yatachunguza kwa kina NeRF ya NVIDIA, ikijumuisha kasi yake, matukio ya utumiaji na mambo mengine.
Kwa hivyo, ni nini NeRF?
NeRF inawakilisha sehemu za mng'aro wa neva, ambayo inarejelea mbinu ya kuunda mionekano ya kipekee ya matukio changamano kwa kuboresha utendaji wa msingi unaoendelea wa eneo la sauti kwa kutumia idadi ndogo ya maoni ya ingizo.
Inapopewa mkusanyiko wa picha za 2D kama ingizo, NeRF za NVIDIA huajiri mitandao ya neural kuwakilisha na kutengeneza matukio ya 3D.
Idadi ndogo ya picha kutoka pembe mbalimbali kuzunguka eneo zinahitajika kwa ajili ya neural mtandao, pamoja na eneo la kamera katika kila fremu.
Haraka picha hizi zinachukuliwa, ni bora zaidi, hasa katika matukio na watendaji wanaohamia au vitu.
Tukio la 3D linalozalishwa na AI litachafuliwa ikiwa kuna mwendo mwingi wakati wa utaratibu wa kunasa picha ya 2D.
Kwa kutabiri rangi ya mwanga inayotoka kila upande kutoka eneo lolote katika mazingira ya 3D, NeRF hujaza kwa ufanisi mapengo yaliyoachwa na data hii ili kuunda picha nzima.
Kwa kuwa NeRF inaweza kutoa onyesho la 3D katika milisekunde kadhaa baada ya kupokea pembejeo zinazofaa, ndiyo njia ya haraka zaidi ya NeRF hadi sasa.
NeRF hufanya kazi haraka sana hivi kwamba ni mara moja, kwa hivyo jina lake. Ikiwa uwakilishi wa kawaida wa 3D kama vile wavu poligonal ni picha za vekta, NeRF ni picha za ramani ndogo: hunasa kwa wingi jinsi mwanga hutoka kwa kitu au ndani ya tukio.
NeRF ya papo hapo ni muhimu kwa 3D kwani kamera za kidijitali na mgandamizo wa JPEG zimekuwa kwenye upigaji picha wa P2, na hivyo kuongeza kasi, urahisi na ufikiaji wa kunasa na kushiriki kwa 3D.
NeRF ya Papo hapo inaweza kutumika kutengeneza ishara au hata mandhari nzima ya ulimwengu pepe.
Ili kutoa heshima kwa siku za mwanzo za picha za Polaroid, timu ya Utafiti ya NVIDIA iliunda upya picha maarufu ya Andy Warhol akipiga picha ya papo hapo na kuibadilisha kuwa onyesho la 3D kwa kutumia Instant NeRF.
Je, ni kasi mara 1,000 kweli?
Onyesho la 3D linaweza kuchukua saa kadhaa kuunda kabla ya NeRF, kulingana na ugumu na ubora wake.
AI iliharakisha mchakato huo, lakini bado inaweza kuchukua masaa kutoa mafunzo vizuri. Kwa kutumia mbinu inayoitwa usimbaji wa hashi wenye maazimio mengi, iliyoanzishwa na NVIDIA, NeRF ya Papo hapo hupunguza muda wa uwasilishaji kwa idadi ya 1,000.
Kifurushi Kidogo cha Mitandao ya Neural ya CUDA na Zana ya NVIDIA CUDA zilitumika kuunda modeli. Kulingana na NVIDIA, kwa sababu ni mtandao wa neva wa uzani mwepesi, unaweza kufunzwa na kutumiwa kwenye NVIDIA GPU moja, na kadi za NVIDIA Tensor Core zinazofanya kazi kwa kasi ya haraka zaidi.
Tumia Uchunguzi
Magari yanayojiendesha yenyewe ni mojawapo ya matumizi muhimu zaidi ya teknolojia hii. Magari haya kwa kiasi kikubwa hufanya kazi kwa kufikiria mazingira yao yanapoenda.
Walakini, shida ya teknolojia ya kisasa ni kwamba ni ngumu na inachukua muda mrefu sana.
Hata hivyo, kwa kutumia Instant NeRF, kinachohitajika ili gari linalojiendesha kukadiria/kuelewa ukubwa na umbo la vitu vya ulimwengu halisi ni kupiga picha tuli, kuzigeuza kuwa 3D, na kisha kutumia maelezo hayo.
Bado kunaweza kuwa na matumizi mengine kwenye metaverse au mchezo video viwanda vya uzalishaji.
Kwa sababu NeRF ya Papo hapo hukuruhusu kuunda avatari au hata ulimwengu wote pepe kwa haraka, hii ni kweli.
Karibu kidogo Tabia ya 3D modeli ingehitajika kwa sababu unachohitaji kufanya ni kuendesha mtandao wa neural, na ingekutengenezea mhusika.
Kwa kuongeza, NVIDIA bado inachunguza kutumia teknolojia hii kwa programu za ziada zinazohusiana na kujifunza kwa mashine.
Kwa mfano, inaweza kutumika kutafsiri lugha kwa usahihi zaidi kuliko hapo awali na kuboresha madhumuni ya jumla kujifunza kwa kina algoriti zinazotumika sasa kwa anuwai kubwa ya kazi.
Hitimisho
Masuala mengi ya michoro hutegemea miundo ya data mahususi ya kazi ili kutumia ulaini wa tatizo au uchache.
Njia mbadala ya kujifunza kwa vitendo inayotolewa na usimbaji wa heshi yenye maazimio mengi ya NVIDIA huzingatia kiotomatiki maelezo muhimu, bila kujali mzigo wa kazi.
Ili kupata maelezo zaidi kuhusu jinsi mambo yanavyofanya kazi ndani, angalia afisa GitHub hifadhi.
Acha Reply