Table of Contents[Veşartin][Rêdan]
Bi gelemperî, modelên hilberîner ên kûr ên mîna GANs, VAEs, û modelên otoregressive pirsgirêkên hevrêziya wêneyê digirin.
Ji ber qalîteya bilind a daneyên ku ew diafirînin, torên dijberiya hilberîner (GAN) di van salên dawî de gelek bal kişandin.
Modelên belavbûnê qadek din a lêkolînê ya balkêş e ku xwe ava kiriye. Zeviyên hilberandina wêne, vîdyoyê û dengan her du jî ji bo her duyan karanîna berfireh dîtine.
Modelên belavbûnê li hember GANs: Kîjan Encamên Baştir Hilberîne? Bi awayekî xwezayî, ev yek bû sedema nîqaşek berdewam.
Di mîmariya hesabkirinê de ku wekî GAN tê zanîn, du torên neural li dijî hev têne şer kirin da ku daneyên nû yên sentezkirî hilberînin ku dikarin daneyên rastîn derbas bikin.
Modelên belavbûnê her ku diçe populertir dibin ji ber ku ew aramiya perwerdehiyê û encamên bilind ji bo hilberîna muzîk û grafîkê peyda dikin.
Ev gotar dê bi hûrgulî modela belavbûnê û GAN-an, û hem jî ew ê çawa ji hev û çend tiştên din cûda bibin, derbas bike.
Ji ber vê yekê, Torên Dijbera Generative çi ne?
Ji bo afirandina daneyên nû, çêkirî yên ku dibe ku bi daneya rastîn werin xelet kirin, torên dijberî yên hilberîner (GAN) du torên neuralî bikar tînin û wan li hember hevûdu dixin (bi vî rengî di nav de "dijber").
Ew bi berfirehî ji bo axaftin, vîdyoyê û çêkirina wêneyê têne bikar anîn.
Armanca GAN ew e ku daneyên ku berê nehatine keşifkirin ji danegehek taybetî biafirîne. Hewldana derxistina modelek dabeşkirina daneya bingehîn a rastîn, nenaskirî ji nimûneyan, vê yekê dike.
Alternatîf tê gotin, ev tora modelên nepenî ne ku hewl didin ku belavkirinek statîstîkî ya taybetî fêr bibin.
Rêbaza ku GAN bikar anî ji bo kifşkirina ka meriv çawa vê armancê pêk tîne nû bû. Bi rastî, ew daneyan bi lîstina lîstikek du-lîstikvan hilberînin da ku modelek nepenî pêşve bibin.
Li jêr strukturê diyar dike:
- Cudakarek ku jêhatîbûna ferqkirina daneyên rastîn û sexte bi dest dixe
- jeneratorek ku awayên nû ji bo afirandina daneyan hildibijêre dikare cihêkar bixapîne.
Cûdakar wekî tora neuralî xuya dike. Ji ber vê yekê, jenerator pêdivî ye ku wêneyek bi kalîteya bilind biafirîne da ku wê bixapîne.
Rastiya ku ev jenerator bi karanîna ti dabeşkirina derketinê nayên perwerde kirin cûdahiyek girîng di navbera modelên kodkerê otomatîk û modelên din de ye.
Du awayan hene ku meriv fonksiyona windabûnê ya modelê hilweşîne:
- şiyana hejmartinê heke cihêkar bi rast daneyên rastîn pêşbîn dike
- Daneyên çêkirî ji hêla beşek rast ve têne pêşbînî kirin.
Li ser cihêkarê çêtirîn pêkan, ev fonksiyona winda paşê kêm dibe:
Ji ber vê yekê modelên gelemperî dikarin wekî modelên kêmkirina dûrbûnê werin fikirîn û, heke cihêkar îdeal be, wekî kêmkirina cûdahiyê di navbera belavkirina rast û hilberî de.
Di rastiyê de, cûdahiyên cihêreng dikarin werin xebitandin û bi awayên cûrbecûr perwerdehiya GAN-ê encam bidin.
Dînamîkên fêrbûnê, ku di nav xwe de danûstendinek di navbera jenerator û cihêkar de vedihewîne, bişopîne dijwar e, tevî ku ew hêsan e ku meriv fonksiyona windakirina GAN-an rast bike.
Di heman demê de tu garantî tune ku fêrbûn dê bigihîje hev. Wekî encamek, perwerdehiya modelek GAN-ê dijwar e, ji ber ku ew tîpîk e ku meriv li ser pirsgirêkên mîna windabûna gradient û hilweşîna modê (gava ku di nimûneyên hatî hilberandin de cihêrengiyek tune be) rêve bibe.
Naha, dema Modelên Diffusionê ye
Pirsgirêka lihevhatina perwerdehiya GAN-ê bi pêşkeftina modelên belavbûnê ve hatî çareser kirin.
Van modelan texmîn dikin ku pêvajoyek belavbûnê bi windabûna agahdariya ku ji ber destwerdana pêşkeftî ya deng ve hatî peyda kirin wekhev e (di her gavê pêvajoya belavbûnê de dengek gaussian tê zêdekirin).
Armanca modelek wusa ew e ku were destnîşankirin ka deng çawa bandorê li agahdariya heyî ya di nimûneyê de dike, an, bi rengek din, ji ber belavbûnê çiqas agahdarî winda dibe.
Ger modelek dikare vê yekê fêhm bike, pêdivî ye ku ew bikaribe nimûneya orîjînal bigire û windabûna agahdariya ku qewimî betal bike.
Ev bi riya modela belavkirina denoising pêk tê. Pêvajoyek belavbûna pêş û pêvajoyek belavbûna berevajî du gavan pêk tîne.
Pêvajoya belavkirina pêşde gav bi gav dengê Gaussian zêde dike (ango, pêvajoya belavbûnê) heya ku dane bi tevahî bi deng veneqete.
Dûv re tora neuralî bi karanîna rêbaza belavbûna berevajî tê perwerde kirin da ku fêrî îhtîmalên dabeşkirina şertî bibe da ku deng berevajî bike.
Li vir hûn dikarin li ser bêtir fêm bikin modela belavbûnê.
Modela Diffusion Vs GANs
Mîna modelek belavbûnê, GAN wêneyan ji dengan çêdikin.
Model ji torgilokek neuralî ya jeneratorê pêk tê, ku bi dengê hin guhêrbarên şertê agahdar, wek etîketa polê an kodkirina nivîsê, dest pê dike.
Wê hingê encam divê bibe tiştek ku dişibe wêneyek realîst.
Ji bo afirandina nifşên wêneyên fotorealîst û pêbawer, em GAN-ê bikar tînin. Ji GAN-an jî dîmenên rastîntir bi karanîna modelên belavbûnê têne hilberandin.
Bi awayek, modelên belavbûnê di danasîna rastiyan de rasttir in.
Gava ku GAN wekî dengek bêserûber an guhêrbarek şerta pola tê girtin û nimûneyek rastîn derdixe, modelên belavbûnê bi gelemperî hêdîtir, dubareker in, û hewceyê bêtir rêbernameyê ne.
Dema ku denoiskirin bi mebesta ku ji deng vegere wêneyê orîjînal gelek caran tê sepandin pir cîh ji xeletiyê re tune.
Her nuqteya kontrolê li seranserê qonaxa afirandinê tê derbas kirin, û bi her gavê re, dibe ku wêne bêtir û bêtir agahdarî bi dest bixe.
Xelasî
Di encamê de, ji ber çend lêkolînên girîng ên ku tenê di salên 2020 û 2021-an de hatin weşandin, modelên belavbûnê naha dikarin di warê senteza wêneyê de ji GAN-an derbikevin.
Vê salê, OpenAI dest pê kir DALL-E2, modelek hilberîna wêneyê ku destûrê dide bijîjkan ku modelên belavbûnê bikar bînin.
Her çend GAN nûjen in, lê astengiyên wan pîvandin û karanîna wan di çarçoveyek nû de dijwar dike.
Ji bo ku bi karanîna modelên li gorî îhtîmalê bi karanîna qalîteya nimûneya GAN-ê bigihîje, gelek xebat li ser wê hatine kirin.
Leave a Reply