Ni gbogbogbo, awọn awoṣe ipilẹṣẹ ti o jinlẹ bii GANs, VAEs, ati awọn awoṣe autoregressive mu awọn iṣoro iṣelọpọ aworan mu.
Fi fun didara giga ti data ti wọn ṣẹda, awọn nẹtiwọki adversarial generative (GANs) ti gba akiyesi pupọ ni awọn ọdun aipẹ.
Awọn awoṣe itọka jẹ aaye ikẹkọ iyalẹnu miiran ti o ti fi idi ararẹ mulẹ. Awọn aaye ti aworan, fidio, ati iran ohun mejeeji ti rii lilo nla fun awọn mejeeji.
Awọn awoṣe Itankale vs. GANs: Ewo ni o Mu Awọn abajade to Dara julọ jade? Ní ti ẹ̀dá, èyí ti yọrí sí ìjíròrò tí ń lọ lọ́wọ́.
Ni awọn iširo faaji mọ bi awọn GAN, meji awọn nẹtiwọki ti nhu ti wa ni ija lodi si ọkan miiran lati gbe awọn rinle sise instances ti data ti o le kọja fun onigbagbo data.
Awọn awoṣe itankale n gba diẹ sii ati siwaju sii olokiki nitori wọn pese iduroṣinṣin ikẹkọ ati awọn abajade giga fun iṣelọpọ orin ati awọn aworan.
Nkan yii yoo lọ nipasẹ awoṣe itankale ati awọn GAN ni awọn alaye, bi daradara bi wọn ṣe yatọ si ara wọn ati awọn ohun miiran diẹ.
Nitorinaa, kini Awọn Nẹtiwọọki Adversarial Generative?
Lati le ṣẹda tuntun, awọn apẹẹrẹ atọwọda ti data ti o le ṣe aṣiṣe fun data tootọ, awọn nẹtiwọọki atako ti ipilẹṣẹ (GANs) lo awọn nẹtiwọọki nkankikan meji ati da wọn si ara wọn (nitorinaa “alatako” ni orukọ).
Wọn ti lo lọpọlọpọ fun sisọ ọrọ, fidio, ati ṣiṣẹda aworan.
Idi ti GAN ni lati ṣẹda data ti a ko ṣe awari tẹlẹ lati inu data data kan pato. Igbiyanju lati ṣe afihan awoṣe gangan, pinpin data ipilẹ ti a ko mọ lati awọn apẹẹrẹ, ṣe eyi.
Ni omiiran ti a sọ, awọn nẹtiwọọki wọnyi jẹ awọn awoṣe titọ ti o gbiyanju lati kọ ẹkọ pinpin iṣiro kan pato.
Ọna ti GAN ti a lo lati ṣe iwari bi o ṣe le ṣe aṣeyọri ete yii jẹ aramada. Ni otitọ, wọn ṣe agbejade data nipa ṣiṣere ere elere meji lati ṣe agbekalẹ awoṣe aitọ.
Awọn atẹle ṣe apejuwe eto naa:
- Iyatọ ti o ni agbara lati ṣe iyatọ laarin otitọ ati data iro
- monomono ti o gbe awọn ọna tuntun lati ṣẹda data le tan ẹlẹyamẹya jẹ.
Iyatọ naa duro bi nẹtiwọọki nkankikan. Nitorina, monomono nilo lati ṣẹda aworan kan pẹlu didara to ga julọ lati tan o.
Otitọ pe awọn olupilẹṣẹ wọnyi ko ni ikẹkọ nipa lilo pinpin iṣelọpọ eyikeyi jẹ iyatọ pataki laarin awọn awoṣe autoencoder ati awọn awoṣe miiran.
Awọn ọna meji lo wa lati decompose iṣẹ isonu ti awoṣe:
- agbara lati ṣe iwọn ti o ba jẹ pe eleyato ni deede asọtẹlẹ data gidi
- data ti ipilẹṣẹ jẹ asọtẹlẹ deede nipasẹ ipin kan.
Lori iyasọtọ ti o ṣeeṣe ti o dara julọ, iṣẹ ipadanu yii lẹhinna dinku:
Nitorina awọn awoṣe jeneriki le ni ero bi awọn awoṣe idinku ijinna ati, ti o ba jẹ iyasọtọ ti o dara, bi idinku iyatọ laarin otitọ ati pinpin iṣelọpọ.
Ni otitọ, awọn iyatọ oriṣiriṣi le jẹ oojọ ati ja si ni ọpọlọpọ awọn ọna ikẹkọ GAN.
Awọn agbara ikẹkọ, eyiti o pẹlu iṣowo-pipa laarin olupilẹṣẹ ati iyasọtọ, jẹ nija lati tẹle, botilẹjẹpe o rọrun lati ṣatunṣe iṣẹ isonu ti GANs.
Ko si awọn idaniloju tun pe ẹkọ yoo ṣajọpọ. Bi abajade, ikẹkọ awoṣe GAN kan nira, nitori pe o jẹ aṣoju lati ṣiṣe kọja awọn iṣoro bii awọn gradients ti o parẹ ati ipo iṣubu (nigbati ko ba si oniruuru ninu awọn apẹẹrẹ ti ipilẹṣẹ).
Bayi, o to akoko fun Awọn awoṣe Itankale
Iṣoro naa pẹlu isọdọkan ikẹkọ GANs ti ni idojukọ nipasẹ idagbasoke awọn awoṣe itankale.
Awọn awoṣe wọnyi ro pe ilana itankale jẹ deede si ipadanu alaye ti o mu wa nipasẹ kikọlu ilọsiwaju ti ariwo (ariwo gaussian kan ni a ṣafikun ni gbogbo igba ti ilana itankale).
Idi ti iru awoṣe ni lati pinnu bi ariwo ṣe ni ipa lori alaye ti o wa ninu apẹẹrẹ, tabi, lati fi sii ni ọna miiran, iye alaye ti sọnu nitori itankale.
Ti awoṣe ba le ṣawari eyi, o yẹ ki o ni anfani lati gba apẹẹrẹ atilẹba pada ki o ṣe atunṣe pipadanu alaye ti o ṣẹlẹ.
Eyi jẹ aṣeyọri nipasẹ awoṣe itọka ti o kọlu. Ilana itankale siwaju ati ilana itusilẹ yiyipada ṣe awọn igbesẹ meji naa.
Ilana itankale siwaju pẹlu fifi ariwo Gaussian kun diẹdiẹ (ie, ilana itankale) titi ti data yoo fi doti patapata nipasẹ ariwo.
Nẹtiwọọki nkankikan ti ni ikẹkọ nigbamii nipa lilo ọna itusilẹ yiyipada lati kọ ẹkọ iṣeeṣe pinpin ipo lati yi ariwo pada.
Nibi ti o ti le ni oye siwaju sii nipa awọn itankale awoṣe.
Awoṣe Itankale Vs GANs
Gẹgẹbi awoṣe itankale, awọn GAN ṣe agbejade awọn aworan lati ariwo.
Awoṣe naa jẹ ti nẹtiwọọki olupilẹṣẹ monomono, eyiti o bẹrẹ pẹlu ariwo ti diẹ ninu awọn oniyipada imudara alaye, gẹgẹbi aami kilasi tabi fifi koodu ọrọ kan.
Abajade yẹ ki o jẹ nkan ti o dabi aworan ti o daju.
Lati ṣẹda photorealistic ati ki o ga-fidelity aworan iran, a gba GANs. Paapaa awọn iwo ojulowo diẹ sii ju awọn GAN ni a ṣejade ni lilo awọn awoṣe itankale.
Ni ọna kan, awọn awoṣe itankale jẹ deede diẹ sii ni apejuwe awọn otitọ.
Lakoko ti GAN kan gba bi ariwo laileto igbewọle tabi oniyipada karabosipo kilasi ati ṣe agbejade apẹẹrẹ ojulowo, awọn awoṣe itọka nigbagbogbo ma lọra, aṣetunṣe, ati nilo itọsọna pupọ diẹ sii.
Ko si aaye pupọ fun aṣiṣe nigba ti denoising ti lo leralera pẹlu ibi-afẹde ti ipadabọ si aworan atilẹba lati ariwo naa.
Oju-ọna ayẹwo kọọkan kọja jakejado ipele ẹda, ati pẹlu igbesẹ kọọkan, aworan naa le ni alaye diẹ sii ati siwaju sii.
ipari
Ni ipari, Nitori iwadii pataki diẹ ti a tẹjade nikan ni awọn ọdun 2020 ati 2021, awọn awoṣe itankale le ṣe ju awọn GAN lọ ni awọn ofin ti iṣelọpọ aworan.
Ni ọdun yii, OpenAI ṣe ifilọlẹ DALL-E2, Awoṣe iṣelọpọ aworan ti o gba awọn oṣiṣẹ laaye lati gba awọn awoṣe itankale kaakiri.
Botilẹjẹpe awọn GAN jẹ gige-eti, awọn idiwọ wọn jẹ ki o nira lati ṣe iwọn ati lo wọn ni awọn aaye tuntun.
Lati le ṣaṣeyọri didara apẹẹrẹ GAN-bii nipa lilo awọn awoṣe ti o da lori iṣeeṣe, ọpọlọpọ iṣẹ ni a ti fi sinu rẹ.
Fi a Reply