Table of Contents[Qari][muuji]
AI cusub oo la wanaajiyey ayaa wanaajisay awoodaha, fahamka, iyo awoodda lagu soo saaro sawirro heer sare ah. Waxaa laga yaabaa inaad beryahan dambe la kulantay sawirro yaab leh oo madadaalo leh oo sabbaynaya intarneedka.
Eeyga Shiba Inu wuxuu ku lebbisan yahay beret iyo turtleneck madow. Iyo otter badeed oo u dhiganta hannaankii Nederlaand ee Vermeer's "Gabadha Dhago Luul leh." Waxaana jira koob maraq ah oo u eg bahal dhogor leh.
Sawiradan ma aysan abuurin farshaxan bini'aadam.
Taa baddalkeeda, DALL-E 2, nidaam cusub oo AI ah oo u beddeli kara sharraxaadaha qoraalka sawirada, iyaga ayaa abuuray.
Kaliya qor waxaad rabto inaad aragto, AI-guna wuxuu kuu abuuri doonaa - si faahfaahsan, tayo fiican, iyo, xaaladaha qaarkood, hal-abuurnimo dhab ah. Maqaalkan, waxaan si qoto dheer u eegi doonaa OpenAI diraasaddii ugu dambeysay, DALL.E 2, iyo sidoo kale sida ay u shaqeyso, iyo qaar kaloo badan. Aan bilowno.
Marka, maxaa dhab ahaan ah DALL.E 2?
DALL-E 2 waa "qaab abuur", nooc ka mid ah algorithm barashada mashiinka kaas oo soo saara wax soo saar adag halkii uu ka samayn lahaa saadaalin ama hawlo kala soocida xogta gelinta.
Waxaad siisaa DALL-E 2 sharaxaad qoran, waxayna abuurtaa sawir u dhigma. Marka la isku daro fikradaha, tayada, iyo qaababka, OpenAI's DALLE 2 waxa ay soo saari kartaa sawir cusub, sawiro macquul ah iyo farshaxan ka yimid sharaxaad luqadeed oo aasaasi ah.
Nooca ugu dambeeyay, DALLE 2, ayaa la sheegay inuu yahay mid la taaban karo, oo awood u leh samaynta sawiro qoraallo ah oo qaraaro sare ah iyo noocyo kala duwan oo noocyo hal abuur leh. Tusaale ahaan, sawirada hoose (laga bilaabo DALL-E 2 blog post) waxaa abuuray sharaxaadda "Astronaut fuushan faras."
Mid ka mid ah sharraxaaddu waxay soo gabagabaynaysaa, "sida sawir-gacmeed qalin-qoritaan ah," halka kan kalena uu ku soo gabagabeynayo, "qaab sawir leh."
Waxa kale oo ay ku beddeli kartaa sawirrada jira si sax ah oo yaab leh. Sidaa darteed, waxaad ku dari kartaa ama tirtiri kartaa walxaha adigoo ilaalinaya midabada, milicsiga, iyo hooska, dhammaan inta aad ilaalinayso muuqaalka asalka ah.
Sidee u shaqeeyaan?
DALL-E 2 waxay isticmaashaa CLIP iyo moodooyinka fidinta, laba casri ah waxbarashada qoto dheer habab la sameeyay sanadihii ugu dambeeyay. Si kastaba ha ahaatee, waxay ku salaysan tahay fikrad la mid ah sida qoto dheer oo dhan shabakadaha neerfaha: waxbarashada matalaadda. CLIP isku mar waxay tabobartaa laba shabakadaha neerfaha sawiro iyo qoraalo.
Shabakad ka mid ah ayaa barata muuqaallada muuqaalka ah ee sawirka, halka tan kalena ay barato matalaadda qoraalka. Inta lagu jiro tababarka, labada shabakadood waxay isku dayaan inay wax ka beddelaan cabbirkooda si sawirro iyo sharraxaadyo isbarbar-dhigga ahi ay u keenaan isku-xidhnaansho isku mid ah.
"Diffusion", oo ah nooc ka mid ah tusaalaha wax-soo-saarka ee baranaya samaynta sawirro isagoo si tartiib tartiib ah u qaylinaya oo diidaya muunaddiisa tababarka, waa habka kale ee barashada mashiinka ee laga isticmaalo DALL-E 2. Noocyada faafinta waxay la mid yihiin autoencoders taas oo u beddeleysa xogta gelinta ku darista matalaadda ka dibna isticmaal macluumaadka gundhigga si aad dib ugu abuurto xogta asalka ah.
Isticmaalka OpenAI's qaabka luqadda CLIP, oo ku xidhi karta sharraxaadda qoraalka iyo sawiro, waxay marka hore u tarjumeysaa degdegga qoran qaab dhexdhexaad ah oo ku daraya sifooyinka muhiimka ah ee sawirku leeyahay si uu u waafaqo degdeggaas (sida uu qabo CLIP).
Midda labaad, DALL-E 2 waxay abuurtaa CLIP-u hoggaansanaan sawirka iyadoo la isticmaalayo qaabka fidinta, kaas oo ah shabakad neerfaha ah.
Sawirrada qalloocan ee leh pixels random, moodooyinka fidinta waa la bartaa. Waxay bartaan sida loo soo celiyo sawirada qaabkoodii asalka ahaa. Moodooyinka faafinta waxay soo saari karaan sawirro tayo sare leh, gaar ahaan marka la isticmaalo iyadoo lala kaashanayo hab hagitaan ah oo mudnaanta siinaya saxnaanta kala duwanaanshaha.
Natiijo ahaan, qaabka faafinta wuxuu qaataa pixels random wuxuuna isticmaalaa CLIP si uu ugu beddelo sawir cusub oo u dhigma erayga degdega ah. Sababtoo ah fikradda fidinta, DALL-E 2 waxay soo saari kartaa sawirro ka sarreeya DALL-E.
DALL.E 2 isticmaalka kiis
Labaatankii sano ee la soo dhaafay, aragtida kombiyuutarka tignoolajiyadu waxay ka soo gudubtay fikrad fudud una gudubtay horumar wayn. In kasta oo horumarkaas la sameeyay, moodooyinka aqoonsiga sawirka iyo shayga ayaa weli wajahaya caqabado la taaban karo nolol maalmeedka. Maqnaanshaha xog-ururinta waa mid ka mid ah cilladaha ugu muhiimsan ee aqoonsiga sawirka iyo aragtida kombuyuutarka. Sababtoo ah waxaa jira yaraanta xogta labada daraf, tababarka moodooyinka aqoonsiga sawirka si loo bixiyo boqolkiiba 100 natiijooyin sax ah ayaa ku dhow inay adagtahay.
Nasiib wanaag, qaabka cusub ee barashada mashiinka OpenAI wuxuu dabooli karaa farqiga u dhexeeya tignoolajiyada. DALLE 2 waxa uu awood u leeyahay in uu soo saaro sawiro cajiib ah oo ku salaysan sharraxaadda qoraalka. Soo saarista sawirka beenta ah waxay ku siin kartaa xogta moodooyinka aqoonsiga sawirka iyadoo lagu saleynayo shuruudahooda. Maqnaanshaha xogtu waxay turunturooyin muhiim ah u tahay aqoonsiga shayga iyo sawirka.
Xilligii dhijitaalka ahaa, xog-ururinta waa meel walba, haddana waxaan wali raadineynaa jid-gaabyo lagu quudiyo moodalka AI, si ay u bixiso natiijooyin wanaagsan. Si kastaba ha ahaatee, ma fududa in la tababaro qaabka aqoonsiga sawirka. Waxay u baahan tahay tiro badan oo xog ah oo kala duwanaansho yar leh, kuwaas oo laga yaabo inaynaan awoodin inaynu si fudud u soo saarno.
Haddaba, waa maxay jawaabta: Jawaabtu waa DALLE 2. Sawir-dhaliyaha OpenAI, oo leh awood uu ku soo saaro sawirro qoraallo ah oo beddelo kuwa jira, ayaa gacan ka geysan kara in la xakameeyo farqiga. Tani waxay gacan ka geysan doontaa abuurista xogta tababarka dheeraadka ah iyadoo sidoo kale yareyn doonta cadadka calaamadaynta aadanaha ee loo baahan yahay. Inkasta oo faa'iidada muhiimka ah, waa inaad ka warqabtaa soo saarista sawirada been abuurka ah iyo sawirada ka saaraya ku darida. Tani waxay horseedi kartaa hababka ogaanshaha sawirka oo soo saara natiijooyin dhexdhexaad ah.
Xaddidaadda
DALL.E 2 ayaa laga yaabaa inay si fiican u yeelato saameyn waxyeello leh haddii ay ku dhacdo gacmo khaldan, sida uu qabo OpenAI. Dunida maanta ee been-abuurka qoto dheer, qaabka ayaa si sahlan loo isticmaali karaa in lagu faafiyo macluumaadka beenta ah ama sawirada cunsuriyadda, taas oo ah sababta OpenAI ay u ogolaato kaliya horumariyeyaasha inay isticmaalaan DALL.2 martiqaad. Qaabku waa inuu u hoggaansamaa xaddidaadda nuxurka adag dhammaan talooyinka ay hesho.
Si looga saaro kartida DALL.E 2 abuurista sawir kasta oo cadaawad ama rabshad leh, xogta xogta waxaa la sameeyay iyada oo aan wax hub ah oo dilaa ah Iyadoo OpenAI ay sheegtay inay qorsheynayso inay u beddelo API mustaqbalka, kiiska DALL.E 2, waxay diyaar u tahay inay si taxadar leh u sii wado.
Ugu Dambeyn
DALL-E 2 waa cilmi baaris kale oo OpenAI oo xiiso leh oo furay albaabka codsiyada cusub.
Mid ka mid ah tusaalaha ayaa ah abuurista xog-ururin aad u weyn si loo daboolo mid ka mid ah caqabadaha ugu waaweyn ee aragga kombuyuutarka – xogta. Halka kiis dhaqaale ee barnaamijyo badan oo ku saleysan DALL-E lagu go'aamin doono qiimaha iyo siyaasadaha OpenAI u dejiso isticmaaleyaasheeda API, dhammaantood waxay shaki la'aan hore u marin doonaan soo saarista sawirka.
Leave a Reply