San fharsaingeachd, bidh modalan ginealach domhainn leithid GANs, VAEs, agus modalan fèin-ghluasadach a’ làimhseachadh duilgheadasan co-chur ìomhaighean.
Leis cho àrd sa tha an dàta a chruthaicheas iad, tha lìonraidhean nàimhdeil ginealach (GANs) air mòran aire fhaighinn anns na bliadhnachan mu dheireadh.
Tha modalan sgaoilidh na raon sgrùdaidh inntinneach eile a tha air e fhèin a stèidheachadh. Tha raointean ìomhaigh, bhidio, agus gineadh guth le chèile air feum mòr a dhèanamh airson an dithis aca.
Modalan sgaoilidh vs. GAN: Dè a bheir toraidhean nas fheàrr? Gu nàdarra, tha seo air leantainn gu deasbad leantainneach.
Anns an ailtireachd coimpiutaireachd ris an canar an GAN, tha dhà lìonraidhean neònach air an sabaid an aghaidh a chèile gus eisimpleirean de dhàta a tha air ùr-cho-chur a-mach a bheir seachad airson fìor dhàta.
Tha modalan sgaoilidh a’ fàs nas mòr-chòrdte leis gu bheil iad a’ toirt seachad seasmhachd trèanaidh agus toraidhean àrd airson ceòl agus grafaigean a dhèanamh.
Thèid an artaigil seo tron mhodal sgaoilidh agus GAN gu mionaideach, a bharrachd air mar a tha iad eadar-dhealaichte bho chèile agus beagan rudan eile.
Mar sin, dè a th’ ann an Lìonraidhean Gineadach Nàimhdeil?
Gus suidheachaidhean ùra, fuadain de dhàta a chruthachadh a dh’ fhaodadh a bhith air am mealladh airson fìor dhàta, bidh lìonraidhean nàimhdeil ginealach (GANs) a’ cleachdadh dà lìonra neural agus gan cur an aghaidh a chèile (mar sin an “nàimhdeil” san ainm).
Tha iad air an cleachdadh gu mòr airson cainnt, bhidio, agus cruthachadh dhealbhan.
Is e amas GAN dàta nach deach a lorg roimhe a chruthachadh bho sheata dàta sònraichte. Le bhith a’ feuchainn ri modail den fhìor sgaoileadh dàta neo-aithnichte a lorg bho na sampallan, nì seo.
Air an làimh eile, tha na lìonraidhean sin nam modalan so-thuigsinn a bhios a’ feuchainn ri cuairteachadh staitistigeil sònraichte ionnsachadh.
Bha an dòigh a chleachd GAN airson faighinn a-mach mar a choileanas e an t-amas seo ùr. Gu dearbh, bidh iad a 'dèanamh dàta le bhith a' cluich geama dà-chluicheadair gus modal inntinneach a leasachadh.
Tha na leanas a 'toirt cunntas air an structar:
- Eadar-dhealachadh a gheibh an comas eadar-dhealachadh a dhèanamh eadar dàta fìor agus dàta meallta
- faodaidh gineadair a thogas dòighean ùra air dàta a chruthachadh an neach-lethbhreith a mhealladh.
Tha an leth-bhreith a’ seasamh mar lìonra neural. Mar sin, feumaidh an gineadair dealbh de chàileachd àrd a chruthachadh gus a mhealladh.
Tha an fhìrinn nach eil na gineadairean sin air an trèanadh le bhith a’ cleachdadh cuairteachadh toraidh sam bith na eadar-dhealachadh mòr eadar modalan autoencoder agus modalan eile.
Tha dà dhòigh air gnìomh call a 'mhodail a dhubhadh às:
- an comas àireamhachadh a bheil an neach-leth-bhreith a’ sùileachadh dàta fìor
- tha dàta a chaidh a chruthachadh air a ro-innse gu ceart le cuibhreann.
A thaobh an lethbhreith ion-dhèanta as fheàrr, tha an gnìomh call seo air a lughdachadh an uairsin:
Mar sin faodar smaoineachadh air modalan coitcheann mar mhodalan lughdachadh astar agus, ma tha an leth-bhreith air leth freagarrach, mar lughdachadh eadar-dhealachaidh eadar an fhìor chuairteachadh agus an sgaoileadh toraidh.
Gu fìrinneach, dh’ fhaodadh diofar eadar-dhealachaidhean a bhith air an cleachdadh agus grunn dhòighean trèanaidh GAN a thoirt gu buil.
Tha an daineamaigs ionnsachaidh, a tha a’ toirt a-steach malairt eadar an gineadair agus an leth-bhreith, dùbhlanach a leantainn, a dh’ aindeoin gu bheil e sìmplidh gnìomh call GANs atharrachadh.
Chan eil cinnt sam bith ann cuideachd gun tig ionnsachadh còmhla. Mar thoradh air an sin, tha e duilich modal GAN a thrèanadh, leis gu bheil e àbhaisteach a bhith a’ ruith thairis air duilgheadasan leithid caiseadan a’ dol à sealladh agus tuiteam modh (nuair nach eil iomadachd anns na sampallan a chaidh a chruthachadh).
A-nis, tha an t-àm ann airson Modalan Diffusion
Chaidh dèiligeadh ris an duilgheadas le co-ghluasad trèanaidh GANs tro bhith a’ leasachadh mhodalan sgaoilidh.
Tha na modailean sin a’ gabhail ris gu bheil pròiseas sgaoilidh co-ionann ri call fiosrachaidh mar thoradh air bacadh adhartach fuaim (tha fuaim gaussian air a chur ris aig a h-uile ceum den phròiseas sgaoilidh).
Is e adhbhar a leithid de mhodail faighinn a-mach mar a tha fuaim a’ toirt buaidh air an fhiosrachadh a tha an làthair anns an sampall, no, ann an dòigh eile, dè an ìre de dh’ fhiosrachadh a thèid a chall mar thoradh air sgaoileadh.
Mas urrainn do mhodail seo obrachadh a-mach, bu chòir dha a bhith comasach air an sampall tùsail fhaighinn air ais agus an call fiosrachaidh a thachair a thoirt air falbh.
Tha seo air a choileanadh tro mhodail sgaoilidh denoising. Tha pròiseas sgaoilidh air adhart agus pròiseas sgaoilidh air ais a’ dèanamh suas an dà cheum.
Tha am pròiseas sgaoileadh air adhart a’ toirt a-steach fuaim Gaussian mean air mhean (ie, am pròiseas sgaoilidh) gus am bi an dàta air a thruailleadh gu tur le fuaim.
Tha an lìonra neural air a thrèanadh às deidh sin a’ cleachdadh an dòigh sgaoilidh cùil gus ionnsachadh mu na coltachd sgaoilidh cumhach gus am fuaim a thionndadh air ais.
An seo faodaidh tu barrachd a thuigsinn mu dheidhinn an modail sgaoilidh.
Modail Sgaoileadh Vs GANs
Coltach ri modail sgaoilidh, bidh GANn a’ toirt a-mach dealbhan bho fhuaim.
Tha am modail air a dhèanamh suas de lìonra neural gineadair, a thòisicheas le fuaim caochladair suidheachadh fiosrachail, leithid bileag clas no còdachadh teacsa.
Bu chòir gum biodh an toradh an uairsin rudeigin a tha coltach ri ìomhaigh fhìor.
Gus ginealaichean dhealbhan photorealistic agus àrd-dhìlseachd a chruthachadh, bidh sinn a’ fastadh GANn. Tha eadhon seallaidhean lèirsinneach nas reusanta na GANn air an toirt a-mach a’ cleachdadh modalan sgaoilidh.
Ann an dòigh, tha modalan sgaoilidh nas cruinne ann a bhith a’ toirt cunntas air an fhìrinn.
Fhad ‘s a bhios GAN a’ toirt a-steach fuaim air thuaiream no caochladair suidheachadh clas agus a ’toirt a-mach sampall reusanta, bidh modalan sgaoilidh gu tric nas slaodaiche, ath-aithriseach, agus feumaidh iad tòrr a bharrachd stiùiridh.
Chan eil mòran rùm ann airson mearachd nuair a thèid diùltadh a chuir an sàs a-rithist is a-rithist leis an amas tilleadh chun ìomhaigh thùsail bhon fhuaim.
Thèid gach puing-seic troimhe tron ìre cruthachaidh, agus le gach ceum, is dòcha gum faigh an dealbh barrachd is barrachd fiosrachaidh.
Co-dhùnadh
Gu crìch, Mar thoradh air glè bheag de rannsachadh cudromach nach deach fhoillseachadh ach anns na 2020n agus 2021, faodaidh modalan sgaoilidh a-nis coileanadh nas fheàrr na GANn a thaobh synthesis dhealbhan.
Am-bliadhna, chuir OpenAI air bhog DALL-E2, modail cinneasachadh ìomhaighean a leigeas le cleachdaichean modalan sgaoilidh fhastadh.
Ged a tha GANn aig fìor thoiseach, tha na cuingeadan aca ga dhèanamh dùbhlanach an sgèile agus an cleachdadh ann an co-theacsan ùra.
Gus càileachd sampall coltach ri GAN a choileanadh a’ cleachdadh mhodalan stèidhichte air coltas, chaidh tòrr obrach a chuir a-steach ann.
Leave a Reply