Мундариҷа[Пинҳон кардан][Намоиш]
Умуман, моделҳои амиқи тавлидкунанда ба монанди GAN, VAE ва моделҳои авторегрессивӣ мушкилоти синтези тасвирро ҳал мекунанд.
Бо дарназардошти сифати баланди маълумоте, ки онҳо эҷод мекунанд, шабакаҳои генеративии рақобат (GANs) дар солҳои охир таваҷҷуҳи зиёд доранд.
Моделҳои диффузия боз як соҳаи ҷолиби омӯзиш мебошанд, ки худро таъсис додааст. Соҳаҳои тавлиди тасвир, видео ва овоз ҳарду барои ҳардуи онҳо истифодаи васеъ пайдо кардаанд.
Моделҳои диффузия ва GAN: Кадомаш натиҷаҳои беҳтар меорад? Табиист, ки ин боиси мудокимаи мудокима гардид.
Дар меъмории ҳисоббарорӣ бо номи GAN маълум аст, ду шабакаҳои нейралӣ барои тавлиди мисолҳои нав синтезшудаи додаҳо, ки метавонанд барои маълумоти ҳақиқӣ гузаранд, бар зидди ҳамдигар мубориза мебаранд.
Моделҳои диффузия торафт маъмултар мешаванд, зеро онҳо устувории омӯзиш ва натиҷаҳои баландро барои истеҳсоли мусиқӣ ва графика таъмин мекунанд.
Ин мақола модели диффузия ва GAN-ро ба таври муфассал баррасӣ хоҳад кард, инчунин фарқияти онҳо аз ҳамдигар ва чанд чизи дигар.
Пас, шабакаҳои генеративии душман чист?
Барои эҷод кардани мисолҳои нави сунъии додаҳо, ки метавонанд бо маълумоти воқеӣ иштибоҳ карда шаванд, шабакаҳои генеративии рақобат (GANs) ду шабакаи нейронро истифода мебаранд ва онҳоро ба ҳам муқобил мегузоранд (ҳамин тавр “рақиб” дар ном).
Онҳо барои эҷоди сухан, видео ва тасвирҳо васеъ истифода мешаванд.
Ҳадафи GAN эҷод кардани маълумоти қаблан кашфнашуда аз маҷмӯи додаҳои мушаххас мебошад. Кӯшиши баҳодиҳии модели тақсимоти воқеии маълумотҳои номаълум аз намунаҳо ин корро мекунад.
Ба таври дигар гуфта мешавад, ки ин шабакаҳо моделҳои номуайян мебошанд, ки кӯшиши омӯхтани тақсимоти мушаххаси оморӣ доранд.
Усуле, ки GAN барои дарёфти чӣ гуна амалӣ кардани ин ҳадаф истифода бурд, нав буд. Дарвоқеъ, онҳо тавассути як бозии ду-плеер барои таҳияи модели номуайян маълумот истеҳсол мекунанд.
Ин сохторро тавсиф мекунад:
- Дискриминатор, ки қобилияти фарқ кардани маълумоти аслӣ ва қалбакиро ба даст меорад
- генераторе, ки роҳҳои нави эҷоди маълумотро интихоб мекунад, метавонад дискриминаторро фиреб диҳад.
Дискриминатор ҳамчун шабакаи нейронӣ баромад мекунад. Аз ин рӯ, генератор бояд тасвиреро бо сифати баланд эҷод кунад, то онро фиреб диҳад.
Далели он, ки ин генераторҳо бо истифода аз ягон тақсимоти баромад омӯзонида нашудаанд, фарқияти назаррас байни моделҳои автоматӣ ва дигар моделҳо мебошад.
Ду роҳи тақсим кардани функсияи гумшудаи модел вуҷуд дорад:
- қобилияти муайян кардани миқдор, агар дискриминатор маълумоти воқеиро дақиқ пешбинӣ кунад
- маълумоти тавлидшуда аз ҷониби як қисми дақиқ пешгӯӣ карда мешавад.
Дар беҳтарин дискриминатори имконпазир, ин функсияи талафот пас аз он кам карда мешавад:
Аз ин рӯ, моделҳои умумиро метавон ҳамчун моделҳои минимизатсияи масофа ва агар дискриминатор идеалӣ бошад, ҳамчун кам кардани фарқият байни тақсимоти ҳақиқӣ ва истеҳсолшуда баррасӣ кард.
Дар асл, ихтилофҳои гуногун метавонанд истифода шаванд ва ба усулҳои гуногуни омӯзиши GAN оварда расонанд.
Динамикаи омӯзиш, ки мубодилаи байни генератор ва дискриминаторро дар бар мегирад, риоя кардан душвор аст, гарчанде ки он танзим кардани функсияи талафоти GANs осон аст.
Инчунин кафолат дода намешавад, ки омӯзиш ба ҳам наздик мешавад. Дар натиҷа, омӯзиши модели GAN душвор аст, зеро маъмулан бо мушкилоте ба мисли нопадид шудани градиентҳо ва фурӯпошии режим (ҳангоми мавҷуд набудани гуногунии намунаҳои тавлидшуда) маъмул аст.
Ҳоло вақти он барои Моделҳои диффузия аст
Мушкилоти конвергенсияи омӯзишии GANs тавассути таҳияи моделҳои диффузия ҳал карда шудааст.
Ин моделҳо тахмин мекунанд, ки раванди паҳншавӣ ба талафоти иттилоотие, ки дар натиҷаи дахолати прогрессивии садо ба вуҷуд омадааст (дар ҳар як марҳилаи ҷараёни паҳншавӣ садои гаусӣ илова карда мешавад) баробар аст.
Мақсади чунин модел муайян кардани он аст, ки садо ба иттилооти дар намуна мавҷудбуда чӣ гуна таъсир мерасонад ё ба ибораи дигар, дар натиҷаи паҳншавӣ чӣ қадар иттилоот гум мешавад.
Агар модел инро фаҳмад, он бояд қодир бошад, ки намунаи аслиро баргардонад ва талафоти иттилооти рухдодаро баргардонад.
Ин тавассути модели диффузияи деноизис анҷом дода мешавад. Раванди диффузияи пеш ва раванди диффузияи баръакс ду марҳиларо ташкил медиҳанд.
Раванди паҳншавии пешакӣ тадриҷан илова кардани садои Гауссро дар бар мегирад (яъне раванди диффузия) то он даме, ки маълумот бо садо комилан олуда шавад.
Баъдан шабакаи нейрон бо истифода аз усули диффузияи баръакс омӯзонида мешавад, то эҳтимолияти тақсимоти шартиро барои баргардонидани садо омӯзад.
Дар ин ҷо шумо метавонед дар бораи он бештар фаҳмед модели диффузия.
Модели диффузия ва GANs
Мисли модели диффузия, GANҳо аз садо тасвирҳо истеҳсол мекунанд.
Модел аз шабакаи нейронии генератор иборат аст, ки бо садои баъзе тағирёбандаҳои иттилоотии кондитсионер, ба монанди тамғаи синф ё рамзгузории матн оғоз мешавад.
Пас, натиҷа бояд чизе бошад, ки ба тасвири воқеӣ монанд бошад.
Барои эҷод кардани наслҳои тасвири фотореалистӣ ва дақиқ, мо GANҳоро истифода мебарем. Ҳатто бо истифода аз моделҳои диффузионӣ назар ба GANҳо визуалӣ бештар воқеӣ истеҳсол карда мешаванд.
Ба як андоза, моделҳои диффузия дар тавсифи далелҳо дақиқтаранд.
Дар ҳоле, ки GAN ҳамчун садои тасодуфии вуруд ё тағирёбандаи кондитсионерии синфӣ мегирад ва намунаи воқеиро мебарорад, моделҳои диффузия аксар вақт сусттар, такроршавандаанд ва ба роҳнамоии бештар ниёз доранд.
Ҳангоми истифодаи такрорӣ бо мақсади баргаштан ба тасвири аслӣ аз ғавғо барои хатогӣ ҷои зиёд вуҷуд надорад.
Ҳар як гузаргоҳ дар тӯли марҳилаи эҷод мегузарад ва бо ҳар як қадам, тасвир метавонад маълумоти бештар ва бештар ба даст орад.
хулоса
Хулоса, аз сабаби чанд тадқиқоти назаррасе, ки танҳо дар солҳои 2020 ва 2021 нашр шуда буданд, моделҳои диффузия ҳоло метавонанд аз GAN аз ҷиҳати синтези тасвирҳо бартарӣ дошта бошанд.
Имсол OpenAI оғоз ёфт DALL-E2, модели истеҳсоли тасвир, ки ба таҷрибаомӯзон имкон медиҳад, ки моделҳои диффузиро истифода баранд.
Гарчанде ки GANҳо пешрафтаанд, маҳдудиятҳои онҳо миқёс ва истифодаи онҳоро дар заминаҳои нав душвор мегардонанд.
Барои ноил шудан ба сифати намуна ба GAN бо истифода аз моделҳои эҳтимолӣ, дар он корҳои зиёде анҷом дода шудаанд.
Дин ва мазҳаб