Мундариҷа[Пинҳон кардан][Намоиш]
Моделҳои бузурги матн ба тасвир дар рушди AI тавассути тавлиди синтези тасвири баландсифат ва гуногунҷанба аз як дархости матни додашуда пешрафти назаррас ба даст оварданд.
Ин моделҳо наметавонанд тасвирҳои беназири субъектҳоро дар танзимоти гуногун синтез кунанд ё намуди субъектҳоро дар маҷмӯи истинодҳои додашуда такрор кунанд.
Технологияҳои нав нашршуда ба монанди DALL.E2 OpenAI ё StabilityAI Диффузияи устувор ва Midjourney аллакай интернетро бо тӯфон мегиранд. Ҳоло вақти танзим кардани натиҷаҳо расидааст. Аммо чӣ тавр?
Google DreamBooth AI расид.
DreamBooth дорои қобилияти шинохтани мавзӯи тасвир, ҷудо кардани он аз контексти аслии он ва сипас дақиқ синтез кардани он ба контексти нави дилхоҳ. Илова бар ин, он метавонад бо генераторҳои ҳозираи тасвири AI истифода шавад.
Дар ин мақола, мо ба DreamBooth, истифодаи он, дастури дарсӣ, маҳдудиятҳои он ва ғайра аз назар гузаронем.
Dreambooth чист?
хобгоҳ, модели нави паҳншавии матн ба тасвир, аз ҷониби Google пешниҳод карда шуд. Саволи хаттӣ метавонад ҳамчун роҳнамо аз ҷониби Google DreamBooth AI барои тавлиди доираи васеи аксҳои мавзӯи интихобшудаи корбар дар танзимоти гуногун истифода шавад.
Як гурӯҳи тадқиқотӣ аз Донишгоҳи Бостон ва Google DreamBooth-ро таҳия карданд, як усули пешрафтаи тағир додани моделҳои матн ба тасвир, ки аз омӯзиши васеъ гузаштаанд.
Консепсияи умумӣ хеле содда аст: онҳо мехоҳанд луғати забонро афзоиш диҳанд, то идентификаторҳои ғайриоддӣ бо мавзӯъҳои фармоишӣ, ки корбарон метавонанд муайян кунанд, алоқаманд бошанд.
Ҳадафи асосии модел ин пайваст кардани корбарон ба модели паҳншавии матн ба тасвир бо додани захираҳое, ки ба онҳо лозим аст, то тасвирҳои фотореалистии мисолҳои мавзӯи интихобкардаи худро таҳия кунанд.
Дар натиҷа, ин техника барои ҷамъбасти мушкилот дар як қатор ҳолатҳо хуб кор мекунад.
DreamBooth-и Google аз абзорҳои қаблии матн ба тасвир фарқ мекунад, масалан DALL-E2, Диффузияи устуворва Миёни сафар, ки он ба корбарон имкон медиҳад, ки тасвири мавзӯъро бештар назорат кунанд, то ба онҳо имкон диҳанд, ки модели диффузияро бо истифода аз воридоти матнӣ идора кунанд.
Вижагиҳо
- DreamBooth AI метавонад модели матн ба тасвирро бо 3-5 тасвир такмил диҳад.
- Аксҳои аслии фотореалистиро бо DreamBooth AI сохтан мумкин аст.
- Илова бар ин, DreamBooth AI метавонад аксҳои мавзӯъро аз паҳлӯҳои гуногун эҷод кунад.
Ариза
Намоишҳои санъат
Ин вазифа махсусан аз интиқоли услуб фарқ мекунад, ки семантикаи саҳнаи сарчашмаро нигоҳ дошта, услуби тасвири дигарро ба саҳнаи аслӣ нигоҳ медорад.
Дар асоси равиши эҷодӣ, AI метавонад тағироти назарраси саҳнаро ҳангоми нигоҳ доштани мушаххасоти мушаххас ва мавзӯъҳои мавзӯъ анҷом диҳад.
Тағйири моликият
Хусусиятҳои мисоли мавзӯъ метавонанд аз ҷониби DreamBooth AI тағир дода шаванд.
Аксессуаризатсия
Композитсияи қавии пеш аз модели насл он чизест, ки қобилияти DreamBooth AI-ро барои оро додани ашё ин қадар ҷолиб мегардонад.
Аз нав контекстизатсия
DreamBooth AI метавонад барои мисоли муайяни мавзӯъ тасвирҳои фарқкунандаро бо роҳи додани як модели омӯзонидашуда ҳукме, ки идентификатори беназир ва исми синфро дар бар мегирад, тавлид кунад.
Он метавонад мавзӯъро дар мавқеъҳои беназир, қаблан шуниданашуда, артикулятсияҳо ва сохтори саҳна эҷод кунад, на тағир додани муҳити атроф. Инъикосҳо ва сояҳои воқеӣ, инчунин таъсири мутақобилаи байни субъект ва объектҳои атроф.
Дарси Dreambooth
Дар ин дарс, мо пайравӣ хоҳем кард Дафтарчаи Google Collab, ва ман ба шумо тавассути он роҳ хоҳам дод, ки ин шуморо водор мекунад, ки онро мустақилона фаҳмед ва истифода баред.
Танзими GPU ва насби китобхонаҳо
Муайян кардани кадом навъҳои GPU ва VRAM, қадами аввал аст. Насб кардани якчанд талабот ва вобастагӣ низ зарур аст. Танҳо тугмаи бозиро пахш кунед ва пас интизор шавед, ки он ба итмом расад.
Дар Huggingface ҳисоб эҷод кунед ва нишона эҷод кунед
Қадами навбатӣ сабти номи Huggingface аст. Вақте ки шумо анҷом додед, танзимотро дар кунҷи рости боло клик кунед. Шумо дар саҳифаи оянда хоҳед расид.
Токен ва номро мувофиқи дархост аз ин ҷо созед. Токен бояд нусхабардорӣ ва ба Google collab дар чашмаки зер часбонда шавад.
Xformers насб кунед
Дар ин марҳила, шумо метавонед танҳо тугмаи бозиро пахш кунед, то xformers -ро бо пахш кардани вақти корӣ насб кунед.
Ба Drive пайваст шавед
Акнун, шумо танҳо бояд ин ячейкаро иҷро кунед, то ба гардонандаи google пайваст шавед.
Саволро ворид кунед
Дар чашмаки зерин шумо танҳо бояд дархостро ворид кунед.
Боркунии тасвирҳо
Дар ин қадам, шумо бояд танҳо тасвирҳоеро, ки мехоҳед омӯзиш диҳед, бор кунед.
Модели AI-ро омӯзонед
Ин марҳилаи муҳимтарин аст, зеро шумо DreamBooth-ро барои омӯзиши модели нави AI дар асоси ҳама аксҳои истинодҳои пешниҳодкардаи худ истифода хоҳед бурд. Шумо бояд диққати худро ба ду майдони вуруд маҳдуд кунед. "— дархости мисол" параметри аввал аст. Шумо бояд дар ин ҷо номи хеле мушаххасро пешниҳод кунед.
Далели '-рӯйхати консепсия' майдони дуюми вуруди муҳим аст. Он бояд барои мувофиқ кардани номе, ки дар бахши "Тағйир додани дархост" истифода мешавад, тағир дода шавад.
Тасвирҳои AI эҷод кунед
Тасвирҳои AI дар ин марҳила эҷод карда мешаванд, ки дар он шумо метавонед дастурҳои матниро ворид кунед.
Маҳдудиятҳои Dreambooth
- Сатри фармон монеа барои такрор кардани мавзӯъ бо дараҷаи баланди тафсилот мегардад. DreamBooth метавонад контексти мавзӯъро тағир диҳад, аммо агар модел мехоҳад худи мавзӯъро тағир диҳад, дар чаҳорчӯба мушкилот вуҷуд дорад.
- Масъалаи дигар аз ҳад зиёд мувофиқ кардани тасвири баромад ба тасвири воридотӣ мебошад. Агар тасвирҳои кофӣ надошта бошанд, мавзӯъ метавонад баррасӣ нашавад ё метавонад бо контексти тасвирҳои пешниҳодшуда омехта карда шавад. Вақте ки контекст барои насли аҷиб пурсида мешавад, ҳамон чизе рӯй медиҳад.
хулоса
Барои истеҳсоли натиҷаҳо аз як вуруди матн, қисми зиёди моделҳои матн ба тасвир миллионҳо параметрҳо ва китобхонаҳоро талаб мекунанд.
DreamBooth ба даст овардани мундариҷа ва истифодаи истеъмолкунандагонро тавассути талаб кардани танҳо ворид кардани се то панҷ акси мавзӯъ дар якҷоягӣ бо заминаи матнӣ содда мекунад.
Дин ва мазҳаб