Преглед садржаја[Сакрити][Прикажи]
Велики модели од текста до слике направили су значајан напредак у развоју вештачке интелигенције тако што су произвели висококвалитетну и разноврсну синтезу слика из датог текстуалног одзивника.
Ови модели нису у стању да синтетишу јединствене репрезентације субјеката у различитим окружењима или да реплицирају изглед субјеката у датом референтном скупу.
Нове технологије као што су ОпенАИ ДАЛЛ.Е2 или СтабилитиАИ Стабле Диффусион и Мидјоурнеи већ освајају интернет. Сада је време да прилагодите резултате. Али како?
Гоогле ДреамБоотх АИ је стигао.
ДреамБоотх има способност да препозна тему слике, деконструише је из њеног првобитног контекста, а затим је прецизно синтетизује у нови жељени контекст. Поред тога, може се користити са тренутним АИ генераторима слике.
У овом чланку ћемо детаљно погледати ДреамБоотх, његову употребу, водич, ограничења и још много тога.
Шта је Дреамбоотх?
ДреамБоотх, потпуно нови модел дифузије текста у слику, представио је Гоогле. Гоогле ДреамБоотх АИ може користити писани упит као упутство за генерисање широког спектра фотографија одабраног субјекта корисника у различитим подешавањима.
Истраживачка група са Универзитета у Бостону и Гугла развила је ДреамБоотх, најсавременију технику за измену модела текста у слику који су прошли опсежну претходну обуку.
Општи концепт је прилично једноставан: они желе да повећају речник језичке визије тако да су необични ИД-ови токена повезани са прилагођеним темама које корисници могу да дефинишу.
Главни циљ модела је да повеже кориснике са модел дифузије текста у слику дајући им ресурсе који су им потребни да произведу фотореалистичне репрезентације инстанци њиховог одабраног предмета.
Као последица тога, чини се да ова техника добро функционише за сумирање изазова у низу ситуација.
Гоогле-ов ДреамБоотх се разликује од претходних алата за претварање текста у слику, као нпр ДАЛЛ-Е2, Стабле Диффусион, и Мидјоурнеи, у томе што корисницима даје већу контролу над сликом теме пре него што им дозволи да манипулишу моделом дифузије користећи уносе засноване на тексту.
Карактеристике
- ДреамБоотх АИ би могао да побољша модел текста у слику са 3-5 слика.
- Оригиналне фотореалистичне фотографије се могу креирати помоћу ДреамБоотх АИ.
- Поред тога, ДреамБоотх АИ може да креира фотографије теме из више углова.
апликација
Арт Рендитионс
Овај задатак се посебно разликује од преноса стила, који задржава семантику изворне сцене док укључује стил друге слике у оригиналну сцену.
На основу креативног приступа, вештачка интелигенција може да изврши значајне измене сцене уз задржавање специфичности идентификације и инстанце теме.
Проперти Модифицатион
ДреамБоотх АИ може модификовати карактеристике предметне инстанце.
Аццессоризатион
Снажна композиција пре генерацијског модела је оно што чини способност ДреамБоотх АИ да украшава објекте тако занимљивом.
Реконтекстуализација
ДреамБоотх АИ може да произведе карактеристичне слике за одређени предмет тако што ће обученом моделу дати реченицу која укључује јединствени идентификатор и именицу класе.
Може да генерише субјект у јединственим, раније нечувеним положајима, артикулацијама и структури сцене уместо да мења окружење. Реалистичне рефлексије и сенке, као и интеракције између субјекта и околних објеката.
Дреамбоотх туториал
У овом водичу ћемо пратити Бележница Гоогле Цоллаб, а ја ћу вас провести кроз то, што ће вам помоћи да разумете и користите сами.
Подешавање ГПУ-а и инсталирање библиотека
Први корак је сазнање које врсте ГПУ-а и ВРАМ-а су доступне. Такође је неопходно инсталирати неколико захтева и зависности. Једноставно притисните дугме за репродукцију, а затим сачекајте да се заврши.
Направите налог на Хуггингфаце-у и генеришете токен
Следећи корак је регистрација за Хуггингфаце налог. Када завршите, кликните на подешавања у горњем десном углу. Стићи ћете на следећу страницу.
Креирајте токен и име према захтеву одавде. Токен треба копирати и налепити у Гоогле сарадњу у ћелији испод.
Инсталирајте кформерс
У овој фази, можете једноставно притиснути дугме за репродукцију да бисте инсталирали кформерс кликом на рунтиме.
Повежите се са Диском
Сада само треба да покренете ову ћелију да бисте се повезали са Гоогле диском.
Унесите упит
У следећој ћелији морате само да унесете промпт.
Учитавање слика
У овом кораку, само морате да отпремите слике које желите да тренирате.
Воз АИ модел
Ово је најважнија фаза, јер ћете користити ДреамБоотх за обуку новог АИ модела на основу свих ваших достављених референтних фотографија. Морате ограничити своју пажњу на два поља за унос. „—инстанца промпт“ је први параметар. Овде морате навести веома јасно име.
Аргумент '–цонцепт лист' је друго критично поље за унос. Мора се преименовати тако да одговара оном који се користи у одељку „Промени промпт“.
Генеришите АИ слике
АИ слике ће бити креиране у овој фази, где можете да унесете текстуална упутства.
Дреамбоотх Лимитатионс
- Командна линија постаје препрека прављењу итерација у теми са високим степеном детаља. ДреамБоотх може да промени контекст субјекта, али ако модел жели да промени сам субјект, постоје проблеми са оквиром.
- Други проблем је претерано прилагођавање излазне слике улазној слици. Ако нема довољно слика, тема се можда неће узети у обзир или се може уклопити у контекст послатих слика. Када се пита контекст за непарну генерацију, дешава се иста ствар.
Zakljucak
За производњу излаза из једног уноса текста, већина модела текста у слику захтева милионе параметара и библиотека.
ДреамБоотх поједностављује куповину и употребу садржаја за потрошаче тако што захтева само унос од три до пет тематских фотографија заједно са текстуалном позадином.
Ostavite komentar