Мазмұны[Жасыру][Көрсету]
Үлкен мәтіннен кескінге модельдер берілген мәтіндік шақырудан жоғары сапалы және әртараптандырылған сурет синтезін жасау арқылы AI дамуында айтарлықтай ілгерілеушілік жасады.
Бұл модельдер әртүрлі параметрлердегі субъектілердің бірегей көріністерін синтездей алмайды немесе берілген анықтамалық жинақтағы нысандардың көрінісін қайталай алмайды.
OpenAI DALL.E2 немесе StabilityAI сияқты жаңадан шығарылған технологиялар Тұрақты диффузия және Midjourney қазірдің өзінде интернетті дауылмен алып жатыр. Енді нәтижелерді теңшеу уақыты келді. Дегенмен қалай?
Google DreamBooth AI келді.
DreamBooth суреттің тақырыбын тану, оны бастапқы контекстен деконструкциялау, содан кейін оны жаңа қажетті контекстке дәл синтездеу мүмкіндігіне ие. Оған қоса, оны қазіргі AI сурет генераторларымен пайдалануға болады.
Бұл мақалада біз DreamBooth-ты, оның қолданылуын, оқу құралын, шектеулерін және т.б. қарастырамыз.
Dreambooth дегеніміз не?
арман кабинасы, жаңа мәтіннен кескінге диффузиялық моделін Google ұсынған. Жазбаша сұрауды Google DreamBooth AI әртүрлі параметрлерде пайдаланушы таңдаған тақырыптың кең ауқымды фотосуреттерін жасау үшін нұсқау ретінде пайдалануға болады.
Бостон университеті мен Google-дың зерттеу тобы алдын-ала дайындықтан өткен мәтіннен кескінге үлгілерді өзгертудің озық әдісі болып табылатын DreamBooth-ті әзірледі.
Жалпы тұжырымдама өте қарапайым: олар тілге қатысты сөздікті ұлғайтқысы келеді, осылайша сирек таңбалауыш идентификаторлары пайдаланушылар анықтай алатын реттелетін тақырыптармен байланыстырылады.
Модельдің негізгі мақсаты - пайдаланушыларды желіге қосу мәтіннен кескінге диффузиялық модель оларға таңдалған тақырыптың даналарының фотореалистік көріністерін жасау үшін қажетті ресурстарды беру арқылы.
Нәтижесінде, бұл әдіс бірқатар жағдайларда қиындықтарды қорытындылау үшін жақсы жұмыс істейтін сияқты.
Google DreamBooth алдыңғы мәтіннен кескінге арналған құралдардан ерекшеленеді, мысалы DALL-E2, Тұрақты диффузия, және Орташа сапар, бұл пайдаланушыларға мәтінге негізделген енгізулерді пайдаланып диффузиялық модельді басқаруға рұқсат бермес бұрын тақырып кескінін көбірек басқаруға мүмкіндік береді.
Мүмкіндіктер
- DreamBooth AI 3-5 кескіні бар мәтіннен кескінге үлгіні жақсартуы мүмкін.
- Түпнұсқа фотореалистикалық фотосуреттерді DreamBooth AI көмегімен жасауға болады.
- Сонымен қатар, DreamBooth AI бірнеше бұрыштан тақырыптың фотосуреттерін жасай алады.
қолдану
Көркем шығармалар
Бұл тапсырма мәнерді тасымалдаудан ерекше ерекшеленеді, ол бастапқы көріністің семантикасын сақтайды, сонымен бірге басқа кескіннің стилін бастапқы көрініске енгізеді.
Шығармашылық тәсілге негізделген AI сәйкестендіру және тақырып данасы ерекшеліктерін сақтай отырып, маңызды көріністі өзгертулерді орындай алады.
Меншік модификациясы
Нысан данасы сипаттамаларын DreamBooth AI арқылы өзгертуге болады.
Аксессуаризация
Ұрпақ үлгісіне дейінгі күшті композициялық DreamBooth AI-ның нысандарды безендіру қабілетін соншалықты қызықты етеді.
Қайта контекстуализация
DreamBooth AI оқытылған үлгіге бірегей идентификатор мен сынып есімін қамтитын сөйлем беру арқылы белгілі бір тақырып данасы үшін ерекше кескіндерді жасай алады.
Ол айналаны өзгертпей, нысанды бірегей, бұрын естімеген позаларда, артикуляцияларда және көрініс құрылымында жасай алады. Нақты көріністер мен көлеңкелер, сондай-ақ субъект пен қоршаған объектілер арасындағы өзара әрекеттесу.
Dreambooth оқулығы
Бұл оқулықта біз келесі әрекеттерді орындаймыз Google Collab жазу кітапшасы, және мен сізге оны өз бетіңізше түсінуге және пайдалануға мүмкіндік беретін оны таныстырамын.
GPU орнату және кітапханаларды орнату
GPU және VRAM түрлерінің қандай екенін білу бірінші қадам болып табылады. Бірнеше талаптар мен тәуелділіктерді орнату да қажет. Ойнату түймесін басып, оның аяқталуын күтіңіз.
Huggingface сайтында тіркелгі жасаңыз және белгіні жасаңыз
Келесі қадам - Huggingface есептік жазбасына тіркелу. Аяқтаған кезде жоғарғы оң жақ бұрыштағы параметрлерді басыңыз. Сіз келесі бетте келесіз.
Осы жерден сұралғандай таңбалауыш пен атауды жасаңыз. Белгішені көшіріп, төмендегі ұяшықтағы Google collab ішіне қою керек.
xformers орнатыңыз
Бұл кезеңде орындау уақытын басу арқылы xformers орнату үшін ойнату түймесін басуға болады.
Drive-қа қосылыңыз
Енді Google Drive-қа қосылу үшін осы ұяшықты іске қосу керек.
Сұрауды енгізіңіз
Келесі ұяшықта сіз жай ғана шақыруды енгізуіңіз керек.
Суреттерді жүктеп салу
Бұл қадамда сіз жаттықтырғыңыз келетін суреттерді жүктеп салуыңыз керек.
AI моделін үйрету
Бұл ең маңызды кезең, өйткені сіз барлық ұсынылған анықтамалық фотосуреттер негізінде жаңа AI үлгісін үйрету үшін DreamBooth қолданбасын пайдаланасыз. Назарыңызды екі енгізу өрісіне шектеуіңіз керек. «—дана шақыруы» бірінші параметр болып табылады. Мұнда сіз өте ерекше атау беруіңіз керек.
«–тұжырымдамалар тізімі» аргументі екінші маңызды енгізу өрісі болып табылады. Оның атауы «Сұрауды өзгерту» бөлімінде қолданылғанға сәйкес болу үшін өзгертілуі керек.
AI кескіндерін жасаңыз
Бұл кезеңде AI суреттері жасалады, мұнда мәтіндік нұсқауларды енгізуге болады.
Dreambooth шектеулері
- Пәрмен жолы жоғары дәрежелі егжей-тегжейлі тақырыпта итерациялар жасауға кедергі болады. DreamBooth нысанның контекстін өзгерте алады, бірақ модель нысанның өзін өзгерткісі келсе, кадрға қатысты мәселелер бар.
- Тағы бір мәселе - шығыс суретті кіріс кескініне шамадан тыс орнату. Егер жеткізілген суреттер жеткіліксіз болса, тақырып қарастырылмауы немесе жіберілген кескіндердің контекстімен араластырылуы мүмкін. Тақ буынға арналған контекст сұралғанда, дәл солай орын алады.
қорытынды
Бір мәтінді енгізуден нәтижелерді шығару үшін мәтіннен кескінге үлгілердің негізгі бөлігі миллиондаған параметрлер мен кітапханаларды қажет етеді.
DreamBooth мәтіндік фонмен бірге үш-бес тақырыптық фотосуретті енгізуді талап ету арқылы тұтынушылар үшін мазмұнды алу мен пайдалануды жеңілдетеді.
пікір қалдыру