Turinys[Slėpti][Rodyti]
Naujausios AI naujovės gali radikaliai pakeisti požiūrį į meną.
Tokie modeliai kaip DALL-E 2 išgarsėjo gebėjimu kurti aukštos kokybės vaizdus naudojant paprasto teksto įvestį.
Nors DALL-E 2 vis dar buvo uždarytas daugumai visuomenės, daugelis ieškojo alternatyvos, kuri galėtų atlikti šį darbą taip pat gerai. Viena populiariausių alternatyvų – internetinė paslauga „Midjourney“.
„Discord“ serveryje yra daugiau nei 3 milijonai vartotojų, todėl tai neabejotinai vienas iš labiausiai prieinamų sklaidos modelių vaizdams ir menui kurti.
Šiame straipsnyje aptarsime, ką Vidurinė kelionė gali padaryti ir kaip tai veikia. Vėliau mes padėsime jums sukurti pirmąjį dirbtinio intelekto sukurtą paveikslėlį su nuosekliu vadovu.
Kas yra Midjourney?
Vidurinė kelionė yra patentuotas dirbtinio intelekto įrankis, galintis kurti vaizdus iš teksto įvesties. Skirtingai nuo kitų tokio tipo modelių, „Midjourney“ paslauga pasiekiama per internetinį „Discord“ serverį.
Vartotojai, norintys kurti meną naudodami „Midjourney“, turės susikurti „Discord“ paskyrą ir pasiekti oficialų „Midjourney“ serverį. Iš ten jie turės pereiti į vieną iš daugelio galimų atvirų pokalbių kambarių, vadinamų „kanalais“.
Šiuose kanaluose vartotojai kartu su keletu kitų naudotojų pateiks teksto raginimus. Kiti vartotojai galės matyti jūsų raginimus ir išvesties vaizdus.
Kadangi visa priekinė sąsaja iš esmės yra „Discord“ platformoje, nenuostabu, kad serveris per pastaruosius kelis mėnesius nepaprastai išaugo. 2022 m. spalio mėn. šiuo metu tai yra didžiausias „Discord“ serveris platformos istorijoje.
Pasak įkūrėjo Davido Holzo, apie 30 procentų vartotojų „Midjourney“ naudoja kaip profesionalus. Holzas paminėjo, kad daugelis grafikų naudoja „Midjourney“ kaip ankstyvą savo koncepcijos kūrimo darbo eigos žingsnį.
Midjourney taip pat pradėjo paveikti komercinių iliustracijų pramonę. Britų žurnalas „The Economist“ netgi panaudojo „Midjourney“, kad sukurtų vieno iš naujausių savo numerių priekinį viršelį.
Kaip veikia Midjourney?
Kadangi „Midjourney“ yra patentuotas, nėra tiksliai žinoma, kuo modelis skiriasi nuo kitų vaizdo generavimo modelių, pvz. Stabili difuzija ir DALL-E 2. Tačiau mes žinome, kad „Midjourney“ vaizdams generuoti naudoja neuroninį tinklą.
Be to, kaip ir daugelis kitų vaizdų generavimo algoritmų, „Midjourney“ remiasi technika, žinoma kaip difuzinis modeliavimas.
Difuzijos modeliai veikia iš esmės po truputį dekonstruodami vaizdą, kol vaizdas tampa beprasmiu triukšmu. Tada modelis bandys panaikinti vaizdų triukšmą, kad sužinotų, kaip pakeisti difuzijos procesą.
Vaizdo generavimo modeliai paprastai prideda žingsnį, kuris interpretuoja pradinį tekstą. Pavyzdžiui, tarkime, kad naudotojas prašo „Midjourney“ sukurti katės, žaidžiančios su žalių siūlų kamuoliu, atvaizdą. Teksto koduotuvas paima įvestą tekstą „katė, žaidžianti su žalių siūlų kamuoliuku“ ir paverčia jį skaičių, atitinkančių kiekvieną žodį, sąrašą.
Pradėdama nuo atsitiktinio triukšmo tinklelio, „Midjourney“ bandys nutildyti vaizdą, kartu įtraukdama semantinę informaciją, gautą iš originalaus teksto.
Pirmojo vidurio įvaizdžio kūrimas
Šiame skyriuje pateiksime trumpą vadovą, kuris padės sukurti pirmąjį Vidurio kelionės vaizdą.
Pirmiausia turėsite prisijungti prie Midjourney Discord serveris. Jei dar neturite Discord paskyros, būsite paraginti ją sukurti. „Discord“ leidžia lengvai susikurti paskyrą, o visą programą galite pasiekti naudodami naršyklę.
Prisijungę prie serverio turėsite pasirinkti vieną iš galimų „naujokų“ kambarių. Šiose patalpose kartu su kitais Midjourney naudotojais teiksite teksto raginimus.
Tada įveskite komandą „/imagine“ ir įveskite savo eilutę.
Midjourney sukurs keturias parinktis pagal jūsų raginimą. Gali užtrukti iki minutės, kol „Discord“ robotas grąžins išvestį. Galite pasirinkti padidinti arba sukurti keturių vaizdų variantus.
Šiame pavyzdyje įvedžiau raginimą „fantazijos pilies karūnavimas“.
Galime pasirinkti generuoti papildomus konkretaus vaizdo variantus. Šiame pavyzdyje pasirinkau mygtuką „V2“, kad sukurčiau antrojo vaizdo variantus.
Taip pat galime pasirinkti padidinti vaizdą. Padidinus vaizdo mastelį, sugeneruojama didesnė 1024 × 1024 pikselių pasirinkto vaizdo versija. Padidintas vaizdas dažnai prideda ir papildomos informacijos.
„Midjourney“ taip pat siūlo eksperimentinę „Remaster“ funkciją. Ši funkcija atkurs vaizdą, kurio kokybė ir darna gali būti geresnė.
Sugeneravę padidintą arba pertvarkytą raginimą dabar galite atsisiųsti vaizdą spustelėdami jį, kad vaizdas būtų rodomas viso dydžio. Dešiniuoju pelės mygtuku spustelėkite paveikslėlį ir pasirinkite Išsaugoti paveikslėlį išsaugoti jį vietoje.
Galite susieti savo „Discord“ paskyrą su oficialia „Midjourney“ žiniatinklio programa, kad peržiūrėtumėte visus „Midjourney“ jums sukurtus vaizdus.
Kainos
„Midjourney“ siūlo du pagrindinius planus: pagrindinį ir standartinį.
Pagrindinis planas kainuoja 10 USD per mėnesį ir leidžia vartotojui kiekvieną mėnesį paleisti apie 200 raginimų. Standartinio plano kaina yra 30 USD per mėnesį ir suteikia vartotojui papildomų 15 GPU valandų vaizdams generuoti. Tai sudaro maždaug 4.5 karto daugiau užklausų kiekvieną mėnesį.
Atnaujinimas į standartinį planą taip pat atrakina „atsipalaidavimo“ režimą, kuris leidžia vartotojui atlikti neribotą skaičių užduočių mainais už šiek tiek ilgesnį laukimo laiką.
Vartotojai taip pat gali pridėti papildomus 20 USD per mėnesį, kad vartotojai galėtų vykdyti savo užklausas privačiai.
Išvada
„Midjourney“ yra puikus dirbtinio intelekto vaizdų generavimo įrankis, kuris siūlo sąžiningą kainą, jei nuspręsite atnaujinti į mokamą planą.
Be paties įrankio, programą supanti bendruomenė išskyrė ją iš kitų panašių AI įrankių. „Discord“ serveryje yra kasdienių bendruomenės įvykių ir iššūkių, prie kurių vartotojai gali prisijungti. Serveryje yra įvairių kanalų, kuriuose galite užduoti klausimus ir rasti patarimų bei gudrybių, kaip patobulinti raginimus.
Palikti atsakymą