Nedávne inovácie v oblasti AI môžu radikálne zmeniť spôsob, akým pristupujeme k umeniu.
Modely ako DALL-E 2 sa preslávili svojou schopnosťou vytvárať vysokokvalitné obrázky zo zadávania obyčajného textu.
Zatiaľ čo DALL-E 2 bol pre väčšinu verejnosti stále uzavretý, mnohí hľadali alternatívu, ktorá by túto prácu zvládla rovnako dobre. Jednou z najobľúbenejších alternatív je online služba Midjourney.
S viac ako 3 miliónmi používateľov na ich serveri Discord je to pravdepodobne jeden z najdostupnejších modelov difúzie na generovanie obrázkov a umenia.
V tomto článku sa budeme zaoberať tým, čo Stredná cesta dokáže a ako to funguje. Neskôr vás pomocou podrobného sprievodcu prevedieme vytvorením vášho prvého obrázka vygenerovaného AI.
Čo je Midjourney?
Stredná cesta je proprietárny nástroj poháňaný AI, ktorý dokáže vytvárať obrázky z textového vstupu. Na rozdiel od iných modelov svojho druhu je služba Midjourney dostupná prostredníctvom online servera Discord.
Používatelia, ktorí chcú vytvárať umenie s Midjourney, si budú musieť vytvoriť Discord účet a pristupovať na oficiálny server Midjourney. Odtiaľ budú musieť prejsť do jednej z mnohých dostupných otvorených diskusných miestností nazývaných „kanály“.
V týchto kanáloch potom používatelia budú odosielať textové výzvy spolu s niekoľkými ďalšími používateľmi. Ostatní používatelia budú môcť vidieť vaše výzvy a výstupné obrázky.
Keďže celé front-end rozhranie v podstate žije na platforme Discord, nie je divu, že server za posledných niekoľko mesiacov ohromne narástol. Od októbra 2022 je to v súčasnosti najväčší Discord server v histórii platformy.
Podľa zakladateľa Davida Holza asi 30 percent používateľov používa Midjourney ako profesionál. Holz spomenul, že veľa grafikov používa Midjourney ako prvý krok vo svojom pracovnom postupe pri vývoji konceptu.
Midjourney začala ovplyvňovať aj priemysel komerčných ilustrácií. Britský časopis The Economist dokonca použil Midjourney na vytvorenie prednej obálky jedného z ich nedávnych vydaní.
Ako funguje Midjourney?
Keďže Midjourney je proprietárny, nie je presne známe, ako sa model líši od iných modelov generovania obrázkov, ako je Stabilná difúzia a DALL-E 2. Vieme však, že Midjourney používa na generovanie obrázkov neurónovú sieť.
Rovnako ako mnoho iných algoritmov generovania obrázkov, aj Midjourney sa spolieha na techniku známu ako difúzne modelovanie.
Difúzne modely fungujú tak, že v podstate postupne dekonštruujú obraz, až kým sa z neho nestane nezmyselný šum. Model sa potom pokúsi odšumovať obrázky, aby sa naučil, ako zvrátiť proces difúzie.
Modely generovania obrázkov zvyčajne pridávajú krok, ktorý interpretuje počiatočný text. Povedzme napríklad, že používateľ požiada Midjourney, aby vytvoril obrázok mačky, ktorá sa hrá s klbkom zelenej priadze. Textový kódovač vezme vstupný text „mačka sa hrá s klbkom zelenej priadze“ a prevedie ho na zoznam čísel, ktoré predstavujú každé slovo.
Počnúc náhodnou mriežkou šumu sa Midjourney pokúsi odšumiť obraz a zároveň začlení sémantické informácie získané z pôvodného textu.
Vytvorenie obrazu prvej polovice cesty
V tejto časti vám poskytneme rýchleho sprievodcu, ktorý vám pomôže vytvoriť váš prvý obrázok Midjourney.
Najprv sa budete musieť pripojiť k Server Midjourney Discord. Ak ešte nemáte účet Discord, zobrazí sa výzva na jeho vytvorenie. Discord uľahčuje vytvorenie účtu a k celej aplikácii máte prístup cez prehliadač.
Po pripojení na server si budete musieť vybrať jednu z dostupných miestností „nováčikov“. V týchto miestnostiach budete odosielať svoje textové výzvy spolu s ostatnými používateľmi Midjourney.
Ďalej zadajte príkaz „/imagine“ a zadajte výzvu.
Midjourney vygeneruje štyri možnosti na základe vašej výzvy. Môže trvať až minútu, kým robot Discord vráti výstup. Môžete si vybrať buď zväčšenie alebo vytvorenie variácií štyroch obrázkov.
V tomto príklade som zadal výzvu „korunovácia hradu fantázie“.
Môžeme sa rozhodnúť vygenerovať ďalšie variácie konkrétneho obrázka. V tomto príklade som vybral tlačidlo „V2“ na vytvorenie variácií druhého obrázka.
Môžeme sa tiež rozhodnúť pre upgrade obrázka. Prevzorkovanie obrázka vygeneruje väčšiu verziu vybratého obrázka s rozlíšením 1024 × 1024 pixelov. Upscalovaný obrázok často pridá aj ďalšie podrobnosti.
Midjourney ponúka aj experimentálnu funkciu Remaster. Táto funkcia obnoví obrázok, ktorý môže mať zvýšenú kvalitu a koherenciu.
Po vygenerovaní aktualizovanej alebo remasterovanej výzvy si teraz môžete stiahnuť obrázok kliknutím naň, čím sa obrázok zobrazí v plnej veľkosti. Kliknite pravým tlačidlom myši na obrázok a vyberte si Uložiť obrázok uložiť ho lokálne.
Svoj účet Discord môžete pripojiť k oficiálnej webovej aplikácii Midjourney a zobraziť všetky obrázky, ktoré pre vás Midjourney vygenerovalo.
CENNÍK
Midjourney ponúka dva hlavné plány: Basic a Standard.
Základný plán stojí 10 USD mesačne a umožňuje používateľovi spustiť približne 200 výziev každý mesiac. Cena štandardného plánu je 30 USD mesačne a používateľovi poskytuje ďalších 15 hodín GPU na generovanie obrázkov. To predstavuje približne 4.5-krát viac žiadostí každý mesiac.
Inovácia na štandardný plán tiež odomkne „relax“ režim, ktorý používateľovi umožňuje vykonávať neobmedzený počet úloh výmenou za mierne dlhšie čakacie doby.
Používatelia môžu tiež pridať ďalších 20 USD mesačne, aby umožnili používateľom vykonávať svoje požiadavky súkromne.
záver
Midjourney je skvelý nástroj na generovanie obrázkov AI, ktorý ponúka primeranú cenu, ak sa rozhodnete prejsť na platený plán.
Okrem samotného nástroja komunita okolo aplikácie vynikla medzi inými podobnými nástrojmi AI. Discord server má každodenné komunitné udalosti a výzvy, ku ktorým sa môžu používatelia pripojiť. V rámci servera existujú rôzne kanály, kde môžete klásť otázky a nájsť tipy a triky, ako zlepšiť svoje výzvy.
Nechaj odpoveď