Nedávné inovace v AI mohou radikálně změnit způsob, jakým přistupujeme k umění.
Modely jako DALL-E 2 se proslavily schopností vytvářet vysoce kvalitní obrázky ze vstupu prostého textu.
Zatímco DALL-E 2 byl pro většinu veřejnosti stále uzavřen, mnozí hledali alternativu, která by tuto práci zvládla stejně dobře. Jednou z nejoblíbenějších alternativ je online služba Midjourney.
S více než 3 miliony uživatelů na jejich serveru Discord je to pravděpodobně jeden z nejdostupnějších modelů šíření pro generování obrázků a umění.
V tomto článku se podíváme na to, co Střední cesta umí a jak to funguje. Později vás provedeme vytvořením vašeho prvního obrázku vytvořeného umělou inteligencí pomocí podrobného průvodce.
Co je Midjourney?
Střední cesta je proprietární nástroj s umělou inteligencí, který dokáže vytvářet obrázky z textového vstupu. Na rozdíl od jiných modelů svého druhu je služba Midjourney přístupná prostřednictvím online serveru Discord.
Uživatelé, kteří chtějí vytvářet umění s Midjourney, si budou muset vytvořit Discord účet a přistupovat na oficiální server Midjourney. Odtud budou muset přejít do jedné z mnoha dostupných otevřených chatovacích místností nazývaných „kanály“.
V těchto kanálech pak budou uživatelé odesílat textové výzvy spolu s několika dalšími uživateli. Ostatní uživatelé budou moci vidět vaše výzvy a výstupní obrázky.
Vzhledem k tomu, že celé rozhraní front-endu v podstatě žije na platformě Discord, není divu, že se server za posledních několik měsíců ohromně rozrostl. Od října 2022 je to v současné době největší Discord server v historii platformy.
Podle zakladatele Davida Holze asi 30 procent uživatelů používá Midjourney jako profesionál. Holz zmínil, že mnoho grafiků používá Midjourney jako raný krok ve svém pracovním postupu při vývoji konceptu.
Midjourney také začal ovlivňovat průmysl komerční ilustrace. Britský časopis The Economist dokonce použil Midjourney k vytvoření přední obálky jednoho ze svých nedávných čísel.
Jak Midjourney funguje?
Vzhledem k tomu, že Midjourney je proprietární, není přesně známo, jak se model liší od jiných modelů generování obrázků, jako je Stabilní difúze a DALL-E 2. Víme však, že Midjourney používá ke generování obrázků neuronovou síť.
Stejně jako mnoho jiných algoritmů pro generování obrazu se Midjourney spoléhá na techniku známou jako difúzní modelování.
Difúzní modely fungují tak, že v podstatě dekonstruují obraz kousek po kousku, dokud se z vašeho obrazu nestane bezvýznamný šum. Model se pak pokusí odšumovat obrázky, aby se naučil, jak obrátit proces difúze.
Modely generování obrázků obvykle přidávají krok, který interpretuje původní text. Řekněme například, že uživatel požádá Midjourney o vytvoření obrázku kočky, která si hraje s klubkem zelené příze. Textový kodér vezme vstupní text „kočka si hraje s klubkem zelené příze“ a převede jej na seznam čísel, která představují každé slovo.
Počínaje náhodnou mřížkou šumu se Midjourney pokusí odšumit obraz a zároveň začlení sémantické informace získané z původního textu.
Vytvořte svůj první snímek uprostřed cesty
V této části vám poskytneme rychlého průvodce, který vám pomůže vytvořit váš první obrázek Midjourney.
Nejprve se budete muset připojit k Server Midjourney Discord. Pokud ještě nemáte účet Discord, budete vyzváni k jeho vytvoření. Discord usnadňuje vytvoření účtu a můžete přistupovat k celé aplikaci prostřednictvím svého prohlížeče.
Jakmile se připojíte k serveru, budete muset vybrat jednu z dostupných místností pro „nováčky“. V těchto místnostech budete odesílat své textové výzvy spolu s ostatními uživateli Midjourney.
Dále zadejte příkaz „/imagine“ a zadejte výzvu.
Midjourney vygeneruje čtyři možnosti na základě vaší výzvy. Může trvat až minutu, než robot Discord vrátí výstup. Můžete si vybrat buď upscale, nebo vytvořit variace čtyř obrázků.
V tomto příkladu jsem zadal výzvu „korunovace hradu fantazie“.
Můžeme zvolit generování dalších variant konkrétního obrázku. V tomto příkladu jsem zvolil tlačítko „V2“ pro vytvoření variant druhého obrázku.
Můžeme se také rozhodnout pro upgrade obrázku. Upscaling obrázku vygeneruje větší verzi vybraného obrázku s rozlišením 1024×1024 pixelů. Upscalovaný obrázek často také přidá další podrobnosti.
Midjourney také nabízí experimentální funkci Remaster. Tato funkce obnoví obraz, který může mít zvýšenou kvalitu a koherenci.
Po vygenerování upscaled nebo remasterované výzvy si nyní můžete stáhnout obrázek kliknutím na něj, aby se obrázek zobrazil v plné velikosti. Klikněte pravým tlačítkem na obrázek a vyberte Uložit obrázek uložit jej lokálně.
Svůj účet Discord můžete propojit s oficiální webovou aplikací Midjourney a zobrazit všechny obrázky, které pro vás Midjourney vygenerovalo.
CENY
Midjourney nabízí dva hlavní plány: Basic a Standard.
Základní plán stojí 10 $ měsíčně a umožňuje uživateli spustit asi 200 výzev každý měsíc. Standardní tarif má cenu 30 USD/měsíc a poskytuje uživateli dalších 15 hodin GPU na generování obrázků. To představuje asi 4.5krát více požadavků každý měsíc.
Upgrade na standardní plán také odemkne „relaxační“ režim, který uživateli umožňuje spouštět neomezený počet úloh výměnou za mírně delší čekací doby.
Uživatelé mohou také přidat dalších 20 $ měsíčně, aby umožnili uživatelům provádět své požadavky soukromě.
Proč investovat do čističky vzduchu?
Midjourney je skvělý nástroj pro generování obrázků AI, který nabízí férovou cenu, pokud se rozhodnete upgradovat na placený plán.
Kromě samotného nástroje ji komunita obklopující aplikaci vyzdvihla mezi ostatními podobnými nástroji AI. Discord server má každodenní komunitní události a výzvy, ke kterým se mohou uživatelé připojit. Na serveru existují různé kanály, kde můžete klást otázky a najít tipy a triky, jak zlepšit své výzvy.
Napsat komentář