Tartalomjegyzék[Elrejt][Előadás]
A mesterséges intelligencia legújabb innovációi gyökeresen megváltoztathatják a művészethez való hozzáállásunkat.
Az olyan modellek, mint a DALL-E 2, arról váltak híressé, hogy egyszerű szövegbevitellel kiváló minőségű képeket tudnak készíteni.
Míg a DALL-E 2 még mindig zárva volt a nagyközönség előtt, sokan olyan alternatívát kerestek, amely ugyanilyen jól ellátja ezt a feladatot. Az egyik legnépszerűbb alternatíva a Midjourney online szolgáltatás.
Több mint 3 millió felhasználóval a Discord szerveren, ez vitathatatlanul az egyik leginkább hozzáférhető diffúziós modell a képek és művészetek generálására.
Ebben a cikkben megvizsgáljuk, hogy mit középút megteheti és hogyan működik. Később lépésről lépésre végigvezetjük Önt az első mesterséges intelligencia által generált kép elkészítésében.
Mi az a Midjourney?
középút egy szabadalmaztatott mesterséges intelligenciával működő eszköz, amely szövegbevitelből képes képeket készíteni. A többi hasonló modelltől eltérően a Midjourney szolgáltatás egy online Discord szerveren keresztül érhető el.
Azoknak a felhasználóknak, akik művészetet szeretnének létrehozni a Midjourney segítségével, létre kell hozniuk egy Discord fiókot, és hozzá kell férniük a hivatalos Midjourney szerverhez. Innen a „csatornáknak” nevezett nyitott chatszobák egyikébe kell navigálniuk.
Ezeken a csatornákon a felhasználók szöveges üzeneteket küldenek be több más felhasználó mellett. A többi felhasználó láthatja az Ön értesítéseit és kimeneti képeit.
Mivel a teljes front-end felület lényegében a Discord platformon él, nem csoda, hogy a szerver hatalmasat fejlődött az elmúlt hónapokban. 2022 októberétől ez jelenleg a legnagyobb Discord szerver a platform történetében.
David Holz alapítója szerint a felhasználók körülbelül 30 százaléka használja a Midjourney-t profiként. Holz megemlítette, hogy sok grafikus a Midjourney-t használja koncepciófejlesztési munkafolyamata korai lépéseként.
A Midjourney a kereskedelmi illusztrációs iparágra is hatással volt. A brit The Economist magazin még a Midjourney-t is felhasználta, hogy borítót készítsen egyik legutóbbi számához.
Hogyan működik a Midjourney?
Mivel a Midjourney szabadalmazott, nem ismert pontosan, hogy a modell miben tér el más képgeneráló modellektől, mint pl. Stabil diffúzió és DALL-E 2. Tudjuk azonban, hogy a Midjourney neurális hálózatot használ a képek előállításához.
Emellett sok más képgeneráló algoritmushoz hasonlóan a Midjourney is a diffúziós modellezésként ismert technikára támaszkodik.
A diffúziós modellek lényegében apránként dekonstruálják a képet, amíg a kép értelmetlen zaj lesz. A modell ezután megpróbálja zajtalanítani a képeket, hogy megtanulja, hogyan fordíthatja meg a diffúziós folyamatot.
A képgeneráló modellek általában hozzáadnak egy lépést, amely értelmezi a kezdeti szöveget. Tegyük fel például, hogy a felhasználó megkéri a Midjourney-t, hogy készítsen egy képet egy macskáról, aki egy zöld fonalgolyóval játszik. A szövegkódoló veszi a „zöld fonalgolyóval játszó macska” bemeneti szöveget, és egy számlistává alakítja, amely az egyes szavakat reprezentálja.
Egy véletlenszerű zajrácstól kezdve a Midjourney megpróbálja zajtalanítani a képet, miközben beépíti az eredeti szövegből nyert szemantikai információkat is.
Első Midjourney kép létrehozása
Ebben a részben egy gyors útmutatót adunk, amely segít az első Midjourney kép elkészítésében.
Először is csatlakoznod kell a Midjourney Discord szerver. Ha még nincs Discord-fiókja, a rendszer felkéri, hogy hozzon létre egyet. A Discord megkönnyíti a fiók létrehozását, és a böngészőn keresztül elérheti a teljes alkalmazást.
Miután csatlakozott a szerverhez, ki kell választania az elérhető „újonc” szobák egyikét. Ezekben a szobákban küldheti el szöveges üzeneteit a Midjourney többi felhasználójával együtt.
Ezután írja be a „/imagine” parancsot, és írja be a promptot.
A Midjourney négy lehetőséget generál az Ön felszólítása alapján. Akár egy percig is eltarthat, amíg a Discord bot visszaadja a kimenetet. Választhat, hogy felnagyítja vagy variációkat készít a négy képből.
Ebben a példában beírtam a „fantasy kastély megkoronázása” parancsot.
Dönthetünk úgy, hogy egy adott képhez további variációkat generálunk. Ebben a példában a „V2” gombot választottam a második kép variációinak létrehozásához.
Választhatunk egy kép felnagyítását is. Egy kép felskálázása a kiválasztott kép nagyobb, 1024×1024 pixeles verzióját generálja. A felnagyított kép gyakran további részleteket is hozzáad.
A Midjourney kísérleti Remaster funkciót is kínál. Ez a funkció olyan képet hoz létre, amelynek minősége és koherenciája jobb lehet.
A feljavított vagy újramasterált prompt generálása után letöltheti a képet úgy, hogy rákattint a kép teljes méretében való megjelenítéséhez. Kattintson a jobb gombbal a képre, és válassza ki Kép mentése hogy helyben mentse el.
Csatlakoztathatja Discord-fiókját a hivatalos Midjourney webalkalmazáshoz, hogy megtekinthesse a Midjourney által készített összes képet.
Árazás
A Midjourney két fő tervet kínál: Basic és Standard.
Az alapterv havi 10 dollárba kerül, és havonta körülbelül 200 felszólítást tesz lehetővé a felhasználó számára. A Standard csomag ára 30 USD/hó, és további 15 GPU-órát biztosít a felhasználónak a képek generálására. Ez havonta körülbelül 4.5-szer annyi kérést jelent.
A Standard csomagra való frissítés feloldja a „relax” módot is, amely lehetővé teszi a felhasználó számára, hogy korlátlan számú munkát végezzen, cserébe kissé hosszabb várakozási időért.
A felhasználók havonta további 20 dollárt is hozzáadhatnak, hogy a felhasználók privát módon futtassák le kéréseiket.
Következtetés
A Midjourney egy nagyszerű eszköz az AI-képgeneráláshoz, amely méltányos árat kínál, ha úgy dönt, hogy fizetős csomagra vált.
Magán az eszközön kívül az alkalmazást körülvevő közösség is kiemelkedett a többi hasonló AI-eszköz közül. A Discord szerver napi közösségi eseményeket és kihívásokat tartogat, amelyekhez a felhasználók csatlakozhatnak. Különféle csatornák léteznek a szerveren belül, ahol kérdéseket tehet fel, és tippeket és trükköket találhat a promptok javításához.
Hagy egy Válaszol