Spis treści[Ukryć][Pokazać]
Ostatnie innowacje w AI mogą radykalnie zmienić sposób, w jaki podchodzimy do sztuki.
Modele takie jak DALL-E 2 stały się znane ze swojej zdolności do tworzenia wysokiej jakości obrazów na podstawie zwykłego tekstu.
Chociaż DALL-E 2 był nadal niedostępny dla większości publiczności, wielu szukało alternatywy, która równie dobrze poradzi sobie z tym zadaniem. Jedną z najpopularniejszych alternatyw jest serwis internetowy Midjourney.
Z ponad 3 milionami użytkowników na serwerze Discord, jest to prawdopodobnie jeden z najbardziej dostępnych modeli dyfuzji do generowania obrazów i sztuki.
W tym artykule omówimy co W połowie drogi można zrobić i jak to działa. Później poprowadzimy Cię krok po kroku przez proces tworzenia pierwszego obrazu wygenerowanego przez sztuczną inteligencję.
Co to jest Midjourney?
W połowie drogi to zastrzeżone narzędzie oparte na sztucznej inteligencji, które może tworzyć obrazy z wprowadzonego tekstu. W przeciwieństwie do innych modeli tego rodzaju, usługa Midjourney jest dostępna przez internetowy serwer Discord.
Użytkownicy, którzy chcą tworzyć grafikę w Midjourney, będą musieli utworzyć konto Discord i uzyskać dostęp do oficjalnego serwera Midjourney. Stamtąd będą musieli przejść do jednego z wielu dostępnych otwartych pokojów rozmów zwanych „kanałami”.
W tych kanałach użytkownicy będą następnie przesyłać monity tekstowe wraz z kilkoma innymi użytkownikami. Inni użytkownicy będą mogli zobaczyć Twoje monity i obrazy wyjściowe.
Ponieważ cały interfejs front-end zasadniczo znajduje się na platformie Discord, nic dziwnego, że serwer ogromnie urósł w ciągu ostatnich kilku miesięcy. Od października 2022 jest to obecnie największy serwer Discord w historii platformy.
Według założyciela Davida Holza, około 30 procent użytkowników korzysta z Midjourney jako profesjonalista. Holz wspomniał, że wielu grafików wykorzystuje Midjourney jako wczesny etap procesu opracowywania koncepcji.
Midjourney zaczął również wpływać na przemysł ilustracji komercyjnych. Brytyjski magazyn The Economist wykorzystał nawet Midjourney do stworzenia okładki jednego ze swoich ostatnich numerów.
Jak działa Midjourney?
Ponieważ Midjourney jest zastrzeżony, nie wiadomo dokładnie, czym model różni się od innych modeli generowania obrazu, takich jak Stabilna dyfuzja i DALL-E 2. Wiemy jednak, że Midjourney wykorzystuje sieć neuronową do generowania obrazów.
Podobnie jak wiele innych algorytmów generowania obrazu, Midjourney opiera się na technice znanej jako modelowanie dyfuzji.
Modele dyfuzji działają na zasadzie stopniowej dekonstrukcji obrazu, aż obraz stanie się bezsensownym szumem. Następnie model spróbuje odszumić obrazy, aby dowiedzieć się, jak odwrócić proces dyfuzji.
Modele generowania obrazu zazwyczaj dodają krok, który interpretuje początkowy tekst. Załóżmy na przykład, że użytkownik prosi Midjourney o utworzenie obrazu kota bawiącego się kłębkiem zielonej włóczki. Koder tekstu pobiera tekst wejściowy „kot bawiący się kłębkiem zielonej przędzy” i przekształca go w listę liczb reprezentujących każde słowo.
Rozpoczynając od losowej siatki szumów, Midjourney spróbuje odszumić obraz, włączając jednocześnie informacje semantyczne uzyskane z oryginalnego tekstu.
Tworzenie pierwszego obrazu podróży
W tej sekcji podamy krótki przewodnik, który pomoże Ci stworzyć swój pierwszy obraz Midjourney.
Najpierw musisz dołączyć do Serwer Discord Midjourney. Jeśli nie masz jeszcze konta Discord, zostaniesz poproszony o jego utworzenie. Discord ułatwia utworzenie konta i dostęp do całej aplikacji za pośrednictwem przeglądarki.
Po dołączeniu do serwera będziesz musiał wybrać jeden z dostępnych pokoi „nowych”. Te pokoje będą miejscem, w którym wraz z innymi użytkownikami Midjourney będziesz przesyłać swoje komunikaty tekstowe.
Następnie wpisz polecenie „/ wyobraź sobie” i wpisz monit.
Midjourney wygeneruje cztery opcje na podstawie Twojego monitu. Zwrócenie danych wyjściowych przez bota Discord może potrwać do minuty. Możesz wybrać opcję skalowania lub tworzenia wariacji czterech obrazów.
W tym przykładzie wprowadziłem monit „koronacja zamku fantasy”.
Możemy zdecydować się na wygenerowanie dodatkowych wariacji konkretnego obrazu. W tym przykładzie wybrałem przycisk „V2”, aby utworzyć wariacje drugiego obrazu.
Możemy również zdecydować się na przeskalowanie obrazu. Skalowanie obrazu w górę generuje większą wersję wybranego obrazu o wymiarach 1024×1024 pikseli. Powiększony obraz często dodaje również dodatkowe szczegóły.
Midjourney oferuje również eksperymentalną funkcję Remaster. Ta funkcja zregeneruje obraz, który może mieć lepszą jakość i spójność.
Po wygenerowaniu monitu przeskalowanego lub zremasterowanego możesz teraz pobrać obraz, klikając go, aby wyświetlić obraz w pełnym rozmiarze. Kliknij obraz prawym przyciskiem myszy i wybierz Zapisać obraz zapisać go lokalnie.
Możesz połączyć swoje konto Discord z oficjalną aplikacją internetową Midjourney, aby wyświetlić wszystkie obrazy wygenerowane przez Midjourney.
Cennik
Midjourney oferuje dwa główne plany: podstawowy i standardowy.
Plan podstawowy kosztuje 10 USD miesięcznie i umożliwia użytkownikowi uruchamianie około 200 monitów każdego miesiąca. Plan standardowy kosztuje 30 USD miesięcznie i daje użytkownikowi dodatkowe 15 godzin GPU na generowanie obrazów. To około 4.5 razy więcej żądań każdego miesiąca.
Aktualizacja do Planu Standardowego odblokowuje również tryb „relaks”, który pozwala użytkownikowi uruchomić nieograniczoną liczbę zadań w zamian za nieco dłuższy czas oczekiwania.
Użytkownicy mogą również dodać dodatkowe 20 USD miesięcznie, aby umożliwić użytkownikom prywatne uruchamianie swoich żądań.
Wnioski
Midjourney to świetne narzędzie do generowania obrazów AI, które oferuje uczciwą cenę, jeśli zdecydujesz się na uaktualnienie do płatnego planu.
Oprócz samego narzędzia społeczność otaczająca aplikację wyróżnia ją spośród innych podobnych narzędzi AI. Na serwerze Discord odbywają się codzienne wydarzenia społecznościowe i wyzwania, do których użytkownicy mogą dołączyć. Na serwerze istnieją różne kanały, w których można zadawać pytania oraz znajdować wskazówki i porady dotyczące ulepszania monitów.
Dodaj komentarz