Innehållsförteckning[Dölj][Visa]
De senaste innovationerna inom AI kan radikalt förändra vårt sätt att närma oss konst.
Modeller som DALL-E 2 har blivit kända för sin förmåga att skapa högkvalitativa bilder från vanlig textinmatning.
Medan DALL-E 2 fortfarande var stängd för större delen av allmänheten, sökte många ett alternativ som kan göra jobbet lika bra. Ett av de populäraste alternativen är onlinetjänsten Midjourney.
Med över 3 miljoner användare i sin Discord-server är det utan tvekan en av de mest tillgängliga spridningsmodellerna för att generera bilder och konst.
I den här artikeln kommer vi att gå igenom vad midjourney kan göra och hur det fungerar. Senare kommer vi att guida dig till att göra din första AI-genererade bild med en steg-för-steg-guide.
Vad är Midjourney?
midjourney är ett egenutvecklat AI-drivet verktyg som kan skapa bilder från textinmatning. Till skillnad från andra modeller av sitt slag nås Midjourney-tjänsten via en online Discord-server.
Användare som vill skapa konst med Midjourney måste skapa ett Discord-konto och komma åt den officiella Midjourney-servern. Därifrån måste de navigera till ett av många tillgängliga öppna chattrum som kallas "kanaler".
I dessa kanaler kommer användare sedan att skicka textmeddelanden tillsammans med flera andra användare. Andra användare kommer att kunna se dina meddelanden och skriva ut bilder.
Eftersom hela front-end-gränssnittet i huvudsak bor i Discord-plattformen är det inte konstigt att servern har vuxit enormt under de senaste månaderna. Från och med oktober 2022 är det för närvarande den största Discord-servern i plattformens historia.
Enligt grundaren David Holz använder cirka 30 procent av användarna Midjourney som proffs. Holz nämnde att många grafiker använder Midjourney som ett tidigt steg i sitt konceptutvecklingsarbetsflöde.
Midjourney har också börjat påverka den kommersiella illustrationsbranschen. Den brittiska tidskriften The Economist använde till och med Midjourney för att skapa en framsida till ett av deras senaste nummer.
Hur fungerar Midjourney?
Eftersom Midjourney är proprietär är det inte exakt känt hur modellen skiljer sig från andra bildgenereringsmodeller som t.ex. Stabil diffusion och DALL-E 2. Men vi vet att Midjourney använder ett neuralt nätverk för att generera bilder.
Liksom många andra bildgenereringsalgoritmer förlitar sig Midjourney på en teknik som kallas diffusionsmodellering.
Diffusionsmodeller fungerar genom att i huvudsak dekonstruera en bild lite i taget tills din bild blir meningslöst brus. Modellen kommer sedan att försöka försvaga bilderna för att lära sig att vända diffusionsprocessen.
Bildgenereringsmodeller lägger vanligtvis till ett steg som tolkar den ursprungliga texten. Låt oss till exempel säga att användaren ber Midjourney att skapa en bild av en katt som leker med en nystan av grönt garn. En textkodare tar inmatningstexten "katt som leker med ett nystan av grönt garn" och konverterar den till en lista med siffror som representerar varje ord.
Med utgångspunkt från ett slumpmässigt rutnät av brus, kommer Midjourney att försöka försvaga bilden samtidigt som den införlivar den semantiska informationen från originaltexten.
Skapa din första Midjourney-bild
I det här avsnittet ger vi dig en snabbguide som hjälper dig att skapa din första Midjourney-bild.
Först måste du gå med i Midjourney Discord-server. Om du inte har ett Discord-konto ännu kommer du att bli ombedd att skapa ett. Discord gör det enkelt att skapa ett konto och du kan komma åt hela applikationen via din webbläsare.
När du har anslutit dig till servern måste du välja ett av de tillgängliga "nykomlingarna"-rummen. Dessa rum kommer att vara där du skickar dina textmeddelanden tillsammans med andra Midjourney-användare.
Skriv sedan in kommandot "/imagine" och skriv in din prompt.
Midjourney genererar fyra alternativ baserat på din prompt. Det kan ta upp till en minut för Discord-boten att returnera resultatet. Du kan välja att antingen uppskala eller skapa varianter av de fyra bilderna.
I det här exemplet har jag skrivit in prompten "fantasislottkröning".
Vi kan välja att generera ytterligare varianter av en specifik bild. I det här exemplet har jag valt knappen "V2" för att skapa varianter av den andra bilden.
Vi kan också välja att uppskala en bild. Uppskalning av en bild genererar en större version på 1024×1024 pixlar av den valda bilden. Den uppskalade bilden kommer ofta att lägga till ytterligare detaljer också.
Midjourney erbjuder också en experimentell Remaster-funktion. Denna funktion kommer att återskapa en bild som kan ha ökad kvalitet och koherens.
Efter att ha genererat en uppskalad eller remastrad prompt kan du nu ladda ner bilden genom att klicka på den för att visa bilden i full storlek. Högerklicka på bilden och välj Spara bild för att spara den lokalt.
Du kan koppla ditt Discord-konto till den officiella Midjourney-webbapplikationen för att se alla bilder som Midjourney har genererat åt dig.
Priser
Midjourney erbjuder två huvudplaner: Basic och Standard.
Grundplanen kostar $10/månad och låter användaren köra cirka 200 uppmaningar varje månad. Standardplanen är prissatt till $30/månad och ger användaren ytterligare 15 GPU-timmar för att generera bilder. Det motsvarar cirka 4.5 gånger så många förfrågningar varje månad.
Uppgradering till standardplanen låser också upp "relax"-läget, vilket gör att användaren kan köra ett obegränsat antal jobb i utbyte mot lite längre väntetider.
Användare kan också lägga till ytterligare $20 per månad för att låta användare köra sina förfrågningar privat.
Slutsats
Midjourney är ett utmärkt verktyg för AI-bildgenerering som erbjuder ett rimligt pris om du bestämmer dig för att uppgradera till en betald plan.
Förutom själva verktyget har gemenskapen kring appen gjort att den sticker ut bland andra liknande AI-verktyg. Discord-servern har dagliga community-evenemang och utmaningar som användare kan gå med i. Det finns olika kanaler inom servern där du kan ställa frågor och hitta tips och tricks om hur du kan förbättra dina meddelanden.
Kommentera uppropet