Innholdsfortegnelse[Gjemme seg][Forestilling]
Nylige innovasjoner innen AI kan radikalt endre måten vi nærmer oss kunst på.
Modeller som DALL-E 2 har blitt kjent for sin evne til å lage bilder av høy kvalitet fra ren tekstinntasting.
Mens DALL-E 2 fortsatt var stengt for det meste av publikum, søkte mange et alternativ som kan gjøre jobben like bra. Et av de mest populære alternativene er nettjenesten Midjourney.
Med over 3 millioner brukere i Discord-serveren, er det uten tvil en av de mest tilgjengelige diffusjonsmodellene for å generere bilder og kunst.
I denne artikkelen skal vi gå gjennom hva midt på reisen kan gjøre og hvordan det fungerer. Senere vil vi veilede deg til å lage ditt første AI-genererte bilde med en trinn-for-trinn-guide.
Hva er Midjourney?
midt på reisen er et proprietært AI-drevet verktøy som kan lage bilder fra tekstinndata. I motsetning til andre modeller av sitt slag, er Midjourney-tjenesten tilgjengelig via en online Discord-server.
Brukere som ønsker å lage kunst med Midjourney, må opprette en Discord-konto og få tilgang til den offisielle Midjourney-serveren. Derfra må de navigere til et av mange tilgjengelige åpne chatterom kalt "kanaler".
I disse kanalene vil brukere deretter sende inn tekstmeldinger sammen med flere andre brukere. Andre brukere vil kunne se spørsmålene dine og sende ut bilder.
Siden hele front-end-grensesnittet i hovedsak bor i Discord-plattformen, er det ikke rart at serveren har vokst enormt de siste månedene. Fra oktober 2022 er den for tiden den største Discord-serveren i plattformens historie.
Ifølge grunnlegger David Holz bruker omtrent 30 prosent av brukerne Midjourney som profesjonelle. Holz nevnte at mange grafikere bruker Midjourney som et tidlig trinn i arbeidsflyten for konseptutvikling.
Midjourney har også begynt å påvirke den kommersielle illustrasjonsindustrien. Det britiske magasinet The Economist brukte til og med Midjourney til å lage en forside for en av deres nylige utgaver.
Hvordan fungerer Midjourney?
Siden Midjourney er proprietær, er det ikke nøyaktig kjent hvordan modellen skiller seg fra andre bildegenereringsmodeller som Stabil diffusjon og DALL-E 2. Vi vet imidlertid at Midjourney bruker et nevralt nettverk for å generere bilder.
I likhet med mange andre bildegenereringsalgoritmer er Midjourney avhengig av en teknikk kjent som diffusjonsmodellering.
Diffusjonsmodeller fungerer ved i hovedsak å dekonstruere et bilde litt etter litt til bildet ditt blir meningsløs støy. Modellen vil da prøve å forringe bildene for å lære hvordan man kan snu diffusjonsprosessen.
Bildegenereringsmodeller legger vanligvis til et trinn som tolker den første teksten. La oss for eksempel si at brukeren ber Midjourney om å lage et bilde av en katt som leker med en nyle av grønt garn. En tekstkoder tar inn teksten «katt som leker med en nyle av grønt garn» og konverterer den til en liste med tall som representerer hvert ord.
Med utgangspunkt i et tilfeldig rutenett av støy, vil Midjourney forsøke å forringe bildet samtidig som den inkorporerer den semantiske informasjonen hentet fra den originale teksten.
Lag ditt første Midjourney-bilde
I denne delen gir vi deg en rask guide som hjelper deg med å lage ditt første Midjourney-bilde.
Først må du bli med Midjourney Discord-server. Hvis du ikke har en Discord-konto ennå, vil du bli bedt om å opprette en. Discord gjør det enkelt å opprette en konto og du kan få tilgang til hele applikasjonen via nettleseren din.
Når du har blitt med på serveren, må du velge et av de tilgjengelige "nykommer"-rommene. Disse rommene vil være der du sender inn tekstmeldinger sammen med andre Midjourney-brukere.
Deretter skriver du inn "/imagine"-kommandoen og skriver inn ledeteksten.
Midjourney vil generere fire alternativer basert på spørsmålet ditt. Det kan ta opptil et minutt før Discord-roboten returnerer utdata. Du kan velge å enten oppskalere eller lage varianter av de fire bildene.
I dette eksemplet har jeg skrevet inn ledeteksten "fantasislottkroning".
Vi kan velge å generere flere varianter av et spesifikt bilde. I dette eksemplet har jeg valgt knappen "V2" for å lage varianter av det andre bildet.
Vi kan også velge å oppskalere et bilde. Oppskalering av et bilde genererer en større versjon på 1024×1024 piksler av det valgte bildet. Det oppskalerte bildet vil ofte også legge til flere detaljer.
Midjourney tilbyr også en eksperimentell Remaster-funksjon. Denne funksjonen vil gjenskape et bilde som kan ha økt kvalitet og sammenheng.
Etter å ha generert en oppskalert eller remasteret ledetekst, kan du nå laste ned bildet ved å klikke på det for å vise bildet i full størrelse. Høyreklikk på bildet og velg Lagre bildet for å lagre den lokalt.
Du kan koble Discord-kontoen din til den offisielle Midjourney-nettapplikasjonen for å se alle bildene Midjourney har generert for deg.
Priser
Midjourney tilbyr to hovedplaner: Basic og Standard.
Grunnplanen koster $10/måned og lar brukeren kjøre rundt 200 forespørsler hver måned. Standardplanen er priset til $30/måned og gir brukeren ytterligere 15 GPU-timer til å generere bilder. Dette utgjør omtrent 4.5 ganger så mange forespørsler hver måned.
Oppgradering til standardplanen låser også opp "relax"-modusen, som lar brukeren kjøre et ubegrenset antall jobber i bytte mot litt lengre ventetider.
Brukere kan også legge til ytterligere $20 per måned for å la brukere kjøre forespørslene sine privat.
konklusjonen
Midjourney er et flott verktøy for generering av AI-bilder som tilbyr en rimelig pris hvis du bestemmer deg for å oppgradere til en betalt plan.
Foruten selve verktøyet, har fellesskapet rundt appen fått den til å skille seg ut blant andre lignende AI-verktøy. Discord-serveren har daglige fellesskapsarrangementer og utfordringer som brukere kan bli med på. Det finnes ulike kanaler på serveren hvor du kan stille spørsmål og finne tips og triks om hvordan du kan forbedre spørsmålene dine.
Legg igjen en kommentar