Kita urip ing jaman sing nyenengake, kanthi pengumuman babagan teknologi canggih saben minggu. OpenAI mung ngrilis model teks-kanggo-gambar mutakhir DALLE 2.
Mung sawetara wong sing entuk akses awal menyang sistem AI anyar sing bisa ngasilake grafis realistis saka deskripsi basa alami. Iku isih ditutup kanggo umum.
Stability AI banjur dirilis ing Difusi Stabil model, varian open-source saka DALLE2. Peluncuran iki wis ngowahi kabeh. Wong-wong ing saindenging internet nerbitake asil cepet lan kaget karo seni sing nyata.
Apa Difusi Stabil?
Difusi Stabil yaiku model pembelajaran mesin sing bisa nggawe gambar saka teks, ngganti gambar gumantung saka teks, lan ngisi rincian babagan gambar kanthi resolusi kurang utawa rinci.
Iki dilatih babagan milyaran foto lan bisa ngasilake asil sing padha karo DALL-E2 lan MidJourney. Stabilitas AI diciptakake, lan diumumake tanggal 22 Agustus 2022.
Nanging kanthi sumber daya komputasi lokal sing winates, model Stable Diffusion mbutuhake wektu suwe kanggo nggawe gambar kanthi kualitas dhuwur. Mlaku model online nggunakake panyedhiya maya nyedhiyakake sumber daya komputasi sing meh tanpa wates lan ngidini kita entuk asil sing apik banget kanthi luwih cepet.
Hosting model minangka layanan mikro uga ngidini aplikasi kreatif liyane luwih gampang ngeksploitasi potensial model kasebut tanpa kudu ngatasi kerumitan nglakokake model ML kanthi online.
Ing kirim iki, kita bakal nyoba kanggo nduduhake carane nggawe model difusi stabil lan masang menyang AWS.
Mbangun lan nyebarake Difusi Stabil
BentoML lan Amazon Web Services EC2 minangka rong pilihan kanggo hosting model Difusi Stabil online. BentoML minangka kerangka open-source kanggo skala learning machine layanan. Kanthi BentoML, kita bakal mbangun layanan dispersi sing dipercaya lan nyebarake menyang AWS EC2.
Nyiapake lingkungan lan download model difusi stabil
Instal syarat lan clone repositori.
Sampeyan bisa milih lan ngundhuh model Difusi Stabil. Presisi tunggal cocok kanggo CPU utawa GPU kanthi luwih saka 10GB VRAM. Setengah presisi becik kanggo GPU sing kurang saka 10GB VRAM.
Difusi Stabil Bangunan
Kita bakal mbangun layanan BentoML kanggo ngawula model konco a RESTful API. Conto ing ngisor iki nggunakake model presisi tunggal kanggo prediksi lan modul service.py kanggo nyambungake layanan menyang logika bisnis. Kita bisa mbukak fungsi kasebut minangka API kanthi menehi tag nganggo @svc.api.
Salajengipun, kita bisa nemtokake jinis input lan output API ing paramèter. Titik pungkasan txt2img, contone, nampa input JSON lan ngasilake output Gambar, dene titik akhir img2img nampa input Gambar lan JSON lan ngasilake output Gambar.
A StableDiffusionRunnable nemtokake logika inferensi penting. Runnable tanggung jawab kanggo mbukak metode pipa txt2img model lan ngirim input sing cocog. Kanggo mbukak logika inferensi model ing API, Runner khusus dibangun saka StableDiffusionRunnable.
Banjur, gunakake printah ing ngisor iki kanggo miwiti layanan BentoML kanggo nyoba. Ngatur lokal Model Difusi Stabil inferensi ing CPU rodo sluggish. Saben panyuwunan butuh udakara 5 menit kanggo diproses.
Teks menyang gambar
Teks menyang output gambar
File bentofile.yaml nemtokake file lan dependensi sing dibutuhake.
Gunakake printah ing ngisor iki kanggo mbangun bento. Bento minangka format distribusi kanggo layanan BentoML. Iki minangka arsip mandiri sing ngemot kabeh data lan konfigurasi sing dibutuhake kanggo miwiti layanan kasebut.
Bento Difusi Stabil wis rampung. Yen sampeyan ora bisa ngasilake bento kanthi bener, aja gupuh; sampeyan bisa ngundhuh model sing wis dibangun nggunakake printah sing kadhaptar ing bagean sabanjure.
Model pra-bangunan
Ing ngisor iki minangka model pra-bangun:
Pasang model Difusi Stabil menyang EC2
Kanggo nyebarke bento menyang EC2, kita bakal nggunakake bentoctl. bentoctl bisa ngidini sampeyan masang bentos menyang sembarang platform maya nggunakake Terraform. Kanggo mbangun lan ngetrapake file Terraform, instal operator AWS EC2.
Ing file config.yaml penyebaran, penyebaran wis dikonfigurasi. Mangga aran gratis kanggo ngowahi kanggo kabutuhan. Bento disebarake kanthi gawan ing inang g4dn.xlarge karo Learning Deep AMI GPU PyTorch 1.12.0 (Ubuntu 20.04) AMI ing wilayah us-west-1.
Gawe file Terraform saiki. Gawe gambar Docker lan upload menyang AWS ECR. Gumantung bandwidth sampeyan, upload gambar bisa uga butuh wektu suwe. Nalika nggunakake bento menyang AWS EC2, gunakake file Terraform.
Kanggo ngakses UI Swagger, sambungake menyang konsol EC2 lan bukak alamat IP umum ing browser. Pungkasan, yen layanan Stable Diffusion BentoML ora dibutuhake maneh, mbusak panyebaran kasebut.
kesimpulan
Sampeyan kudu bisa ndeleng carane narik lan kuat SD lan model kanca sing. Wektu bakal ngerti yen kita bakal ngulang konsep kasebut utawa pindhah menyang pendekatan sing luwih canggih.
Nanging, saiki ana inisiatif kanggo nglatih model sing luwih gedhe kanthi pangaturan supaya luwih ngerti lingkungan lan instruksi. Kita nyoba ngembangake layanan Difusi Stabil nggunakake BentoML lan disebarake menyang AWS EC2.
Kita bisa mbukak model Difusi Stabil ing hardware sing luwih kuat, nggawe gambar kanthi latensi sing sithik, lan ngluwihi komputer siji kanthi nggunakake layanan ing AWS EC2.
Ninggalake a Reply