Rydym yn byw mewn cyfnod cyffrous, gyda chyhoeddiadau am dechnoleg flaengar bob wythnos. Mae OpenAI newydd ryddhau'r model testun-i-ddelwedd blaengar DALLE 2.
Dim ond ychydig o bobl a gafodd fynediad cynnar i system AI newydd a all gynhyrchu graffeg realistig o ddisgrifiadau iaith naturiol. Mae’n dal ar gau i’r cyhoedd.
Yna rhyddhaodd Sefydlogrwydd AI y Trylediad Sefydlog model, amrywiad ffynhonnell agored o DALLE2. Mae'r lansiad hwn wedi newid popeth. Roedd pobl ar draws y rhyngrwyd yn cyhoeddi canlyniadau cyflym ac yn cael eu synnu gan gelf realistig.
Beth yw Trylediad Sefydlog?
Trylediad Sefydlog yn fodel dysgu peirianyddol sy'n gallu creu delweddau o destun, newid delweddau yn dibynnu ar y testun, a llenwi manylion ar ddelweddau cydraniad isel neu fanylion isel.
Cafodd ei hyfforddi ar biliynau o luniau a gall ddarparu canlyniadau sy'n cyfateb i DALL-E2 ac Canol Taith. Sefydlogrwydd AI ei ddyfeisio, a chafodd ei wneud yn gyhoeddus ar Awst 22, 2022.
Ond gydag adnoddau cyfrifiadurol lleol cyfyngedig, mae'r model Stable Diffusion yn cymryd amser hir i greu lluniau o ansawdd uchel. Mae rhedeg y model ar-lein gan ddefnyddio darparwr cwmwl yn rhoi adnoddau cyfrifiannol bron yn ddiddiwedd i ni ac yn ein galluogi i gael canlyniadau rhagorol yn gynt o lawer.
Mae cynnal y model fel microwasanaeth hefyd yn caniatáu i apiau creadigol eraill fanteisio'n haws ar botensial y model heb orfod delio â chymhlethdodau rhedeg modelau ML ar-lein.
Yn y swydd hon, byddwn yn ceisio dangos sut i ddatblygu model gwasgariad sefydlog a'i ddefnyddio i AWS.
Adeiladu a Defnyddio Trylediad Sefydlog
BentoML ac Amazon Web Services EC2 yn ddau opsiwn ar gyfer cynnal y model Stable Diffusion ar-lein. Mae BentoML yn fframwaith ffynhonnell agored ar gyfer graddio dysgu peiriant gwasanaethau. Gyda BentoML, byddwn yn adeiladu gwasanaeth gwasgaru dibynadwy ac yn ei ddefnyddio i AWS EC2.
Paratoi'r amgylchedd a lawrlwytho model gwasgariad sefydlog
Gosod gofynion a chlonio'r ystorfa.
Gallwch ddewis a lawrlwytho'r model Stable Diffusion. Mae manwl gywirdeb sengl yn addas ar gyfer CPUs neu GPUs gyda mwy na 10GB o VRAM. Mae hanner manwl gywirdeb yn ddelfrydol ar gyfer GPUs â llai na 10GB VRAM.
Adeiladu Trylediad Stabl
Byddwn yn adeiladu gwasanaeth BentoML i wasanaethu'r model y tu ôl i a API RESTING. Mae'r enghraifft ganlynol yn defnyddio'r model manwl sengl ar gyfer rhagfynegiad a'r modiwl service.py i gysylltu'r gwasanaeth â rhesymeg busnes. Gallwn ddatgelu'r swyddogaethau fel APIs trwy eu tagio â @svc.api.
At hynny, gallwn ddiffinio mathau mewnbwn ac allbwn yr APIs yn y paramedrau. Mae diweddbwynt txt2img, er enghraifft, yn derbyn mewnbwn JSON ac yn cynhyrchu allbwn Delwedd, tra bod y pwynt terfyn img2img yn derbyn Delwedd a mewnbwn JSON ac yn dychwelyd allbwn Delwedd.
Mae StableDiffusionRunnable yn diffinio'r rhesymeg casgliad hanfodol. Mae'r rhedadwy yn gyfrifol am redeg dulliau pibell txt2img y model ac anfon y mewnbynnau perthnasol. Ar gyfer rhedeg y rhesymeg casgliad model yn yr APIs, mae Rhedwr wedi'i deilwra yn cael ei adeiladu o'r StableDiffusionRunnable.
Yna, defnyddiwch y gorchymyn canlynol i gychwyn gwasanaeth BentoML i'w brofi. Yn lleol yn rhedeg y Model Trylediad Sefydlog braidd yn araf yw'r casgliad ar CPUs. Bydd pob cais yn cymryd tua 5 munud i'w brosesu.
Testun i ddelwedd
Allbwn testun i ddelwedd
Mae'r ffeil bentofile.yaml yn diffinio'r ffeiliau a'r dibyniaethau gofynnol.
Defnyddiwch y gorchymyn isod i adeiladu bento. Bento yw'r fformat dosbarthu ar gyfer gwasanaeth BentoML. Mae'n archif hunangynhwysol sy'n cynnwys yr holl ddata a ffurfweddiadau sydd eu hangen i gychwyn y gwasanaeth.
Mae'r bento Stable Diffusion wedi'i gwblhau. Os nad oeddech yn gallu cynhyrchu'r bento yn iawn, peidiwch â chynhyrfu; gallwch lawrlwytho model a adeiladwyd ymlaen llaw gan ddefnyddio'r gorchmynion a restrir yn yr adran nesaf.
Modelau Cyn-adeiladu
Dyma'r modelau rhag-adeiladu:
Defnyddio model Trylediad Sefydlog i EC2
I ddefnyddio'r bento i EC2, byddwn yn defnyddio bentoctl. gall bentoctl adael i chi ddefnyddio'ch bentos i unrhyw un platfform cwmwl defnyddio Terraform. I adeiladu a chymhwyso ffeiliau Terraform, gosodwch y gweithredwr AWS EC2.
Yn y ffeil config.yaml deployment, mae'r gosodiad eisoes wedi'i ffurfweddu. Mae croeso i chi olygu eich gofynion. Mae'r Bento yn cael ei ddefnyddio yn ddiofyn ar westeiwr g4dn.xlarge gyda'r Dysgu Dwfn AMI GPU PyTorch 1.12.0 (Ubuntu 20.04) AMI ar y rhanbarth us-orllewin-1.
Creu'r ffeiliau Terraform nawr. Creu delwedd y Docker a'i uwchlwytho i AWS ECR. Yn dibynnu ar eich lled band, gall uwchlwytho delweddau gymryd amser hir. Wrth ddefnyddio'r bento i AWS EC2, defnyddiwch y ffeiliau Terraform.
I gael mynediad i'r Swagger UI, cysylltwch â'r consol EC2 ac agorwch y cyfeiriad IP cyhoeddus mewn porwr. Yn olaf, os nad oes angen y gwasanaeth BentoML Stable Diffusion mwyach, dileu'r defnydd.
Casgliad
Dylech allu gweld pa mor ddiddorol a phwerus yw DC a'i fodelau cydymaith. Amser a ddengys a fyddwn yn ailadrodd y cysyniad ymhellach neu'n symud ymlaen at ddulliau mwy soffistigedig.
Fodd bynnag, mae mentrau ar y gweill ar hyn o bryd i hyfforddi modelau mwy gydag addasiadau i ddeall yr amgylchoedd a'r cyfarwyddiadau yn well. Ceisiwyd datblygu'r gwasanaeth Trylediad Sefydlog gan ddefnyddio BentoML a'i ddefnyddio i AWS EC2.
Roeddem yn gallu rhedeg y model Stable Diffusion ar galedwedd mwy pwerus, creu lluniau gyda hwyrni isel, ac ymestyn y tu hwnt i un cyfrifiadur trwy ddefnyddio'r gwasanaeth ar AWS EC2.
Gadael ymateb