ഉള്ളടക്ക പട്ടിക[മറയ്ക്കുക][കാണിക്കുക]
എല്ലാ ആഴ്ചയും അത്യാധുനിക സാങ്കേതികവിദ്യയെക്കുറിച്ചുള്ള പ്രഖ്യാപനങ്ങളുമായി ഞങ്ങൾ ആവേശകരമായ സമയത്താണ് ജീവിക്കുന്നത്. OpenAI ഇപ്പോൾ അത്യാധുനിക ടെക്സ്റ്റ്-ടു-ഇമേജ് മോഡൽ DALLE 2 പുറത്തിറക്കി.
സ്വാഭാവിക ഭാഷാ വിവരണങ്ങളിൽ നിന്ന് റിയലിസ്റ്റിക് ഗ്രാഫിക്സ് സൃഷ്ടിക്കാൻ കഴിയുന്ന ഒരു പുതിയ AI സിസ്റ്റത്തിലേക്ക് കുറച്ച് ആളുകൾക്ക് മാത്രമേ നേരത്തെ പ്രവേശനം ലഭിച്ചിട്ടുള്ളൂ. ഇത് ഇപ്പോഴും പൊതുജനങ്ങൾക്കായി അടച്ചിരിക്കുന്നു.
സ്റ്റെബിലിറ്റി AI പിന്നീട് പുറത്തിറക്കി സ്ഥിരതയുള്ള വ്യാപനം മോഡൽ, DALLE2-ന്റെ ഒരു ഓപ്പൺ സോഴ്സ് വേരിയന്റ്. ഈ വിക്ഷേപണം എല്ലാം മാറ്റിമറിച്ചു. ഇന്റർനെറ്റിലുടനീളം ആളുകൾ പെട്ടെന്നുള്ള ഫലങ്ങൾ പ്രസിദ്ധീകരിക്കുകയും റിയലിസ്റ്റിക് കലയിൽ ആശ്ചര്യപ്പെടുകയും ചെയ്തു.
എന്താണ് സ്ഥിരതയുള്ള വ്യാപനം?
സ്ഥിരതയുള്ള വ്യാപനം ടെക്സ്റ്റിൽ നിന്ന് ഇമേജുകൾ സൃഷ്ടിക്കാനും ടെക്സ്റ്റിനനുസരിച്ച് ഇമേജുകൾ മാറ്റാനും കുറഞ്ഞ റെസല്യൂഷനോ കുറഞ്ഞ വിശദാംശമോ ഉള്ള ചിത്രങ്ങളിൽ വിശദാംശങ്ങൾ പൂരിപ്പിക്കാനും കഴിവുള്ള ഒരു മെഷീൻ ലേണിംഗ് മോഡലാണ്.
ഇത് ശതകോടിക്കണക്കിന് ഫോട്ടോകളിൽ പരിശീലിപ്പിക്കപ്പെട്ടു, അതിന് തുല്യമായ ഫലങ്ങൾ നൽകാൻ കഴിയും DALL-E2 ഒപ്പം മധ്യയാത്ര. സ്ഥിരത AI ഇത് കണ്ടുപിടിച്ചു, അത് 22 ഓഗസ്റ്റ് 2022-ന് പരസ്യമാക്കി.
എന്നാൽ പരിമിതമായ പ്രാദേശിക കമ്പ്യൂട്ടേഷണൽ റിസോഴ്സുകളോടെ, ഉയർന്ന നിലവാരമുള്ള ചിത്രങ്ങൾ സൃഷ്ടിക്കാൻ സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ വളരെ സമയമെടുക്കുന്നു. ഒരു ക്ലൗഡ് പ്രൊവൈഡർ ഉപയോഗിച്ച് മോഡൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നത് ഞങ്ങൾക്ക് അനന്തമായ കമ്പ്യൂട്ടേഷണൽ ഉറവിടങ്ങൾ നൽകുകയും മികച്ച ഫലങ്ങൾ വളരെ വേഗത്തിൽ കരസ്ഥമാക്കാൻ ഞങ്ങളെ അനുവദിക്കുകയും ചെയ്യുന്നു.
ഒരു മൈക്രോസർവീസ് ആയി മോഡൽ ഹോസ്റ്റുചെയ്യുന്നത്, ML മോഡലുകൾ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിന്റെ സങ്കീർണ്ണതകൾ കൈകാര്യം ചെയ്യാതെ തന്നെ മോഡലിന്റെ സാധ്യതകൾ കൂടുതൽ എളുപ്പത്തിൽ പ്രയോജനപ്പെടുത്താൻ മറ്റ് ക്രിയേറ്റീവ് ആപ്പുകളെ അനുവദിക്കുന്നു.
ഈ പോസ്റ്റിൽ, ഒരു സ്ഥിരതയുള്ള ഡിഫ്യൂഷൻ മോഡൽ എങ്ങനെ വികസിപ്പിക്കാമെന്നും അത് AWS-ലേക്ക് എങ്ങനെ വിന്യസിക്കാമെന്നും കാണിക്കാൻ ഞങ്ങൾ ശ്രമിക്കും.
സ്ഥിരതയുള്ള വ്യാപനം നിർമ്മിക്കുകയും വിന്യസിക്കുകയും ചെയ്യുക
ബെന്റോഎംഎൽ കൂടാതെ ആമസോൺ വെബ് സേവനങ്ങൾ EC2 എന്നിവ സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ ഓൺലൈനിൽ ഹോസ്റ്റുചെയ്യുന്നതിനുള്ള രണ്ട് ഓപ്ഷനുകളാണ്. സ്കെയിലിംഗിനുള്ള ഒരു ഓപ്പൺ സോഴ്സ് ചട്ടക്കൂടാണ് BentoML മെഷീൻ ലേണിംഗ് സേവനങ്ങള്. BentoML ഉപയോഗിച്ച്, ഞങ്ങൾ ഒരു വിശ്വസനീയമായ ഡിസ്പർഷൻ സേവനം നിർമ്മിക്കുകയും അത് AWS EC2-ലേക്ക് വിന്യസിക്കുകയും ചെയ്യും.
പരിസ്ഥിതി തയ്യാറാക്കുകയും സ്ഥിരതയുള്ള ഡിഫ്യൂഷൻ മോഡൽ ഡൗൺലോഡ് ചെയ്യുകയും ചെയ്യുന്നു
ആവശ്യകതകൾ ഇൻസ്റ്റാൾ ചെയ്ത് റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക.
നിങ്ങൾക്ക് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ തിരഞ്ഞെടുത്ത് ഡൗൺലോഡ് ചെയ്യാം. 10GB VRAM-ൽ കൂടുതലുള്ള CPU-കൾക്കോ GPU-കൾക്കോ ഒറ്റ കൃത്യത അനുയോജ്യമാണ്. 10GB VRAM-ൽ താഴെയുള്ള GPU-കൾക്ക് ഹാഫ് പ്രിസിഷൻ അനുയോജ്യമാണ്.
ബിൽഡിംഗ് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ
a പിന്നിലുള്ള മോഡൽ നൽകുന്നതിന് ഞങ്ങൾ ഒരു BentoML സേവനം നിർമ്മിക്കും RESTful API. ഇനിപ്പറയുന്ന ഉദാഹരണം പ്രവചനത്തിനായി ഏക കൃത്യ മാതൃകയും സേവനത്തെ ബിസിനസ് ലോജിക്കിലേക്ക് ബന്ധിപ്പിക്കുന്നതിന് service.py മൊഡ്യൂളും ഉപയോഗിക്കുന്നു. @svc.api-ൽ ടാഗ് ചെയ്ത് API-കളായി ഫംഗ്ഷനുകൾ വെളിപ്പെടുത്താനാകും.
കൂടാതെ, നമുക്ക് API-കളുടെ ഇൻപുട്ട്, ഔട്ട്പുട്ട് തരങ്ങൾ പരാമീറ്ററുകളിൽ നിർവചിക്കാം. ഉദാഹരണത്തിന്, txt2img എൻഡ്പോയിന്റ് ഒരു JSON ഇൻപുട്ട് സ്വീകരിക്കുകയും ഒരു ഇമേജ് ഔട്ട്പുട്ട് നിർമ്മിക്കുകയും ചെയ്യുന്നു, അതേസമയം img2img എൻഡ്പോയിന്റ് ഒരു ഇമേജും ഒരു JSON ഇൻപുട്ടും സ്വീകരിക്കുകയും ഒരു ഇമേജ് ഔട്ട്പുട്ട് നൽകുകയും ചെയ്യുന്നു.
ഒരു StableDiffusionRunnable അത്യാവശ്യമായ അനുമാന യുക്തിയെ നിർവ്വചിക്കുന്നു. മോഡലിന്റെ txt2img പൈപ്പ് രീതികൾ പ്രവർത്തിപ്പിക്കുന്നതിനും പ്രസക്തമായ ഇൻപുട്ടുകൾ അയയ്ക്കുന്നതിനും റണ്ണബിൾ ചുമതലയുണ്ട്. API-കളിൽ മോഡൽ അനുമാന ലോജിക് പ്രവർത്തിപ്പിക്കുന്നതിന്, StableDiffusionRunnable-ൽ നിന്ന് ഒരു ഇഷ്ടാനുസൃത റണ്ണർ നിർമ്മിച്ചിരിക്കുന്നു.
തുടർന്ന്, പരിശോധനയ്ക്കായി ഒരു BentoML സേവനം ആരംഭിക്കുന്നതിന് ഇനിപ്പറയുന്ന കമാൻഡ് ഉപയോഗിക്കുക. പ്രാദേശികമായി നടത്തുന്നത് സ്ഥിരതയുള്ള ഡിഫ്യൂഷൻ മോഡൽ CPU-കളിലെ അനുമാനം മന്ദഗതിയിലാണ്. ഓരോ അഭ്യർത്ഥനയും പ്രോസസ്സ് ചെയ്യുന്നതിന് ഏകദേശം 5 മിനിറ്റ് എടുക്കും.
ചിത്രത്തിലേക്കുള്ള വാചകം
ടെക്സ്റ്റ് ടു ഇമേജ് ഔട്ട്പുട്ട്
bentofile.yaml ഫയൽ ആവശ്യമായ ഫയലുകളും ഡിപൻഡൻസികളും നിർവചിക്കുന്നു.
ഒരു ബെന്റോ നിർമ്മിക്കാൻ താഴെയുള്ള കമാൻഡ് ഉപയോഗിക്കുക. ഒരു BentoML സേവനത്തിന്റെ വിതരണ ഫോർമാറ്റാണ് ബെന്റോ. സേവനം ആരംഭിക്കുന്നതിന് ആവശ്യമായ എല്ലാ ഡാറ്റയും കോൺഫിഗറേഷനുകളും ഉൾക്കൊള്ളുന്ന ഒരു സ്വയം ഉൾക്കൊള്ളുന്ന ആർക്കൈവാണിത്.
സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ബെന്റോ പൂർത്തിയായി. നിങ്ങൾക്ക് ബെന്റോ ശരിയായി സൃഷ്ടിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, പരിഭ്രാന്തരാകരുത്; അടുത്ത വിഭാഗത്തിൽ ലിസ്റ്റുചെയ്തിരിക്കുന്ന കമാൻഡുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് പ്രീ-ബിൽറ്റ് മോഡൽ ഡൗൺലോഡ് ചെയ്യാം.
പ്രീ-ബിൽഡ് മോഡലുകൾ
ഇനിപ്പറയുന്നവയാണ് പ്രീ-ബിൽഡ് മോഡലുകൾ:
EC2-ലേക്ക് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ വിന്യസിക്കുക
EC2-ലേക്ക് ബെന്റോ വിന്യസിക്കാൻ, ഞങ്ങൾ bentoctl ഉപയോഗിക്കും. bentoctl നിങ്ങളുടെ ബെന്റോകൾ ഏതിലേക്കും വിന്യസിക്കാൻ നിങ്ങളെ അനുവദിക്കും ക്ലൗഡ് പ്ലാറ്റ്ഫോം ടെറാഫോം ഉപയോഗിക്കുന്നു. ടെറാഫോം ഫയലുകൾ നിർമ്മിക്കുന്നതിനും പ്രയോഗിക്കുന്നതിനും, AWS EC2 ഓപ്പറേറ്റർ ഇൻസ്റ്റാൾ ചെയ്യുക.
വിന്യാസ config.yaml ഫയലിൽ, വിന്യാസം ഇതിനകം ക്രമീകരിച്ചിട്ടുണ്ട്. നിങ്ങളുടെ ആവശ്യകതകളനുസരിച്ച് എഡിറ്റ് ചെയ്യാൻ മടിക്കേണ്ടതില്ല. ബെന്റോ സ്ഥിരസ്ഥിതിയായി g4dn.xlarge ഹോസ്റ്റിൽ വിന്യസിച്ചിരിക്കുന്നു ആഴത്തിലുള്ള പഠനം AMI GPU PyTorch 1.12.0 (Ubuntu 20.04) us-west-1 റീജിയണിലെ AMI.
ഇപ്പോൾ Terraform ഫയലുകൾ സൃഷ്ടിക്കുക. ഡോക്കർ ഇമേജ് സൃഷ്ടിച്ച് അത് AWS ECR-ലേക്ക് അപ്ലോഡ് ചെയ്യുക. നിങ്ങളുടെ ബാൻഡ്വിഡ്ത്ത് അനുസരിച്ച്, ഇമേജ് അപ്ലോഡ് ചെയ്യുന്നതിന് വളരെയധികം സമയമെടുത്തേക്കാം. AWS EC2-ലേക്ക് ബെന്റോ വിന്യസിക്കുമ്പോൾ, Terraform ഫയലുകൾ ഉപയോഗിക്കുക.
Swagger UI ആക്സസ് ചെയ്യാൻ, EC2 കൺസോളിലേക്ക് കണക്റ്റുചെയ്ത് ഒരു ബ്രൗസറിൽ പൊതു IP വിലാസം തുറക്കുക. അവസാനമായി, സ്റ്റേബിൾ ഡിഫ്യൂഷൻ BentoML സേവനം ഇനി ആവശ്യമില്ലെങ്കിൽ, വിന്യാസം നീക്കം ചെയ്യുക.
തീരുമാനം
എസ്ഡിയും അതിന്റെ സഹകാരി മോഡലുകളും എത്ര ആകർഷകവും ശക്തവുമാണെന്ന് നിങ്ങൾക്ക് കാണാനാകും. ഞങ്ങൾ ആശയം കൂടുതൽ ആവർത്തിക്കുമോ അതോ കൂടുതൽ സങ്കീർണ്ണമായ സമീപനങ്ങളിലേക്ക് നീങ്ങുമോ എന്ന് സമയം പറയും.
എന്നിരുന്നാലും, ചുറ്റുപാടുകളും നിർദ്ദേശങ്ങളും നന്നായി മനസ്സിലാക്കുന്നതിന് ക്രമീകരണങ്ങളോടെ വലിയ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിനുള്ള സംരംഭങ്ങൾ നിലവിൽ നടക്കുന്നുണ്ട്. ഞങ്ങൾ BentoML ഉപയോഗിച്ച് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ സേവനം വികസിപ്പിക്കാൻ ശ്രമിച്ചു, അത് AWS EC2-ലേക്ക് വിന്യസിച്ചു.
AWS EC2-ൽ സേവനം വിന്യസിച്ചുകൊണ്ട് കൂടുതൽ ശക്തമായ ഹാർഡ്വെയറിൽ സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ പ്രവർത്തിപ്പിക്കാനും കുറഞ്ഞ ലേറ്റൻസിയിൽ ചിത്രങ്ങൾ സൃഷ്ടിക്കാനും ഒരൊറ്റ കമ്പ്യൂട്ടറിനപ്പുറത്തേക്ക് വ്യാപിപ്പിക്കാനും ഞങ്ങൾക്ക് കഴിഞ്ഞു.
നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക