យើងរស់នៅក្នុងពេលវេលាដ៏គួរឱ្យរំភើបជាមួយនឹងការប្រកាសអំពីបច្ចេកវិទ្យាទំនើបរៀងរាល់សប្តាហ៍។ OpenAI ទើបតែបញ្ចេញគំរូអត្ថបទទៅរូបភាពដ៏ទំនើប DALLE 2។
មានមនុស្សតែពីរបីនាក់ប៉ុណ្ណោះដែលអាចចូលប្រើប្រព័ន្ធ AI ថ្មីដែលអាចបង្កើតក្រាហ្វិកជាក់ស្តែងពីការពិពណ៌នាភាសាធម្មជាតិ។ វានៅតែត្រូវបានបិទជាសាធារណៈ។
ស្ថេរភាព AI បន្ទាប់មកបានចេញផ្សាយ ការសាយភាយមានស្ថេរភាព គំរូ វ៉ារ្យ៉ង់ប្រភពបើកចំហនៃ DALLE2 ។ ការបើកដំណើរការនេះបានផ្លាស់ប្តូរអ្វីៗទាំងអស់។ មនុស្សទូទាំងអ៊ីនធឺណិតកំពុងផ្សព្វផ្សាយលទ្ធផលរហ័ស និងមានការភ្ញាក់ផ្អើលដោយសិល្បៈប្រាកដនិយម។
តើការសាយភាយមានស្ថេរភាពគឺជាអ្វី?
ការសាយភាយមានស្ថេរភាព គឺជាគំរូសិក្សាដោយម៉ាស៊ីនដែលមានសមត្ថភាពបង្កើតរូបភាពពីអត្ថបទ ផ្លាស់ប្ដូររូបភាពអាស្រ័យលើអត្ថបទ និងការបំពេញព័ត៌មានលម្អិតលើរូបភាពកម្រិតទាប ឬលម្អិតទាប។
វាត្រូវបានបណ្តុះបណ្តាលលើរូបថតរាប់ពាន់លាន ហើយអាចផ្តល់លទ្ធផលស្មើនឹង DALL-E2 និង ការធ្វើដំណើរពាក់កណ្តាល. ស្ថេរភាព AI បានបង្កើតវា ហើយវាត្រូវបានផ្សព្វផ្សាយជាសាធារណៈនៅថ្ងៃទី 22 ខែសីហា ឆ្នាំ 2022។
ប៉ុន្តែជាមួយនឹងធនធានកុំព្យូទ័រក្នុងស្រុកមានកម្រិត ម៉ូដែល Stable Diffusion ត្រូវការពេលយូរដើម្បីបង្កើតរូបភាពដែលមានគុណភាពខ្ពស់។ ការដំណើរការគំរូតាមអ៊ីនធឺណិតដោយប្រើអ្នកផ្តល់សេវាពពកផ្តល់ឱ្យយើងនូវធនធានគណនាស្ទើរតែគ្មានដែនកំណត់ និងអនុញ្ញាតឱ្យយើងទទួលបានលទ្ធផលដ៏ល្អលឿនជាង។
ការបង្ហោះគំរូនេះជាសេវាមីក្រូក៏អនុញ្ញាតឱ្យកម្មវិធីច្នៃប្រឌិតផ្សេងទៀតទាញយកសក្តានុពលរបស់ម៉ូដែលយ៉ាងងាយស្រួលដោយមិនចាំបាច់ដោះស្រាយភាពស្មុគស្មាញនៃការដំណើរការម៉ូដែល ML តាមអ៊ីនធឺណិត។
នៅក្នុងការបង្ហោះនេះ យើងនឹងព្យាយាមបង្ហាញពីរបៀបបង្កើតគំរូនៃការសាយភាយដែលមានស្ថេរភាព ហើយដាក់ពង្រាយវាទៅ AWS ។
បង្កើត និងដាក់ពង្រាយការសាយភាយមានស្ថេរភាព
BentoML និង Amazon Web Services EC2 គឺជាជម្រើសពីរសម្រាប់ការបង្ហោះម៉ូដែល Stable Diffusion តាមអ៊ីនធឺណិត។ BentoML គឺជាក្របខ័ណ្ឌប្រភពបើកចំហសម្រាប់ការធ្វើមាត្រដ្ឋាន ការរៀនម៉ាស៊ីន សេវាកម្ម។ ជាមួយនឹង BentoML យើងនឹងបង្កើតសេវាកម្មបែកខ្ញែកដែលអាចទុកចិត្តបាន ហើយដាក់ពង្រាយវាទៅ AWS EC2។
កំពុងរៀបចំបរិស្ថាន និងទាញយកគំរូចែកចាយដែលមានស្ថេរភាព
ដំឡើងតម្រូវការ និងក្លូនឃ្លាំង។
អ្នកអាចជ្រើសរើស និងទាញយកគំរូ Stable Diffusion ។ ភាពជាក់លាក់តែមួយគឺសមរម្យសម្រាប់ CPU ឬ GPUs ដែលមាន VRAM លើសពី 10GB ។ ភាពជាក់លាក់ពាក់កណ្តាលគឺល្អសម្រាប់ GPUs ដែលមាន VRAM តិចជាង 10GB ។
ការសាយភាយមានស្ថេរភាព
យើងនឹងបង្កើតសេវាកម្ម BentoML ដើម្បីបម្រើគំរូនៅពីក្រោយ ក API ល្អបំផុត. ឧទាហរណ៍ខាងក្រោមប្រើគំរូភាពជាក់លាក់តែមួយសម្រាប់ការទស្សន៍ទាយ និងម៉ូឌុល service.py ដើម្បីភ្ជាប់សេវាកម្មទៅនឹងតក្កវិជ្ជាអាជីវកម្ម។ យើងអាចបង្ហាញមុខងារជា APIs ដោយដាក់ស្លាកពួកវាជាមួយ @svc.api។
លើសពីនេះ យើងអាចកំណត់ប្រភេទបញ្ចូល និងទិន្នផលរបស់ APIs ក្នុងប៉ារ៉ាម៉ែត្រ។ ឧទាហរណ៍ ចំណុចបញ្ចប់ txt2img ទទួលការបញ្ចូល JSON និងបង្កើតលទ្ធផលរូបភាព ចំណែកឯចំណុចបញ្ចប់ img2img ទទួលយករូបភាព និងធាតុបញ្ចូល JSON ហើយត្រឡប់លទ្ធផលរូបភាព។
StableDiffusionRunnable កំណត់តក្កវិជ្ជាសន្និដ្ឋានសំខាន់។ Runnable ទទួលខុសត្រូវក្នុងការដំណើរការវិធីសាស្ត្របំពង់ txt2img របស់ម៉ូដែល និងការផ្ញើធាតុចូលដែលពាក់ព័ន្ធ។ សម្រាប់ដំណើរការតក្កវិជ្ជាការសន្និដ្ឋានគំរូនៅក្នុង APIs កម្មវិធីរត់ផ្ទាល់ខ្លួនត្រូវបានសាងសង់ពី StableDiffusionRunnable ។
បន្ទាប់មក សូមប្រើពាក្យបញ្ជាខាងក្រោមដើម្បីចាប់ផ្តើមសេវាកម្ម BentoML សម្រាប់ការធ្វើតេស្ត។ ដំណើរការក្នុងស្រុក គំរូនៃការសាយភាយមានស្ថេរភាព ការសន្និដ្ឋានលើស៊ីភីយូគឺយឺតជាង។ សំណើនីមួយៗនឹងចំណាយពេលប្រហែល 5 នាទីដើម្បីដំណើរការ។
អត្ថបទទៅរូបភាព
អត្ថបទទៅលទ្ធផលរូបភាព
ឯកសារ bentofile.yaml កំណត់ឯកសារដែលត្រូវការ និងភាពអាស្រ័យ។
ប្រើពាក្យបញ្ជាខាងក្រោមដើម្បីបង្កើត bento ។ Bento គឺជាទម្រង់ចែកចាយសម្រាប់សេវាកម្ម BentoML ។ វាជាបណ្ណសារដែលផ្ទុកដោយខ្លួនឯងដែលមានទិន្នន័យ និងការកំណត់រចនាសម្ព័ន្ធទាំងអស់ដែលត្រូវការដើម្បីចាប់ផ្តើមសេវាកម្ម។
បេនតូនៃការសាយភាយមានស្ថេរភាពត្រូវបានបញ្ចប់។ ប្រសិនបើអ្នកមិនអាចបង្កើត bento បានត្រឹមត្រូវទេ កុំភ័យស្លន់ស្លោ។ អ្នកអាចទាញយកគំរូដែលបានសាងសង់ជាមុនដោយប្រើពាក្យបញ្ជាដែលបានរាយក្នុងផ្នែកបន្ទាប់។
គំរូសាងសង់ជាមុន
ខាងក្រោមនេះគឺជាគំរូមុនការបង្កើត៖
ដាក់ឱ្យប្រើគំរូការសាយភាយស្ថិរភាពទៅ EC2
ដើម្បីដាក់ពង្រាយ bento ទៅ EC2 យើងនឹងប្រើ bentoctl ។ bentoctl អាចអនុញ្ញាតឱ្យអ្នកដាក់ bentos របស់អ្នកទៅណាមួយ។ វេទិកាពពក ការប្រើប្រាស់ Terraform ។ ដើម្បីបង្កើត និងអនុវត្តឯកសារ Terraform សូមដំឡើងប្រតិបត្តិករ AWS EC2 ។
នៅក្នុងឯកសារ config.yaml ការដាក់ពង្រាយ ការដាក់ពង្រាយត្រូវបានកំណត់រចនាសម្ព័ន្ធរួចហើយ។ សូមមានអារម្មណ៍សេរីក្នុងការកែសម្រួលតាមតម្រូវការរបស់អ្នក។ Bento ត្រូវបានដាក់ពង្រាយតាមលំនាំដើមនៅលើម៉ាស៊ីន g4dn.xlarge ជាមួយ ការសិក្សាស៊ីជម្រៅ។ AMI GPU PyTorch 1.12.0 (អ៊ូប៊ុនទូ 20.04) AMI នៅលើតំបន់ us-west-1 ។
បង្កើតឯកសារ Terraform ឥឡូវនេះ។ បង្កើតរូបភាព Docker ហើយបង្ហោះវាទៅ AWS ECR ។ អាស្រ័យលើកម្រិតបញ្ជូនរបស់អ្នក ការបង្ហោះរូបភាពអាចចំណាយពេលយូរ។ នៅលើការដាក់ពង្រាយ bento ទៅ AWS EC2 សូមប្រើឯកសារ Terraform ។
ដើម្បីចូលប្រើ Swagger UI សូមភ្ជាប់ទៅកុងសូល EC2 ហើយបើកអាសយដ្ឋាន IP សាធារណៈនៅក្នុងកម្មវិធីរុករក។ ជាចុងក្រោយ ប្រសិនបើសេវាកម្ម Stable Diffusion BentoML មិនត្រូវបានទាមទារទៀតទេ សូមដកការដាក់ពង្រាយចេញ។
សន្និដ្ឋាន
អ្នកគួរតែអាចមើលឃើញថា SD ដ៏គួរឲ្យចាប់អារម្មណ៍ និងមានថាមពល និងម៉ូដែលដៃគូរបស់វាមានកម្រិតណា។ ពេលវេលានឹងប្រាប់ថាតើយើងនឹងធ្វើម្តងទៀតលើគោលគំនិតនេះបន្ថែមទៀត ឬបន្តទៅវិធីសាស្រ្តទំនើបបន្ថែមទៀត។
ទោះជាយ៉ាងណាក៏ដោយ បច្ចុប្បន្នមានគំនិតផ្តួចផ្តើមកំពុងដំណើរការដើម្បីបណ្តុះបណ្តាលគំរូធំជាងមុន ជាមួយនឹងការកែតម្រូវដើម្បីយល់កាន់តែច្បាស់ជុំវិញជុំវិញ និងការណែនាំ។ យើងបានព្យាយាមបង្កើតសេវាកម្ម Stable Diffusion ដោយប្រើ BentoML ហើយដាក់ពង្រាយវាទៅ AWS EC2។
យើងអាចដំណើរការគំរូ Stable Diffusion លើផ្នែករឹងដែលមានថាមពលខ្លាំងជាងមុន បង្កើតរូបភាពដែលមានភាពយឺតយ៉ាវទាប និងពង្រីកលើសពីកុំព្យូទ័រតែមួយដោយដាក់ពង្រាយសេវាកម្មនៅលើ AWS EC2។
សូមផ្ដល់យោបល់