Dreambooth Tutorial ສໍາລັບຜູ້ເລີ່ມຕົ້ນ

ສາລະບານ[ເຊື່ອງ][ສະແດງ]

Dreambooth ແມ່ນຫຍັງ?
ຄຸນລັກສະນະ
ຄໍາຮ້ອງສະຫມັກ+-
ບົດຮຽນ Dreambooth+-
ຂໍ້ຈໍາກັດ Dreambooth
ສະຫຼຸບ

ຮູບແບບຂໍ້ຄວາມເປັນຮູບພາບຂະຫນາດໃຫຍ່ໄດ້ມີຄວາມກ້າວຫນ້າທີ່ສໍາຄັນໃນການພັດທະນາ AI ໂດຍການຜະລິດການສັງເຄາະຮູບພາບທີ່ມີຄຸນນະພາບສູງແລະມີຄວາມຫຼາກຫຼາຍຈາກການເຕືອນຂໍ້ຄວາມ.

ໂມເດວເຫຼົ່ານີ້ບໍ່ສາມາດສັງເຄາະຕົວແທນທີ່ເປັນເອກະລັກຂອງຫົວຂໍ້ຕ່າງໆໃນການຕັ້ງຄ່າຕ່າງໆ ຫຼືເພື່ອເຮັດເລື້ມຄືນຮູບລັກສະນະຂອງວິຊາໃນຊຸດອ້າງອີງທີ່ໃຫ້ໄວ້.

ເທກໂນໂລຍີທີ່ອອກໃຫມ່ເຊັ່ນ OpenAI's DALL.E2 ຫຼື StabilityAI's ການແຜ່ກະຈາຍຄົງທີ່ ແລະ Midjourney ແມ່ນແລ້ວເອົາອິນເຕີເນັດໂດຍພະຍຸ. ໃນປັດຈຸບັນມັນແມ່ນເວລາທີ່ຈະປັບແຕ່ງຜົນໄດ້ຮັບ. ແນວໃດ?

Google DreamBooth AI ມາຮອດແລ້ວ.

DreamBooth ມີຄວາມສາມາດທີ່ຈະຮັບຮູ້ຫົວຂໍ້ຂອງຮູບພາບ, deconstruct ມັນຈາກສະພາບຕົ້ນສະບັບຂອງຕົນ, ແລະຫຼັງຈາກນັ້ນສັງເຄາະມັນເຂົ້າໄປໃນສະພາບທີ່ຕ້ອງການໃຫມ່. ນອກຈາກນັ້ນ, ມັນສາມາດຖືກນໍາໃຊ້ກັບເຄື່ອງສ້າງຮູບພາບ AI ໃນປະຈຸບັນ.

ໃນບົດຄວາມນີ້, ພວກເຮົາຈະພິຈາລະນາຢ່າງເລິກເຊິ່ງກ່ຽວກັບ DreamBooth, ການນໍາໃຊ້ຂອງມັນ, ການສອນຂອງມັນ, ຂໍ້ຈໍາກັດຂອງມັນ, ແລະອື່ນໆອີກ.

Dreambooth ແມ່ນຫຍັງ?

ຕູບຕູບ, ຮູບແບບການແຜ່ກະຈາຍຂໍ້ຄວາມເປັນຮູບຍີ່ຫໍ້ໃຫມ່, ຖືກນໍາສະເຫນີໂດຍ Google. ການເຕືອນທີ່ຂຽນສາມາດຖືກນໍາໃຊ້ເປັນຄໍາແນະນໍາໂດຍ Google DreamBooth AI ເພື່ອສ້າງຮູບພາບທີ່ຫລາກຫລາຍຂອງຫົວຂໍ້ທີ່ເລືອກຂອງຜູ້ໃຊ້ໃນການຕັ້ງຄ່າຕ່າງໆ.

ກຸ່ມຄົ້ນຄ້ວາຈາກມະຫາວິທະຍາໄລ Boston ແລະ Google ພັດທະນາ DreamBooth, ເຕັກນິກທີ່ທັນສະ ໄໝ ສໍາລັບການປ່ຽນຕົວແບບຂໍ້ຄວາມເປັນຮູບພາບທີ່ຜ່ານການຝຶກອົບຮົມເບື້ອງຕົ້ນຢ່າງກວ້າງຂວາງ.

ແນວຄວາມຄິດໂດຍລວມແມ່ນກົງໄປກົງມາຫຼາຍ: ພວກເຂົາຕ້ອງການເພີ່ມວັດຈະນານຸກົມພາສາວິໄສທັດເຊັ່ນວ່າ ID token ທີ່ບໍ່ທໍາມະດາແມ່ນກ່ຽວຂ້ອງກັບຫົວຂໍ້ທີ່ຜູ້ໃຊ້ສາມາດກໍານົດໄດ້.

ເປົ້າຫມາຍຕົ້ນຕໍຂອງຮູບແບບແມ່ນເພື່ອເຊື່ອມຕໍ່ຜູ້ໃຊ້ກັບ ຮູບແບບການກະຈາຍຂໍ້ຄວາມເປັນຮູບພາບ ໂດຍການໃຫ້ພວກເຂົາຊັບພະຍາກອນທີ່ພວກເຂົາຕ້ອງການເພື່ອຜະລິດການເປັນຕົວແທນຂອງ photorealistic ຂອງຕົວຢ່າງຂອງຫົວຂໍ້ທີ່ເຂົາເຈົ້າເລືອກ.

ດັ່ງນັ້ນ, ເຕັກນິກນີ້ເບິ່ງຄືວ່າຈະເຮັດວຽກໄດ້ດີສໍາລັບການສະຫຼຸບສິ່ງທ້າທາຍໃນສະຖານະການຕ່າງໆ.

DreamBooth ຂອງ Google ແຕກຕ່າງຈາກເຄື່ອງມືຂໍ້ຄວາມເປັນຮູບພາບທີ່ຜ່ານມາ, ເຊັ່ນ: DALL-E2, ການແຜ່ກະຈາຍຄົງທີ່, ແລະ ກາງແຈ້ງ, ໃນນັ້ນມັນເຮັດໃຫ້ຜູ້ໃຊ້ສາມາດຄວບຄຸມຮູບພາບຫົວຂໍ້ໄດ້ຫຼາຍຂຶ້ນກ່ອນທີ່ຈະປ່ອຍໃຫ້ພວກເຂົາຈັດການຮູບແບບການແຜ່ກະຈາຍໂດຍໃຊ້ວັດສະດຸປ້ອນຂໍ້ຄວາມ.

ຄຸນລັກສະນະ

DreamBooth AI ອາດຈະປັບປຸງຮູບແບບຂໍ້ຄວາມເປັນຮູບພາບທີ່ມີ 3-5 ຮູບພາບ.
ຮູບພາບຕົ້ນສະບັບສາມາດສ້າງໄດ້ດ້ວຍ DreamBooth AI.
ນອກຈາກນັ້ນ, DreamBooth AI ສາມາດສ້າງຮູບພາບຂອງຫົວຂໍ້ຈາກຫຼາຍມຸມ.

ຄໍາຮ້ອງສະຫມັກ

ການສະແດງສິລະປະ

ວຽກງານນີ້ແຕກຕ່າງຈາກການຖ່າຍທອດແບບສະໄຕ, ເຊິ່ງຮັກສາຄວາມສົມດູນຂອງ scene ແຫຼ່ງໃນຂະນະທີ່ການລວມເອົາຮູບແບບຂອງຮູບພາບອື່ນເຂົ້າໄປໃນ scene ຕົ້ນສະບັບ.

ການສະແດງສິລະປະ

ໂດຍອີງໃສ່ວິທີການສ້າງສັນ, AI ສາມາດເຮັດສໍາເລັດການປ່ຽນແປງ scene ທີ່ສໍາຄັນໃນຂະນະທີ່ຮັກສາການກໍານົດຕົວຕົນແລະຫົວຂໍ້ສະເພາະ.

ການແກ້ໄຂຊັບສິນ

ຄຸນລັກສະນະຂອງຕົວຢ່າງຂອງຫົວຂໍ້ສາມາດຖືກດັດແປງໂດຍ DreamBooth AI.

ການແກ້ໄຂຊັບສິນ

ອຸປະກອນເສີມ

ອົງປະກອບທີ່ເຂັ້ມແຂງກ່ອນຮູບແບບການຜະລິດແມ່ນສິ່ງທີ່ເຮັດໃຫ້ຄວາມສາມາດຂອງ DreamBooth AI ໃນການຕົບແຕ່ງວັດຖຸທີ່ຫນ້າສົນໃຈຫຼາຍ.

ອຸປະກອນເສີມ

Recontextualization

DreamBooth AI ສາມາດຜະລິດຮູບພາບທີ່ໂດດເດັ່ນສໍາລັບຕົວຢ່າງວິຊາສະເພາະໂດຍການໃຫ້ຕົວແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມເປັນປະໂຫຍກທີ່ປະກອບມີຕົວກໍານົດທີ່ເປັນເອກະລັກແລະຄໍານາມໃນຫ້ອງຮຽນ.

Recontextualization

ມັນສາມາດສ້າງຫົວຂໍ້ທີ່ເປັນເອກະລັກ, ບໍ່ເຄີຍໄດ້ຍິນມາກ່ອນຂອງທ່າທາງ, ການປະທັບຕາ, ແລະໂຄງສ້າງຂອງ scene ແທນທີ່ຈະປ່ຽນສິ່ງອ້ອມຂ້າງ. ການສະທ້ອນຕົວຈິງ ແລະເງົາ, ເຊັ່ນດຽວກັນກັບປະຕິສໍາພັນລະຫວ່າງຫົວຂໍ້ແລະວັດຖຸອ້ອມຂ້າງ.

ບົດຮຽນ Dreambooth

ໃນ tutorial ນີ້, ພວກເຮົາຈະປະຕິບັດຕາມ ປື້ມບັນທຶກ Google Collab, ແລະຂ້າພະເຈົ້າຈະນໍາທ່ານຜ່ານມັນ, ຊຶ່ງຈະເຮັດໃຫ້ທ່ານເຂົ້າໃຈແລະນໍາໃຊ້ມັນດ້ວຍຕົວທ່ານເອງ.

ຕັ້ງຄ່າ GPU ແລະຕິດຕັ້ງຫ້ອງສະຫມຸດ

ການຊອກຫາປະເພດ GPU ແລະ VRAM ແມ່ນຫຍັງແມ່ນຂັ້ນຕອນທໍາອິດ. ການຕິດຕັ້ງຂໍ້ກໍານົດຈໍານວນຫນຶ່ງແລະການເພິ່ງພາອາໄສແມ່ນຍັງຈໍາເປັນ. ພຽງແຕ່ກົດປຸ່ມຫຼິ້ນ, ຫຼັງຈາກນັ້ນລໍຖ້າໃຫ້ມັນສໍາເລັດ.

ການຕັ້ງຄ່າ GPU ແລະຕິດຕັ້ງຫ້ອງສະຫມຸດ

ສ້າງບັນຊີຢູ່ໃນ Huggingface ແລະສ້າງ token

ຂັ້ນຕອນຕໍ່ໄປແມ່ນການລົງທະບຽນສໍາລັບບັນຊີ Huggingface. ເມື່ອທ່ານສໍາເລັດການ, ໃຫ້ຄລິກໃສ່ການຕັ້ງຄ່າໃນແຈເທິງຂວາ. ທ່ານຈະມາຮອດໃນຫນ້າຕໍ່ໄປ.

Hugging Face Token

ສ້າງ token ແລະຊື່ຕາມການຮ້ອງຂໍຈາກທີ່ນີ້. ໂທເຄັນຄວນຖືກຄັດລອກແລະວາງໃສ່ Google collab ໃນຕາລາງຂ້າງລຸ່ມນີ້.

Token ໃນ Google Colab

ຕິດຕັ້ງ xformers

ໃນຂັ້ນຕອນນີ້, ທ່ານພຽງແຕ່ສາມາດກົດປຸ່ມຫຼິ້ນເພື່ອຕິດຕັ້ງ xformers ໂດຍການຄລິກໃສ່ runtime.

ຕິດຕັ້ງ Xformers

ເຊື່ອມຕໍ່ຫາ Drive

ໃນປັດຈຸບັນ, ທ່ານພຽງແຕ່ຕ້ອງດໍາເນີນການເຊນນີ້ເພື່ອເຊື່ອມຕໍ່ກັບ google drive.

ເຊື່ອມຕໍ່ຫາ Drive

ໃສ່ການເຕືອນ

ໃນຫ້ອງຕໍ່ໄປນີ້, ທ່ານພຽງແຕ່ຕ້ອງໃສ່ການກະຕຸ້ນເຕືອນ.

ປ້ອນການກະຕຸ້ນເຕືອນ

ກຳລັງອັບໂຫລດຮູບ

ໃນຂັ້ນຕອນນີ້, ທ່ານພຽງແຕ່ຕ້ອງອັບໂຫລດຮູບພາບທີ່ທ່ານຕ້ອງການທີ່ຈະຝຶກອົບຮົມ.

ທ່ານສາມາດອັບໂຫລດຮູບພາບຂອງທ່ານໃນ Cell ນີ້

ຮູບແບບການຝຶກອົບຮົມ AI

ນີ້ແມ່ນໄລຍະທີ່ສໍາຄັນທີ່ສຸດ, ຍ້ອນວ່າທ່ານຈະໃຊ້ DreamBooth ເພື່ອຝຶກອົບຮົມຮູບແບບ AI ໃໝ່ ໂດຍອີງໃສ່ຮູບຖ່າຍທີ່ສົ່ງມາຂອງທ່ານ. ເຈົ້າຕ້ອງຈຳກັດຄວາມສົນໃຈຂອງເຈົ້າໃສ່ສອງຊ່ອງປ້ອນຂໍ້ມູນ. "-instance prompt" ແມ່ນຕົວກໍານົດການທໍາອິດ. ທ່ານຕ້ອງໃຫ້ຊື່ທີ່ແຕກຕ່າງສູງຢູ່ທີ່ນີ້.

ການໂຕ້ແຍ້ງ '–ລາຍການແນວຄວາມຄິດ' ແມ່ນຊ່ອງໃສ່ຂໍ້ມູນທີ່ສໍາຄັນທີສອງ. ມັນຕ້ອງຖືກປ່ຽນຊື່ເພື່ອໃຫ້ກົງກັບອັນທີ່ໃຊ້ໃນສ່ວນ 'ປ່ຽນການເຕືອນ'.

ການຝຶກອົບຮົມ AI Model

ສ້າງຮູບພາບ AI

ຮູບພາບ AI ຈະຖືກສ້າງຂື້ນໃນຂັ້ນຕອນນີ້, ບ່ອນທີ່ທ່ານສາມາດໃສ່ຄໍາແນະນໍາຂໍ້ຄວາມ.

ສ້າງຮູບພາບ AI

ຂໍ້ຈໍາກັດ Dreambooth

ຄໍາສັ່ງຄໍາສັ່ງກາຍເປັນອຸປະສັກທີ່ຈະເຮັດໃຫ້ການຊໍ້າຄືນໃນຫົວຂໍ້ທີ່ມີລະດັບສູງຂອງລາຍລະອຽດ. DreamBooth ສາມາດປ່ຽນສະພາບການຂອງຫົວຂໍ້, ແຕ່ຖ້າຕົວແບບຕ້ອງການປ່ຽນຫົວຂໍ້ຂອງມັນເອງ, ມີບັນຫາກັບກອບ.
ບັນຫາອື່ນແມ່ນ overfitting ຮູບ output ກັບຮູບພາບ input. ຖ້າບໍ່ມີຮູບພາບພຽງພໍ, ຫົວຂໍ້ອາດຈະບໍ່ຖືກພິຈາລະນາຫຼືອາດຈະຖືກປະສົມປະສານກັບສະພາບການຂອງຮູບພາບທີ່ສົ່ງມາ. ໃນເວລາທີ່ສະພາບການສໍາລັບການຜະລິດຄີກຖືກຖາມ, ສິ່ງດຽວກັນເກີດຂຶ້ນ.

ສະຫຼຸບ

ເພື່ອຜະລິດຜົນໄດ້ຮັບຈາກການປ້ອນຂໍ້ຄວາມດຽວ, ຮູບແບບຂໍ້ຄວາມເປັນຮູບສ່ວນໃຫຍ່ຕ້ອງການຕົວກໍານົດການ ແລະຫ້ອງສະໝຸດຫຼາຍລ້ານ.

DreamBooth ງ່າຍໃນການໄດ້ມາແລະການນໍາໃຊ້ເນື້ອຫາສໍາລັບຜູ້ບໍລິໂພກໂດຍຕ້ອງການພຽງແຕ່ການປ້ອນຂໍ້ມູນຂອງສາມຫາຫ້າຮູບຫົວຂໍ້ຮ່ວມກັນກັບພື້ນຫລັງຂໍ້ຄວາມ.

Dreambooth Tutorial ສໍາລັບຜູ້ເລີ່ມຕົ້ນ

Dreambooth ແມ່ນຫຍັງ?

ຄຸນລັກສະນະ