ஆரம்பநிலைக்கான ட்ரீம்பூத் பயிற்சி

பொருளடக்கம்[மறை][காட்டு]

ட்ரீம்பூத் என்றால் என்ன?
அம்சங்கள்
விண்ணப்ப+-
ட்ரீம்பூத் பயிற்சி+-
ட்ரீம்பூத் வரம்புகள்
தீர்மானம்

பெரிய டெக்ஸ்ட்-டு-இமேஜ் மாதிரிகள், கொடுக்கப்பட்ட டெக்ஸ்ட் ப்ராம்ட்டில் இருந்து உயர்தர மற்றும் பன்முகப்படுத்தப்பட்ட படத்தொகுப்பை உருவாக்குவதன் மூலம் AI இன் வளர்ச்சியில் குறிப்பிடத்தக்க முன்னேற்றத்தை அடைந்தன.

இந்த மாதிரிகள் பல்வேறு அமைப்புகளில் பாடங்களின் தனிப்பட்ட பிரதிநிதித்துவங்களை ஒருங்கிணைக்கவோ அல்லது கொடுக்கப்பட்ட குறிப்புத் தொகுப்பில் உள்ள பாடங்களின் தோற்றத்தைப் பிரதிபலிக்கவோ முடியாது.

OpenAI இன் DALL.E2 அல்லது StabilityAI போன்ற புதிதாக வெளியிடப்பட்ட தொழில்நுட்பங்கள் நிலையான பரவல் மற்றும் மிட்ஜோர்னி ஏற்கனவே இணையத்தை புயலால் தாக்கி வருகிறது. முடிவுகளைத் தனிப்பயனாக்குவதற்கான நேரம் இது. இன்னும் எப்படி?

Google DreamBooth AI வந்துவிட்டது.

DreamBooth ஒரு படத்தின் தலைப்பை அடையாளம் கண்டு, அதன் அசல் சூழலில் இருந்து அதை மறுகட்டமைத்து, பின்னர் அதை ஒரு புதிய விரும்பிய சூழலில் துல்லியமாக ஒருங்கிணைக்கும் திறனைக் கொண்டுள்ளது. கூடுதலாக, இது தற்போதைய AI பிக்சர் ஜெனரேட்டர்களுடன் பயன்படுத்தப்படலாம்.

இந்தக் கட்டுரையில், DreamBooth, அதன் பயன்பாடு, அதன் பயிற்சி, அதன் வரம்புகள் மற்றும் பலவற்றை ஆழமாகப் பார்ப்போம்.

ட்ரீம்பூத் என்றால் என்ன?

ட்ரீம்பூத், ஒரு புத்தம் புதிய டெக்ஸ்ட்-டு-இமேஜ் டிஃப்யூஷன் மாடல், Google ஆல் வழங்கப்பட்டது. வெவ்வேறு அமைப்புகளில் பயனரின் தேர்ந்தெடுக்கப்பட்ட விஷயத்தின் பரந்த அளவிலான புகைப்படங்களை உருவாக்க, Google DreamBooth AI ஆல் வழிகாட்டுதலாக எழுதப்பட்ட அறிவுறுத்தலைப் பயன்படுத்தலாம்.

பாஸ்டன் பல்கலைக்கழகம் மற்றும் கூகுள் ஆகியவற்றின் ஆராய்ச்சிக் குழு ட்ரீம்பூத்தை உருவாக்கியது, இது விரிவான முன் பயிற்சிக்கு உட்பட்ட உரை-க்கு-பட மாதிரிகளை மாற்றுவதற்கான அதிநவீன நுட்பமாகும்.

ஒட்டுமொத்த கருத்து மிகவும் எளிமையானது: அவர்கள் மொழி-பார்வை அகராதியை அதிகரிக்க விரும்புகிறார்கள், அதாவது வழக்கத்திற்கு மாறான டோக்கன் ஐடிகள் பயனர்கள் வரையறுக்கக்கூடிய தனிப்பயன் தலைப்புகளுடன் தொடர்புடையவை.

மாடலின் முக்கிய குறிக்கோள் பயனர்களை இணைப்பதாகும் உரை-க்கு-பட பரவல் மாதிரி அவர்களுக்குத் தேவையான ஆதாரங்களைக் கொடுப்பதன் மூலம், அவர்கள் தேர்ந்தெடுக்கப்பட்ட விஷயங்களின் நிகழ்வுகளின் ஒளிக்காட்சிப் பிரதிநிதித்துவங்களை உருவாக்க வேண்டும்.

இதன் விளைவாக, இந்த நுட்பம் பல்வேறு சூழ்நிலைகளில் உள்ள சவால்களை சுருக்கமாகக் கூறுவதற்கு நன்றாக வேலை செய்கிறது.

கூகிளின் ட்ரீம்பூத் முந்தைய டெக்ஸ்ட்-டு-இமேஜ் கருவிகளிலிருந்து வேறுபடுகிறது DALL-E2, நிலையான பரவல், மற்றும் நடுப்பயணம், இது பயனர்களுக்கு உரை அடிப்படையிலான உள்ளீடுகளைப் பயன்படுத்தி பரவல் மாதிரியைக் கையாள அனுமதிக்கும் முன் தலைப்புப் படத்தின் மீது அதிக கட்டுப்பாட்டை வழங்குகிறது.

அம்சங்கள்

DreamBooth AI ஆனது 3-5 படங்களுடன் உரை-க்கு-பட மாதிரியை மேம்படுத்தலாம்.
ட்ரீம்பூத் AI மூலம் அசல் ஒளிக்கதிர் புகைப்படங்களை உருவாக்கலாம்.
கூடுதலாக, DreamBooth AI ஆனது ஒரு தலைப்பின் புகைப்படங்களை பல கோணங்களில் உருவாக்க முடியும்.

விண்ணப்ப

கலை விளக்கங்கள்

இந்தப் பணியானது பாணிப் பரிமாற்றத்தில் இருந்து குறிப்பாக வேறுபடுகிறது, இது மூலக் காட்சியின் சொற்பொருளை வைத்து, மற்றொரு படத்தின் பாணியை அசல் காட்சியில் இணைக்கிறது.

கலை வழங்கல்

ஆக்கபூர்வமான அணுகுமுறையின் அடிப்படையில், அடையாளம் மற்றும் தலைப்பு நிகழ்வு விவரக்குறிப்புகளைப் பராமரிக்கும் போது AI குறிப்பிடத்தக்க காட்சி மாற்றங்களைச் செய்ய முடியும்.

சொத்து மாற்றம்

பொருள் நிகழ்வின் சிறப்பியல்புகளை DreamBooth AI ஆல் மாற்றியமைக்க முடியும்.

சொத்து மாற்றம்

அணுகல்

ட்ரீம்பூத் AI இன் பொருட்களை அலங்கரிக்கும் திறனை மிகவும் சுவாரஸ்யமாக்குவது தலைமுறை மாதிரிக்கு முந்தைய வலுவான கலவையாகும்.

அணுகல்

மறு சூழல்மயமாக்கல்

DreamBooth AI ஆனது ஒரு குறிப்பிட்ட விஷயத்திற்கு தனித்துவமான படங்களை உருவாக்க முடியும், பயிற்சியளிக்கப்பட்ட மாதிரிக்கு தனித்துவமான அடையாளங்காட்டி மற்றும் வகுப்பு பெயர்ச்சொல் ஆகியவற்றை உள்ளடக்கிய ஒரு வாக்கியத்தை வழங்க முடியும்.

மறு சூழல்மயமாக்கல்

இது சூழலை மாற்றுவதற்குப் பதிலாக, தனிப்பட்ட, முன்பு கேள்விப்படாத தோரணைகள், உச்சரிப்புகள் மற்றும் காட்சி அமைப்பில் பாடத்தை உருவாக்க முடியும். யதார்த்தமான பிரதிபலிப்புகள் மற்றும் நிழல்கள், அத்துடன் பொருள் மற்றும் சுற்றியுள்ள பொருட்களுக்கு இடையேயான தொடர்புகள்.

ட்ரீம்பூத் பயிற்சி

இந்த டுடோரியலில், நாங்கள் பின்பற்றுவோம் Google Collab நோட்புக், மற்றும் நான் உங்களை அதன் வழியாக நடத்துவேன், இது உங்களுக்கு புரியவைத்து அதை நீங்களே பயன்படுத்திக்கொள்ளும்.

GPU ஐ அமைத்தல் மற்றும் நூலகங்களை நிறுவுதல்

என்ன GPU மற்றும் VRAM வகைகள் உள்ளன என்பதைக் கண்டறிவது முதல் படியாகும். சில தேவைகள் மற்றும் சார்புகளை நிறுவுவதும் அவசியம். பிளே பட்டனை அழுத்தி, அது முடிவடையும் வரை காத்திருக்கவும்.

GPU ஐ அமைத்தல் மற்றும் நூலகங்களை நிறுவுதல்

Huggingface இல் கணக்கை உருவாக்கி டோக்கனை உருவாக்கவும்

அடுத்த கட்டமாக Huggingface கணக்கில் பதிவு செய்ய வேண்டும். நீங்கள் முடித்ததும், மேல் வலது மூலையில் உள்ள அமைப்புகளைக் கிளிக் செய்யவும். நீங்கள் அடுத்த பக்கத்தில் வருவீர்கள்.

கட்டிப்பிடிக்கும் முக டோக்கன்

இங்கிருந்து கோரியபடி டோக்கன் மற்றும் பெயரை உருவாக்கவும். டோக்கனை நகலெடுத்து கீழே உள்ள கலத்தில் உள்ள கூகுள் கொலாப்பில் ஒட்ட வேண்டும்.

Google Colab இல் டோக்கன்

எக்ஸ்ஃபார்மர்களை நிறுவவும்

இந்த கட்டத்தில், இயக்க நேரத்தைக் கிளிக் செய்வதன் மூலம் எக்ஸ்ஃபார்மர்களை நிறுவ பிளே பொத்தானை அழுத்தலாம்.

Xformers ஐ நிறுவவும்

இயக்ககத்துடன் இணைக்கவும்

இப்போது, கூகுள் டிரைவில் இணைக்க இந்த செல்லை இயக்க வேண்டும்.

இயக்ககத்துடன் இணைக்கவும்

கட்டளையை உள்ளிடவும்

பின்வரும் கலத்தில், நீங்கள் வரியில் உள்ளிட வேண்டும்.

கட்டளையை உள்ளிடவும்

படங்களை பதிவேற்றுகிறது

இந்த கட்டத்தில், நீங்கள் பயிற்சி செய்ய விரும்பும் படங்களை பதிவேற்ற வேண்டும்.

இந்த கலத்தில் உங்கள் படங்களை பதிவேற்றலாம்

பயிற்சி AI மாதிரி

நீங்கள் சமர்ப்பித்த அனைத்து குறிப்பு புகைப்படங்களின் அடிப்படையில் ஒரு புதிய AI மாதிரியைப் பயிற்றுவிக்க DreamBooth ஐப் பயன்படுத்துவதால், இது மிக முக்கியமான கட்டமாகும். உங்கள் கவனத்தை இரண்டு உள்ளீட்டு புலங்களுக்கு மட்டுப்படுத்த வேண்டும். "-உதாரண ப்ராம்ட்" என்பது முதல் அளவுரு. நீங்கள் இங்கே மிகவும் தனித்துவமான பெயரை வழங்க வேண்டும்.

'–கான்செப்ட் பட்டியல்' வாதம் இரண்டாவது முக்கியமான உள்ளீட்டு புலமாகும். 'விரைவில் மாற்று' பிரிவில் பயன்படுத்தப்படும் பெயருடன் பொருந்துமாறு இது மறுபெயரிடப்பட வேண்டும்.

பயிற்சி AI மாதிரி

AI படங்களை உருவாக்கவும்

இந்த கட்டத்தில் AI படங்கள் உருவாக்கப்படும், அங்கு நீங்கள் உரை வழிமுறைகளை உள்ளிடலாம்.

AI படங்களை உருவாக்கவும்

ட்ரீம்பூத் வரம்புகள்

கட்டளை வரியில் அதிக அளவு விவரங்களுடன் தலைப்பில் மறு செய்கைகளைச் செய்வதற்கு ஒரு தடையாகிறது. DreamBooth பாடத்தின் சூழலை மாற்றலாம், ஆனால் மாடல் விஷயத்தையே மாற்ற விரும்பினால், சட்டத்தில் சிக்கல்கள் உள்ளன.
மற்றொரு சிக்கல், வெளியீட்டுப் படத்தை உள்ளீட்டுப் படத்திற்கு அதிகமாக பொருத்துவது. போதுமான படங்கள் வழங்கப்படவில்லை என்றால், பொருள் கருதப்படாமல் இருக்கலாம் அல்லது சமர்ப்பிக்கப்பட்ட படங்களின் சூழலுடன் கலக்கப்படலாம். ஒற்றைப்படை தலைமுறைக்கான சூழல் கேட்கப்பட்டால், அதே விஷயம் நடைபெறுகிறது.

தீர்மானம்

ஒற்றை உரை உள்ளீட்டிலிருந்து வெளியீடுகளை உருவாக்க, பெரும்பாலான உரை-க்கு-பட மாதிரிகளுக்கு மில்லியன் கணக்கான அளவுருக்கள் மற்றும் நூலகங்கள் தேவைப்படுகின்றன.

டிரீம்பூத் உள்ளடக்கம் பெறுதல் மற்றும் நுகர்வோருக்கான பயன்பாட்டை எளிதாக்குகிறது, மூன்று முதல் ஐந்து தலைப்புப் புகைப்படங்களை உரைப் பின்னணியுடன் உள்ளீடு செய்ய வேண்டும்.

ஆரம்பநிலைக்கான ட்ரீம்பூத் பயிற்சி

ட்ரீம்பூத் என்றால் என்ன?

அம்சங்கள்