பொருளடக்கம்[மறை][காட்டு]
பெரிய டெக்ஸ்ட்-டு-இமேஜ் மாதிரிகள், கொடுக்கப்பட்ட டெக்ஸ்ட் ப்ராம்ட்டில் இருந்து உயர்தர மற்றும் பன்முகப்படுத்தப்பட்ட படத்தொகுப்பை உருவாக்குவதன் மூலம் AI இன் வளர்ச்சியில் குறிப்பிடத்தக்க முன்னேற்றத்தை அடைந்தன.
இந்த மாதிரிகள் பல்வேறு அமைப்புகளில் பாடங்களின் தனிப்பட்ட பிரதிநிதித்துவங்களை ஒருங்கிணைக்கவோ அல்லது கொடுக்கப்பட்ட குறிப்புத் தொகுப்பில் உள்ள பாடங்களின் தோற்றத்தைப் பிரதிபலிக்கவோ முடியாது.
OpenAI இன் DALL.E2 அல்லது StabilityAI போன்ற புதிதாக வெளியிடப்பட்ட தொழில்நுட்பங்கள் நிலையான பரவல் மற்றும் மிட்ஜோர்னி ஏற்கனவே இணையத்தை புயலால் தாக்கி வருகிறது. முடிவுகளைத் தனிப்பயனாக்குவதற்கான நேரம் இது. இன்னும் எப்படி?
Google DreamBooth AI வந்துவிட்டது.
DreamBooth ஒரு படத்தின் தலைப்பை அடையாளம் கண்டு, அதன் அசல் சூழலில் இருந்து அதை மறுகட்டமைத்து, பின்னர் அதை ஒரு புதிய விரும்பிய சூழலில் துல்லியமாக ஒருங்கிணைக்கும் திறனைக் கொண்டுள்ளது. கூடுதலாக, இது தற்போதைய AI பிக்சர் ஜெனரேட்டர்களுடன் பயன்படுத்தப்படலாம்.
இந்தக் கட்டுரையில், DreamBooth, அதன் பயன்பாடு, அதன் பயிற்சி, அதன் வரம்புகள் மற்றும் பலவற்றை ஆழமாகப் பார்ப்போம்.
ட்ரீம்பூத் என்றால் என்ன?
ட்ரீம்பூத், ஒரு புத்தம் புதிய டெக்ஸ்ட்-டு-இமேஜ் டிஃப்யூஷன் மாடல், Google ஆல் வழங்கப்பட்டது. வெவ்வேறு அமைப்புகளில் பயனரின் தேர்ந்தெடுக்கப்பட்ட விஷயத்தின் பரந்த அளவிலான புகைப்படங்களை உருவாக்க, Google DreamBooth AI ஆல் வழிகாட்டுதலாக எழுதப்பட்ட அறிவுறுத்தலைப் பயன்படுத்தலாம்.
பாஸ்டன் பல்கலைக்கழகம் மற்றும் கூகுள் ஆகியவற்றின் ஆராய்ச்சிக் குழு ட்ரீம்பூத்தை உருவாக்கியது, இது விரிவான முன் பயிற்சிக்கு உட்பட்ட உரை-க்கு-பட மாதிரிகளை மாற்றுவதற்கான அதிநவீன நுட்பமாகும்.
ஒட்டுமொத்த கருத்து மிகவும் எளிமையானது: அவர்கள் மொழி-பார்வை அகராதியை அதிகரிக்க விரும்புகிறார்கள், அதாவது வழக்கத்திற்கு மாறான டோக்கன் ஐடிகள் பயனர்கள் வரையறுக்கக்கூடிய தனிப்பயன் தலைப்புகளுடன் தொடர்புடையவை.
மாடலின் முக்கிய குறிக்கோள் பயனர்களை இணைப்பதாகும் உரை-க்கு-பட பரவல் மாதிரி அவர்களுக்குத் தேவையான ஆதாரங்களைக் கொடுப்பதன் மூலம், அவர்கள் தேர்ந்தெடுக்கப்பட்ட விஷயங்களின் நிகழ்வுகளின் ஒளிக்காட்சிப் பிரதிநிதித்துவங்களை உருவாக்க வேண்டும்.
இதன் விளைவாக, இந்த நுட்பம் பல்வேறு சூழ்நிலைகளில் உள்ள சவால்களை சுருக்கமாகக் கூறுவதற்கு நன்றாக வேலை செய்கிறது.
கூகிளின் ட்ரீம்பூத் முந்தைய டெக்ஸ்ட்-டு-இமேஜ் கருவிகளிலிருந்து வேறுபடுகிறது DALL-E2, நிலையான பரவல், மற்றும் நடுப்பயணம், இது பயனர்களுக்கு உரை அடிப்படையிலான உள்ளீடுகளைப் பயன்படுத்தி பரவல் மாதிரியைக் கையாள அனுமதிக்கும் முன் தலைப்புப் படத்தின் மீது அதிக கட்டுப்பாட்டை வழங்குகிறது.
அம்சங்கள்
- DreamBooth AI ஆனது 3-5 படங்களுடன் உரை-க்கு-பட மாதிரியை மேம்படுத்தலாம்.
- ட்ரீம்பூத் AI மூலம் அசல் ஒளிக்கதிர் புகைப்படங்களை உருவாக்கலாம்.
- கூடுதலாக, DreamBooth AI ஆனது ஒரு தலைப்பின் புகைப்படங்களை பல கோணங்களில் உருவாக்க முடியும்.
விண்ணப்ப
கலை விளக்கங்கள்
இந்தப் பணியானது பாணிப் பரிமாற்றத்தில் இருந்து குறிப்பாக வேறுபடுகிறது, இது மூலக் காட்சியின் சொற்பொருளை வைத்து, மற்றொரு படத்தின் பாணியை அசல் காட்சியில் இணைக்கிறது.
ஆக்கபூர்வமான அணுகுமுறையின் அடிப்படையில், அடையாளம் மற்றும் தலைப்பு நிகழ்வு விவரக்குறிப்புகளைப் பராமரிக்கும் போது AI குறிப்பிடத்தக்க காட்சி மாற்றங்களைச் செய்ய முடியும்.
சொத்து மாற்றம்
பொருள் நிகழ்வின் சிறப்பியல்புகளை DreamBooth AI ஆல் மாற்றியமைக்க முடியும்.
அணுகல்
ட்ரீம்பூத் AI இன் பொருட்களை அலங்கரிக்கும் திறனை மிகவும் சுவாரஸ்யமாக்குவது தலைமுறை மாதிரிக்கு முந்தைய வலுவான கலவையாகும்.
மறு சூழல்மயமாக்கல்
DreamBooth AI ஆனது ஒரு குறிப்பிட்ட விஷயத்திற்கு தனித்துவமான படங்களை உருவாக்க முடியும், பயிற்சியளிக்கப்பட்ட மாதிரிக்கு தனித்துவமான அடையாளங்காட்டி மற்றும் வகுப்பு பெயர்ச்சொல் ஆகியவற்றை உள்ளடக்கிய ஒரு வாக்கியத்தை வழங்க முடியும்.
இது சூழலை மாற்றுவதற்குப் பதிலாக, தனிப்பட்ட, முன்பு கேள்விப்படாத தோரணைகள், உச்சரிப்புகள் மற்றும் காட்சி அமைப்பில் பாடத்தை உருவாக்க முடியும். யதார்த்தமான பிரதிபலிப்புகள் மற்றும் நிழல்கள், அத்துடன் பொருள் மற்றும் சுற்றியுள்ள பொருட்களுக்கு இடையேயான தொடர்புகள்.
ட்ரீம்பூத் பயிற்சி
இந்த டுடோரியலில், நாங்கள் பின்பற்றுவோம் Google Collab நோட்புக், மற்றும் நான் உங்களை அதன் வழியாக நடத்துவேன், இது உங்களுக்கு புரியவைத்து அதை நீங்களே பயன்படுத்திக்கொள்ளும்.
GPU ஐ அமைத்தல் மற்றும் நூலகங்களை நிறுவுதல்
என்ன GPU மற்றும் VRAM வகைகள் உள்ளன என்பதைக் கண்டறிவது முதல் படியாகும். சில தேவைகள் மற்றும் சார்புகளை நிறுவுவதும் அவசியம். பிளே பட்டனை அழுத்தி, அது முடிவடையும் வரை காத்திருக்கவும்.
Huggingface இல் கணக்கை உருவாக்கி டோக்கனை உருவாக்கவும்
அடுத்த கட்டமாக Huggingface கணக்கில் பதிவு செய்ய வேண்டும். நீங்கள் முடித்ததும், மேல் வலது மூலையில் உள்ள அமைப்புகளைக் கிளிக் செய்யவும். நீங்கள் அடுத்த பக்கத்தில் வருவீர்கள்.
இங்கிருந்து கோரியபடி டோக்கன் மற்றும் பெயரை உருவாக்கவும். டோக்கனை நகலெடுத்து கீழே உள்ள கலத்தில் உள்ள கூகுள் கொலாப்பில் ஒட்ட வேண்டும்.
எக்ஸ்ஃபார்மர்களை நிறுவவும்
இந்த கட்டத்தில், இயக்க நேரத்தைக் கிளிக் செய்வதன் மூலம் எக்ஸ்ஃபார்மர்களை நிறுவ பிளே பொத்தானை அழுத்தலாம்.
இயக்ககத்துடன் இணைக்கவும்
இப்போது, கூகுள் டிரைவில் இணைக்க இந்த செல்லை இயக்க வேண்டும்.
கட்டளையை உள்ளிடவும்
பின்வரும் கலத்தில், நீங்கள் வரியில் உள்ளிட வேண்டும்.
படங்களை பதிவேற்றுகிறது
இந்த கட்டத்தில், நீங்கள் பயிற்சி செய்ய விரும்பும் படங்களை பதிவேற்ற வேண்டும்.
பயிற்சி AI மாதிரி
நீங்கள் சமர்ப்பித்த அனைத்து குறிப்பு புகைப்படங்களின் அடிப்படையில் ஒரு புதிய AI மாதிரியைப் பயிற்றுவிக்க DreamBooth ஐப் பயன்படுத்துவதால், இது மிக முக்கியமான கட்டமாகும். உங்கள் கவனத்தை இரண்டு உள்ளீட்டு புலங்களுக்கு மட்டுப்படுத்த வேண்டும். "-உதாரண ப்ராம்ட்" என்பது முதல் அளவுரு. நீங்கள் இங்கே மிகவும் தனித்துவமான பெயரை வழங்க வேண்டும்.
'–கான்செப்ட் பட்டியல்' வாதம் இரண்டாவது முக்கியமான உள்ளீட்டு புலமாகும். 'விரைவில் மாற்று' பிரிவில் பயன்படுத்தப்படும் பெயருடன் பொருந்துமாறு இது மறுபெயரிடப்பட வேண்டும்.
AI படங்களை உருவாக்கவும்
இந்த கட்டத்தில் AI படங்கள் உருவாக்கப்படும், அங்கு நீங்கள் உரை வழிமுறைகளை உள்ளிடலாம்.
ட்ரீம்பூத் வரம்புகள்
- கட்டளை வரியில் அதிக அளவு விவரங்களுடன் தலைப்பில் மறு செய்கைகளைச் செய்வதற்கு ஒரு தடையாகிறது. DreamBooth பாடத்தின் சூழலை மாற்றலாம், ஆனால் மாடல் விஷயத்தையே மாற்ற விரும்பினால், சட்டத்தில் சிக்கல்கள் உள்ளன.
- மற்றொரு சிக்கல், வெளியீட்டுப் படத்தை உள்ளீட்டுப் படத்திற்கு அதிகமாக பொருத்துவது. போதுமான படங்கள் வழங்கப்படவில்லை என்றால், பொருள் கருதப்படாமல் இருக்கலாம் அல்லது சமர்ப்பிக்கப்பட்ட படங்களின் சூழலுடன் கலக்கப்படலாம். ஒற்றைப்படை தலைமுறைக்கான சூழல் கேட்கப்பட்டால், அதே விஷயம் நடைபெறுகிறது.
தீர்மானம்
ஒற்றை உரை உள்ளீட்டிலிருந்து வெளியீடுகளை உருவாக்க, பெரும்பாலான உரை-க்கு-பட மாதிரிகளுக்கு மில்லியன் கணக்கான அளவுருக்கள் மற்றும் நூலகங்கள் தேவைப்படுகின்றன.
டிரீம்பூத் உள்ளடக்கம் பெறுதல் மற்றும் நுகர்வோருக்கான பயன்பாட்டை எளிதாக்குகிறது, மூன்று முதல் ஐந்து தலைப்புப் புகைப்படங்களை உரைப் பின்னணியுடன் உள்ளீடு செய்ய வேண்டும்.
ஒரு பதில் விடவும்