டிஃப்யூஷன் மாடல்கள் வெளியிடப்பட்டதன் மூலம் புயலால் உலகம் முழுவதும் பரவியது டால்-இ 2, கூகுளின் இமேஜன், நிலையான பரவல், மற்றும் நடுப்பயணம், புதுமைகளைத் தூண்டுதல் மற்றும் இயந்திரக் கற்றலின் எல்லைகளை நீட்டுதல்.
இந்த மாதிரிகள் ஃபோட்டோரியலிஸ்டிக், மேஜிக்கல், ஃப்யூச்சரிஸ்டிக் மற்றும், நிச்சயமாக, அழகான படங்கள் உட்பட, வார்த்தைத் தூண்டுதல்களிலிருந்து கிட்டத்தட்ட வரம்பற்ற படங்களை உருவாக்க முடியும்.
இந்த திறன்கள் மனிதர்கள் சிலிக்கானுடன் இடைமுகப்படுத்துவதன் அர்த்தம் என்ன என்பதை மறுபரிசீலனை செய்து, நடைமுறையில் நாம் கற்பனை செய்யக்கூடிய எந்தவொரு படத்தையும் உருவாக்கும் திறனை நமக்கு அளிக்கிறது.
இந்த மாதிரிகள் உருவாகும்போது அல்லது அடுத்த உருவாக்கும் முன்னுதாரணத்தை எடுத்துக் கொள்ளும்போது, மனிதர்கள் ஒரு சிந்தனையுடன் படங்கள், படங்கள் மற்றும் பிற அதிவேக அனுபவங்களை உருவாக்க முடியும்.
இந்த இடுகையில், நாம் விவாதிப்போம் பரவல் மாதிரி, நிலையான பரவல், அது எவ்வாறு இயங்குகிறது மற்றும் ஒரு பரவல் மாதிரி ஓவியம் வரைதல் பயிற்சி, மற்றவற்றுடன்.
பரவல் மாதிரி என்றால் என்ன?
பயிற்சி தரவிலிருந்து புதிய தரவை உருவாக்கக்கூடிய இயந்திர கற்றல் மாதிரிகள் உருவாக்க மாதிரிகள் என குறிப்பிடப்படுகின்றன. பிற உற்பத்தி மாதிரிகள் ஓட்டம் சார்ந்த மாதிரிகள், மாறுபாடு தன்னியக்க குறியீடாக்கிகள் மற்றும் உருவாக்கும் எதிர்விளைவு நெட்வொர்க்குகள் (GANs) ஆகியவை அடங்கும்.
ஒவ்வொன்றும் சிறந்த தரத்தில் படங்களை உருவாக்க முடியும். இரைச்சலைச் சேர்ப்பதன் மூலம் பயிற்சித் தரவைச் சேதப்படுத்திய பிறகு, இந்த இரைச்சலைச் சேர்க்கும் செயல்முறையை மாற்றியமைப்பதன் மூலம் தரவை மீட்டெடுக்க பரவல் மாதிரிகள் கற்றுக்கொள்கின்றன. வேறு விதமாகச் சொல்வதானால், பரவல் மாதிரிகள் சத்தத்திலிருந்து ஒத்திசைவான படங்களை உருவாக்க முடியும்.
படங்களுக்கு சத்தத்தை அறிமுகப்படுத்துவதன் மூலம் பரவல் மாதிரிகள் கற்றுக்கொள்கின்றன, பின்னர் மாடல் அதை அகற்றுவதில் தேர்ச்சி பெறுகிறது. யதார்த்தமான காட்சிகளை உருவாக்க, மாதிரியானது, சீரற்ற விதைகளுக்கு இந்த டெனோயிசிங் நுட்பத்தைப் பயன்படுத்துகிறது.
பட தயாரிப்பு செயல்முறையை கண்டிஷனிங் செய்வதன் மூலம், இந்த மாதிரிகள் உரையில் இருந்து மட்டும் கிட்டத்தட்ட வரம்பற்ற எண்ணிக்கையிலான படங்களை உருவாக்க டெக்ஸ்ட்-டு-இமேஜ் வழிகாட்டுதலுடன் இணைந்து பயன்படுத்தப்படலாம். CLIP போன்ற உட்பொதிவுகளிலிருந்து உள்ளீடுகள் மூலம் விதைகளை இயக்க முடியும், இது வலுவான உரை-க்கு-பட திறன்களைக் கொடுக்கிறது.
டிஃப்யூஷன் மாடல்கள் படத்தை உருவாக்குதல், படத்தை நீக்குதல், வண்ணப்பூச்சு வரைதல், அவுட் பெயிண்டிங் மற்றும் பிட் பரவல் உள்ளிட்ட பல்வேறு பணிகளைச் செய்ய முடியும்.
இப்போது, நிலையான பரவல் என்றால் என்ன?
நிலையான பரவல் என்பது உரை அடிப்படையிலான படத்தை உருவாக்குவதற்கான இயந்திர கற்றல் மாதிரியாகும் ஸ்திரத்தன்மை.AI. இது உரையிலிருந்து படங்களை உருவாக்கும் திறன் கொண்டது.
நிலையான பரவலின் கூறுகள்
நிலையான பரவல் பல கூறுகள் மற்றும் கருத்துகளை உள்ளடக்கிய அமைப்பாகும். இது ஒரே மாதிரி இல்லை. பேட்டைக்குப் பின்னால் நாம் சரிபார்க்கும் போது, முதலில் நாம் பார்ப்பது என்னவென்றால், உரைத் தகவலை உரையின் கருத்துக்களைப் படம்பிடிக்கும் எண் பிரதிநிதித்துவமாக மாற்றும் உரை-புரிதல் கூறு உள்ளது.
இந்த டெக்ஸ்ட் என்கோடரை டிரான்ஸ்ஃபார்மர் என்று அழைக்கலாம் மொழி மாதிரி (தொழில்நுட்ப ரீதியாக: CLIP மாதிரியின் உரை குறியாக்கி). இது உள்ளீட்டு உரையை எடுத்து, உரையில் உள்ள ஒவ்வொரு சொல்/டோக்கனுக்கும் முழு எண்களின் பட்டியலை (வெக்டார்) உருவாக்குகிறது. அந்த தரவு பின்னர் பல கூறுகளால் உருவாக்கப்பட்ட பட ஜெனரேட்டருக்கு வழங்கப்படுகிறது.
பட ஜெனரேட்டரில் இரண்டு படிகள் உள்ளன:
1. படத் தகவல் உருவாக்கியவர்
நிலையான பரவலின் முக்கிய கூறு இந்த உறுப்பு ஆகும். முந்தைய பதிப்புகளை விட செயல்திறனில் பெரும்பாலான முன்னேற்றம் இங்குதான் செய்யப்படுகிறது.
படத் தரவை வழங்க இந்தக் கூறு பல நிலைகளைக் கடந்து செல்கிறது. படத் தகவலை உருவாக்கியவர் படத் தகவல் இடைவெளியில் (அல்லது மறைந்த இடத்தில்) மட்டுமே செயல்படுகிறார்.
இந்தப் பண்பு காரணமாக பிக்சல் இடத்தில் இயங்கிய முந்தைய பரவல் மாதிரிகளை விட இது விரைவானது. தொழில்நுட்ப ரீதியாக, இந்த கூறு ஒரு திட்டமிடல் வழிமுறை மற்றும் UNet ஆகியவற்றைக் கொண்டுள்ளது. நரம்பு நெட்வொர்க்.
இந்த கூறுகளில் நடைபெறும் செயல்முறை "பரவல்" என்று குறிப்பிடப்படுகிறது. படிநிலைகளில் செயலாக்கப்படும் தகவலின் விளைவாக உயர்தர படம் இறுதியில் உருவாக்கப்படுகிறது (அடுத்த கூறு, பட குறிவிலக்கி மூலம்).
2. பட குறிவிலக்கி
தகவல் தயாரிப்பாளரிடமிருந்து பெறப்பட்ட தரவைப் பயன்படுத்தி, பட குறிவிலக்கி ஒரு படத்தை உருவாக்குகிறது. செயல்பாட்டின் முடிவில் முடிக்கப்பட்ட பிக்சல் படத்தை உருவாக்க இது ஒரு முறை மட்டுமே இயங்குகிறது.
நிலையான பரவல் இம்பெயிண்டிங் பயிற்சி
ஸ்டேபிள் டிஃப்யூஷன் பிக்சர் இன்பெயிண்டிங் என்பது படத்தின் விடுபட்ட அல்லது சேதமடைந்த பகுதிகளை நிரப்பும் நுட்பமாகும். படத்தை ஓவியம் வரைவதன் நோக்கம், படம் மீட்டெடுக்கப்பட்டதை மறைப்பதாகும்.
ஒரு படத்தில் இருந்து விரும்பத்தகாத விஷயங்களை அகற்ற அல்லது வரலாற்று புகைப்படங்களின் சேதமடைந்த பகுதிகளை மீட்டெடுக்க இந்த நுட்பம் அடிக்கடி பயன்படுத்தப்படுகிறது. ஸ்டேபிள் டிஃப்யூஷன் இன்பெயிண்டிங் என்பது ஒப்பீட்டளவில் சமீபத்திய வர்ணம் பூசுவதற்கான வழியாகும், இது நம்பிக்கைக்குரிய விளைவுகளை அளிக்கிறது.
கீழே உள்ள வழிமுறைகளைப் பின்பற்றுவதன் மூலம், நீங்கள் நிலையான பரவலுடன் வண்ணம் தீட்ட முயற்சிக்க விரும்பினால், ஏற்கனவே உள்ள புகைப்படங்களை ஓவியம் வரைவதையும் மாற்றியமைப்பதையும் ஆராயத் தொடங்குவீர்கள்:
- ஹக்கிங்ஃபேஸுக்குச் செல்லவும் நிலையான பரவல் ஊடுருவல்
- உங்கள் சொந்த படத்தை பதிவேற்றவும்
- மாற்றப்பட வேண்டிய உங்கள் படத்தின் பகுதியை அழிக்கவும்.
- உங்கள் கட்டளையை இங்கே உள்ளிடவும் (நீங்கள் அகற்றுவதற்குப் பதிலாக எதைச் சேர்க்க விரும்புகிறீர்கள்)
- "ரன்" என்பதைத் தேர்ந்தெடுக்கவும்
மேலே உள்ள வீடியோவில், நாங்கள் மூன்று எலுமிச்சைகளுடன் ஒரு படத்தைப் பதிவேற்றி, அவற்றை ஆப்பிள்களாக மாற்றுகிறோம். உங்கள் சொந்த புகைப்படங்கள் மற்றும் அறிவுறுத்தல்களுடன் இதை முயற்சிக்க நான் தனிப்பட்ட முறையில் பரிந்துரைக்கிறேன்.
தீர்மானம்
பொதுவாக, நிலையான பரவலான ஓவியம் என்பது போலியான படங்கள் அல்லது வீடியோக்களை உருவாக்குவதற்கான சிறந்த முறையாகும். புதிய தொழில்நுட்ப முன்னேற்றத்தை நோக்கி நாம் செல்லும்போது, தொழில்நுட்பம் முன்னேறும்போது உண்மையானது மற்றும் மோசடியானது ஆகியவற்றை வேறுபடுத்துவது கடினமாகவும் கடினமாகவும் இருக்கும்.
ஸ்வாஹிர்
முதல் பாதி இரண்டாம் பாதிக்கு முற்றிலும் தொடர்பில்லாதது. அவர் முன்பு விளக்கிய மாதிரியின் கட்டமைப்பில் இன்பெயின்ட் எவ்வாறு செயல்படுகிறது என்பதை ஆசிரியர் விளக்கியிருந்தால், அது மிகவும் அருமையாக இருந்திருக்கும். ஆனால் இல்லை! சீரற்ற உரையைச் சேகரித்து செயலாக்குவதை விட, அதற்கு உண்மையான புரிதல் தேவைப்படும்.