பொதுவாக, GANகள், VAEகள் மற்றும் தன்னியக்க மாதிரிகள் போன்ற ஆழமான உருவாக்க மாதிரிகள் பட தொகுப்பு சிக்கல்களைக் கையாளுகின்றன.
அவர்கள் உருவாக்கும் தரவின் உயர் தரத்தைக் கருத்தில் கொண்டு, சமீபத்திய ஆண்டுகளில் உருவாக்கப்படும் எதிரி நெட்வொர்க்குகள் (GANs) அதிக கவனத்தைப் பெற்றுள்ளன.
பரவல் மாதிரிகள் தன்னை நிலைநிறுத்திக் கொண்ட மற்றொரு கவர்ச்சிகரமான ஆய்வுத் துறையாகும். படம், வீடியோ மற்றும் குரல் உருவாக்கம் ஆகிய துறைகள் இரண்டுக்கும் விரிவான பயன்பாட்டைக் கண்டறிந்துள்ளன.
பரவல் மாதிரிகள் எதிராக GANகள்: எது சிறந்த முடிவுகளைத் தருகிறது? இயற்கையாகவே, இது ஒரு தொடர்ச்சியான விவாதத்திற்கு வழிவகுத்தது.
GAN எனப்படும் கணக்கீட்டு கட்டமைப்பில், இரண்டு நரம்பியல் வலையமைப்புகள் உண்மையான தரவுகளுக்கு அனுப்பக்கூடிய தரவுகளின் புதிதாக ஒருங்கிணைக்கப்பட்ட நிகழ்வுகளை உருவாக்குவதற்கு ஒன்றுக்கொன்று எதிராகப் போராடுகின்றன.
டிஃப்யூஷன் மாடல்கள் மேலும் மேலும் பிரபலமடைந்து வருகின்றன, ஏனெனில் அவை இசை மற்றும் கிராபிக்ஸ் தயாரிப்பதற்கான பயிற்சி நிலைத்தன்மை மற்றும் உயர் முடிவுகளை வழங்குகின்றன.
இந்தக் கட்டுரையானது பரவல் மாதிரி மற்றும் GANகள் மற்றும் அவை எவ்வாறு ஒன்றுக்கொன்று வேறுபடுகின்றன மற்றும் வேறு சில விஷயங்களைப் பற்றி விரிவாகப் பேசும்.
எனவே, ஜெனரேட்டிவ் அட்வர்ஸரியல் நெட்வொர்க்குகள் என்றால் என்ன?
உண்மையான தரவு என்று தவறாகக் கருதப்படும் புதிய, செயற்கையான தரவுகளை உருவாக்க, ஜெனரேட்டிவ் அட்வர்ஸரியல் நெட்வொர்க்குகள் (GAN கள்) இரண்டு நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்துகின்றன மற்றும் அவற்றை ஒன்றுக்கொன்று எதிராக நிறுத்துகின்றன (இதனால் பெயரில் உள்ள "எதிரி").
அவை பேச்சு, வீடியோ மற்றும் பட உருவாக்கம் ஆகியவற்றிற்கு பரவலாகப் பயன்படுத்தப்படுகின்றன.
GAN இன் நோக்கம் ஒரு குறிப்பிட்ட தரவுத்தொகுப்பிலிருந்து முன்னர் கண்டறியப்படாத தரவை உருவாக்குவதாகும். மாதிரிகளில் இருந்து உண்மையான, அடையாளம் காணப்படாத அடிப்படை தரவு விநியோகத்தின் மாதிரியை ஊகிக்க முயற்சிக்கிறது.
மாற்றாக, இந்த நெட்வொர்க்குகள் ஒரு குறிப்பிட்ட புள்ளிவிவர விநியோகத்தைக் கற்றுக்கொள்ள முயற்சிக்கும் மறைமுக மாதிரிகள்.
இந்த நோக்கத்தை எவ்வாறு நிறைவேற்றுவது என்பதைக் கண்டறிய GAN பயன்படுத்திய முறை புதுமையானது. உண்மையில், அவர்கள் ஒரு மறைமுகமான மாதிரியை உருவாக்க டூ-பிளேயர் கேம் விளையாடுவதன் மூலம் தரவை உருவாக்குகிறார்கள்.
பின்வருபவை கட்டமைப்பை விவரிக்கிறது:
- உண்மையான மற்றும் போலியான தரவுகளை வேறுபடுத்தும் திறனைப் பெறும் ஒரு பாரபட்சம்
- தரவை உருவாக்க புதிய வழிகளை எடுக்கும் ஜெனரேட்டர் பாரபட்சம் காட்டுபவர்களை ஏமாற்றலாம்.
பாகுபாடு காண்பவர் ஒரு நரம்பியல் வலையமைப்பாகக் காட்டுகிறார். எனவே, ஜெனரேட்டர் அதை ஏமாற்ற உயர் தரத்துடன் ஒரு படத்தை உருவாக்க வேண்டும்.
இந்த ஜெனரேட்டர்கள் எந்த வெளியீட்டு விநியோகத்தையும் பயன்படுத்தி பயிற்சியளிக்கப்படவில்லை என்பது ஆட்டோஎன்கோடர் மாதிரிகள் மற்றும் பிற மாடல்களுக்கு இடையே உள்ள குறிப்பிடத்தக்க வேறுபாடாகும்.
மாதிரியின் இழப்பு செயல்பாட்டை சிதைக்க இரண்டு வழிகள் உள்ளன:
- பாரபட்சம் செய்பவர் உண்மையான தரவை துல்லியமாக முன்னறிவித்தால் அளவிடும் திறன்
- உருவாக்கப்பட்ட தரவு ஒரு பகுதியால் துல்லியமாக கணிக்கப்படுகிறது.
சிறந்த சாத்தியமான பாரபட்சத்தில், இந்த இழப்பு செயல்பாடு குறைக்கப்படுகிறது:
எனவே பொதுவான மாதிரிகள் தூரத்தை குறைத்தல் மாதிரிகள் என்றும், பாகுபாடு சிறந்ததாக இருந்தால், உண்மை மற்றும் உற்பத்தி செய்யப்பட்ட விநியோகத்திற்கு இடையே உள்ள வேறுபாடு குறைத்தல் என்றும் கருதலாம்.
உண்மையில், பல்வேறு வேறுபாடுகள் பயன்படுத்தப்படலாம் மற்றும் பல்வேறு GAN பயிற்சி முறைகளில் விளைவடையலாம்.
GANகளின் இழப்புச் செயல்பாட்டைச் சரிசெய்வது எளிமையாக இருந்தபோதிலும், ஜெனரேட்டருக்கும் பாரபட்சமானவருக்கும் இடையிலான வர்த்தக பரிமாற்றத்தை உள்ளடக்கிய கற்றல் இயக்கவியல், பின்பற்றுவது சவாலானது.
கற்றல் ஒன்றிணையும் என்பதற்கும் எந்த உறுதிமொழியும் இல்லை. இதன் விளைவாக, GAN மாடலைப் பயிற்றுவிப்பது கடினம், ஏனெனில் மறைந்துபோகும் சாய்வுகள் மற்றும் பயன்முறை சரிவு (உருவாக்கப்பட்ட மாதிரிகளில் பன்முகத்தன்மை இல்லாதபோது) போன்ற சிக்கல்களில் இயங்குவது பொதுவானது.
இப்போது, டிஃப்யூஷன் மாடல்களுக்கான நேரம் இது
GAN களின் பயிற்சி ஒருங்கிணைப்பில் உள்ள சிக்கல் பரவல் மாதிரிகளை உருவாக்குவதன் மூலம் தீர்க்கப்பட்டது.
இந்த மாதிரிகள் ஒரு பரவல் செயல்முறையானது சத்தத்தின் முற்போக்கான குறுக்கீட்டால் ஏற்படும் தகவல் இழப்புக்கு சமம் என்று கருதுகிறது (பரவல் செயல்முறையின் ஒவ்வொரு காலகட்டத்திலும் ஒரு காசியன் சத்தம் சேர்க்கப்படுகிறது).
அத்தகைய மாதிரியின் நோக்கம், மாதிரியில் இருக்கும் தகவலை சத்தம் எவ்வாறு பாதிக்கிறது அல்லது வேறு விதமாகச் சொல்வதானால், பரவல் காரணமாக எவ்வளவு தகவல் இழக்கப்படுகிறது என்பதை தீர்மானிப்பதாகும்.
ஒரு மாதிரியால் இதைக் கண்டுபிடிக்க முடிந்தால், அது அசல் மாதிரியை மீட்டெடுக்க முடியும் மற்றும் ஏற்பட்ட தகவல் இழப்பைச் செயல்தவிர்க்க வேண்டும்.
இது ஒரு denoising பரவல் மாதிரி மூலம் நிறைவேற்றப்படுகிறது. முன்னோக்கி பரவல் செயல்முறை மற்றும் தலைகீழ் பரவல் செயல்முறை இரண்டு படிகளை உருவாக்குகின்றன.
முன்னோக்கி பரவல் செயல்முறையானது காஸியன் சத்தத்தை (அதாவது பரவல் செயல்முறை) படிப்படியாக சேர்ப்பதை உள்ளடக்கியது, தரவு சத்தத்தால் முற்றிலும் மாசுபடும் வரை.
சத்தத்தைத் தலைகீழாக மாற்றுவதற்கான நிபந்தனை விநியோக நிகழ்தகவுகளைக் கற்றுக்கொள்வதற்காக நரம்பியல் வலையமைப்பு பின்னர் தலைகீழ் பரவல் முறையைப் பயன்படுத்தி பயிற்சியளிக்கப்படுகிறது.
இங்கே நீங்கள் பற்றி மேலும் புரிந்து கொள்ள முடியும் பரவல் மாதிரி.
பரவல் மாதிரி Vs GANகள்
ஒரு பரவல் மாதிரியைப் போலவே, GAN கள் சத்தத்திலிருந்து படங்களை உருவாக்குகின்றன.
இந்த மாதிரியானது ஜெனரேட்டர் நரம்பியல் நெட்வொர்க்கால் ஆனது, இது கிளாஸ் லேபிள் அல்லது டெக்ஸ்ட் என்கோடிங் போன்ற சில இன்ஃபர்மேட்டிவ் கண்டிஷனிங் மாறியின் சத்தத்துடன் தொடங்குகிறது.
இதன் விளைவாக ஒரு யதார்த்தமான படத்தை ஒத்ததாக இருக்க வேண்டும்.
ஃபோட்டோரியலிஸ்டிக் மற்றும் உயர் நம்பகத்தன்மை கொண்ட படத் தலைமுறைகளை உருவாக்க, நாங்கள் GANகளைப் பயன்படுத்துகிறோம். GAN களை விட மிகவும் யதார்த்தமான காட்சிகள் பரவல் மாதிரிகளைப் பயன்படுத்தி தயாரிக்கப்படுகின்றன.
ஒரு வகையில், உண்மைகளை விவரிப்பதில் பரவல் மாதிரிகள் மிகவும் துல்லியமானவை.
ஒரு GAN உள்ளீடு சீரற்ற சத்தம் அல்லது ஒரு வகுப்பு கண்டிஷனிங் மாறி மற்றும் ஒரு யதார்த்தமான மாதிரியை வெளியிடும் போது, பரவல் மாதிரிகள் பெரும்பாலும் மெதுவாக, மீண்டும் செயல்படுகின்றன, மேலும் அதிக வழிகாட்டுதல் தேவைப்படுகிறது.
இரைச்சலில் இருந்து அசல் படத்திற்குத் திரும்பும் குறிக்கோளுடன் டெனோயிசிங் மீண்டும் மீண்டும் பயன்படுத்தப்படும்போது பிழைக்கு அதிக இடமில்லை.
ஒவ்வொரு சோதனைச் சாவடியும் உருவாக்கும் நிலை முழுவதும் கடந்து செல்கிறது, மேலும் ஒவ்வொரு அடியிலும், படம் மேலும் மேலும் தகவலைப் பெறலாம்.
தீர்மானம்
முடிவில், 2020கள் மற்றும் 2021 இல் மட்டுமே வெளியிடப்பட்ட சில குறிப்பிடத்தக்க ஆராய்ச்சிகளின் காரணமாக, படத்தொகுப்பின் அடிப்படையில் பரவல் மாதிரிகள் இப்போது GAN களை விட சிறப்பாக செயல்பட முடியும்.
இந்த ஆண்டு, OpenAI தொடங்கப்பட்டது DALL-E2, பயிற்சியாளர்கள் பரவல் மாதிரிகளைப் பயன்படுத்த அனுமதிக்கும் படத் தயாரிப்பு மாதிரி.
GANகள் அதிநவீனமானவை என்றாலும், அவற்றின் கட்டுப்பாடுகள் அவற்றை புதிய சூழல்களில் அளவிடுவதற்கும் பயன்படுத்துவதற்கும் சவாலாக இருக்கின்றன.
நிகழ்தகவு அடிப்படையிலான மாதிரிகளைப் பயன்படுத்தி GAN போன்ற மாதிரித் தரத்தை அடைவதற்காக, நிறைய வேலைகள் செய்யப்பட்டுள்ளன.
ஒரு பதில் விடவும்