இன்று நாம் இயற்கை மொழி செயலாக்கத்தில் ஒரு புரட்சியைக் காண்கிறோம். மேலும், செயற்கை நுண்ணறிவு இல்லாமல் எதிர்காலம் இல்லை என்பது உறுதி. நாங்கள் ஏற்கனவே பல்வேறு AI "உதவியாளர்களை" பயன்படுத்துகிறோம்.
எங்கள் விஷயத்தில் சாட்போட்கள் சிறந்த எடுத்துக்காட்டுகள். அவர்கள் தகவல்தொடர்பு புதிய சகாப்தத்தை பிரதிநிதித்துவப்படுத்துகிறார்கள். ஆனால், அவர்களுக்கு இவ்வளவு சிறப்பு என்ன?
தற்போதைய சாட்போட்கள் மனித நிபுணர்களைப் போலவே துல்லியமாகவும் விவரமாகவும் இயற்கை மொழி விசாரணைகளைப் புரிந்துகொண்டு பதிலளிக்க முடியும். செயல்முறைக்குச் செல்லும் வழிமுறைகளைப் பற்றி அறிந்து கொள்வது உற்சாகமாக இருக்கிறது.
கட்டிப்பிடித்து, அதன் பின்னணியில் உள்ள தொழில்நுட்பத்தைக் கண்டுபிடிப்போம்.
தொழில்நுட்பத்தில் டைவிங்
AI டிரான்ஸ்ஃபார்மர்கள் இந்த பகுதியில் ஒரு முக்கிய முக்கிய சொல். அவர்கள் போன்றவர்கள் நரம்பியல் வலையமைப்புகள் இயற்கை மொழி செயலாக்கத்தில் புரட்சியை ஏற்படுத்தியுள்ளது. உண்மையில், AI மின்மாற்றிகள் மற்றும் நரம்பியல் நெட்வொர்க்குகளுக்கு இடையே கணிசமான வடிவமைப்பு இணைகள் உள்ளன.
இரண்டும் செயலாக்க அலகுகளின் பல அடுக்குகளால் ஆனவை, அவை உள்ளீட்டுத் தரவை வெளியீடாக கணிப்புகளாக மாற்ற தொடர்ச்சியான கணக்கீடுகளைச் செய்கின்றன. இந்த இடுகையில், AI டிரான்ஸ்ஃபார்மர்களின் சக்தி மற்றும் அவை நம்மைச் சுற்றியுள்ள உலகத்தை எவ்வாறு மாற்றுகின்றன என்பதைப் பார்ப்போம்.
இயற்கை மொழி செயலாக்கத்தின் சாத்தியம்
அடிப்படைகளுடன் ஆரம்பிக்கலாம். கிட்டத்தட்ட எல்லா இடங்களிலும் கேட்கிறோம். ஆனால், இயற்கை மொழி செயலாக்கம் என்றால் என்ன?
இது ஒரு பிரிவு செயற்கை நுண்ணறிவு இது இயற்கையான மொழியைப் பயன்படுத்துவதன் மூலம் மனிதர்கள் மற்றும் இயந்திரங்களின் தொடர்புகளில் கவனம் செலுத்துகிறது. மனித மொழியை அர்த்தமுள்ள மற்றும் உண்மையான முறையில் உணரவும், விளக்கவும் மற்றும் உருவாக்கவும் கணினிகளை அனுமதிப்பதே குறிக்கோள்.
பேச்சு அங்கீகாரம், மொழி மொழிபெயர்ப்பு, உணர்வு பகுப்பாய்வு, மற்றும் உரை சுருக்கம் அனைத்தும் NLP பயன்பாடுகளின் எடுத்துக்காட்டுகள். பாரம்பரிய NLP மாதிரிகள், மறுபுறம், ஒரு சொற்றொடரில் உள்ள சொற்களுக்கு இடையே உள்ள சிக்கலான இணைப்புகளைப் புரிந்துகொள்ள சிரமப்படுகின்றன. இது பல NLP பணிகளில் அதிக அளவிலான துல்லியத்தை சாத்தியமற்றதாக்கியது.
இந்த நேரத்தில்தான் AI டிரான்ஸ்ஃபார்மர்கள் படத்தில் நுழைகின்றன. ஒரு சுய-கவனம் செயல்முறை மூலம், மின்மாற்றிகள் ஒரு சொற்றொடரில் உள்ள வார்த்தைகளுக்கு இடையேயான நீண்ட கால சார்புகளையும் இணைப்புகளையும் பதிவு செய்யலாம். இந்த முறையானது உள்ளீட்டு வரிசையின் பல்வேறு பிரிவுகளில் கலந்துகொள்ள மாதிரியைத் தேர்வுசெய்ய உதவுகிறது. எனவே, ஒரு சொற்றொடரில் ஒவ்வொரு வார்த்தையின் சூழலையும் பொருளையும் அது புரிந்து கொள்ள முடியும்.
டிரான்ஸ்ஃபார்மர்ஸ் மாதிரிகள் சரியாக என்ன
AI மின்மாற்றி என்பது a ஆழமான கற்றல் பல்வேறு வகையான தகவல்களைப் புரிந்துகொண்டு செயலாக்கும் கட்டிடக்கலை. ஒரு சொற்றொடரில் உள்ள வெவ்வேறு சொற்கள் எவ்வாறு இணைக்கப்பட்டுள்ளன அல்லது ஒரு படத்தின் வெவ்வேறு பிரிவுகள் எவ்வாறு ஒன்றாகப் பொருந்துகின்றன என்பது போன்ற பல பிட்கள் ஒன்றுடன் ஒன்று எவ்வாறு தொடர்புபடுகின்றன என்பதை தீர்மானிப்பதில் இது சிறந்து விளங்குகிறது.
தகவலை சிறிய பிட்களாகப் பிரித்து, அந்த கூறுகள் அனைத்தையும் ஒரே நேரத்தில் பார்ப்பதன் மூலம் இது செயல்படுகிறது. பல சிறிய ரோபோக்கள் தரவுகளைப் புரிந்துகொள்ள ஒத்துழைப்பது போல் இருக்கிறது. அடுத்து, அது எல்லாவற்றையும் அறிந்தவுடன், பதில் அல்லது வெளியீட்டை வழங்க அனைத்து கூறுகளையும் மீண்டும் இணைக்கிறது.
AI மின்மாற்றிகள் மிகவும் மதிப்புமிக்கவை. பல்வேறு தகவல்களுக்கு இடையே உள்ள சூழலையும் நீண்ட கால இணைப்புகளையும் அவர்கள் புரிந்து கொள்ள முடியும். மொழி பெயர்ப்பு, சுருக்கம் மற்றும் கேள்விகளுக்கு பதில் அளித்தல் போன்ற பணிகளுக்கு இது மிகவும் முக்கியமானது. எனவே, AI சாதிக்கக்கூடிய பல சுவாரஸ்யமான விஷயங்களுக்குப் பின்னால் அவர்கள் மூளையாக இருக்கிறார்கள்!
கவனம் தேவை
"கவனம் மட்டுமே உங்களுக்கு தேவை" என்ற துணைத் தலைப்பு மின்மாற்றி மாதிரியை முன்மொழிந்த 2017 வெளியீட்டைக் குறிக்கிறது. இது இயற்கை மொழி செயலாக்கத்தின் (NLP) ஒழுங்குமுறையில் புரட்சியை ஏற்படுத்தியது.
இந்த ஆராய்ச்சியின் ஆசிரியர்கள், மின்மாற்றி மாதிரியின் சுய-கவனம் பொறிமுறையானது வழக்கமான மறுநிகழ்வு மற்றும் மாற்றத்தக்க நரம்பியல் நெட்வொர்க்குகள் NLP பணிகளுக்குப் பயன்படுத்தப்பட்டது.
சுய கவனம் சரியாக என்ன?
கணிப்புகளை உருவாக்கும் போது, மாதிரியானது பல்வேறு உள்ளீட்டு வரிசைப் பிரிவுகளில் கவனம் செலுத்த அனுமதிக்கும் ஒரு முறையாகும்.
வேறு வார்த்தைகளில் கூறுவதானால், சுய-கவனம் மாதிரியானது மற்ற அனைத்து கூறுகள் தொடர்பான ஒவ்வொரு உறுப்புக்கும் கவனம் செலுத்தும் மதிப்பெண்களின் தொகுப்பைக் கணக்கிட உதவுகிறது, இது மாதிரி ஒவ்வொரு உள்ளீட்டு உறுப்புகளின் முக்கியத்துவத்தையும் சமப்படுத்த அனுமதிக்கிறது.
மின்மாற்றி அடிப்படையிலான அணுகுமுறையில், சுய-கவனம் பின்வருமாறு செயல்படுகிறது:
உள்ளீட்டு வரிசை முதலில் ஒவ்வொரு வரிசை உறுப்பினருக்கும் ஒன்று, திசையன்களின் தொடரில் உட்பொதிக்கப்படுகிறது.
வரிசையில் உள்ள ஒவ்வொரு உறுப்புக்கும், மாதிரியானது மூன்று திசையன்களை உருவாக்குகிறது: வினவல் திசையன், முக்கிய திசையன் மற்றும் மதிப்பு திசையன்.
வினவல் திசையன் அனைத்து முக்கிய திசையன்களுடன் ஒப்பிடப்படுகிறது, மேலும் ஒரு புள்ளி தயாரிப்பைப் பயன்படுத்தி ஒற்றுமைகள் கணக்கிடப்படுகின்றன.
சாஃப்ட்மேக்ஸ் செயல்பாட்டைப் பயன்படுத்தி அதன் விளைவாக வரும் கவனம் மதிப்பெண்கள் இயல்பாக்கப்படுகின்றன, இது வரிசையின் ஒவ்வொரு பகுதியின் ஒப்பீட்டு முக்கியத்துவத்தைக் குறிக்கும் எடைகளின் தொகுப்பை உருவாக்குகிறது.
இறுதி வெளியீடு பிரதிநிதித்துவத்தை உருவாக்க, மதிப்பு திசையன்கள் கவன எடைகள் மற்றும் சுருக்கமாக பெருக்கப்படுகின்றன.
சுய-கவனம் பயன்படுத்தும் டிரான்ஸ்ஃபார்மர் அடிப்படையிலான மாதிரிகள், நிலையான-நீள சூழல் சாளரங்களைச் சார்ந்து இல்லாமல் உள்ளீட்டு வரிசைகளில் நீண்ட தூர உறவுகளை வெற்றிகரமாகப் பிடிக்கலாம்.
உதாரணமாக
எங்களிடம் ஆறு டோக்கன் உள்ளீட்டு வரிசை இருப்பதாக வைத்துக்கொள்வோம்: "பூனை பாயில் அமர்ந்தது." ஒவ்வொரு டோக்கனும் ஒரு வெக்டராக குறிப்பிடப்படலாம், மேலும் உள்ளீட்டு வரிசையை பின்வருமாறு காணலாம்:
அடுத்து, ஒவ்வொரு டோக்கனுக்கும், மூன்று திசையன்களை உருவாக்குவோம்: வினவல் திசையன், முக்கிய திசையன் மற்றும் மதிப்பு திசையன். உட்பொதிக்கப்பட்ட டோக்கன் திசையன் இந்த திசையன்களை வழங்க மூன்று கற்றல் எடை மெட்ரிக்குகளால் பெருக்கப்படுகிறது.
முதல் டோக்கன் "The"க்கு, எடுத்துக்காட்டாக, வினவல், விசை மற்றும் மதிப்பு திசையன்கள்:
வினவல் திசையன்: [0.4, -0.2, 0.1]
முக்கிய திசையன்: [0.2, 0.1, 0.5]
மதிப்பு திசையன்: [0.1, 0.2, 0.3]
உள்ளீட்டு வரிசையில் உள்ள ஒவ்வொரு ஜோடி டோக்கன்களுக்கும் இடையேயான கவனம் மதிப்பெண்கள் சுய-கவனம் பொறிமுறையால் கணக்கிடப்படுகின்றன. எடுத்துக்காட்டாக, டோக்கன்கள் 1 மற்றும் 2 "The" க்கு இடையேயான கவன மதிப்பெண், அவற்றின் வினவல் மற்றும் முக்கிய திசையன்களின் புள்ளி உற்பத்தியாக கணக்கிடப்படும்:
கவனம் மதிப்பெண் = dot_product (டோக்கன் 1 இன் வினவல் திசையன், டோக்கனின் முக்கிய திசையன் 2)
= (0.4 * 0.8) + (-0.2 * 0.2) + (0.1 * 0.1)
= 0.31
இந்த கவனம் மதிப்பெண்கள் ஒவ்வொரு டோக்கனுக்கும் மற்றவற்றின் வரிசையில் தொடர்புடைய தொடர்பைக் காட்டுகின்றன.
கடைசியாக, ஒவ்வொரு டோக்கனுக்கும், அவுட்புட் பிரதிநிதித்துவம், மதிப்பு வெக்டார்களின் எடையுள்ள தொகையை எடுத்து, கவனம் மதிப்பெண்களால் தீர்மானிக்கப்படும் எடைகளுடன் உருவாக்கப்படுகிறது. எடுத்துக்காட்டாக, முதல் டோக்கன் "The"க்கான வெளியீடு பிரதிநிதித்துவம்:
டோக்கன் 1 க்கான வெளியீட்டு திசையன் = (டோக்கன் 1 உடன் கவனம் மதிப்பெண்) * டோக்கன் 2 க்கான மதிப்பு வெக்டர்
+ (டோக்கன் 3 உடன் கவனம் செலுத்துதல்) * டோக்கன் 3க்கான மதிப்பு வெக்டார்
+ (டோக்கன் 4 உடன் கவனம் செலுத்துதல்) * டோக்கன் 4க்கான மதிப்பு வெக்டார்
+ (டோக்கன் 5 உடன் கவனம் செலுத்துதல்) * டோக்கன் 5க்கான மதிப்பு வெக்டார்
+ (டோக்கன் 6 உடன் கவனம் செலுத்துதல்) * டோக்கன் 6க்கான மதிப்பு வெக்டார்
= (0.31 * [0.1, 0.2, 0.3]) + (0.25 * [0.2, -0.1, 0.7]) + (0.08 * [0.3, 0.5, -0.1]) + (0.14 * [0.1, 0.3, -0.2] ) + (0.22 * [0.6, -0.3, 0.4])
= [0.2669, 0.1533, 0.2715]
சுய கவனத்தின் விளைவாக, மின்மாற்றி அடிப்படையிலான மாதிரியானது வெளியீட்டு வரிசையை உருவாக்கும் போது உள்ளீட்டு வரிசையின் வெவ்வேறு பிரிவுகளில் கலந்துகொள்ள தேர்வு செய்யலாம்.
நீங்கள் நினைப்பதை விட பயன்பாடுகள் அதிகம்
அவற்றின் தகவமைப்பு மற்றும் இயந்திர மொழிபெயர்ப்பு, உணர்வு பகுப்பாய்வு, உரை சுருக்கம் மற்றும் பல போன்ற பரந்த அளவிலான NLP பணிகளைக் கையாளும் திறன் காரணமாக, AI மின்மாற்றிகள் சமீபத்திய ஆண்டுகளில் பிரபலமடைந்துள்ளன.
AI மின்மாற்றிகள், கிளாசிக் மொழி-அடிப்படையிலான பயன்பாடுகளுக்கு கூடுதலாக, பட அங்கீகாரம், பரிந்துரை அமைப்புகள் மற்றும் மருந்து கண்டுபிடிப்பு உள்ளிட்ட பல்வேறு களங்களில் பயன்படுத்தப்பட்டுள்ளன.
AI மின்மாற்றிகள் கிட்டத்தட்ட வரம்பற்ற பயன்பாடுகளைக் கொண்டுள்ளன, ஏனெனில் அவை பல சிக்கல் பகுதிகள் மற்றும் தரவு வகைகளுக்கு ஏற்றவாறு வடிவமைக்கப்படலாம். AI மின்மாற்றிகள், சிக்கலான தரவுத் தொடர்களை பகுப்பாய்வு செய்து நீண்ட கால உறவுகளைப் பிடிக்கும் திறன் கொண்டவை, அடுத்த ஆண்டுகளில் AI பயன்பாடுகளின் வளர்ச்சியில் குறிப்பிடத்தக்க உந்து காரணியாக அமைகின்றன.
பிற நரம்பியல் நெட்வொர்க் கட்டமைப்புகளுடன் ஒப்பிடுதல்
அவை உள்ளீட்டு வரிசைகளை பகுப்பாய்வு செய்து, உரையில் நீண்ட தூர உறவுகளைப் புரிந்து கொள்ள முடியும் என்பதால், மற்ற நரம்பியல் நெட்வொர்க் பயன்பாடுகளுடன் ஒப்பிடும்போது, AI மின்மாற்றிகள் இயற்கையான மொழி செயலாக்கத்திற்கு மிகவும் பொருத்தமானவை.
சில நரம்பியல் நெட்வொர்க் கட்டமைப்புகள், கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள் (சிஎன்என்கள்) மற்றும் மீண்டும் மீண்டும் வரும் நரம்பியல் நெட்வொர்க்குகள் (ஆர்என்என்கள்) போன்றவை, படங்கள் அல்லது நேரத் தொடர் தரவு போன்ற கட்டமைக்கப்பட்ட உள்ளீட்டைச் செயலாக்கும் பணிகளுக்கு மிகவும் பொருத்தமானவை.
எதிர்காலம் பிரகாசமாக இருக்கிறது
AI மின்மாற்றிகளின் எதிர்காலம் பிரகாசமாகத் தெரிகிறது. நடந்துகொண்டிருக்கும் ஆய்வின் ஒரு பகுதி, பெருகிய முறையில் சிக்கலான பணிகளைக் கையாளும் திறன் கொண்ட படிப்படியாக அதிக சக்திவாய்ந்த மாதிரிகளை உருவாக்குவதாகும்.
மேலும், AI மின்மாற்றிகளை மற்ற AI தொழில்நுட்பங்களுடன் இணைக்க முயற்சிகள் மேற்கொள்ளப்பட்டு வருகின்றன வலுவூட்டல் கற்றல், மேலும் மேம்பட்ட முடிவெடுக்கும் திறன்களை வழங்க.
ஒவ்வொரு தொழிற்துறையும் AI இன் திறனைப் பயன்படுத்தி புதுமைகளை உருவாக்கவும் போட்டித்தன்மையை அடையவும் முயற்சி செய்கின்றன. எனவே, AI மின்மாற்றிகள், உடல்நலம், நிதி மற்றும் பிற பயன்பாடுகள் உட்பட பல்வேறு பயன்பாடுகளில் படிப்படியாக இணைக்கப்பட வாய்ப்புள்ளது.
AI மின்மாற்றி தொழில்நுட்பத்தில் தொடர்ச்சியான மேம்பாடுகள் மற்றும் இந்த வலுவான AI கருவிகள் மனிதர்கள் மொழியைச் செயலாக்கும் மற்றும் புரிந்துகொள்ளும் விதத்தில் புரட்சியை ஏற்படுத்துவதற்கான சாத்தியக்கூறுகளுடன், எதிர்காலம் பிரகாசமாகத் தெரிகிறது.
ஒரு பதில் விடவும்