நாம் ஒரு புதிய AI புரட்சியின் தொடக்கத்தில் இருக்கக்கூடும்.
உருவாக்கும் செயற்கை நுண்ணறிவு என்பது உள்ளடக்கத்தை உருவாக்கும் திறன் கொண்ட அல்காரிதம்கள் மற்றும் மாதிரிகளைக் குறிக்கிறது. அத்தகைய மாதிரிகளின் வெளியீடு உரை, ஆடியோ மற்றும் படங்கள் ஆகியவை அடங்கும், அவை பெரும்பாலும் உண்மையான மனித வெளியீடு என்று தவறாகக் கருதப்படலாம்.
போன்ற பயன்பாடுகள் அரட்டை GPT ஜெனரேட்டிவ் AI என்பது வெறும் புதுமை அல்ல என்பதை நிரூபித்துள்ளனர். AI ஆனது இப்போது விரிவான வழிமுறைகளைப் பின்பற்றும் திறன் கொண்டது மற்றும் உலகம் எவ்வாறு செயல்படுகிறது என்பதைப் பற்றிய ஆழமான புரிதலைக் கொண்டுள்ளது.
ஆனால் நாம் எப்படி இந்த நிலைக்கு வந்தோம்? இந்த வழிகாட்டியில், இந்த புதிய மற்றும் அற்புதமான AI புரட்சிக்கு வழிவகுத்த AI ஆராய்ச்சியின் சில முக்கிய முன்னேற்றங்களை நாங்கள் காண்போம்.
நியூரல் நெட்வொர்க்குகளின் எழுச்சி
நவீன AI இன் தோற்றத்தை நீங்கள் ஆராய்ச்சியில் கண்டறியலாம் ஆழ்ந்த கற்றல் மற்றும் நரம்பியல் நெட்வொர்க்குகள் 2012 உள்ள.
அந்த ஆண்டில், டொராண்டோ பல்கலைக்கழகத்தைச் சேர்ந்த அலெக்ஸ் கிரிஷெவ்ஸ்கி மற்றும் அவரது குழுவினர் பொருட்களை வகைப்படுத்தக்கூடிய மிகவும் துல்லியமான வழிமுறையை அடைய முடிந்தது.
தி அதிநவீன நரம்பியல் நெட்வொர்க், இப்போது அலெக்ஸ்நெட் என அழைக்கப்படும், இமேஜ்நெட் காட்சி தரவுத்தளத்தில் உள்ள பொருட்களை ரன்னர்-அப்பை விட மிகக் குறைந்த பிழை விகிதத்துடன் வகைப்படுத்த முடிந்தது.
நரம்பியல் வலையமைப்புகள் சில பயிற்சி தரவுகளின் அடிப்படையில் ஒரு குறிப்பிட்ட நடத்தையை அறிய கணித செயல்பாடுகளின் நெட்வொர்க்கைப் பயன்படுத்தும் வழிமுறைகள். எடுத்துக்காட்டாக, புற்றுநோய் போன்ற நோயைக் கண்டறிய மாதிரியைப் பயிற்றுவிப்பதற்காக நீங்கள் ஒரு நரம்பியல் நெட்வொர்க் மருத்துவத் தரவை ஊட்டலாம்.
நரம்பியல் வலையமைப்பு மெதுவாக தரவுகளில் உள்ள வடிவங்களைக் கண்டறிந்து, புதிய தரவைக் கொடுக்கும்போது மிகவும் துல்லியமாக மாறும் என்பது நம்பிக்கை.
அலெக்ஸ்நெட் ஒரு திருப்புமுனை பயன்பாடாகும் மாற்றும் நரம்பியல் பிணையம் அல்லது சிஎன்என்கள். "கன்வல்யூஷனல்" திறவுச்சொல் என்பது கன்வல்யூஷனல் அடுக்குகளைச் சேர்ப்பதைக் குறிக்கிறது, இது நெருக்கமாக இருக்கும் தரவுகளுக்கு அதிக முக்கியத்துவம் அளிக்கிறது.
1980 களில் CNN கள் ஏற்கனவே ஒரு யோசனையாக இருந்தபோதிலும், சமீபத்திய GPU தொழில்நுட்பம் தொழில்நுட்பத்தை புதிய உயரத்திற்குத் தள்ளும் போது 2010 களின் முற்பகுதியில் மட்டுமே அவை பிரபலமடையத் தொடங்கின.
துறையில் CNNகளின் வெற்றி கணினி பார்வை நரம்பியல் நெட்வொர்க்குகளின் ஆராய்ச்சியில் அதிக ஆர்வத்தை ஏற்படுத்தியது.
கூகுள் மற்றும் ஃபேஸ்புக் போன்ற தொழில்நுட்ப ஜாம்பவான்கள் தங்கள் சொந்த AI கட்டமைப்பை பொதுமக்களுக்கு வெளியிட முடிவு செய்தனர். போன்ற உயர்நிலை APIகள் Keras ஆழமான நரம்பியல் நெட்வொர்க்குகளுடன் பரிசோதனை செய்ய பயனர்களுக்கு பயனர் நட்பு இடைமுகத்தை வழங்கியது.
சிஎன்என்கள் படத்தை அறிதல் மற்றும் வீடியோ பகுப்பாய்வில் சிறப்பாக செயல்பட்டன, ஆனால் மொழி சார்ந்த பிரச்சனைகளை தீர்க்கும் போது சிக்கலை எதிர்கொண்டது. இயற்கையான மொழி செயலாக்கத்தில் இந்த வரம்பு இருக்கலாம், ஏனெனில் படங்கள் மற்றும் உரை உண்மையில் அடிப்படையில் வேறுபட்ட சிக்கல்கள்.
எடுத்துக்காட்டாக, ஒரு படத்தில் போக்குவரத்து விளக்கு உள்ளதா என்பதை வகைப்படுத்தும் மாதிரி உங்களிடம் இருந்தால், கேள்விக்குரிய போக்குவரத்து விளக்கு படத்தில் எங்கும் தோன்றும். இருப்பினும், இந்த வகையான மென்மை மொழியில் நன்றாக வேலை செய்யாது. "பாப் மீன் சாப்பிட்டான்" மற்றும் "மீன் சாப்பிட்டான் பாப்" என்ற வாக்கியம் ஒரே வார்த்தைகளைப் பயன்படுத்தினாலும், வெவ்வேறு அர்த்தங்களைக் கொண்டுள்ளது.
மனித மொழி சம்பந்தப்பட்ட பிரச்சினைகளைத் தீர்க்க ஆராய்ச்சியாளர்கள் ஒரு புதிய அணுகுமுறையைக் கண்டுபிடிக்க வேண்டும் என்பது தெளிவாகிவிட்டது.
மின்மாற்றிகள் எல்லாவற்றையும் மாற்றுகின்றன
இல், ஒரு ஆய்வு காட்டுரை "கவனம் மட்டுமே உங்களுக்கு தேவை" என்ற தலைப்பில் ஒரு புதிய வகை நெட்வொர்க்கை முன்மொழிந்தது: டிரான்ஸ்பார்மர்.
சிஎன்என்கள் ஒரு படத்தின் சிறிய பகுதிகளை மீண்டும் மீண்டும் வடிகட்டுவதன் மூலம் வேலை செய்யும் போது, மின்மாற்றிகள் தரவுகளில் உள்ள ஒவ்வொரு உறுப்பையும் மற்ற உறுப்புகளுடன் இணைக்கின்றன. ஆராய்ச்சியாளர்கள் இந்த செயல்முறையை "சுய கவனம்" என்று அழைக்கிறார்கள்.
வாக்கியங்களை அலச முயற்சிக்கும்போது, CNNகள் மற்றும் மின்மாற்றிகள் மிகவும் வித்தியாசமாக வேலை செய்கின்றன. ஒரு CNN ஒன்றுக்கொன்று அருகில் இருக்கும் வார்த்தைகளுடன் இணைப்புகளை உருவாக்குவதில் கவனம் செலுத்தும் போது, ஒரு மின்மாற்றி ஒரு வாக்கியத்தில் உள்ள ஒவ்வொரு வார்த்தைக்கும் இடையே இணைப்புகளை உருவாக்கும்.
சுய-கவனம் செயல்முறை மனித மொழியைப் புரிந்துகொள்வதில் ஒரு ஒருங்கிணைந்த பகுதியாகும். பெரிதாக்கி, முழு வாக்கியமும் எவ்வாறு ஒன்றாக பொருந்துகிறது என்பதைப் பார்ப்பதன் மூலம், இயந்திரங்கள் வாக்கியத்தின் அமைப்பைப் பற்றி தெளிவாகப் புரிந்து கொள்ள முடியும்.
முதல் மின்மாற்றி மாதிரிகள் வெளியிடப்பட்டதும், இணையத்தில் காணப்படும் நம்பமுடியாத அளவிலான உரைத் தரவைப் பயன்படுத்திக் கொள்ள ஆராய்ச்சியாளர்கள் விரைவில் புதிய கட்டமைப்பைப் பயன்படுத்தினர்.
GPT-3 மற்றும் இணையம்
2020 இல், OpenAI இன் GPT-3 மின்மாற்றிகள் எவ்வளவு பயனுள்ளதாக இருக்கும் என்பதை மாதிரி காட்டியது. GPT-3 ஆனது மனிதனிடமிருந்து கிட்டத்தட்ட பிரித்தறிய முடியாத உரையை வெளியிட முடிந்தது. GPT-3 ஐ மிகவும் சக்திவாய்ந்ததாக மாற்றியதன் ஒரு பகுதி, பயன்படுத்தப்பட்ட பயிற்சி தரவுகளின் அளவு. மாடலின் பயிற்சிக்கு முந்தைய தரவுத்தொகுப்பில் பெரும்பாலானவை 400 பில்லியன் டோக்கன்களுடன் வரும் காமன் கிரால் எனப்படும் தரவுத்தொகுப்பில் இருந்து வருகிறது.
யதார்த்தமான மனித உரையை உருவாக்கும் GPT-3 இன் திறன் அதன் சொந்த முயற்சியாக இருந்தாலும், அதே மாதிரி மற்ற பணிகளை எவ்வாறு தீர்க்க முடியும் என்பதை ஆராய்ச்சியாளர்கள் கண்டுபிடித்தனர்.
எடுத்துக்காட்டாக, ட்வீட்டை உருவாக்க நீங்கள் பயன்படுத்தக்கூடிய அதே GPT-3 மாதிரியானது உரையைச் சுருக்கவும், ஒரு பத்தியை மீண்டும் எழுதவும் மற்றும் ஒரு கதையை முடிக்கவும் உதவும். மொழி மாதிரிகள் அவை மிகவும் சக்திவாய்ந்ததாகிவிட்டன, அவை இப்போது எந்த வகையான கட்டளையையும் பின்பற்றும் பொதுவான நோக்கத்திற்கான கருவிகளாக உள்ளன.
GPT-3 இன் பொது-நோக்க இயல்பு அத்தகைய பயன்பாடுகளை அனுமதித்துள்ளது கிட்ஹப் கோபிலட், இது புரோகிராமர்களை எளிய ஆங்கிலத்தில் இருந்து வேலை செய்யும் குறியீட்டை உருவாக்க அனுமதிக்கிறது.
பரவல் மாதிரிகள்: உரையிலிருந்து படங்கள் வரை
டிரான்ஸ்பார்மர்கள் மற்றும் என்எல்பி மூலம் ஏற்பட்ட முன்னேற்றம், பிற துறைகளில் செயற்கை நுண்ணறிவை உருவாக்குவதற்கும் வழி வகுத்துள்ளது.
கணினி பார்வையின் துறையில், படங்களைப் புரிந்துகொள்ள இயந்திரங்களை எவ்வாறு ஆழமான கற்றல் அனுமதித்தது என்பதை நாங்கள் ஏற்கனவே கூறியுள்ளோம். எவ்வாறாயினும், AI படங்களை வகைப்படுத்துவதற்குப் பதிலாக அவற்றை உருவாக்குவதற்கான வழியை நாங்கள் இன்னும் கண்டுபிடிக்க வேண்டும்.
DALL-E 2, ஸ்டேபிள் டிஃப்யூஷன் மற்றும் மிட்ஜர்னி போன்ற ஜெனரேட்டிவ் இமேஜ் மாடல்கள் பிரபலமாகியுள்ளன, ஏனெனில் அவை உரை உள்ளீட்டை எவ்வாறு படங்களாக மாற்ற முடிகிறது.
இந்த பட மாதிரிகள் இரண்டு முக்கிய அம்சங்களை நம்பியுள்ளன: படங்கள் மற்றும் உரைக்கு இடையிலான உறவைப் புரிந்துகொள்ளும் மாதிரி மற்றும் உள்ளீட்டுடன் பொருந்தக்கூடிய உயர்-வரையறை படத்தை உண்மையில் உருவாக்கக்கூடிய மாதிரி.
OpenAI கள் கிளிப் (கான்ட்ராஸ்டிவ் லாங்குவேஜ்-இமேஜ் ப்ரீ-ட்ரெய்னிங்) என்பது ஒரு திறந்த மூல மாதிரியாகும், இது முதல் அம்சத்தைத் தீர்ப்பதை நோக்கமாகக் கொண்டுள்ளது. ஒரு படத்தை கொடுக்கப்பட்டால், CLIP மாதிரியானது அந்த குறிப்பிட்ட படத்திற்கான மிகவும் பொருத்தமான உரை விளக்கத்தை கணிக்க முடியும்.
CLIP மாதிரியானது முக்கியமான பட அம்சங்களை எவ்வாறு பிரித்தெடுப்பது மற்றும் ஒரு படத்தின் எளிமையான பிரதிநிதித்துவத்தை எவ்வாறு உருவாக்குவது என்பதைக் கற்றுக்கொள்வதன் மூலம் செயல்படுகிறது.
பயனர்கள் DALL-E 2 க்கு மாதிரி உரை உள்ளீட்டை வழங்கும்போது, CLIP மாதிரியைப் பயன்படுத்தி உள்ளீடு "பட உட்பொதித்தல்" ஆக மாற்றப்படும். உருவாக்கப்பட்ட பட உட்பொதிப்புடன் பொருந்தக்கூடிய படத்தை உருவாக்குவதற்கான வழியைக் கண்டுபிடிப்பதே இப்போது குறிக்கோள்.
சமீபத்திய உருவாக்கப் பட AIகள் பயன்படுத்துகிறது a பரவல் மாதிரி உண்மையில் ஒரு படத்தை உருவாக்கும் பணியை சமாளிக்க. படங்களிலிருந்து கூடுதல் சத்தத்தை எவ்வாறு அகற்றுவது என்பதை அறிய முன் பயிற்சியளிக்கப்பட்ட நரம்பியல் நெட்வொர்க்குகளை டிஃப்யூஷன் மாதிரிகள் நம்பியுள்ளன.
இந்த பயிற்சியின் போது, நரம்பியல் நெட்வொர்க் ஒரு சீரற்ற இரைச்சல் படத்திலிருந்து உயர் தெளிவுத்திறன் கொண்ட படத்தை எவ்வாறு உருவாக்குவது என்பதை அறிய முடியும். CLIP வழங்கிய உரை மற்றும் படங்களின் மேப்பிங் ஏற்கனவே எங்களிடம் இருப்பதால், எங்களால் முடியும் ஒரு பரவல் மாதிரியைப் பயிற்றுவிக்கவும் CLIP பட உட்பொதிப்பில் எந்தவொரு படத்தையும் உருவாக்குவதற்கான செயல்முறையை உருவாக்கவும்.
உருவாக்கும் AI புரட்சி: அடுத்து என்ன வரும்?
ஒவ்வொரு இரண்டு நாட்களுக்கு ஒருமுறை உருவாக்கப்படும் AI இல் முன்னேற்றங்கள் நிகழும் கட்டத்தில் நாம் இப்போது இருக்கிறோம். AI ஐப் பயன்படுத்தி பல்வேறு வகையான ஊடகங்களை உருவாக்குவது எளிதாகவும் எளிதாகவும் இருப்பதால், இது நம் சமூகத்தை எவ்வாறு பாதிக்கும் என்பதைப் பற்றி நாம் கவலைப்பட வேண்டுமா?
நீராவி என்ஜின் கண்டுபிடிக்கப்பட்டதில் இருந்து தொழிலாளர்களை மாற்றும் இயந்திரங்கள் பற்றிய கவலை எப்போதும் உரையாடலில் இருந்தபோதிலும், இந்த முறை அது சற்று வித்தியாசமாக இருப்பதாகத் தெரிகிறது.
ஜெனரேட்டிவ் AI என்பது பல்நோக்குக் கருவியாக மாறி வருகிறது, இது AI கையகப்படுத்துதலில் இருந்து பாதுகாப்பானதாகக் கருதப்படும் தொழில்களை சீர்குலைக்கக்கூடும்.
சில அடிப்படை வழிமுறைகளிலிருந்து குறைபாடற்ற குறியீட்டை AI எழுதத் தொடங்கினால், நமக்கு புரோகிராமர்கள் தேவைப்படுமா? மக்கள் தாங்கள் விரும்பும் வெளியீட்டை மலிவாக உற்பத்தி செய்ய ஒரு உற்பத்தி மாதிரியைப் பயன்படுத்தினால், படைப்பாளிகளை வேலைக்கு அமர்த்துவார்களா?
உருவாக்கும் AI புரட்சியின் எதிர்காலத்தை கணிப்பது கடினம். ஆனால் இப்போது உருவகமான பண்டோராவின் பெட்டி திறக்கப்பட்டுள்ளது, உலகில் நேர்மறையான தாக்கத்தை ஏற்படுத்தக்கூடிய அற்புதமான கண்டுபிடிப்புகளை தொழில்நுட்பம் அனுமதிக்கும் என்று நம்புகிறேன்.
ஒரு பதில் விடவும்