ChatGPT толық оқу процесі түсіндірілді

Мазмұны[Жасыру][Көрсету]

Генеративті алдын ала дайындық+-
- Теңестіру мәселесі
Бақыланатын дәл реттеу+-
- Қадағалау шектеулері: тарату ауысымы
Қалауларға негізделген, оқуды марапаттау
Болашақ не күтіп тұр?

ChatGPT - жасанды интеллекттің керемет тіл үлгісі. Біз оны әртүрлі тапсырмаларды орындау үшін пайдаланамыз.

Сіз адам сияқты көрінетін жауаптарды шығаруға қалай үйретілгеніне күмәндандыңыз ба? Бұл мақалада біз ChatGPT жаттығуларын қарастырамыз.

Біз оның ең көрнектілердің біріне қалай айналғанын түсіндіреміз тілдік модельдер. ChatGPT-тің қызықты әлемін зерттей отырып, жаңалықпен саяхаттаңыз.

Тренингке шолу

ChatGPT — табиғи тілді өңдеу үлгісі.

ChatGPT көмегімен біз интерактивті диалогтар мен адамға ұқсас талқылауларға қатыса аламыз. Ол осыған ұқсас тәсілді қолданады GPT нұсқаулығы, ол озық тіл үлгісі болып табылады. Ол ChatGPT-тен сәл бұрын әзірленді.

Ол неғұрлым тартымды әдісті қолданады. Бұл пайдаланушының табиғи әрекеттесуіне мүмкіндік береді. Сонымен, бұл чат-боттар мен виртуалды көмекшілер сияқты әртүрлі қолданбалар үшін тамаша құрал.

ChatGPT оқыту процедурасы көп сатылы процесс. Генеративті алдын ала дайындық - ChatGPT оқытудағы алғашқы қадам.

Бұл кезеңде модель мәтіндік деректердің үлкен корпусын пайдалана отырып оқытылады. Содан кейін модель табиғи тілде табылған статистикалық корреляциялар мен заңдылықтарды ашады. Сонымен, біз грамматикалық тұрғыдан дәл және дәйекті жауап аламыз.

Содан кейін біз бақыланатын дәл реттеу қадамын орындаймыз. Бұл бөлімде модель белгілі бір тапсырма бойынша оқытылады. Мысалы, ол тілдік аударманы немесе сұраққа жауап бере алады.

Соңында, ChatGPT адамның кері байланысынан алынған сыйақыны пайдаланады.

Енді осы қадамдарды қарастырайық.

Генеративті алдын ала дайындық

Оқытудың бастапқы деңгейі – Generative Pretraining. Бұл тіл үлгілерін үйретудің кең таралған әдісі. Токен тізбегін жасау үшін әдіс «келесі қадамды болжау парадигмасын» қолданады.

Ол нені білдіреді?

Әрбір таңбалауыш бірегей айнымалы болып табылады. Олар сөзді немесе сөздің бөлігін білдіреді. Модель алдында тұрған сөздерді ескере отырып, қай сөздің келесі келу ықтималдығын анықтауға тырысады. Ол өз ретімен барлық терминдер бойынша ықтималдық үлестірімін пайдаланады.

Тілдік модельдердің мақсаты – лексемалық тізбектерді құру. Бұл тізбектер адам тілінің заңдылықтары мен құрылымдарын көрсетуі керек. Бұл мәтіндік деректердің үлкен көлеміне үлгілерді оқыту арқылы мүмкін болады.

Содан кейін бұл деректер сөздердің тілде қалай таралатынын түсіну үшін пайдаланылады.

Жаттығу кезінде модель ықтималдықты бөлу параметрлерін өзгертеді.

Және, ол мәтіндегі сөздердің күтілетін және нақты таралуы арасындағы айырмашылықты азайтуға тырысады. Бұл жоғалту функциясын пайдалану арқылы мүмкін болады. Жоғалту функциясы күтілетін және нақты таратылымдар арасындағы айырмашылықты есептейді.

Табиғи тілдерді өңдеу және компьютерлік көру Генеративті алдын ала дайындықты қолданатын салалардың бірі болып табылады.

Ашық 2

Теңестіру мәселесі

Түзету мәселесі Генеративті алдын ала дайындықтағы қиындықтардың бірі болып табылады. Бұл модельдің ықтималдық үлестірімін нақты деректердің таралуына сәйкестендірудің қиындығын білдіреді.
Басқаша айтқанда, модельдің жасалған жауаптары адамға ұқсас болуы керек.

Модель кейде күтпеген немесе дұрыс емес жауаптарды бере алады. Және бұл әртүрлі себептерден туындауы мүмкін, мысалы, оқыту деректерінің ауытқуы немесе модельдің контекст туралы хабардар болмауы. Тілдік үлгілердің сапасын жақсарту үшін теңестіру мәселесін шешу қажет.

Бұл мәселені шешу үшін ChatGPT сияқты тіл үлгілері дәл реттеу әдістерін пайдаланады.

Бақыланатын дәл реттеу

ChatGPT тренингінің екінші бөлігі бақыланатын дәл реттеу болып табылады. Адам әзірлеушілері осы сәтте адам пайдаланушысы және чатбот ретінде әрекет ететін диалогтарға қатысады.

Бұл әңгімелер жазылады және деректер жинағына біріктіріледі. Әрбір жаттығу үлгісі «чатбот» ретінде қызмет ететін адам әзірлеушінің келесі жауабына сәйкес келетін нақты сөйлесу тарихын қамтиды.

Бақыланатын дәл реттеудің мақсаты үлгі бойынша байланысты жауаптағы белгілер тізбегіне тағайындалған ықтималдықты барынша арттыру болып табылады. Бұл әдіс «имитациялық оқыту» немесе «мінез-құлықты клондау» деп аталады.

Осылайша модель анағұрлым табиғи және үйлесімді жауап беруді үйрене алады. Ол адам мердігерлері берген жауаптарды қайталайды.

Бақыланатын дәл реттеу - бұл белгілі бір тапсырма үшін тіл үлгісін реттеуге болатын жерде.

Мысал келтірейік. Біз чатботты фильмдер бойынша ұсыныстар беруді үйреткіміз келеді делік. Біз фильмнің сипаттамаларына негізделген фильм рейтингтерін болжау үшін тіл үлгісін жаттықтырамыз. Сондай-ақ, біз фильмнің сипаттамалары мен рейтингтерінің деректер жинағын қолданатын едік.

Алгоритм ақыр соңында фильмнің қай аспектілері жоғары немесе нашар рейтингтерге сәйкес келетінін анықтайды.

Ол үйретілгеннен кейін, біз пайдаланушыларға фильмдерді ұсыну үшін үлгімізді пайдалана аламыз. Пайдаланушылар өздеріне ұнайтын фильмді сипаттай алады және чатбот онымен салыстыруға болатын көбірек фильмдерді ұсыну үшін тазартылған тіл үлгісін пайдаланады.

Қадағалау шектеулері: тарату ауысымы

Бақыланатын нақты баптау – бұл белгіленген мақсатты орындау үшін тіл үлгісін үйрету. Бұл a үлгісін беру арқылы мүмкін болады мәліметтер базасы сосын оны болжау жасауға жаттықтырады. Алайда бұл жүйеде «қадағалау шектеулері» деп аталатын шектеулер бар.

Осы шектеулердің бірі – «тарату ауысымы». Ол оқыту деректерінің модель кездесетін кірістердің нақты әлем бойынша таралуын дәл көрсетпеу мүмкіндігін білдіреді.

Бұрынғы мысалды қарастырайық. Фильмді ұсыну мысалында үлгіні үйрету үшін пайдаланылатын деректер жинағы чатбот кездесетін фильмдердің әртүрлілігін және пайдаланушы қалауларын дәл көрсетпеуі мүмкін. Чатбот біз қалағандай жақсы жұмыс істемеуі мүмкін.

Нәтижесінде ол оқыту кезінде бақылаған деректерге ұқсамайтын кірістерге жауап береді.

Бақыланатын оқыту үшін үлгі тек берілген мысалдар жинағында оқытылатын болса, бұл мәселе туындайды.

Оған қоса, модель жаңа контексттерге бейімделуге және қателерінен сабақ алуға көмектесу үшін күшейтілген оқыту пайдаланылса, үлестіру өзгерісі жағдайында жақсырақ жұмыс істей алады.

Қалауларға негізделген, оқуды марапаттау

Марапаттау оқу - чатботты дамытудағы үшінші оқыту кезеңі. Сыйақыны оқытуда модель марапат сигналын барынша арттыруға үйретіледі.

Бұл модель тапсырманы қаншалықты тиімді орындап жатқанын көрсететін балл. Марапаттау сигналы модель жауаптарын бағалайтын немесе бағалайтын адамдардың енгізуіне негізделген.

Сыйақы бойынша оқыту адам пайдаланушылары ұнататын жоғары сапалы жауаптар беретін чатботты әзірлеуге бағытталған. Мұны істеу үшін машиналық оқыту әдісі деп аталады оқытуды күшейту — кері байланыстан үйренуді қамтиды сыйақы түрінде — үлгіні үйрету үшін қолданылады.

Чатбот пайдаланушы сұрауларына жауап береді, мысалы, марапаттау кезінде оған берілген тапсырманы ағымдағы түсінуіне байланысты. Жауаптарды адам төрешілер бағалаған соң чатботтың қаншалықты тиімді жұмыс істейтініне байланысты марапат сигналы беріледі.

Бұл марапат сигналын чатбот өз параметрлерін өзгерту үшін пайдаланады. Және бұл тапсырманың өнімділігін арттырады.

Марапаттау бойынша кейбір шектеулер

Марапаттауды үйренудің кемшілігі - чатботтың жауаптары туралы кері байланыс біраз уақытқа келмеуі мүмкін, өйткені марапат сигналы сирек және кешіктірілген болуы мүмкін. Нәтижесінде чат-ботты сәтті үйрету қиын болуы мүмкін, себебі ол белгілі бір жауаптар бойынша кері байланысты кейінірек қабылдамауы мүмкін.

Тағы бір мәселе, судьялардың сәтті жауап беретіні туралы әртүрлі көзқарастары немесе түсіндірмелері болуы мүмкін, бұл марапат сигналында біржақтылыққа әкелуі мүмкін. Мұны азайту үшін оны бірнеше судья сенімдірек марапаттау сигналын беру үшін жиі пайдаланады.

Болашақ не күтіп тұр?

ChatGPT өнімділігін одан әрі жақсарту үшін бірнеше ықтимал болашақ қадамдар бар.

Модельді түсінуді арттыру үшін болашақтағы ықтимал бағыттардың бірі қосымша оқу деректер жиынын және деректер көздерін қосу болып табылады. Модельдің мәтіндік емес кірістерді түсіну және есепке алу қабілетін арттыру да мүмкін.

Мысалы, тіл үлгілері визуалды немесе дыбыстарды түсіне алады.

Арнайы оқыту әдістерін қосу арқылы ChatGPT белгілі бір тапсырмалар үшін де жақсартуға болады. Мысалы, ол орындай алады көңіл-күйді талдау немесе табиғи тіл өндірісі. Қорытындылай келе, ChatGPT және оған қатысты тіл үлгілері алға жылжу үшін үлкен үміт береді.