ChatGPT-ийн сургалтын үйл явцыг бүхэлд нь тайлбарлав

Гарчиг[Нуух][Үзүүлэх]

Генератив урьдчилсан бэлтгэл+-
- Зохицуулах асуудал
Хяналттай нарийн тохируулга+-
- Хяналтын хязгаарлалт: Түгээлтийн шилжилт
Сонголтод тулгуурлан, суралцахыг урамшуулах
Ирээдүй юу болох вэ?

ChatGPT бол хиймэл оюун ухааны гайхалтай хэлний загвар юм. Бид бүгд үүнийг янз бүрийн ажилд туслах зорилгоор ашигладаг.

Хэрхэн хүнийхтэй төстэй хариулт өгөхөд сургасан талаар та хэзээ нэгэн цагт асууж байсан уу? Энэ нийтлэлд бид ChatGPT-ийн сургалтыг судлах болно.

Энэ нь хэрхэн хамгийн шилдэг нь болж хувирсныг бид тайлбарлах болно хэлний загварууд. Биднийг ChatGPT-ийн сонирхолтой ертөнцтэй танилцах явцдаа нээлтийн аянд гараарай.

Сургалтын тойм

ChatGPT бол байгалийн хэлээр боловсруулах загвар юм.

ChatGPT-ийн тусламжтайгаар бид интерактив яриа хэлцэл, хүн шиг хэлэлцүүлэгт оролцох боломжтой. Үүнтэй төстэй аргыг ашигладаг GPT зааварчилгаа, энэ нь хамгийн сүүлийн үеийн хэлний загвар юм. Энэ нь ChatGPT-ээс өмнөхөн бүтээгдсэн.

Энэ нь илүү сонирхолтой аргыг ашигладаг. Энэ нь байгалийн хэрэглэгчийн харилцан үйлчлэлийг бий болгодог. Тиймээс энэ нь чатбот болон виртуал туслах гэх мэт төрөл бүрийн програмуудад тохиромжтой хэрэгсэл юм.

ChatGPT-ийн сургалтын журам нь олон үе шаттай үйл явц юм. Generative Pretraining нь ChatGPT-ийн сургалтын эхний алхам юм.

Энэ үе шатанд загварыг маш их хэмжээний текст өгөгдлөөр бэлтгэдэг. Дараа нь загвар нь байгалийн хэл дээрх статистик хамаарал, хэв маягийг олж илрүүлдэг. Тиймээс бид дүрмийн хувьд үнэн зөв, уялдаатай хариу өгөх боломжтой.

Дараа нь бид хяналттай нарийн тохируулгын алхмуудыг дагана. Энэ хэсэгт загварыг тодорхой даалгавар дээр сургадаг. Жишээлбэл, энэ нь хэлний орчуулга эсвэл асуултанд хариулах боломжтой.

Эцэст нь, ChatGPT нь хүний санал хүсэлтээс суралцах урамшууллыг ашигладаг.

Одоо эдгээр алхмуудыг авч үзье.

Генератив урьдчилсан бэлтгэл

Сургалтын эхний түвшин нь Generative Pretraining юм. Энэ нь хэлний загваруудыг сургах нийтлэг арга юм. Токен дарааллыг бий болгохын тулд энэ арга нь "дараагийн алхамын таамаглалын парадигмыг" ашигладаг.

Энэ юу гэсэн үг вэ?

Токен бүр нь өвөрмөц хувьсагч юм. Тэд үг эсвэл үгийн хэсгийг төлөөлдөг. Загвар нь өмнөх үгсийг өгвөл дараа нь аль үг ирэх магадлал өндөр болохыг тодорхойлохыг оролддог. Энэ нь бүх нэр томъёонд магадлалын тархалтыг дарааллаар нь ашигладаг.

Хэлний загваруудын зорилго нь жетон дарааллыг бий болгох явдал юм. Эдгээр дараалал нь хүний хэлний хэв маяг, бүтцийг илэрхийлэх ёстой. Энэ нь асар их хэмжээний текст өгөгдөл дээр загваруудыг сургах замаар боломжтой юм.

Дараа нь энэ өгөгдлийг хэл дээр үгс хэрхэн тархаж байгааг ойлгоход ашигладаг.

Сургалтын явцад загвар нь магадлалын тархалтын параметрүүдийг өөрчилдөг.

Мөн энэ нь текст дэх үгсийн хүлээгдэж буй болон бодит тархалтын хоорондох ялгааг багасгахыг хичээдэг. Энэ нь алдагдал функцийг ашиглах боломжтой юм. Алдагдлын функц нь хүлээгдэж буй болон бодит хуваарилалтын зөрүүг тооцоолдог.

Байгалийн хэл боловсруулах болон компьютерийн алсын хараа нь бидний Generative Pretraining ашигладаг салбаруудын нэг юм.

Нээлттэй 2

Зохицуулах асуудал

Зохицуулах асуудал нь Урьдчилан бэлтгэхэд тулгардаг бэрхшээлүүдийн нэг юм. Энэ нь загварын магадлалын тархалтыг бодит өгөгдлийн тархалттай тааруулахад хүндрэлтэй байгааг хэлнэ.
Өөрөөр хэлбэл, загвар өмсөгчдийн үүсгэсэн хариултууд нь илүү хүнийхтэй төстэй байх ёстой.

Загвар нь заримдаа гэнэтийн эсвэл зохисгүй хариултуудыг өгч болно. Энэ нь сургалтын өгөгдлийн гажуудал эсвэл загвар контекст мэдлэг дутмаг зэрэг олон шалтгаанаас үүдэлтэй байж болно. Хэлний загваруудын чанарыг сайжруулахын тулд тохируулгын асуудлыг шийдэх ёстой.

Энэ асуудлыг даван туулахын тулд ChatGPT гэх мэт хэлний загварууд нь нарийн тааруулах аргыг ашигладаг.

Хяналттай нарийн тохируулга

ChatGPT сургалтын хоёр дахь хэсэг нь нарийн тохируулга юм. Энэ үед хүний хөгжүүлэгчид харилцан яриа өрнүүлж, хүний хэрэглэгч болон чатботын үүрэг гүйцэтгэдэг.

Эдгээр яриаг бүртгэж, мэдээллийн санд нэгтгэдэг. Сургалтын түүвэр бүр нь "чатбот"-оор үйлчилдэг хүний хөгжүүлэгчийн дараагийн хариулттай тохирох харилцан ярианы түүхийг агуулдаг.

Хяналттай нарийн тааруулахын зорилго нь загвараас холбогдох хариулт дахь жетонуудын дарааллыг тодорхойлох магадлалыг нэмэгдүүлэх явдал юм. Энэ аргыг "дууриамал сурах" эсвэл "зан төлөвийг хувилах" гэж нэрлэдэг.

Ингэснээр загвар нь илүү байгалийн дуугаралттай, уялдаатай хариулт өгч сурах боломжтой. Энэ нь хүний гүйцэтгэгчдийн өгсөн хариултыг давтаж байна.

Хяналттай нарийн тохируулга гэдэг нь хэлний загварыг тодорхой даалгаварт тохируулж болно.

Нэг жишээ хэлье. Бид киноны зөвлөмж өгөхийн тулд чатбот зааж өгөхийг хүсч байна гэж бодъё. Бид киноны тайлбар дээр үндэслэн киноны үнэлгээг урьдчилан таамаглах хэлний загварыг сургах болно. Мөн бид киноны тайлбар, үнэлгээний мэдээллийн багцыг ашиглах болно.

Алгоритм нь киноны аль тал нь өндөр эсвэл муу үнэлгээтэй тохирч байгааг олж мэдэх болно.

Үүнийг сургасны дараа бид загвараа ашиглан хэрэглэгчдэд кино санал болгох боломжтой. Хэрэглэгчид дуртай киногоо дүрсэлж болох ба чатбот нь үүнтэй харьцуулахуйц илүү олон киног санал болгохын тулд боловсронгуй хэлний загварыг ашиглана.

Хяналтын хязгаарлалт: Түгээлтийн шилжилт

Хяналттай нарийн тохируулга гэдэг нь тодорхой зорилгыг биелүүлэхийн тулд хэлний загварыг заах явдал юм. Энэ нь загварыг тэжээх замаар боломжтой юм a мэдээллийн сан тэгээд таамаглал дэвшүүлэхэд сургана. Гэсэн хэдий ч энэ систем нь "хяналтын хязгаарлалт" гэж нэрлэгддэг хязгаарлалттай байдаг.

Эдгээр хязгаарлалтуудын нэг нь "түгээлтийн шилжилт" юм. Энэ нь сургалтын өгөгдөл нь тухайн загварт тулгарч буй орцуудын бодит тархалтыг үнэн зөв тусгахгүй байж болзошгүйг хэлж байна.

Өмнөх жишээг авч үзье. Киноны санал болгож буй жишээн дээр загварыг сургахад ашигласан өгөгдлийн багц нь чатботт таарах олон төрлийн кино болон хэрэглэгчийн сонголтыг зөв тусгахгүй байж магадгүй юм. Чатбот нь бидний хүссэнээр сайн ажиллахгүй байж магадгүй.

Үүний үр дүнд энэ нь сургалтын явцад ажиглагдсантай адилгүй орцуудыг хангадаг.

Хяналттай сургалтын хувьд загварыг зөвхөн өгөгдсөн тохиолдлуудад сургах үед ийм асуудал үүсдэг.

Нэмж дурдахад, шинэ нөхцөл байдалд дасан зохицож, алдаанаасаа суралцахад нь дэмжлэг үзүүлэх сургалтыг ашиглавал загвар нь тархалтын өөрчлөлтийн үед илүү сайн ажиллах болно.

Сонголтод тулгуурлан, суралцахыг урамшуулах

Шагналтай суралцах нь чатбот хөгжүүлэх гурав дахь сургалтын шат юм. Шагналтай суралцахдаа шагналын дохиог нэмэгдүүлэхийн тулд загварыг заадаг.

Энэ нь тухайн загвар тухайн ажлыг хэр үр дүнтэй гүйцэтгэж байгааг илтгэх оноо юм. Шагналын дохио нь загварын хариултыг үнэлдэг эсвэл үнэлдэг хүмүүсийн оруулсан мэдээлэлд тулгуурладаг.

Шагналтай суралцах нь хүний хэрэглэгчдийн илүүд үздэг өндөр чанартай хариултуудыг гаргадаг чатбот хөгжүүлэх зорилготой юм. Үүнийг хийхийн тулд машин сургалтын техник гэж нэрлэдэг бататгах сургалт—үүнд санал хүсэлтээс суралцах орно урамшуулал хэлбэрээр—загвар өмсөгчийг сургахад ашигладаг.

Чатбот нь жишээлбэл, урамшуулалтай суралцах явцад түүнд өгсөн даалгаврын одоогийн ойлголтоос хамааран хэрэглэгчийн асуултад хариулдаг. Хариултуудыг шүүгчид үнэлсний дараа чатбот хэр үр дүнтэй ажиллаж байгааг үндэслэн шагналын дохио өгдөг.

Энэхүү шагналын дохиог чатбот тохиргоогоо өөрчлөхөд ашигладаг. Мөн энэ нь даалгаврын гүйцэтгэлийг сайжруулдаг.

Шагналтай суралцах зарим хязгаарлалтууд

Шагналтай суралцахын сул тал бол шагналын дохио нь ховор, хоцрогдсон байж болзошгүй тул чатботын хариултын талаархи санал хүсэлт хэсэг хугацаанд ирэхгүй байх явдал юм. Үүний үр дүнд чатботыг амжилттай сургахад хэцүү байж магадгүй, учир нь энэ нь тодорхой хариултуудын талаар хожим нь санал хүсэлт хүлээн авахгүй байж магадгүй юм.

Өөр нэг асуудал бол хүний шүүгч нар амжилттай хариу үйлдэл үзүүлэх талаар янз бүрийн үзэл бодол, тайлбартай байж болох бөгөөд энэ нь шагналын дохиог гажуудуулахад хүргэж болзошгүй юм. Үүнийг багасгахын тулд илүү найдвартай шагналын дохиог хүргэхийн тулд хэд хэдэн шүүгч үүнийг ихэвчлэн ашигладаг.

Ирээдүй юу болох вэ?

ChatGPT-ийн гүйцэтгэлийг цаашид сайжруулах хэд хэдэн боломжит алхмууд бий.

Загварын ойлголтыг нэмэгдүүлэхийн тулд ирээдүйн боломжит замуудын нэг бол илүү олон сургалтын мэдээллийн багц болон мэдээллийн эх сурвалжийг оруулах явдал юм. Загварын текстийн бус орцуудыг ойлгох, харгалзан үзэх чадварыг нэмэгдүүлэх боломжтой.

Жишээлбэл, хэлний загварууд нь дүрс эсвэл дуу авиаг ойлгож чаддаг.

Тодорхой сургалтын арга техникийг оруулснаар ChatGPT-ийг тодорхой ажлуудад сайжруулах боломжтой. Жишээлбэл, энэ нь гүйцэтгэх боломжтой сэтгэл хөдлөлийн шинжилгээ эсвэл байгалийн хэлний үйлдвэрлэл. Дүгнэж хэлэхэд, ChatGPT болон холбогдох хэлний загварууд ахиц дэвшил гаргах сайхан амлалтыг харуулж байна.