Dhibaatada caadiga ah ee garaadka macmalka ah waa raadinta mashiinka fahmi kara luqadda aadanaha.
Tusaale ahaan, marka aad ka raadinayso "makhaayado talyaani ah oo kuu dhow" mashiinka raadinta aad jeceshahay, algorithm waa inuu falanqeeyaa kelmad kasta oo ku jirta weydiintaada oo soo saarta natiijooyinka ku habboon. App-ka turjumaada wanaagsan waa inuu fahmaa macnaha guud ee kelmad gaar ah oo Ingiriisi ah oo si uun u xisaabiya kala duwanaanshaha naxwaha u dhexeeya luqadaha.
Dhammaan hawlahaas iyo kuwo kale oo badanba waxay hoos yimaadaan qaybta hoose ee cilmiga kumbuyuutarka ee loo yaqaan Luqad Dhaqameed Natural ama NLP. Horumarka NLP wuxuu horseeday codsiyo badan oo wax ku ool ah oo ka yimid kaaliyeyaasha farsamada sida Amazon's Alexa ilaa filtarrada spam ee ogaanaya iimaylka xun.
Horumarkii ugu dambeeyay ee NLP waa fikradda a model luqadda weyn ama LLM. LLM-yada sida GPT-3 waxay noqdeen kuwo aad u xoog badan oo u muuqda inay ku guulaysteen ku dhawaad hawl kasta oo NLP ah ama kiis isticmaal.
Maqaalkan, waxaan eegi doonaa waxa dhabta ah ee LLMs, sida moodooyinkan loo tababaray, iyo xaddidaadaha ay hadda leeyihiin.
Waa maxay qaabka luqadda weyn?
Xuddunta, qaabka luqadda si fudud waa algorithm kaas oo og sida ay u badan tahay isku xigxiga ereyadu waa jumlad ansax ah.
Qaab luqadeed aad u fudud oo lagu tababaray dhowr boqol oo buug waa in uu awood u leeyahay in uu sheego in "Wuxuu aaday guriga" uu ka saxsan yahay "Gurigu wuu tegey".
Haddii aan ku beddelno xog-yar oo aad u yar oo aan ku beddelno xog-ururin badan oo laga soo xoqay intarneedka, waxaan bilaabeynaa inaan u wajahno fikradda model luqadda weyn.
Isticmaalka shabakadaha neerfaha, cilmi-baarayaashu waxay ku tababari karaan LLM-yada tiro badan oo xogta qoraalka ah. Sababtoo ah cadadka xogta qoraalka qaabku arkay, LLM waxa uu noqonayaa mid aad ugu wanagsan saadaalinta kelmada xigta ee isku xigta.
Qaabku wuxuu noqdaa mid aad u casrisan, wuxuu qaban karaa hawlo badan oo NLP ah. Hawlahan waxaa ka mid ah soo koobidda qoraalka, abuurista waxyaabo cusub, iyo xitaa jilitaanka wada sheekaysiga aadanaha oo kale.
Tusaale ahaan, qaabka aadka loo jecel yahay ee luqadda GPT-3 waxaa lagu tababaray in ka badan 175 bilyan oo cabbir waxaana loo arkaa inuu yahay nooca luqadda ugu horumarsan ilaa hadda.
Waxay awoodaa inay abuurto kood shaqada, qorto maqaallo dhan, waxayna qaadan kartaa tallaal ka jawaabida su'aalaha ku saabsan mawduuc kasta.
Sidee LLMs loo tababaraa?
Waxaan si kooban u taabannay xaqiiqda ah in LLMs ay awood badan ku leeyihiin xajmiga xogta tababarkooda. Waxaa jirta sabab aan ugu yeerno moodooyinka luqadaha "weyn" ka dib dhammaan.
Tababar hore oo leh qaab-dhismeedka Transformer
Inta lagu jiro marxaladda tababarka ka hor, LLM-yada waxaa lagu barayaa xogta qoraalka ee jirta si ay u bartaan qaabka guud iyo xeerarka luqadda.
Dhawrkii sano ee la soo dhaafay, LLMs ayaa horay loogu tababaray kaydka xogta ee daboolaya qayb muhiim ah oo ka mid ah intarneedka dadweynaha. Tusaale ahaan, qaabka luqadda GPT-3 waxaa lagu tababaray xogta laga helay Gurguurashada Guud dataset, kombuyuutar dhejisyo shabakadeed, bogag shabakad, iyo buugaag digitized ah oo laga soo xoqay in ka badan 50 milyan oo goobood.
Xog-ururinta aadka u weyn ayaa markaa lagu quudiyaa qaab loo yaqaan a transformer. Transformers waa nooc ka mid ah shabakada neerfaha qoto dheer taas oo si fiican ugu shaqeysa xogta isku xigta.
Transformers waxay isticmaalaan a encoder-decoder architecture wax ka qabashada gelinta iyo soo saarista. Asal ahaan, transformerku waxa uu ka kooban yahay laba shabakadood oo neerfaha ah: encoder iyo decoder. Codeeyuhu wuxuu soo saari karaa macnaha qoraalka gelinta wuxuuna u kaydin karaa sidii vector. Decoder-ku wuxuu markaa helayaa vector wuxuuna soo saarayaa fasiraaddiisa qoraalka.
Si kastaba ha ahaatee, fikradda muhiimka ah ee u ogolaatay qaab-dhismeedka transformer-ka inuu si fiican u shaqeeyo waa ku-darka a habka is-fiirsashada. Fikradda is-fiirsashada ayaa u ogolaatay qaabka inuu fiiro gaar ah u yeesho ereyada ugu muhiimsan ee jumlada. Farsamaynta ayaa xitaa tixgalinaysa miisaanka u dhexeeya ereyada sida xidhiidhsan u kala fog.
Faa'iidada kale ee is-fiirsashada ayaa ah in geeddi-socodka la barbar dhigi karo. Halkii ay u habayn lahaayeen xogta taxanaha ah, moodooyinka transformer-ku waxa ay halmar farsamayn karaan dhammaan agabka. Tani waxay awood u siinaysaa transformers-ka inay ku tababaraan xog aad u tiro badan si dhakhso ah marka loo eego hababka kale.
Habayn wanaagsan
Ka dib marxaladda tababarka ka hor, waxaad dooran kartaa inaad soo bandhigto qoraal cusub oo saldhigga LLM ku tababaro. Waxaan ugu yeernaa habkan hagaajinta waxaana badanaa loo isticmaalaa in lagu sii wanaajiyo wax soo saarka LLM ee hawl gaar ah.
Tusaale ahaan, waxaa laga yaabaa inaad u baahato inaad isticmaasho LLM si aad ugu soo saarto macluumaadka akoonkaaga Twitter-ka. Waxaan ku siin karnaa tusaalaha dhowr tusaale oo tweet-kaadi hore ah si aan fikrad uga siino wax soo saarka la rabo.
Waxaa jira dhowr nooc oo kala duwan oo ah hagaajinta hagaajinta.
Waxbarasho yar oo xabbad ah Waxa loola jeedaa habka bixinta tusaalaha tiro yar oo tusaalooyin ah iyada oo la filayo in qaabka luqaddu uu qiyaasi doono sida loo sameeyo wax soo saar la mid ah. Barashada hal xabbad waa hab la mid ah marka laga reebo hal tusaale oo keliya ayaa la bixiyay.
Xaddidaadda Qaababka Luuqadaha Waaweyn
LLMs sida GPT-3 ayaa awood u leh inay qabtaan tiro badan oo kiisas isticmaal ah xitaa iyada oo aan la hagaajin. Si kastaba ha ahaatee, moodooyinkan ayaa wali la socda xaddidaaddooda.
La'aanta Fahamka Semantic ee Adduunka
Dusha sare, LLMs waxay u muuqdaan inay muujinayaan sirdoonka. Si kastaba ha ahaatee, moodooyinkani uma shaqeeyaan si la mid ah maskaxda aadanaha sameeyo. LLMs waxay kaliya ku tiirsan yihiin xisaabinta tirakoobka si ay u soo saaraan wax soo saar. Ma laha awood ay ku sababeeyaan fikradaha iyo fikradaha keligood.
Sababtan awgeed, LLM waxay soo saari kartaa jawaabo aan macno lahayn sababtoo ah ereyadu waxay u muuqdaan "sax" ama "tirakoob ahaan macquul ah" marka loo eego sida gaarka ah.
Maqalka
Moodooyinka sida GPT-3 ayaa sidoo kale la ildaran jawaabo aan sax ahayn. LLMs waxa ay la kulmi karaan dhacdo loo yaqaan dhalanteed halkaas oo moodooyinka soo saara jawaab aan sax ahayn oo xaqiiqo ah iyada oo aan wax wacyigelin ah laga helin in jawaabtu aysan sal ku lahayn xaqiiqda.
Tusaale ahaan, isticmaaluhu wuxuu waydiin karaa moodelka inuu u sharaxo fikradaha Steve Jobs ee iPhone-kii ugu dambeeyay. Qaabka ayaa laga yaabaa inuu soo saaro xigasho hawo khafiif ah oo ku saleysan xogta tababarka.
Eexda iyo aqoonta xadidan
Sida algorithms kale oo badan, moodooyinka luqadaha waaweyni waxay u nugul yihiin inay dhaxlaan eexda ku jirta xogta tababarka. Marka aan bilowno ku tiirsanaanta in badan LLMs si aan u soo saarno macluumaadka, soosaarayaasha moodooyinkan waa in ay helaan habab ay ku yareeyaan waxyeelada suurtagalka ah ee jawaabaha eexda.
Awood la mid ah, indhoolayaasha xogta tababarka moodeelku waxay sidoo kale caqabad ku noqon doonaan qaabka laftiisa. Waqtigan xaadirka ah, moodooyinka luqadaha waaweyn waxay qaataan bilo inay tababaraan. Moodooyinkani waxay sidoo kale ku tiirsan yihiin kaydka xogta ee xaddidan baaxad ahaan. Tani waa sababta ChatGPT kaliya u leedahay aqoonta xaddidan ee dhacdooyinka dhacay 2021 ee la soo dhaafay.
Ugu Dambeyn
Moodooyinka luqadaha waaweyni waxay awood u leeyihiin inay si dhab ah u beddelaan sida aan ula macaamilno tignoolajiyada iyo guud ahaan adduunkeenna.
Tirada badan ee xogta laga heli karo internetka ayaa siisay cilmi-baarayaasha hab ay ku qaabeeyaan kakanaanta luqadda. Si kastaba ha ahaatee, inta jidka lagu jiro, moodooyinkan luqadaha ayaa u muuqda inay kor u qaadeen fahamka aadanaha u eg ee adduunka sida uu yahay.
Marka ay dadweynuhu bilaabaan inay aaminaan moodooyinkan luqadaha si ay u bixiyaan wax soo saar sax ah, cilmi-baarayaasha iyo horumariyayaashu waxay durba helayaan habab ay ku daraan meelo ilaalin ah si tignoolajiyadu ay u ahaato mid anshax leh.
Maxaad u malaynaysaa inuu yahay mustaqbalka LLMs?
Leave a Reply