Google imeendelea kusalia mstari wa mbele katika utafiti wa AI, ikitumia rasilimali zake kubwa na kuajiri idadi kubwa ya wahandisi mahiri. Walakini, kwa upande wa mifano ya lugha, juhudi za Google zilichelewa kucheza.
Huku kampuni kubwa ya kiteknolojia ya Microsoft ikiwa tayari inanufaika kutokana na ushirikiano wenye manufaa na OpenAI, Google haikuwa na chaguo ila kufahamu.
Katika mkutano wa mwaka huu wa Google I/O, kampuni ilitangaza jibu lake kwa mbio nzuŕi za silaha za AI: PaLM 2. Je, mtindo huu mpya utapima utendakazi pamoja na GPT-4 ya OpenAI?
PaLM 2 ni nini?
Google inaeleza PALM 2 kama modeli ya hali ya juu ya lugha ambayo inaboresha muundo wao uliopo wa PaLM uliotangazwa kwa mara ya kwanza mnamo 2022. Sawa na modeli zingine za lugha, PaLM 2 ina uwezo wa kutekeleza majukumu anuwai ya kuunda maandishi kama vile PaLM ina uwezo wa kufanya kazi mbali mbali. , ikiwa ni pamoja na kujibu maswali, kutafsiri maandishi, kanuni ya kuzalisha, Na mengi zaidi.
Uchunguzi umeonyesha kuwa PaLM 2 tayari inaonyesha maboresho makubwa, ikitoa mfano wa PaLM huku ukitumia idadi ya chini zaidi ya vigezo.
PaLM 2 ni Familia ya Wanamitindo
Kama miundo mingine ya lugha, mradi wa PaLM 2 kwa kweli ni familia ya modeli ambazo zina ukubwa tofauti. Google itatoa muundo wa PaLM 2 katika saizi nne: Gecko, Otter, Bison, na Unicorn.
Aina mbalimbali za ukubwa hurahisisha kupeleka PaLM 2 katika hali mbalimbali za matumizi. Kwa mfano, muundo wa Gecko ni mwepesi wa kutosha kwamba mtindo mzima unaweza kutoshea kwenye kifaa cha mkononi na hata kukimbia nje ya mtandao.
Hifadhidata ya Mafunzo ya PaLM 2
Mojawapo ya vipengele muhimu vya modeli ya lugha yenye mafanikio ni seti ya data ya mafunzo. Hifadhidata ya mafunzo lazima iwe tofauti vya kutosha ili kuruhusu kielelezo kuwa na uelewa wa kina wa mada ambayo imeundwa kwa ajili yake.
Kwa miundo mikubwa ya lugha (LLMs), kwa kawaida hakuna mada mahususi ambayo mtindo lazima ujifunze. LLM badala yake zimeundwa kuwa modeli za madhumuni ya jumla ambazo lazima ziwe sawa kutekeleza idadi kubwa ya kazi. Miundo hii hutumia hifadhidata kubwa za maandishi zinazonasa sehemu kubwa ya wavuti pamoja na nyenzo za marejeleo zilizochapishwa, fasihi na hata msimbo wa chanzo.
Tofauti kuu kati ya seti ya data ya mafunzo ya PaLM 2 na miundo mingine ni ujumuishaji wa asilimia kubwa ya data isiyo ya Kiingereza. Kulingana na wao kiufundi ripoti, kupanua mkusanyiko wa data ili kujumuisha maandishi yasiyo ya Kiingereza hufichua modeli hiyo kwa anuwai ya lugha na tamaduni.
Muundo wa PaLM 2 pia ulifunzwa juu ya data sambamba ya lugha nyingi ili kusaidia modeli kupata uwezo wa kutafsiri kutoka lugha moja hadi nyingine. Data inajumuisha jozi za maandishi ambapo ingizo moja liko kwa Kiingereza na lingine ni maandishi sawa katika lugha nyingine.
Jedwali hapo juu linaonyesha usambazaji wa lugha wa hati za wavuti za lugha nyingi zinazotumiwa kufunza PaLM 2.
Vipengele muhimu vya PaLM 2
Hapa kuna baadhi ya maeneo makuu ambayo PaLM 2 hufaulu ikilinganishwa na miundo mingine ya lugha.
Hoja
Seti ya data ya PaLM 2 inajumuisha vyanzo kama vile karatasi za kisayansi na maudhui ya wavuti yenye maneno ya hisabati. Hii inaupa modeli uwezo ulioboreshwa katika hisabati, mawazo ya kawaida na mantiki.
Watafiti walijaribu uwezo wa kufikiri wa kihisabati wa modeli kwenye shule ya daraja na maswali ya hesabu ya shule ya upili ambapo inaonyesha matokeo yanayolingana na uwezo wa hesabu wa GPT-4.
Kuandika
Data ya mafunzo ya PaLM 2 pia inaipa uwezo wa kutoa msimbo katika lugha mbalimbali za programu. Timu ya PALM 2 iliunda muundo mahususi wa usimbaji wa PaLM 2 unaoitwa PaLM 2-S* ambao ulifunzwa kwenye mkusanyiko wa data wa lugha nyingi wa msimbo.
Sio tu kwamba kielelezo kinaweza kutengeneza msimbo, lakini pia kinaweza kushughulikia kazi zinazohusisha lugha nyingi. Kwa mfano, unaweza kuuliza PaLM 2 kuunda kitendakazi cha kupanga cha Python ambacho kinaongeza maoni ya mstari kwa mstari kwa Kihispania.
Lugha nyingi
Kwa kuwa muundo huo ulifunzwa kwenye mkusanyiko wa data unaojumuisha zaidi ya lugha 100, PaLM 2 inaonyesha ustadi wa kuelewa, kutengeneza na kutafsiri maandishi katika lugha nyingi.
Ili kupima wingi wa lugha, watafiti walijaribu modeli hiyo kwenye majaribio mbalimbali ya umahiri wa lugha katika lugha tofauti. Matokeo yanaonyesha kuwa sio tu kwamba PaLM 2 inashinda PaLM lakini pia ilipata alama ya ufaulu kwa kila lugha iliyotathminiwa.
PaLM 2 pia inaonyesha uwezo wake wa lugha nyingi kwa uwezo wake wa kuelewa nahau katika lugha tofauti, ikifafanua vicheshi, kurekebisha makosa ya maandishi, na inaweza hata kujifunza jinsi ya kubadilisha maandishi rasmi kuwa gumzo la mazungumzo.
PaLM 2 Hutumia Bidhaa za Google
Google tayari inachukua faida ya maendeleo ya PaLM 2 kwa kuunganisha muundo na bidhaa zingine.
Bard
Uwezo wa modeli wa kushughulikia kazi za lugha nyingi sasa unawezesha za Google Jaribio la Bard huku ikipanuka hadi zaidi ya nchi na wilaya 180.
Bard sasa pia anatumia uwezo wa kuweka misimbo wa PaLM 2 kusaidia katika upangaji programu na kazi za ukuzaji programu kama vile kutengeneza msimbo na utatuzi wa msimbo.
Duet AI ya Google Workspace
Google pia inapanga kuongeza vipengele vya kuzalisha vya AI kwenye kundi lake la programu za Google Workspace. Gmail na Hati za Google zitajumuisha kipengele kiitwacho hivi karibuni Duet AI hiyo itamsaidia mtumiaji kuandaa majibu na kuandika kwa kutumia vidokezo.
Duet AI pia itawaruhusu watumiaji kuunda mipango maalum katika Majedwali ya Google ya kazi na miradi kulingana na madokezo yanayotolewa na mtumiaji.
Hitimisho
Google kwa hakika inatumai kuziba pengo katika soko la zana za lugha za AI kwa mtindo wao wa lugha ya PaLM 2. Ingawa model'sAPI bado haipatikani hadharani, matokeo kutoka kwa utafiti wao yanaonyesha kuwa modeli hiyo ina ushindani wa kutosha kulingana na utendaji wa GPT-4.
Kwa msingi wa watumiaji wa Google, hakika wana faida ya urekebishaji mkubwa ikiwa AI yao itaunganishwa katika huduma zao kama vile injini yao ya utafutaji au zana zao za tija.
Acha Reply