Google etengabe mantendu da AI ikerketaren abangoardian, bere baliabide zabalak aprobetxatuz eta talentu handiko ingeniari kopuru handi bat enplegatuz. Hala ere, hizkuntza ereduei dagokienez, Googleren ahaleginak berandu iritsi ziren.
Microsoft teknologia-erraldoia dagoeneko OpenAIrekin lankidetza emankorraz baliatzen ari zenez, Google-k ez zuen harrapatzea beste aukerarik izan.
Aurtengo Google I/O konferentzian, konpainiak bere erantzuna iragarri zuen AI sortzailearen arma-lasterketari: PaLM 2. Eredu berri honek OpenAI-ren GPT-4rekin batera neurtuko al du errendimendua?
Zer da PaLM 2?
Googlek deskribatzen du PALM 2 2022an lehen aldiz iragarritako PaLM eredua hobetzen duen punta-puntako hizkuntza-eredu gisa. Beste hizkuntza-ereduen antzera, PaLM 2-k testuak sortzeko hainbat zeregin egiteko gai da, hala nola, PaLM-ek zeregin ugari egiteko gai da. , galderak erantzutea, testua itzultzea, kodea sortzea, Eta askoz gehiago.
Testek erakutsi dute PaLM 2-k dagoeneko hobekuntza nabarmenak erakusten dituela, PaLM eredua gaindituz, parametro kopuru askoz txikiagoa erabiliz.
PaLM 2 Ereduen Familia bat da
Beste hizkuntza-eredu batzuk bezala, PaLM 2 proiektua tamainaz aldatzen den modelo-familia bat da. Google-k PaLM 2 eredua lau tamainatan emango du: Gecko, Otter, Bison eta Unicorn.
Tamainen aniztasunari esker, PaLM 2 erabilera-kasu ezberdinetan erraza da zabaltzea. Adibidez, Gecko modeloa nahikoa arina da, modelo osoa gailu mugikor batean sartzeko eta lineaz kanpo ere exekutatzeko.
PaLM 2-ren prestakuntza-datu multzoa
Hizkuntza-eredu arrakastatsu baten alderdi garrantzitsuenetako bat da prestakuntza-datu multzoa. Prestakuntzaren datu-multzoak nahikoa anitza izan behar du ereduak diseinatutako gaiaren ulermen sakona izan dezan.
Hizkuntza eredu handietarako (LLM), normalean ez dago ereduak trebatu behar duen gai zehatzik. LLMak, horren ordez, helburu orokorreko ereduak izateko eraikitzen dira, zeregin ugari egiteko egokiak izan behar dutenak. Eredu hauek webaren zati handi bat harrapatzen duten testu-datu multzo handiak erabiltzen dituzte, baita argitaratutako erreferentzia-materiala, literatura eta baita iturburu-kodea ere.
PaLM 2-ren prestakuntza-datu-multzoaren eta beste eredu batzuen arteko desberdintasun nagusia ingelesez kanpoko datuen ehuneko handiagoa sartzea da. Euren arabera txosten teknikoa, datu-multzoa ingelesez ez diren testuak barneratzeko zabalduz gero, eredua hizkuntza eta kultura anitzetara zabaltzen da.
PaLM 2 eredua datu eleaniztun paraleloetan ere trebatu zen, ereduari hizkuntza batetik bestera itzultzeko gaitasuna lortzen laguntzeko. Datuek testu bikoteak biltzen dituzte, non sarrera bat ingelesez dagoen eta bestea beste hizkuntza bateko testu baliokidea den.
Goiko taulak PaLM 2 trebatzeko erabiltzen diren web dokumentu eleaniztunen hizkuntza-banaketa erakusten du.
PaLM 2 Ezaugarri nagusiak
Hona hemen PaLM 2-k beste hizkuntza-eredu batzuekin alderatuta nabarmentzen dituen arlo nagusietako batzuk.
arrazoibide
PaLM 2-ren datu-multzoak, hala nola, artikulu zientifikoak eta adierazpen matematikoekin web edukia bezalako iturriak biltzen ditu. Honek ereduari gaitasun hobeak ematen dizkio matematikan, zentzuzko arrazoibidean eta logikan.
Ikertzaileek ereduaren arrazoibide matematikorako gaitasunak probatu zituzten lehen hezkuntzako eta batxilergoko matematikako galderetan, non GPT-4-ren matematika-gaitasunekin konparagarriak diren emaitzak erakusten dituen.
Kodetzea
PaLM 2-ren prestakuntza-datuek programazio-lengoaia ezberdinetan kodea sortzeko gaitasuna ere ematen diote. PALM 2 taldeak PaLM 2-S* izeneko kodetze espezifikoko PaLM 2 eredu bat sortu zuen, kode handiko datu-multzo eleaniztun batean trebatu zena.
Eredua kodea sortzeko gai ez ezik, hizkuntza anitz inplikatzen dituzten atazak kudeatzeko gai da. Adibidez, PaLM 2ri eska diezaiokezu gaztelaniaz lerroz lerroko iruzkinak gehitzen dituen Python ordenatzeko funtzio bat sortzeko.
Eleaniztasuna
Eredua 100 hizkuntza baino gehiago biltzen dituen datu multzo batean trebatu zenez, PaLM 2-k hizkuntza anitzetan testuak ulertzeko, sortzeko eta itzultzeko gaitasuna erakusten du.
Eleaniztasuna probatzeko, ikertzaileek eredua probatu zuten hizkuntza desberdinetako hainbat hizkuntza gaitasun probatan. Emaitzek erakusten dute PaLM 2-k PaLM gainditzen duela ez ezik, ebaluatutako hizkuntza bakoitzeko gainditze kalifikazioa ere lortzen duela.
PaLM 2-k bere gaitasun eleaniztunak ere erakusten ditu hizkuntza ezberdinetako hizkerak ulertzeko, txisteak azalduz, akatsak konponduz eta testu formala txat hizkera bihurtzeko gaitasunagatik.
PaLM 2-k Google produktuak bultzatzen ditu
Google dagoeneko aprobetxatzen ari da PaLM 2-ren aurrerapenez, eredua beste produktu batzuekin integratuz.
Bard
Ereduak zeregin eleaniztunak kudeatzeko duen gaitasunak Google-ren bultzatzen du orain Bardo esperimentua 180 herrialde eta lurralde baino gehiagotara hedatzen baita.
Bard-ek PaLM 2-ren kodetze-gaitasunak ere erabiltzen ditu programazio- eta software-garapeneko zereginetan laguntzeko, hala nola kodea sortzea eta kodea araztea.
Duet AI Google Workspacerako
Google-k bere Google Workspace aplikazio taldean AI sorkuntzako funtzioak gehitzeko asmoa du. Gmail eta Docs-ek laster izeneko eginbide bat sartuko dute Duet AI horrek erabiltzaileari erantzunak idazten lagunduko dio eta galderak erabiliz idazten.
Duet AI-k erabiltzaileei Google Sheets-en plan pertsonalizatuak sortzeko aukera emango die, erabiltzaileak emandako galderen arabera, zeregin eta proiektuetarako.
Ondorioa
Google-k AI hizkuntza-tresnen merkatuan hutsunea ixtea espero du, PaLM 2 hizkuntza-ereduarekin. Ereduaren APIa oraindik publikoki eskuragarri ez dagoen arren, beren ikerketen emaitzek erakusten dute eredua nahikoa lehiakorra dela GPT-4-ren errendimenduarekin bat egiteko.
Google-ren lehendik dagoen erabiltzaile-basearekin, zalantzarik gabe, egokitzapen masiboaren abantaila dute beren AI beren zerbitzuetan integratzen bada, hala nola bilatzailea edo produktibitate-tresna multzoa.
Utzi erantzun bat