Google ka mbetur vazhdimisht në ballë të kërkimit të AI, duke shfrytëzuar burimet e saj të mëdha dhe duke punësuar një numër të konsiderueshëm inxhinierësh me talent të lartë. Megjithatë, për sa i përket modeleve gjuhësore, përpjekjet e Google u vonuan në lojë.
Me gjigantin e teknologjisë Microsoft duke përfituar tashmë nga një partneritet i frytshëm me OpenAI, Google nuk kishte zgjidhje tjetër veçse të arrinte hapin.
Në konferencën e këtij viti të Google I/O, kompania njoftoi përgjigjen e saj për garën gjeneruese të armatimit të AI: PalM 2. A do të jetë ky model i ri në performancë së bashku me GPT-4 të OpenAI?
Çfarë është PalM 2?
Google përshkruan palma 2 si një model gjuhësor më i avancuar që përmirëson modelin e tyre ekzistues PaLM të shpallur për herë të parë në 2022. Ngjashëm me modelet e tjera gjuhësore, PaLM 2 është në gjendje të kryejë detyra të ndryshme të gjenerimit të tekstit, si p.sh. PaLM është i aftë për një gamë të gjerë detyrash , duke përfshirë përgjigjen e pyetjeve, përkthimin e tekstit, gjenerimi i kodit, Dhe më shumë.
Testet kanë treguar se PaLM 2 tashmë tregon përmirësime të rëndësishme, duke tejkaluar modelin PaLM duke përdorur një numër shumë më të vogël parametrash.
Palm 2 është një familje modelesh
Ashtu si modelet e tjera të gjuhëve, projekti PaLM 2 është në fakt një familje modelesh që variojnë në madhësi. Google do të ofrojë modelin PalM 2 në katër madhësi: Gecko, Otter, Bison dhe Unicorn.
Shumëllojshmëria në madhësi e bën të lehtë vendosjen e PaLM 2 në raste të ndryshme përdorimi. Për shembull, modeli Gecko është mjaft i lehtë sa i gjithë modeli mund të futet në një pajisje celulare dhe madje të funksionojë jashtë linje.
Grupi i të dhënave të trajnimit të PalM 2
Një nga aspektet më të rëndësishme të një modeli të suksesshëm gjuhësor është të dhënat e trajnimit. Të dhënat e trajnimit duhet të jenë mjaft të larmishme për të lejuar modelin të ketë një kuptim të thellë të lëndës për të cilën është krijuar.
Për modelet e gjuhëve të mëdha (LLM), zakonisht nuk ka një temë specifike mbi të cilën modeli duhet të trajnohet. LLM-të janë ndërtuar për të qenë modele me qëllime të përgjithshme që duhet të jenë të përshtatshme për të kryer një numër të gjerë detyrash. Këto modele përdorin grupe të mëdha të dhënash tekstuale që kapin një pjesë të madhe të uebit, si dhe materiale referimi të publikuara, literaturë dhe madje edhe kodin burimor.
Dallimi kryesor midis grupit të të dhënave të trajnimit të PaLM 2 dhe modeleve të tjera është përfshirja e një përqindje më të lartë të të dhënave jo-anglisht. Sipas tyre raport teknik, zgjerimi i grupit të të dhënave për të përfshirë tekste jo-anglisht e ekspozon modelin ndaj një larmie më të gjerë gjuhësh dhe kulturash.
Modeli PaLM 2 u trajnua gjithashtu për të dhëna paralele shumëgjuhëshe për të ndihmuar modelin të fitojë aftësinë për të përkthyer nga një gjuhë në tjetrën. Të dhënat përfshijnë çifte tekstesh ku një hyrje është në anglisht dhe tjetra është një tekst ekuivalent në një gjuhë tjetër.
Tabela e mësipërme tregon shpërndarjen gjuhësore të dokumenteve shumëgjuhëshe të internetit të përdorura për të trajnuar PalM 2.
Karakteristikat kryesore të PalM 2
Këtu janë disa nga fushat kryesore në të cilat PaLM 2 shkëlqen në krahasim me modelet e tjera gjuhësore.
arsyetim
Të dhënat e PaLM 2 përfshin burime të tilla si punime shkencore dhe përmbajtje në ueb me shprehje matematikore. Kjo i jep modelit aftësi të përmirësuara në matematikë, arsyetim me sens të përbashkët dhe logjikë.
Studiuesit testuan aftësitë e arsyetimit matematik të modelit në pyetjet e matematikës së shkollës së mesme dhe të shkollës së mesme, ku tregon rezultate të krahasueshme me aftësitë matematikore të GPT-4.
Kodimi
Të dhënat e trajnimit të PalM 2 i japin gjithashtu mundësinë për të gjeneruar kode në një sërë gjuhësh programimi. Ekipi i PALM 2 krijoi një model të kodimit specifik PaLM 2 të quajtur PaLM 2-S*, i cili u trajnua në një grup të dhënash shumëgjuhëshe me kod të rëndë.
Jo vetëm që modeli është i aftë të gjenerojë kode, por është gjithashtu në gjendje të trajtojë detyra që përfshijnë shumë gjuhë. Për shembull, mund t'i kërkoni PaLM 2 të krijojë një funksion klasifikimi Python që shton komente rresht pas rreshti në spanjisht.
Shumëgjuhësia
Meqenëse modeli u trajnua në një grup të dhënash që përfshin mbi 100 gjuhë, PalM 2 tregon aftësi në të kuptuarit, gjenerimin dhe përkthimin e tekstit në shumë gjuhë.
Për të testuar shumëgjuhësinë, studiuesit testuan modelin në teste të ndryshme të aftësisë gjuhësore në gjuhë të ndryshme. Rezultatet tregojnë se jo vetëm që PaLM 2 e tejkalon PalM-në, por gjithashtu ka arritur një notë kaluese për çdo gjuhë të vlerësuar.
PaLM 2 tregon gjithashtu aftësitë e tij shumëgjuhëshe me aftësinë e tij për të kuptuar idioma në gjuhë të ndryshme, për të shpjeguar shaka, për të rregulluar gabime shkrimi dhe madje mund të mësojë se si të konvertojë tekstin zyrtar në bisedë bisedore.
Palm 2 fuqizon Produktet e Google
Google tashmë po përfiton nga përparimet e PaLM 2 duke e integruar modelin me produkte të tjera.
rapsod
Aftësia e modelit për të trajtuar detyra shumëgjuhëshe tani po fuqizon Google-in Eksperimenti i Bardit ndërsa zgjerohet në mbi 180 vende dhe territore.
Bard tani po përdor gjithashtu aftësitë e kodimit të PaLM 2 për të ndihmuar në programimin dhe detyrat e zhvillimit të softuerit si gjenerimi i kodit dhe korrigjimi i kodit.
Duet AI për Google Workspace
Google po planifikon gjithashtu të shtojë veçori gjeneruese të AI në grupin e aplikacioneve të saj Google Workspace. Gmail dhe Docs së shpejti do të përfshijnë një veçori të quajtur Duet AI që do të ndihmojë përdoruesin të hartojë përgjigjet dhe të shkruajë duke përdorur prompts.
Duet AI gjithashtu do t'i lejojë përdoruesit të krijojnë plane të personalizuara në Google Sheets për detyrat dhe projektet bazuar në kërkesat e dhëna nga përdoruesi.
Përfundim
Google me siguri shpreson të mbyllë hendekun në tregun e mjeteve gjuhësore të AI me modelin e tyre të gjuhës PaLM 2. Ndërsa API-ja e modelit nuk është ende e disponueshme publikisht, rezultatet nga hulumtimi i tyre tregojnë se modeli është mjaft konkurrues për të përputhur performancën e GPT-4.
Me bazën ekzistuese të përdoruesve të Google, ata sigurisht kanë avantazhin e përshtatjes masive nëse AI-ja e tyre integrohet në shërbimet e tyre si motori i tyre i kërkimit ose grupi i mjeteve të tyre të produktivitetit.
Lini një Përgjigju