Google постојано останува на чело на истражувањето на вештачката интелигенција, користејќи ги своите огромни ресурси и вработувајќи значителен број врвни инженери. Сепак, во однос на јазичните модели, напорите на Google доцнеа во играта.
Со оглед на тоа што технолошкиот гигант Мајкрософт веќе има корист од плодното партнерство со OpenAI, Google немаше друг избор освен да го достигне.
На овогодинешната конференција на Google I/O, компанијата го објави својот одговор на генеративната трка во вооружување со вештачка интелигенција: PaLM 2. Дали овој нов модел ќе се мери во перформансите заедно со GPT-4 на OpenAI?
Што е PalM 2?
Гугл опишува дланка 2 како најсовремен јазичен модел кој го подобрува нивниот постоечки модел PaLM за прв пат објавен во 2022 година. Слично на другите јазични модели, PaLM 2 може да извршува различни задачи за генерирање текст, како што е PaLM способен за широк опсег на задачи , вклучувајќи одговарање на прашања, преведување текст, генерирање код, и многу повеќе.
Тестовите покажаа дека PaLM 2 веќе покажува значителни подобрувања, надминувајќи го моделот PaLM додека користи многу помал број на параметри.
Палм 2 е семејство на модели
Како и другите јазични модели, проектот PaLM 2 е всушност фамилија на модели кои се движат по големина. Google ќе го обезбеди моделот PaLM 2 во четири големини: геко, видра, бизон и еднорог.
Разновидноста во големини го олеснува распоредувањето на PaLM 2 во различни случаи на употреба. На пример, моделот Gecko е доволно лесен што целиот модел може да го собере во мобилен уред, па дури и да работи офлајн.
Збир на податоци за обука на PaLM 2
Еден од најважните аспекти на успешен јазичен модел е база на податоци за обука. Податокот за обука мора да биде доволно разновиден за да му овозможи на моделот да има длабоко разбирање на предметот за кој е дизајниран.
За големи јазични модели (LLMs), обично нема специфична тема на која моделот мора да се обучи. Наместо тоа, LLM се изградени да бидат модели за општа намена кои мора да бидат погодни за извршување на голем број задачи. Овие модели користат големи текстуални сетови на податоци кои зафаќаат голем дел од мрежата, како и објавен референтен материјал, литература, па дури и изворен код.
Главната разлика помеѓу базата на податоци за обука на PaLM 2 и другите модели е вклучувањето на поголем процент на неанглиски податоци. Според нивните технички извештај, проширувањето на базата на податоци за да вклучи неанглиски текстови, го изложува моделот на поширок спектар на јазици и култури.
Моделот PaLM 2 исто така беше обучен за паралелни повеќејазични податоци за да му помогне на моделот да стекне способност да преведува од еден јазик на друг. Податоците вклучуваат парови текст каде што едниот запис е на англиски, а другиот е еквивалентен текст на друг јазик.
Табелата погоре ја прикажува јазичната дистрибуција на повеќејазичните веб-документи што се користат за обука на PaLM 2.
Клучни карактеристики на PalM 2
Еве некои од главните области во кои PaLM 2 се истакнува во споредба со другите јазични модели.
Расудување
Базата на податоци на PaLM 2 вклучува извори како што се научни трудови и веб-содржини со математички изрази. Ова му дава на моделот подобрени способности во математиката, разумното расудување и логиката.
Истражувачите ги тестирале способностите за математичко расудување на моделот на математички прашања од одделенска настава и средно училиште, каде што покажува споредливи резултати со математичките способности на GPT-4.
Кодирање
Податоците за обука на PaLM 2, исто така, му даваат можност да генерира код на различни програмски јазици. Тимот на PALM 2 создаде модел на PaLM 2 специфичен за кодирање наречен PaLM 2-S* кој беше обучен на повеќејазична база на податоци со многу кодови.
Не само што моделот е способен за генерирање код, туку може да се справи и со задачи кои вклучуваат повеќе јазици. На пример, можете да побарате од PaLM 2 да создаде функција за сортирање на Python која додава коментари линија по линија на шпански.
Повеќејазичност
Бидејќи моделот беше обучен за база на податоци што вклучува над 100 јазици, PaLM 2 покажува познавање на разбирање, генерирање и преведување текст на повеќе јазици.
За да ја тестираат повеќејазичноста, истражувачите го тестирале моделот на различни тестови за познавање јазик на различни јазици. Резултатите покажуваат дека не само што PaLM 2 го надминува PaLM, туку и постигнал преодна оценка за секој оценуван јазик.
PaLM 2, исто така, ги покажува своите повеќејазични способности со неговата способност да разбира идиоми на различни јазици, да објаснува шеги, да поправа печатни грешки, па дури и да научи како да конвертира формален текст во разговорен разговор.
Палм 2 ги напојува производите на Google
Google веќе ги користи предностите на PaLM 2 со интегрирање на моделот со други производи.
Бард
Способноста на моделот да се справува со повеќејазични задачи сега ја напојува Google Експеримент на Бард бидејќи се проширува на преку 180 земји и територии.
Бард сега ги користи и можностите за кодирање на PaLM 2 за да помогне во задачите за програмирање и развој на софтвер, како што се генерирање код и дебагирање на код.
Дует AI за Google Workspace
Google, исто така, планира да додаде генеративни функции за вештачка интелигенција во својата група апликации Google Workspace. Gmail и Docs наскоро ќе вклучат функција наречена Дует АИ што ќе му помогне на корисникот да ги нацрта своите одговори и да пишува со помош на потсетници.
Duet AI, исто така, ќе им овозможи на корисниците да креираат сопствени планови во Google Sheets за задачи и проекти врз основа на упатства дадени од корисникот.
Заклучок
Google сигурно се надева дека ќе ја затвори празнината на пазарот на јазични алатки за вештачка интелигенција со нивниот јазичен модел PaLM 2. Иако sAPI на моделот сè уште не е јавно достапен, резултатите од нивното истражување покажуваат дека моделот е доволно конкурентен за да одговара на перформансите на GPT-4.
Со постоечката база на корисници на Google, тие секако ја имаат предноста на масивно прилагодување доколку нивната вештачка интелигенција се интегрира во нивните услуги како што е нивниот пребарувач или нивниот пакет алатки за продуктивност.
Оставете Одговор