Google ар дайым AI изилдөөлөрүнүн алдыңкы сабында болуп, өзүнүн эбегейсиз ресурстарын колдонуп жана көптөгөн мыкты таланттуу инженерлерди жумуш менен камсыз кылып келет. Бирок, тил моделдери боюнча, Google аракеттери оюнга кечикти.
Технологиялык гигант Microsoft буга чейин OpenAI менен жемиштүү өнөктөштүктөн пайда алып жаткандыктан, Google аны кууп чыгуудан башка аргасы жок болчу.
Быйылкы Google I/O конференциясында компания генеративдик AI жарыша куралдануусуна жообун жарыялады: PaLM 2. Бул жаңы модель OpenAIдин GPT-4 менен катар иштеши боюнча өлчөйбү?
PaLM 2 деген эмне?
Google сүрөттөйт ПАЛМА 2 2022-жылы биринчи жолу жарыяланган учурдагы PaLM моделин өркүндөткөн заманбап тил модели катары. Башка тил моделдерине окшоп, PaLM 2 ар кандай текст түзүү тапшырмаларын аткара алат, мисалы PaLM тапшырмалардын кеңири спектрин аткара алат анын ичинде суроолорго жооп берүү, текстти которуу, кодду түзүү, Жана дагы көп.
Сыноолор көрсөткөндөй, PaLM 2 буга чейин эле олуттуу жакшыртууларды көрсөтүп, PaLM моделинен ашып, бир кыйла азыраак сандагы параметрлерди колдонуп жатат.
PaLM 2 моделдердин үй-бүлөсү
Башка тил моделдери сыяктуу эле, PaLM 2 долбоору чындыгында көлөмү ар кандай моделдердин үй-бүлөсү болуп саналат. Google PaLM 2 моделин төрт өлчөмдө берет: Gecko, Otter, Bizon жана Unicorn.
Өлчөмдөрдүн ар түрдүүлүгү PaLM 2ди колдонуунун ар кандай учурларда колдонууну жеңилдетет. Мисалы, Gecko модели жетиштүү жеңил болгондуктан, бүт модель мобилдик түзүлүшкө батып, жада калса оффлайн режиминде иштей алат.
PaLM 2нин Тренинг маалыматтар топтому
Ийгиликтүү тил моделинин эң маанилүү аспектилеринин бири бул окутуу маалымат топтому. Окутуунун берилиштер топтому моделге ал иштелип чыккан предметти терең түшүнүүгө мүмкүндүк берүү үчүн ар түрдүү болушу керек.
Чоң тил моделдери (LLMs) үчүн, адатта, моделди үйрөтүүгө тийиш болгон конкреттүү тема жок. LLMs тескерисинче, көп сандагы тапшырмаларды аткарууга ылайыктуу болушу керек болгон жалпы максаттагы моделдер болуп курулган. Бул моделдер интернеттин чоң бөлүгүн, ошондой эле жарыяланган маалымдама материалдарын, адабияттарды жана ал тургай баштапкы кодду камтыган чоң тексттик маалымат топтомдорун колдонушат.
PaLM 2нин окутуу маалымат топтомунун башка моделдерден негизги айырмасы англисче эмес маалыматтардын көбүрөөк пайызын камтууда. Алардын айтымында техникалык отчет, англисче эмес тексттерди камтуу үчүн берилиштер топтомун кеңейтүү моделди тилдердин жана маданияттардын кеңири түрүнө көрсөтөт.
PaLM 2 модели бир тилден экинчи тилге которуу жөндөмүнө ээ болууга жардам берүү үчүн параллелдүү көп тилдүү маалыматтар боюнча үйрөтүлгөн. Берилиштер тексттин жуптарын камтыйт, анда бир жазуу англис тилинде, ал эми экинчиси башка тилдеги эквиваленттүү текст.
Жогорудагы таблица PaLM 2ди окутуу үчүн колдонулган көп тилдүү веб-документтердин тилдик бөлүштүрүлүшүн көрсөтөт.
PaLM 2 негизги өзгөчөлүктөрү
Бул жерде PaLM 2 башка тил моделдерине салыштырмалуу эң негизги багыттардын айрымдары.
ойлоо
PaLM 2 маалымат топтому илимий эмгектер жана математикалык туюнтмалар менен веб-мазмун сыяктуу булактарды камтыйт. Бул моделге математикада, жалпы ой жүгүртүүдө жана логикада жакшыртылган мүмкүнчүлүктөрдү берет.
Окумуштуулар моделдин математикалык ой жүгүртүү жөндөмдүүлүгүн мектеп жана орто мектептин математика суроолорунда сынап көрүштү, анда ал GPT-4тин математикалык мүмкүнчүлүктөрүнө окшош натыйжаларды көрсөттү.
Коддоо
PaLM 2 окуу маалыматтары ошондой эле ар кандай программалоо тилдеринде кодду түзүү мүмкүнчүлүгүн берет. PALM 2 командасы коддуу көп тилдүү маалымат топтомунда үйрөтүлгөн PaLM 2-S* деп аталган коддоо үчүн атайын PaLM 2 моделин түзүштү.
Модель код жаратууга жөндөмдүү гана эмес, ошондой эле бир нече тилди камтыган тапшырмаларды аткара алат. Мисалы, сиз PaLM 2ден испан тилинде сап-сап комментарийлерди кошкон Python сорттоо функциясын түзүүнү сурансаңыз болот.
Көп тилдүүлүк
Модель 100дөн ашык тилди камтыган маалымат топтомунда үйрөтүлгөндүктөн, PaLM 2 бир нече тилде текстти түшүнүү, түзүү жана которуу боюнча чеберчиликти көрсөтөт.
Көп тилдүүлүктү текшерүү үчүн изилдөөчүлөр моделди ар кандай тилдердеги ар кандай тилди билүү тесттеринде сынашкан. Натыйжалар көрсөткөндөй, PaLM 2 бир гана PaLMден ашып кетпестен, ар бир бааланган тил үчүн өтүү баасына да жетишкен.
PaLM 2 ошондой эле өзүнүн көп тилдүү мүмкүнчүлүктөрүн ар кандай тилдердеги идиомаларды түшүнүү, тамашаларды түшүндүрүү, каталарды оңдоо жана атүгүл формалдуу текстти оозеки сүйлөшүүгө кантип которууну үйрөнө алат.
PaLM 2 Google өнүмдөрүнө күч берет
Google PaLM 2нин жетишкендиктеринен пайдаланып, моделди башка өнүмдөр менен интеграциялоодо.
Бард
Модельдин көп тилдүү тапшырмаларды аткаруу жөндөмү азыр Google'ду кубаттайт Бард эксперименти ал 180ден ашык өлкөгө жана аймактарга жайылгандыктан.
Бард азыр PaLM 2нин коддоо мүмкүнчүлүктөрүн программалоодо жана коддорду түзүү жана кодду оңдоо сыяктуу программалык камсыздоону иштеп чыгууда жардам берүү үчүн колдонуп жатат.
Google Workspace үчүн дуэт AI
Google ошондой эле өзүнүн Google Workspace тиркемелер тобуна генеративдик AI функцияларын кошууну пландаштырууда. Gmail жана Документтер жакында деп аталган функцияны камтыйт Дуэт AI Бул колдонуучуга жоопторду иштеп чыгууга жана эскертүүлөрдү колдонуу менен жазууга жардам берет.
Duet AI ошондой эле колдонуучуларга Google Sheets'те колдонуучу берген көрсөтмөлөрдүн негизинде тапшырмалар жана долбоорлор үчүн ыңгайлаштырылган пландарды түзүүгө мүмкүндүк берет.
жыйынтыктоо
Google, албетте, PaLM 2 тил модели менен AI тил куралдары рыногундагы боштукту жабууга үмүттөнөт. Model'sAPI азырынча жалпыга жеткиликтүү эмес, бирок алардын изилдөөлөрүнүн натыйжалары моделдин GPT-4 көрсөткүчтөрүнө дал келүү үчүн жетиштүү атаандаштыкка жөндөмдүү экенин көрсөтүп турат.
Google'дун учурдагы колдонуучу базасы менен, алардын AI алардын издөө системасы же өндүрүмдүүлүк куралдарынын топтому сыяктуу кызматтарына интеграцияланса, алар, албетте, массалык ыңгайлашуунун артыкчылыгына ээ.
Таштап Жооп