Cuprins[Ascunde][Spectacol]
Al 23-lea I/O Google a fost destul de palpitant! În domeniul inteligenței artificiale, aceștia au prezentat câteva progrese importante.
Concurența dintre GPT-4 de la OpenAI și Gemini de la Google a fost una dintre cele mai semnificative dezvăluiri. După existenţa lor PALM 2 sistem, Gemini este modelul de limbaj mare (LLM) al generației următoare.
Modelul de învățare automată a fost îmbunătățit de Google, făcându-l și mai sofisticat. Pentru a concura cu îmbunătățirile Bing de la Microsoft, aceștia adaugă, de asemenea, capabilități AI generative în Android și stimulează Căutarea Google cu AI.
Pentru a face Google Bard mai competitiv față de ceilalți chatbot precum ChatGPT, au anunțat o îmbunătățire semnificativă pentru acesta în timpul evenimentului. Bard va accepta în cele din urmă încă 40 de limbi, inclusiv coreeană și japoneză. Cu această extensie, Bard va putea sprijini dezvoltatorii de oriunde.
În plus, pentru a-și îmbunătăți răspunsurile la solicitările utilizatorilor, Bard va oferi acum imagini, hărți și alte elemente grafice. Pentru toți dezvoltatorii de acolo, va fi de mare ajutor. Aici, vom examina specificul LLM Gemini.
Ce este Gemeni?
În conformitate cu Google, Gemini a fost conceput de la început să fie multimodal, foarte eficient în ceea ce privește conectarea instrumentelor și API-urilor și pregătit pentru progrese viitoare, cum ar fi memoria și planificarea. Google a declarat în postarea pe blog că Gemeni are deja capabilități multimodale remarcabile pe care modelele anterioare nu le aveau.
„Odată ce reglam și testăm temeinic Gemini pentru siguranță, îl vom oferi în diferite dimensiuni și capabilități, similare cu PaLM 2”, a spus Google.
Ca rezultat, poate fi implementat pe mai multe produse, aplicații și dispozitive pentru a beneficia de toată lumea.”
La conferință au prezentat PaLM 2, un model de limbă de ultimă oră, cu capacități extinse de multilingve, de raționament și codare. A fost instruit pe larg cu materiale multilingve din peste 100 de limbi.
PaLM 2 poate produce și traduce conținut subtil, cum ar fi idiomuri, poezie și ghicitori într-o varietate de limbi.
Gemeni este probabil să stimuleze eforturile Google în domeniul inteligenței artificiale și să provoace pionierul, ChatGPT de la OpenAI. În timp ce ChatGPT este folosit mai ales pentru conversații bazate pe text, Gemini este multimodal, ceea ce înseamnă că poate răspunde atât la text, cât și la imagini. Odată integrat cu Google Search, are potențialul de a transforma modul în care consumatorii interacționează cu popularul motor de căutare.
Deși mai multe detalii despre Gemeni nu sunt încă disponibile, acesta poate depăși ChatGPT și Bing AI, propulsând Google la șeful domeniului AI.
Sundar Pichai, CEO al Google, a remarcat în timpul conferinței: „După șapte ani în care am fost o companie pe primul loc în IA, ne aflăm într-un punct de cotitură interesant”.
Gemenii sunt acum în curs de pregătire, potrivit lui Pichai, și este creat cu o abordare multimodală, cu scopul de a fi extrem de eficienți și de a deschide ușa pentru progrese viitoare precum memoria și planificarea. Gemenii arată deja capabilități multimodale remarcabile care lipseau din versiunile anterioare, potrivit lui Pichai, chiar dacă se află încă în fazele sale incipiente.
Google îi instruiește pe Gemeni prin intermediul TPU (cipurilor). Pichai a declarat că, după ce Gemini a fost optimizat și a trecut de inspecțiile de siguranță, acesta va fi accesibil într-o gamă de dimensiuni și capacități, deși nu a fost menționată o dată specifică de lansare.
Pichai a precizat clar că toate modelele AI ale Google vor include filigran și metadate în rezultate, cum ar fi imagini, pentru a preveni răspândirea informațiilor incorecte.
Ce îi face pe Gemeni superiori Chat GPT și BingAI?
Gemenii au mai multe caracteristici „multimodale” interesante. Gemeni, spre deosebire de ChatGPT, care poate citi și produce doar text, se bazează pe o paradigmă multimodală și poate înțelege și produce text, cod și imagini.
Numeroase oportunități sunt posibile prin această varietate mai largă de abilități. Gemenii, de exemplu, pot fi folosiți pentru a crea o clasă nouă de chatbot-uri AI care pot înțelege și reacționa atât la text, cât și la imagini.
Cu toate acestea, atât ChatGPT, cât și Bing oferă doar comunicare pe bază de text, Bing oferind un link separat pentru crearea de imagini, dar lipsește suportul pentru imagini în chat.
Gemini poate gestiona o varietate mai mare de produse și aplicații, spre deosebire de ChatGPT. Poate fi folosit, de exemplu, pentru a actualiza Căutarea Google sau pentru a crea un asistent virtual de ultimă oră care utilizează AI. Aceste caracteristici lipsesc în BingAI și ChatGPT. ChatGPT, totuși, oferă plugin-uri care îmbunătățesc rezultatele.
Gemeni posedă, de asemenea, caracteristici precum memoria și planificarea, permițând dezvoltarea de aplicații bazate pe inteligență artificială care depășesc ceea ce este capabil ChatGPT.
Posibilități interesante apar atunci când vă gândiți să aveți un asistent personal alimentat de Gemeni care vă ține evidența preferințelor și vă ajută în planificarea zilnică. Pentru a vedea întregul potențial al Gemenilor și a investiga oportunitățile pe care le deschide, totuși, trebuie mai întâi să așteptăm cu nerăbdare lansarea sa publică.
Concluzie
Gemini, modelul de limbă de ultimă generație al Google, a demonstrat caracteristici multimodale remarcabile, făcându-l mai adaptabil decât ChatGPT, rivalul său doar pentru text.
Gemeni creează noi oportunități pentru chatbot și aplicații AI, permițându-le să citească și să producă text, cod și grafică. Aceste aplicații pot gestiona acum o gamă mai mare de activități. Spre deosebire de Gemini, care acceptă atât imagini, cât și interacțiuni multimodale, ChatGPT și BingAI sunt capabile doar de interacțiuni bazate pe text.
Deși informații mai specifice despre Gemeni nu au fost încă făcute publice, este clar că Google se angajează să avanseze tehnologia AI și să-și mențină liderul în domeniu.
Anticipăm să vedem întregul potențial al Gemenii și posibilitățile creative pe care le deschide, în timp ce așteptăm cu entuziasm lansarea sa oficială.
Lasă un comentariu