Tartalomjegyzék[Elrejt][Előadás]
A 23. Google I/O elég izgalmas volt! A mesterséges intelligencia területén számos fontos előrelépést mutattak be.
Az OpenAI GPT-4 és a Google Gemini közötti versengés volt az egyik legjelentősebb feltárás. A meglévők után TENYÉR 2 rendszer, a Gemini a következő generáció nagy nyelvi modellje (LLM).
A gépi tanulási modellt a Google továbbfejlesztette, így még kifinomultabb. Annak érdekében, hogy felvegyék a versenyt a Microsoft Bing fejlesztéseivel, generatív mesterségesintelligencia-képességeket adnak az Androidhoz, és a Google Keresést AI segítségével bővítik.
A Google Bard versenyképesebbé tétele másokkal szemben chatbotok, mint a ChatGPT, jelentős fejlesztést jelentettek be az esemény során. A Bard végül 40 további nyelvet támogat, köztük a koreai és a japán nyelvet. Ezzel a kiterjesztéssel a Bard bárhol képes lesz támogatni a fejlesztőket.
Ezenkívül a felhasználói kérésekre adott válaszok javítása érdekében a Bard mostantól képeket, térképeket és egyéb grafikákat kínál. Az összes fejlesztő számára ez óriási segítség lesz. Itt megvizsgáljuk az LLM Gemini sajátosságait.
Mi az Ikrek?
Szerint Google, a Gemini az alapoktól kezdve multimodálisnak készült, az eszközök és API-k összekapcsolása szempontjából nagyon hatékony, és készen áll az olyan jövőbeli fejlesztésekre, mint a memória és a tervezés. A Google blogbejegyzésében kijelentette, hogy a Gemini már rendelkezik olyan kiemelkedő multimodális képességekkel, amelyekkel a korábbi modellek nem rendelkeztek.
„Miután finomhangoljuk és alaposan teszteljük a Geminit a biztonság érdekében, a PaLM 2-höz hasonlóan különféle méretekben és képességekben kínáljuk majd” – mondta a Google.
Ennek eredményeként több terméken, alkalmazáson és eszközön is megvalósítható, hogy mindenki számára előnyös legyen.”
A konferencián bemutatták a PaLM 2-t, egy élvonalbeli nyelvi modellt, amely kibővített többnyelvű, érvelési és kódolási képességekkel rendelkezik. Kiterjedten képezték ki több mint 100 nyelvből származó többnyelvű anyagokkal.
A PaLM 2 különféle nyelveken képes előállítani és lefordítani finom tartalmakat, például idiómákat, költészetet és találós kérdéseket.
A Gemini valószínűleg fellendíti a Google mesterséges intelligencia erőfeszítéseit, és kihívás elé állítja az úttörőt, az OpenAI ChatGPT-jét. Míg a ChatGPT-t többnyire szöveges beszélgetésekre használják, a Gemini multimodális, azaz szövegre és vizuális elemekre is képes reagálni. A Google Keresővel való integrálása után képes megváltoztatni a fogyasztók és a népszerű keresőmotor közötti interakciót.
Bár további részletek még nem állnak rendelkezésre a Geminiről, a ChatGPT-t és a Bing AI-t felülmúlhatja, és ezzel a Google-t az AI-mezőny élére emelheti.
Sundar Pichai, a Google vezérigazgatója a konferencia során megjegyezte: „Hét évnyi mesterséges intelligenciával foglalkozó vállalat után izgalmas fordulópont előtt találjuk magunkat.”
Pichai szerint a Gemini jelenleg képzésen vesz részt, és multimodális megközelítéssel hozták létre azzal a céllal, hogy rendkívül hatékony legyen, és megnyissa az ajtót a jövőbeli fejlesztések, például a memória és a tervezés előtt. Pichai szerint a Gemini már most olyan kiemelkedő multimodális képességeket mutat be, amelyek hiányoztak a korábbi verziókból, még akkor is, ha még a kezdeti fázisban van.
A Google a TPU-n (chipeken) keresztül utasítja a Geminit. Pichai kijelentette, hogy miután a Geminit optimalizálták, és átment a biztonsági ellenőrzéseken, számos méretben és kapacitásban elérhető lesz, bár konkrét megjelenési dátumot nem említettek.
Pichai egyértelművé tette, hogy a Google összes mesterségesintelligencia-modellje vízjelet és metaadatokat fog tartalmazni a kimenetekben, például a képekben, hogy megakadályozzák a helytelen információk terjedését.
Mitől jobb az Ikrek ChatGPT és a BingAI?
Az Ikrek számos érdekes „multimodális” tulajdonsággal rendelkezik. A Gemini, ellentétben a ChatGPT-vel, amely csak szöveget tud olvasni és létrehozni, multimodális paradigmán alapul, és képes szöveget, kódot és képeket megérteni és előállítani.
A készségek szélesebb választéka számos lehetőséget kínál. A Gemini például felhasználható mesterséges intelligencia chatbotok új osztályának létrehozására, amely képes megérteni a szöveget és a látványt, és reagálni rá.
Mindazonáltal a ChatGPT és a Bing is csak szöveges kommunikációt biztosít, a Bing külön hivatkozást biztosít a képek létrehozásához, de nem támogatja a csevegésen belüli képeket.
A Gemini a ChatGPT-vel ellentétben a termékek és alkalmazások szélesebb választékát képes kezelni. Használható például a Google Keresés frissítésére, vagy MI-t használó, élvonalbeli virtuális asszisztens létrehozására. Ezek a funkciók hiányoznak a BingAI-ból és a ChatGPT-ből. A ChatGPT azonban olyan bővítményeket biztosít, amelyek javítják az eredményeket.
A Gemini olyan jellemzőkkel is rendelkezik, mint a memória és a tervezés, ami lehetővé teszi olyan mesterséges intelligencia-alapú alkalmazások fejlesztését, amelyek túlmutatnak azon, amire a ChatGPT képes.
Izgalmas lehetőségek merülnek fel, ha fontolóra veszi a Gemini által működtetett személyi asszisztenst, amely nyomon követi preferenciáit, és segíti a napi tervezést. Ahhoz azonban, hogy meglássuk az Ikrekben rejlő teljes potenciált, és megvizsgáljuk, milyen lehetőségek nyílnak meg előtte, először türelmetlenül kell várnunk a nyilvános megjelenésre.
Következtetés
A Gemini, a Google következő generációs nyelvi modellje kiemelkedő multimodális tulajdonságokat mutatott, így jobban alkalmazkodóképes, mint a ChatGPT, a csak szöveges rivális.
A Gemini új lehetőségeket teremt a chatbotok és az AI-alkalmazások számára azáltal, hogy lehetővé teszi számukra szövegek, kódok és grafikák olvasását és előállítását. Ezek az alkalmazások már több tevékenységet is kezelhetnek. A képeket és a multimodális interakciókat egyaránt támogató Geminivel szemben a ChatGPT és a BingAI csak szöveges interakciókra képes.
Bár a Geminivel kapcsolatban konkrétabb információkat még nem hoztak nyilvánosságra, egyértelmű, hogy a Google elkötelezett a mesterséges intelligencia technológia fejlesztése és vezető pozíciójának megőrzése mellett.
Arra számítunk, hogy meglátjuk a Gemini teljes potenciálját és a benne rejlő kreatív lehetőségeket, miközben izgatottan várjuk a hivatalos megjelenést.
Hagy egy Válaszol