Projekt 23. Google I/O bylo docela napínavé! V oblasti umělé inteligence představili několik důležitých pokroků.
Konkurence mezi GPT-4 od OpenAI a Gemini od Googlu byla jedním z nejvýznamnějších odhalení. Po jejich existujících DLAŇ 2 Gemini je velký jazykový model (LLM) následující generace.
Model strojového učení Google vylepšil a stal se tak ještě propracovanějším. Aby mohli konkurovat vylepšením Bing od Microsoftu, přidávají do Androidu také generativní schopnosti umělé inteligence a vylepšují vyhledávání Google pomocí umělé inteligence.
Aby byl Google Bard konkurenceschopnější vůči ostatním chatboty jako ChatGPT, oznámili pro něj v průběhu akce výrazné vylepšení. Bard bude nakonec podporovat dalších 40 jazyků, včetně korejštiny a japonštiny. S tímto rozšířením bude Bard schopen podporovat vývojáře kdekoli.
Kromě toho, aby společnost Bard zlepšila své odpovědi na požadavky uživatelů, bude nyní nabízet obrázky, mapy a další grafiku. Pro všechny vývojáře to bude nesmírná pomoc. Zde prozkoumáme specifika LLM Gemini.
Co je Gemini?
Podle Google, Gemini byl od základu zamýšlen jako multimodální, velmi efektivní z hlediska propojování nástrojů a API a připravený na budoucí pokroky, jako je paměť a plánování. Google ve svém příspěvku na blogu uvedl, že Gemini již má vynikající multimodální schopnosti, které předchozí modely neměly.
„Jakmile vyladíme a důkladně otestujeme Gemini z hlediska bezpečnosti, nabídneme jej v různých velikostech a možnostech, podobně jako PaLM 2,“ řekl Google.
Výsledkem je, že jej lze implementovat do různých produktů, aplikací a zařízení, aby byl přínosem pro každého.“
Na konferenci představili PaLM 2, špičkový jazykový model s rozšířenými vícejazyčnými, uvažovacími a kódovacími schopnostmi. Byl rozsáhle vyškolen s vícejazyčným materiálem z více než 100 jazyků.
PaLM 2 dokáže vytvářet a překládat jemný obsah, jako jsou idiomy, poezie a hádanky, do různých jazyků.
Gemini pravděpodobně podpoří úsilí Googlu o umělou inteligenci a postaví se průkopníkovi, ChatGPT od OpenAI. Zatímco ChatGPT se většinou používá pro textové konverzace, Gemini je multimodální, což znamená, že může reagovat jak na text, tak na obraz. Po integraci s Vyhledáváním Google má potenciál změnit způsob interakce spotřebitelů s populárním vyhledávačem.
Ačkoli další podrobnosti o Gemini zatím nejsou k dispozici, může překonat ChatGPT a Bing AI, což Google posouvá do čela oblasti AI.
Sundar Pichai, generální ředitel společnosti Google, během konference poznamenal: „Po sedmi letech, kdy jsme společností na prvním místě v oblasti umělé inteligence, jsme se ocitli ve vzrušujícím bodu obratu.“
Gemini nyní prochází tréninkem, podle Pichai, a je vytvořen s multimodálním přístupem s cílem být extrémně efektivní a otevřít dveře pro budoucí pokroky, jako je paměť a plánování. Gemini již předvádí vynikající multimodální schopnosti, které v dřívějších verzích chyběly, podle Pichai, i když je stále ve svých raných fázích.
Google instruuje Gemini prostřednictvím svých TPU (čipů). Pichai uvedl, že poté, co bude Gemini optimalizován a projde bezpečnostními kontrolami, bude dostupný v řadě velikostí a kapacit, ačkoli nebylo uvedeno žádné konkrétní datum vydání.
Pichai jasně řekl, že všechny modely umělé inteligence Google budou obsahovat vodoznak a metadata ve výstupech, jako jsou obrázky, aby se zabránilo šíření nesprávných informací.
Čím jsou Blíženci lepší než ChatGPT a BingAI?
Blíženci mají několik zajímavých „multimodálních“ vlastností. Gemini, na rozdíl od ChatGPT, který umí pouze číst a vytvářet text, je založen na multimodálním paradigmatu a dokáže porozumět a vytvořit text, kód a obrázky.
Tato širší paleta dovedností umožňuje řadu příležitostí. Gemini lze například použít k vytvoření nové třídy chatbotů s umělou inteligencí, kteří dokážou porozumět textu i vizuálu a reagovat na něj.
ChatGPT i Bing však poskytují pouze textovou komunikaci, přičemž Bing poskytuje samostatný odkaz pro vytváření obrázků, ale postrádá podporu obrázků v chatu.
Gemini zvládnou na rozdíl od ChatGPT širší škálu produktů a aplikací. Lze jej použít například pro upgrade Google Search nebo vytvoření špičkového virtuálního asistenta, který využívá AI. Tyto funkce chybí v BingAI a ChatGPT. ChatGPT však poskytuje pluginy, které vylepšují výsledky.
Gemini má také vlastnosti, jako je paměť a plánování, což umožňuje vývoj aplikací založených na umělé inteligenci, které jdou nad rámec toho, co ChatGPT dokáže.
Vzrušující možnosti se otevírají, když zvažujete mít osobního asistenta poháněného Gemini, který sleduje vaše preference a pomáhá při každodenním plánování. Abychom však viděli plný potenciál Gemini a prozkoumali příležitosti, které otevírá, musíme nejprve netrpělivě čekat na jeho veřejné vydání.
Proč investovat do čističky vzduchu?
Gemini, jazykový model nové generace společnosti Google, ukázal vynikající multimodální funkce, díky čemuž je přizpůsobivější než ChatGPT, jeho pouze textový konkurent.
Gemini vytváří nové příležitosti pro chatboty a aplikace AI tím, že jim umožňuje číst a vytvářet text, kód a grafiku. Tyto aplikace nyní dokážou spravovat větší rozsah činností. Na rozdíl od Gemini, který podporuje obrázky i multimodální interakce, jsou ChatGPT a BingAI schopny pouze textových interakcí.
Přestože konkrétnější informace týkající se Gemini zatím nebyly zveřejněny, je zřejmé, že Google se zavázal k pokroku v technologii AI a udržení svého prvenství v oboru.
Očekáváme, že uvidíme plný potenciál Gemini a kreativní možnosti, které se otevírají, protože vzrušeně očekáváme jeho formální uvedení.
Napsat komentář