Talaan ng nilalaman[Tago][Ipakita]
Ang Ika-23 Google I/O medyo nakakakilig! Sa larangan ng artificial intelligence, ipinakita nila ang ilang mahahalagang pagsulong.
Ang kumpetisyon sa pagitan ng OpenAI's GPT-4 at Google's Gemini ay isa sa pinakamahalagang pagsisiwalat. Pagkatapos ng kanilang umiiral PALAD 2 sistema, ang Gemini ay ang malaking modelo ng wika (LLM) ng susunod na henerasyon.
Ang modelo ng machine-learning ay pinahusay ng Google, na ginagawa itong mas sopistikado. Upang makipagkumpitensya sa mga pagpapabuti ng Bing ng Microsoft, nagdaragdag din sila ng mga generative na kakayahan ng AI sa Android at pinapalakas ang Google Search gamit ang AI.
Upang gawing mas mapagkumpitensya ang Google Bard sa iba chatbots tulad ng ChatGPT, inihayag nila ang isang makabuluhang pagpapabuti para dito sa panahon ng kaganapan. Sa kalaunan ay susuportahan ni Bard ang 40 pang wika, kabilang ang Korean at Japanese. Sa extension na ito, masusuportahan ni Bard ang mga dev kahit saan.
Bukod pa rito, para mapahusay ang mga tugon nito sa mga kahilingan ng user, mag-aalok na ngayon si Bard ng mga larawan, mapa, at iba pang graphics. Para sa lahat ng mga developer out doon, ito ay napakalaking tulong. Dito, susuriin natin ang mga detalye ng LLM Gemini.
Ano ang Gemini?
Ayon sa Google, ang Gemini ay inilaan mula sa simula upang maging multimodal, napakahusay sa mga tuntunin ng mga tool sa pagkonekta at mga API, at handa para sa mga pagsulong sa hinaharap tulad ng memorya at pagpaplano. Sinabi ng Google sa kanilang post sa blog na ang Gemini ay mayroon nang natitirang multimodal na kakayahan na wala sa mga naunang modelo.
"Kapag na-fine-tune namin at masusing sinubukan ang Gemini para sa kaligtasan, iaalok namin ito sa iba't ibang laki at kakayahan, katulad ng PaLM 2," sabi ng Google.
Bilang resulta, maaari itong ipatupad sa maraming produkto, app, at device para makinabang ang lahat."
Iniharap nila ang PaLM 2, isang makabagong modelo ng wika na may pinalawak na mga kakayahan sa multilinggwal, pangangatwiran, at coding, sa kumperensya. Ito ay malawakang sinanay gamit ang multilingguwal na materyal mula sa mahigit 100 wika.
Ang PaLM 2 ay maaaring gumawa at magsalin ng banayad na nilalaman tulad ng mga idyoma, tula, at bugtong sa iba't ibang wika.
Malamang na palakasin ni Gemini ang mga pagsisikap ng Google sa AI at hamunin ang pioneer, ang ChatGPT ng OpenAI. Habang ang ChatGPT ay kadalasang ginagamit para sa mga text-based na pag-uusap, ang Gemini ay multimodal, ibig sabihin ay maaari itong tumugon sa parehong text at visual. Kapag naisama na sa Google Search, may potensyal itong baguhin kung paano nakikipag-ugnayan ang mga consumer sa sikat na search engine.
Bagama't hindi pa available ang mga karagdagang detalye tungkol sa Gemini, maaari nitong malampasan ang ChatGPT at Bing AI, na nagtutulak sa Google sa pinuno ng field ng AI.
Sinabi ni Sundar Pichai, CEO ng Google, sa panahon ng kumperensya, "Pagkatapos ng pitong taon ng pagiging isang AI-first na kumpanya, nakita namin ang aming sarili sa isang kapana-panabik na punto ng pagbabago."
Ang Gemini ay sumasailalim na ngayon sa pagsasanay, ayon kay Pichai, at ito ay nilikha gamit ang isang multimodal na diskarte na may layuning maging lubhang epektibo at pagbubukas ng pinto para sa hinaharap na pagsulong tulad ng memorya at pagpaplano. Ipinakikita na ng Gemini ang mga natitirang multimodal na kakayahan na wala sa mga naunang bersyon, ayon kay Pichai, kahit na ito ay nasa maagang yugto pa lamang.
Inutusan ng Google ang Gemini sa pamamagitan ng TPU nito (chips). Sinabi ni Pichai na pagkatapos na ma-optimize ang Gemini at makapasa sa mga inspeksyon sa kaligtasan, maa-access ito sa isang hanay ng mga laki at kapasidad, kahit na walang nabanggit na partikular na petsa ng paglabas.
Nilinaw ni Pichai na ang lahat ng mga modelo ng AI ng Google ay magsasama ng watermarking at metadata sa mga output, tulad ng mga larawan, upang maiwasan ang pagkalat ng maling impormasyon.
Ano ang higit na nakahihigit sa Gemini Chat GPT at BingAI?
Ang Gemini ay may ilang nakakaintriga na "multimodal" na katangian. Ang Gemini, sa kaibahan sa ChatGPT, na maaari lamang magbasa at gumawa ng teksto, ay nakabatay sa isang multimodal na paradigm at maaaring umunawa at makagawa ng teksto, code, at mga larawan.
Maraming mga pagkakataon ang naging posible sa pamamagitan ng mas malawak na iba't ibang mga kasanayan. Ang Gemini, halimbawa, ay maaaring gamitin upang lumikha ng isang nobelang klase ng AI chatbots na makakaunawa at makakapag-react sa parehong text at visual.
Gayunpaman, ang ChatGPT at Bing ay nagbibigay lamang ng text-based na komunikasyon, kung saan ang Bing ay nagbibigay ng hiwalay na link para sa paglikha ng mga larawan ngunit walang suporta sa in-chat na larawan.
Kayang panghawakan ng Gemini ang isang mas malawak na iba't ibang mga produkto at aplikasyon sa kaibahan sa ChatGPT. Maaari itong gamitin, halimbawa, upang i-upgrade ang Google Search o lumikha ng isang makabagong virtual assistant na gumagamit ng AI. Ang mga tampok na ito ay kulang sa BingAI at ChatGPT. Ang ChatGPT, gayunpaman, ay nagbibigay ng mga plugin na nagpapahusay sa mga resulta.
Ang Gemini ay nagtataglay din ng mga katangian tulad ng memorya at pagpaplano, na nagpapahintulot sa pagbuo ng mga AI-powered na app na higit pa sa kung ano ang kayang gawin ng ChatGPT.
May mga kapana-panabik na posibilidad kapag isinasaalang-alang mo ang pagkakaroon ng personal na katulong na pinapagana ng Gemini na sumusubaybay sa iyong mga kagustuhan at mga tulong sa pang-araw-araw na pagpaplano. Upang makita ang buong potensyal ng Gemini at maimbestigahan ang mga pagkakataong nagbubukas nito, gayunpaman, kailangan muna nating maghintay nang walang pasensya para sa pampublikong paglabas nito.
Konklusyon
Ang Gemini, ang susunod na henerasyong modelo ng wika ng Google, ay nagpakita ng mga natatanging tampok na multimodal, na ginagawa itong mas madaling ibagay kaysa sa ChatGPT, ang text-only na karibal nito.
Gumagawa ang Gemini ng mga bagong pagkakataon para sa mga chatbot at AI app sa pamamagitan ng pagpapagana sa kanila na magbasa at gumawa ng text, code, at graphics. Ang mga application na ito ay maaari na ngayong pamahalaan ang isang mas malaking hanay ng mga aktibidad. Kabaligtaran sa Gemini, na sumusuporta sa parehong mga imahe at multimodal na pakikipag-ugnayan, ang ChatGPT at BingAI ay may kakayahan lamang sa mga pakikipag-ugnayan na nakabatay sa teksto.
Bagama't hindi pa naisapubliko ang mas tiyak na impormasyon tungkol sa Gemini, malinaw na nakatuon ang Google sa pagsulong ng teknolohiya ng AI at pagpapanatili ng pangunguna nito sa larangan.
Inaasahan naming makita ang buong potensyal ni Gemini at ang mga malikhaing posibilidad na nagbubukas nito habang nasasabik kaming naghihintay sa pormal na paglulunsad nito.
Mag-iwan ng Sagot