Мазмұны[Жасыру][Көрсету]
The 23-ші Google I/O өте әсерлі болды! Жасанды интеллект саласында олар бірнеше маңызды жетістіктерді ұсынды.
OpenAI GPT-4 және Google Gemini арасындағы бәсекелестік ең маңызды ашулардың бірі болды. Олардың бар болғаннан кейін ПАЛМА 2 жүйесі, Gemini — келесі ұрпақтың үлкен тіл үлгісі (LLM).
Машиналық оқыту моделін Google жетілдіріп, оны одан да күрделі етті. Microsoft корпорациясының Bing жақсартуларымен бәсекелесу үшін олар Android жүйесіне генеративті AI мүмкіндіктерін қосуда және AI көмегімен Google Search қызметін арттыруда.
Google Bard-ті басқалармен бәсекеге қабілетті ету ChatGPT сияқты чат-боттар, олар іс-шара барысында оның айтарлықтай жақсарғанын хабарлады. Бард ақыр соңында тағы 40 тілге, соның ішінде корей және жапон тілдеріне қолдау көрсетеді. Бұл кеңейтіммен Bard кез келген жерде әзірлеушілерге қолдау көрсете алады.
Сонымен қатар, пайдаланушы сұрауларына жауаптарын жақсарту үшін Bard енді суреттерді, карталарды және басқа графикаларды ұсынады. Барлық әзірлеушілер үшін бұл үлкен көмек болады. Мұнда біз LLM Gemini ерекшеліктерін қарастырамыз.
Егіздер дегеніміз не?
Сәйкес Google, Gemini басынан мультимодальды, құралдар мен API интерфейстерін қосу тұрғысынан өте тиімді және жад пен жоспарлау сияқты болашақ жетістіктерге дайын болуға арналған. Google өзінің блог жазбасында Gemini-де бұрынғы модельдерде болмаған керемет мультимодальды мүмкіндіктер бар екенін айтты.
«Біз Gemini-ді қауіпсіздік тұрғысынан дәлдеп, мұқият тексергеннен кейін біз оны PaLM 2-ге ұқсас әртүрлі өлшемдер мен мүмкіндіктерде ұсынамыз», - деді Google.
Нәтижесінде, ол барлығына пайдалы болу үшін бірнеше өнімдерде, қолданбаларда және құрылғыларда іске асырылуы мүмкін.
Олар конференцияда кеңейтілген көптілді, пайымдау және кодтау мүмкіндіктері бар алдыңғы қатарлы тіл үлгісі PaLM 2 ұсынды. Ол 100-ден астам тілдегі көптілді материалдармен кеңінен оқытылды.
PaLM 2 әртүрлі тілдерде идиомалар, поэзия және жұмбақтар сияқты нәзік мазмұнды жасап, аудара алады.
Gemini Google-дың AI күш-жігерін арттырып, OpenAI ChatGPT пионеріне қарсы шығуы мүмкін. ChatGPT негізінен мәтінге негізделген сөйлесулер үшін пайдаланылғанымен, Gemini мультимодальды, яғни ол мәтінге де, көрнекі көріністерге де жауап бере алады. Google Search-пен біріктірілгеннен кейін ол тұтынушылардың танымал іздеу жүйесімен өзара әрекеттесуін өзгерту мүмкіндігіне ие.
Gemini туралы қосымша мәліметтер әлі қол жетімді болмаса да, ол ChatGPT және Bing AI-дан асып түсіп, Google-ді AI саласының басына көтере алады.
Google компаниясының бас директоры Сундар Пичай конференция барысында: «Жеті жыл бойы AI-бірінші компания болғаннан кейін біз өзімізді қызықты бетбұрыс нүктесіне тап болдық», - деді.
Пичайдың айтуынша, Егіздер қазір жаттығудан өтуде және ол өте тиімді болу және жады мен жоспарлау сияқты болашақ жетістіктерге жол ашу мақсатында мультимодальды тәсілмен жасалуда. Пичайдың айтуынша, Gemini бұрынғы нұсқаларда болмаған керемет мультимодальды мүмкіндіктерді көрсетуде, тіпті ол әлі бастапқы фазаларында болса да.
Google Gemini-ге TPU (чиптер) арқылы нұсқау береді. Пичайдің айтуынша, Gemini оңтайландырылып, қауіпсіздік тексерулерінен өткеннен кейін оның белгілі бір шығарылым күні айтылмағанымен, әртүрлі өлшемдер мен қуаттарда қол жетімді болады.
Пичай Google компаниясының барлық AI үлгілері дұрыс емес ақпараттың таралуын болдырмау үшін суреттер сияқты шығыстарда су таңбалары мен метадеректерді қосатынын анық айтты.
Егіздерді не артық етеді GPT чат және BingAI?
Егіздердің бірнеше қызықты «мультимодальды» сипаттамалары бар. Gemini тек мәтінді оқи және шығара алатын ChatGPT-тен айырмашылығы, мультимодальды парадигмаға негізделген және мәтінді, кодты және суреттерді түсініп, жасай алады.
Көптеген мүмкіндіктер осы кең ауқымды дағдылардың арқасында мүмкін болады. Мысалы, Gemini мәтінді де, көрнекі көріністерді де түсінетін және әрекет ете алатын AI чат-боттарының жаңа класын жасау үшін пайдаланылуы мүмкін.
Дегенмен, ChatGPT және Bing екеуі тек мәтінге негізделген байланысты қамтамасыз етеді, Bing кескіндерді жасау үшін бөлек сілтемені қамтамасыз етеді, бірақ чатта суретке қолдау көрсетілмейді.
Gemini ChatGPT-тен айырмашылығы кеңірек өнімдер мен қолданбаларды өңдей алады. Оны, мысалы, Google Search қызметін жаңарту немесе AI қолданатын озық виртуалды көмекші жасау үшін пайдалануға болады. Бұл мүмкіндіктер BingAI және ChatGPT-те жоқ. Алайда ChatGPT нәтижелерді жақсартатын плагиндерді ұсынады.
Gemini сонымен қатар жады және жоспарлау сияқты сипаттамаларға ие, бұл ChatGPT мүмкіндіктерінен асып түсетін AI-мен жұмыс істейтін қолданбаларды жасауға мүмкіндік береді.
Сіздің қалауларыңызды қадағалайтын және күнделікті жоспарлауға көмектесетін Gemini арқылы жұмыс істейтін жеке көмекшіні қарастырған кезде қызықты мүмкіндіктер пайда болады. Егіздердің толық әлеуетін көру және оның ашатын мүмкіндіктерін зерттеу үшін, алайда, алдымен оның көпшілікке шығарылуын тағатсыздана күтуіміз керек.
қорытынды
Google-дың келесі буын тіл үлгісі Gemini, тек мәтіндік бәсекелес ChatGPT-ке қарағанда, оны бейімделгіш ететін тамаша мультимодальды мүмкіндіктерді көрсетті.
Gemini мәтінді, кодты және графиканы оқуға және жасауға мүмкіндік беру арқылы чат-боттар мен AI қолданбалары үшін жаңа мүмкіндіктер жасайды. Бұл қолданбалар енді әрекеттердің кең ауқымын басқара алады. Кескіндерді де, мультимодальды өзара әрекеттесуді де қолдайтын Gemini-ге қарағанда, ChatGPT және BingAI тек мәтінге негізделген өзара әрекеттесуге қабілетті.
Gemini туралы нақты ақпарат әлі жарияланбағанымен, Google AI технологиясын ілгерілетуге және осы саладағы көшбасшылығын сақтауға ұмтылатыны анық.
Біз Егіздердің толық әлеуетін және оның ашылатын шығармашылық мүмкіндіктерін көреміз деп күтеміз, өйткені біз оның ресми іске қосылуын асыға күтеміз.
пікір қалдыру