Table des matières[Cacher][Montrer]
La 23e E/S Google était assez passionnant ! Dans le domaine de l'intelligence artificielle, ils ont présenté plusieurs avancées importantes.
La concurrence entre le GPT-4 d'OpenAI et le Gemini de Google a été l'une des révélations les plus importantes. Après leur existence PAUME 2 système, Gemini est le grand modèle de langue (LLM) de la génération suivante.
Le modèle d'apprentissage automatique a été amélioré par Google, le rendant encore plus sophistiqué. Afin de rivaliser avec les améliorations Bing de Microsoft, ils ajoutent également des capacités d'IA génératives à Android et renforcent la recherche Google avec l'IA.
Pour rendre Google Bard plus compétitif par rapport aux autres les chatbots comme ChatGPT, ils ont annoncé une amélioration significative pour celui-ci lors de l'événement. Bard prendra éventuellement en charge 40 langues supplémentaires, dont le coréen et le japonais. Avec cette extension, Bard pourra prendre en charge les développeurs n'importe où.
De plus, afin d'améliorer ses réponses aux demandes des utilisateurs, Bard proposera désormais des images, des cartes et d'autres graphiques. Pour tous les développeurs là-bas, ce sera une aide immense. Ici, nous examinerons les spécificités du LLM Gemini.
Qu'est-ce que les Gémeaux?
Selon Google, Gemini a été conçu dès le départ pour être multimodal, très efficace en termes de connexion d'outils et d'API, et prêt pour les avancées futures telles que la mémoire et la planification. Google a déclaré dans son article de blog que Gemini possède déjà des capacités multimodales exceptionnelles que les modèles précédents n'avaient pas.
"Une fois que nous aurons affiné et testé de manière approfondie Gemini pour la sécurité, nous l'offrirons dans différentes tailles et capacités, similaires à PaLM 2", a déclaré Google.
En conséquence, il peut être mis en œuvre sur plusieurs produits, applications et appareils au profit de tous. »
Lors de la conférence, ils ont présenté PaLM 2, un modèle de langage de pointe avec des capacités étendues de multilingue, de raisonnement et de codage. Il a été largement formé avec du matériel multilingue de plus de 100 langues.
PaLM 2 peut produire et traduire des contenus subtils tels que des idiomes, de la poésie et des énigmes dans une variété de langues.
Gemini est susceptible de stimuler les efforts de Google en matière d'IA et de défier le pionnier, ChatGPT d'OpenAI. Alors que ChatGPT est principalement utilisé pour les conversations textuelles, Gemini est multimodal, ce qui signifie qu'il peut répondre à la fois au texte et aux visuels. Une fois intégré à la recherche Google, il a le potentiel de transformer la façon dont les consommateurs interagissent avec le moteur de recherche populaire.
Bien que de plus amples détails sur Gemini ne soient pas encore disponibles, il peut surpasser ChatGPT et Bing AI, propulsant Google à la tête du domaine de l'IA.
Sundar Pichai, PDG de Google, a fait remarquer lors de la conférence : "Après sept ans d'être une entreprise axée sur l'IA, nous nous trouvons à un tournant passionnant."
Gemini est actuellement en cours de formation, selon Pichai, et il est créé avec une approche multimodale dans le but d'être extrêmement efficace et d'ouvrir la porte à de futures avancées comme la mémoire et la planification. Gemini montre déjà des capacités multimodales exceptionnelles qui étaient absentes des versions précédentes, selon Pichai, même si elle en est encore à ses débuts.
Google instruit Gemini via ses TPU (puces). Pichai a déclaré qu'une fois Gemini optimisé et passé les inspections de sécurité, il serait accessible dans une gamme de tailles et de capacités, bien qu'aucune date de sortie spécifique n'ait été mentionnée.
Pichai a clairement indiqué que tous les modèles d'IA de Google intégreront le filigrane et les métadonnées dans les sorties, telles que les images, pour empêcher la diffusion d'informations incorrectes.
Ce qui rend Gemini supérieur à ChatGPT et Bing AI ?
Gemini possède plusieurs caractéristiques « multimodales » intrigantes. Gemini, contrairement à ChatGPT, qui ne peut que lire et produire du texte, est basé sur un paradigme multimodal et peut comprendre et produire du texte, du code et des images.
De nombreuses opportunités sont rendues possibles par cette plus grande variété de compétences. Gemini, par exemple, peut être utilisé pour créer une nouvelle classe de chatbots IA capables de comprendre et de réagir à la fois au texte et aux visuels.
Cependant, ChatGPT et Bing ne fournissent que des communications textuelles, Bing fournissant un lien séparé pour créer des images mais ne prenant pas en charge les images dans le chat.
Gemini peut gérer une plus grande variété de produits et d'applications contrairement à ChatGPT. Il peut être utilisé, par exemple, pour mettre à niveau la recherche Google ou créer un assistant virtuel de pointe qui utilise l'IA. Ces fonctionnalités manquent dans BingAI et ChatGPT. ChatGPT, cependant, fournit des plugins qui améliorent les résultats.
Gemini possède également des caractéristiques telles que la mémoire et la planification, permettant le développement d'applications alimentées par l'IA qui vont au-delà de ce dont ChatGPT est capable.
Des possibilités passionnantes se présentent lorsque vous envisagez d'avoir un assistant personnel propulsé par Gemini qui garde une trace de vos préférences et aide à la planification quotidienne. Pour voir tout le potentiel de Gemini et étudier les opportunités qu'il ouvre, cependant, nous devons d'abord attendre avec impatience sa sortie publique.
Conclusion
Gemini, le modèle de langage de nouvelle génération de Google, a montré des fonctionnalités multimodales exceptionnelles, le rendant plus adaptable que ChatGPT, son rival textuel.
Gemini crée de nouvelles opportunités pour les chatbots et les applications d'IA en leur permettant de lire et de produire du texte, du code et des graphiques. Ces applications peuvent désormais gérer un plus large éventail d'activités. Contrairement à Gemini, qui prend en charge à la fois les images et les interactions multimodales, ChatGPT et BingAI ne sont capables que d'interactions textuelles.
Bien que des informations plus spécifiques concernant Gemini n'aient pas encore été rendues publiques, il est clair que Google s'est engagé à faire progresser la technologie de l'IA et à maintenir son avance dans le domaine.
Nous prévoyons de voir le plein potentiel de Gemini et les possibilités créatives qu'il ouvre alors que nous attendons avec impatience son lancement officiel.
Soyez sympa! Laissez un commentaire