Google Gemini : quel est ce nouveau modèle d’IA qui veut dépasser ChatGPT ?

Le nouveau modèle de langage de Google, Gemini 1.0, a été lancé par la firme ce mercredi 6 décembre. Prometteur, il serait capable de surpasser GPT-4, créé par OpenAI.

Une nouvelle annonce prête à secouer le monde de l’intelligence artificielle. Ce mercredi, Google a annoncé le lancement de Gemini 1.0, un modèle de langage capable de gérer du texte, de l’image, du son, de la vidéo et même du code informatique.

«Gemini est le fruit d'une collaboration à grande échelle entre des équipes de Google. Il a été conçu dès le départ pour être multimodal, ce qui signifie qu'il peut généraliser et comprendre, exploiter et combiner de manière transparente différents types d'informations, notamment le texte, le code, l'audio, l'image et la vidéo», a indiqué Demis Hassabis, co-fondateur de Google Deepmind, l’équipe en charge du développement de l’IA au sein de la firme californienne.

Trois formats pour des utilisations adaptées

Dans sa présentation de Gemini 1.0, Google a annoncé que la première version du modèle d’IA sera disponible sous trois formats :

Gemini Nano, pour les tâches locales sur les smartphones.
Gemini Pro, qui devrait intégrer tous les services de Google, dont Google Bard, le chatbot conversationnel de l’entreprise qui fait concurrence à ChatGPT.
Gemini Ultra, la version la plus poussée de ce modèle de langage, utilisée lors des démonstrations de Google et destinée aux tâches les plus complexes.

We’ve optimized Gemini 1.0 for three different sizes, meaning it can run on everything from data centers to mobile phones.

Ultra: our largest one for highly complex tasks

Pro: our best one for scaling across many tasks

Nano: our most efficient one for devices pic.twitter.com/u5r0SnRmIi

— Google DeepMind (@GoogleDeepMind) December 6, 2023

Par ailleurs, les équipes de Google et de Google Deepmind ont également dévoilé les résultats de Gemini face à d’autres modèles de langage comme GPT-4, qu’il surpasserait dans 30 des 32 référentiels utilisés dans le cadre de la recherche et du développement des modèles de langage.

Des capacités de reconnaissances impressionnantes

C’est notamment dans le cadre de la reconnaissance d’image que Gemini s’est montré menaçant pour OpenAI et ses modèles, puisqu’il a obtenu un meilleur résultat dans chacun des référentiels. Une fierté mise en avant par Sundar Pichai, le PDG de Google, à travers une vidéo publiée sur X et qui montre les capacités de Gemini au grand public.

Seeing some qs on what Gemini *is* (beyond the zodiac :). Best way to understand Gemini’s underlying amazing capabilities is to see them in action, take a look pic.twitter.com/OiCZSsOnCc

— Sundar Pichai (@sundarpichai) December 6, 2023

Déjà disponible en remplacement de LaMDA, le précédent modèle de langage de Google, Gemini n’est utilisable qu’en anglais sur les appareils de la marque, en attendant un déploiement en français dans un futur proche.

Sur le même sujetIntelligence artificielle : Elon Musk présente Grok, rivale de ChatGPTLire

«Il s'agit d'une étape importante dans le développement de l'IA et du début d'une nouvelle ère pour Google, qui continue à innover rapidement et à faire progresser de manière responsable les capacités de nos modèles», a conclu l’entreprise.