En décembre 2023, Google a donné le coup d’envoi de l’« ère des Gémeaux », en parlant – comme il l’a fait dans un article partagé en février 2024 sur son blog officiel – d’une étape majeure dans le parcours de l’entreprise visant à rendre l’IA plus accessible à tous. Voici en quoi il consiste et ce que les utilisateurs peuvent faire avec la technologie développée par Google DeepMind, l’entreprise d’IA contrôlée par Alphabet.
Découvrir Gemeni
Pour comprendre en quoi consiste Gemini, il est nécessaire de prendre un peu de recul et d’analyser brièvement les principales innovations annoncées par Google au cours de l’année écoulée dans le domaine de l’intelligence artificielle.
Quelques mois avant le lancement de Gemini, en mars 2023 pour être précis, le géant de la technologie a présenté Bard comme une expérience d’intelligence artificielle conversationnelle (et certainement aussi comme une réponse à ChatGPT, créé par le concurrent OpenAI). L’idée était de donner à chacun la possibilité d’expérimenter les modèles d’IA de Google à travers une interface simple, comme celle d’un chatbot.
Quelques mois plus tard, avec le lancement de Gemini, défini sur le blog de l’entreprise comme la « famille de modèles d’IA la plus grande et la plus performante » créée par Google, la multinationale a ressenti le besoin de renommer Bard, afin que cet outil reflète mieux la « technologie avancée dont il est équipé » : c’est pourquoi, en février 2024, le chatbot est devenu tout simplement Gemini.
Cet outil, c’est-à-dire le chatbot, n’a pas été le seul à être inclus dans la marque ombrelle « Gemini », qui désigne plutôt un ensemble de technologies et d’outils basés sur l’IA de Google. En fait, la naissance de Gemini a déclenché une stratégie de rebranding plus large qui a regroupé non seulement Bard mais aussi d’autres produits Google sous un même nom : Duet AI for developers est devenu Gemini Code Assist, tandis que Duet AI for Google Workspace a été rebaptisé Gemini for Google Workspace, pour ne citer que quelques exemples.
Différence entre les modèles Gemini et les applications Gemini
Google n’a pas fourni d’explication très claire à ce sujet, mais on ne peut s’empêcher de remarquer que, bien que les différentes technologies soient toutes regroupées sous le nom de « Gemini », il existe une nette différence entre les modèles d’IA Gemini et les applications Gemini pour le web et le mobile.
Les applications ne seraient en fait qu’une interface permettant d’accéder à certains modèles d’IA développés par DeepMind : ainsi, par exemple, avec le chatbot de Google (anciennement Bard et désormais également présenté comme l’application web Gemini), il est possible d’accéder à Gemini Pro.
GEMINI ULTRA, GEMINI PRO ET GEMINI NANO : EN QUOI CONSISTE CETTE TECHNOLOGIE ET À QUOI SERT-ELLE ?
En plus d’être la famille de modèles la plus grande et la plus performante de Google, Gemini serait aussi la plus flexible : cette technologie serait en effet capable de fonctionner efficacement partout, des smartphones aux centres de données, comme l’indique l’article de présentation de Gemini partagé en décembre 2023.
Une autre caractéristique de cette technologie est qu’elle est multimodale : Gemini est capable de comprendre, de combiner et de générer différents types d’informations, y compris du texte, des images, de l’audio, de la vidéo et du code informatique.
Tout cela est possible grâce au fait que le modèle est – comme le présente directement Google – « optimisé pour trois dimensions différentes » :
• Gemini Ultra, qui, parmi les différents modèles de la famille Gemini, serait le plus puissant et capable d’effectuer des tâches plus complexes ;
• Gemini Pro, un modèle qui peut être appliqué à un grand nombre de tâches (par exemple, il est déjà utilisé sur divers produits Google, y compris le chatbot précédemment appelé Bard) ;
• Gemini Nano, le modèle le mieux adapté aux tâches à effectuer sur un seul appareil. Ce type d’intelligence artificielle, appelé « on-device », peut être installé sur des téléphones mobiles, des tablettes et des PC, sans occuper beaucoup d’espace, et permet également au modèle d’IA de fonctionner hors ligne, c’est-à-dire sans qu’il soit nécessaire d’accéder aux serveurs ou aux ensembles de données pertinents.
COMMENT ACCÉDER À GEMINI ?
L’application web de Gemini est actuellement celle qui rend l’utilisation de l’IA de Google accessible au plus grand nombre de personnes et d’appareils (PC, tablettes et mobiles), sur Android et iOS.
Cet outil, actuellement disponible dans plus de 40 langues, utilise une version dédiée de Gemini Pro, permettant ainsi aux utilisateurs d’y accéder pour « le raisonnement avancé, la planification, la compréhension et plus encore ».
Google a également lancé une application mobile Google Gemini, présentée sur Google Play comme un « assistant expérimental basé sur l’IA » qui, une fois installé sur le smartphone, remplacera l’Assistant Google en tant qu’assistant principal du téléphone.
Gemini Advanced, en revanche, consiste en une expérience de chat différente, particulièrement adaptée aux entreprises, car elle donne accès au modèle d’IA le plus puissant de Google, à savoir Gemini 1.0 Ultra.
Google offre également aux développeurs et aux entreprises clientes la possibilité d’accéder à Gemini Pro via l’API Gemini sur Google AI Studio ou Google Cloud Vertex AI.