Talonné par son grand rival OpenAI, Google vient de lancer Gemini 2.5 et deux nouvelles fonctionnalités : un outil collaboratif baptisé « Canvas » et une
option permettant de convertir vos textes en podcasts audio. Une petite
révolution ?
Alors que la course à l’intelligence artificielle (IA) s’intensifie, Google lance Gemini
2.5 pour rivaliser avec les récentes avancées de ChatGPT, notamment GPT-4.5 et
la refonte de son générateur d’images. Cette nouvelle version de Gemini,
actuellement en phase expérimentale mais accessible aux abonnés, promet de
décupler les possibilités de l’IA.
Gemini 2.5 se positionne comme le modèle de langage le plus avancé de Google à
ce jour. Déjà déployé sur les smartphones et le web, il se distingue par sa capacité
accrue à raisonner et à vérifier les informations avant de répondre aux requêtes des
utilisateurs. Un aspect qui pourrait transformer l’efficacité globale de l’IA.
Un « espace interactif » dédié à la création
Dans la foulée, la firme de Mountain View a lancé deux nouvelles fonctionnalités qui
enrichissent l’expérience Gemini. Plus besoin de prompts complexes pour la
création et l’édition de documents. Grâce à « Canvas », il suffit de sélectionner un
extrait de texte pour reformuler une phrase ou obtenir des modifications
chirurgicales, ciblées et personnalisées à l’envi. Exactement comme sur un éditeur
de texte classique, mais en collaboration directe avec l’IA. L’utilisateur peut mettre
un paragraphe en surbrillance et demander à l’IA de le modifier, en changeant de
ton, en le raccourcissant, en variant la mise en forme, etc. Le document créé sur
Gemini s’exporte ensuite en quelques secondes vers Google Docs.
Une aide au codage
Canvas devient aussi un assistant pratique pour le codage. Si Gemini était déjà
capable de générer du code, il offre désormais une visualisation en temps réel du
résultat. Un exemple ? Créez un formulaire d’abonnement, puis demandez à Gemini
de générer le code HTML, et un simple clic sur « Preview » permet d’obtenir un
aperçu. Chaque modification, même infime, s’y reflète instantanément. De quoi
simplifier et démocratiser considérablement le développement.
De l’écrit à l’oral
En parallèle, Google lance « Audio Overview », un outil qui convertit vos documents
en fichiers audio, voire en podcasts. Cette fonctionnalité, issue de l’outil
NotebookLM, permet une écoute plus agréable et dynamique des longs documents,
grâce à des « hôtes virtuels » qui simulent une conversation. Bluffant.
En l’espace de quelques mois, les systèmes d’intelligence artificielle (IA) ont réalisé
des progrès gigantesques. Depuis l’automne 2024, il est possible d’avoir des
conversations naturelles, fluides et rythmées, avec des services d’IA tels que Mistral,
ChatGPT ou Gemini. Ces nouveautés sont d’autant plus appréciables qu’un compte
Google n’est plus nécessaire pour utiliser l’IA.