Google dévoile Gemini 1.5 : une fenêtre de contexte étendue pour booster la performance

Google dévoile Gemini 1.5 : une fenêtre de contexte étendue pour booster la performance

Google vient de lâcher une petite bombe dans le monde de l'IA avec l'annonce de Gemini 1.5, et autant vous dire que ça promet ! Après le succès de la version 1.0 en décembre, ils remettent le couvert avec une version encore plus balèze qui va clairement changer la donne.

La grande nouveauté de Gemini 1.5, c'est sa "fenêtre de contexte" qui a pris du muscle. Pour ceux qui débarquent, cette fenêtre de contexte, c'est un peu le cerveau de l'IA, qui digère et traite tout ce qu'on lui donne : mots, images, vidéos, sons, ou code. Plus elle est grande, plus l'IA peut comprendre de trucs en une fois, et donc, être plus pertinente et efficace dans ses réponses.

Et là, Google frappe fort : Gemini 1.5 Pro, c'est une fenêtre de contexte standard de 128 000 tokens, contre 32 000 pour la version 1.0. Traduction ? L'IA peut se gaver de plus de 700 000 mots, avaler des codes de plus de 30 000 lignes, écouter 11 heures de son, ou visionner 1 heure de vidéo d'un coup. Pour vous donner une idée, même GPT-4 Turbo et Claude 2.1 sont à la traîne avec, respectivement, 128 000 et 200 000 tokens.

Ce qui rend Gemini 1.5 Pro ultra impressionnant, c'est sa capacité à analyser, classer et résumer des tonnes de contenu en un clin d'œil. Genre, il peut décortiquer les 402 pages du transcript de la mission Apollo 11 sur la Lune et te sortir les moments clés, ou encore mater un film muet de Buster Keaton de 44 minutes et te faire un débrief de tous les rebondissements et les détails subtils. Sans parler de son talent pour naviguer dans des blocs de code énormes et proposer des améliorations utiles.

Mais le truc encore plus fou, c'est que Google a réussi à pousser le bouchon jusqu'à 1 million de tokens en prod, et certains chanceux peuvent déjà tester ça. Ils ont même testé jusqu'à 10 millions de tokens pour le texte !

Tout ça, c'est grâce à une nouvelle architecture appelée Mixture-of-Experts (MoE), où l'IA est divisée en plein de petits réseaux de neurones spécialisés. Ça permet à Gemini 1.5 d'être super efficace, que ce soit pour l'apprentissage ou pour l'utilisation au quotidien.

En termes de perf, Gemini 1.5 Pro met la pâtée à la version 1.0 dans 87% des benchmarks, que ce soit pour le texte, le code, l'image, le son ou la vidéo. Et il est même au coude à coude avec le 1.0 Ultra.

Gemini 1.5 Pro, avec sa fenêtre de contexte de 128 000 tokens, débarque en avant-première pour les devs et les clients entreprises via AI Studio et Vertex AI. Pour l'instant, c'est encore au stade expérimental, mais ça promet !

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.