Google révolutionne l’intelligence artificielle avec le déploiement de Gemini 2.5 Flash pour les développeurs. Cette mise à jour promet des performances accrues et des capacités améliorées, tout en enrichissant les expériences des utilisateurs sur l’application Gemini. Découvrez comment cette avancée transforme le paysage technologique actuel.

Sommaire :
Déploiement de Gemini 2.5 Flash
Suite à une annonce brève la semaine dernière, Google commence le déploiement de Gemini 2.5 Flash en version préliminaire. Une fonctionnalité de « budget de réflexion » permet aux développeurs de contrôler la quantité de raisonnement effectuée en fonction de la demande et du cas d’utilisation.
Capacités de Raisonnement
Tous les modèles de la famille Gemini 2.5 possèdent des capacités de raisonnement qui permettent de réfléchir « à travers leurs pensées avant de répondre » pour une « performance améliorée et une précision accrue ». Cela s’avère particulièrement utile pour les demandes nécessitant un raisonnement en plusieurs étapes, comme les problèmes mathématiques ou l’analyse de questions de recherche.
Au lieu de générer immédiatement une sortie, le modèle peut effectuer un processus de « réflexion » pour mieux comprendre la requête, décomposer des tâches complexes et planifier sa réponse.
Fonctionnalités pour les Développeurs
Les modèles Flash de Gemini sont réputés pour leur rapidité et leur coût réduit. Avec la version 2.5 Flash, Google introduit des capacités de raisonnement où les développeurs peuvent « définir des budgets de réflexion pour contrôler le coût par rapport à la qualité ».
Spécifications Clés de Gemini 2.5 Flash
Voici les spécifications clés pour Gemini 2.5 Flash en prévision (gemini-2.5-flash-preview-04-17) :
- Limites de Taux : 1000 RPM / 10,000 RPD (Niveau Payant), 10 RPM / 500 RPD (Niveau Gratuit)
- Date Limite de Connaissance : Janvier 2025
- Modalités d’Entrée : Texte, Images, Vidéo, Audio
- Modalités de Sortie : Texte
- Contexte : 1 million de tokens
- Longueur Max de Sortie : 64K tokens
Gestion du Budget de Réflexion
Les développeurs contrôlent le « nombre de tokens qu’un modèle peut générer pendant la réflexion », allant de 0 à 24,576 tokens. Une interface de réglage est disponible dans Google AI Studio et Vertex AI, ainsi qu’un paramètre API. Lorsque le budget de réflexion est fixé à zéro, ce modèle de nouvelle génération correspondra au coût et à la latence de 2.0 Flash.
Si aucun budget n’est spécifié, Gemini 2.5 Flash « décide automatiquement de la quantité de réflexion en fonction de la complexité perçue de la tâche ». Google fournit des exemples de raisonnements minimal, moyen et élevé.
Exemples de Raisonnement
**Raisonnement Minimal :**
- « Merci » en espagnol
- Combien de provinces le Canada a-t-il ?
**Raisonnement Moyen :**
- Vous lancez deux dés. Quelle est la probabilité qu’ils s’additionnent à 7 ?
- Mon gymnase a des heures de jeu de basket entre 9h et 15h le lundi, mercredi, vendredi, et entre 14h et 20h le mardi et le samedi. Si je travaille de 9h à 18h cinq jours par semaine et que je veux jouer cinq heures de basket en semaine, élaborez un emploi du temps pour moi.
**Raisonnement Élevé :**
Dans le contexte des agents, un exemple serait que des résumés rapides nécessiteraient un budget de réflexion faible, tandis qu’une analyse détaillée exigerait un budget plus élevé.
Disponibilité de Gemini 2.5 Flash
Gemini 2.5 Flash est disponible en prévision pour les développeurs dans Google AI Studio et Vertex AI. Google indique qu’il continuera à améliorer Gemini 2.5 Flash, avec d’autres mises à jour à venir avant que le modèle ne soit généralement disponible pour une utilisation en production complète.
Application Gemini
La version 2.5 Flash (expérimentale) arrive également dans l’application Gemini avec la capacité d’ajuster automatiquement la quantité de raisonnement selon la complexité de la demande. Les utilisateurs finaux n’ont pas d’option de réglage manuel dans l’application.
Dès son lancement, diverses capacités de l’application Gemini, comme les applications/extensions, le téléchargement de fichiers, etc., sont supportées, tandis que ce modèle remplacera le 2.0 Flash Thinking (expérimental), qui a été mis à jour pour la dernière fois en mars.

Pour des informations supplémentaires sur Gemini et ses fonctionnalités, vous pouvez consulter [Google Cloud AI](https://cloud.google.com/ai).
Qu’est-ce que Gemini 2.5 Flash ?
Gemini 2.5 Flash est un modèle de traitement lancé par Google, offrant des capacités de raisonnement et la possibilité pour les développeurs de contrôler le budget de réflexion selon le cas d’utilisation.
Quelles sont les limitations de Gemini 2.5 Flash ?
Les limites de taux sont fixées à 1000 RPM / 10,000 RPD pour le niveau payant et 10 RPM / 500 RPD pour le niveau gratuit. Le modèle a également une fenêtre contextuelle de 1 million de tokens, avec une longueur de sortie maximale de 64K tokens.
Comment les développeurs peuvent-ils ajuster le modèle ?
Les développeurs peuvent contrôler le nombre de tokens qu’un modèle peut générer pendant le processus de réflexion, de 0 à 24,576 tokens, en utilisant un curseur dans Google AI Studio et Vertex AI, ainsi qu’un paramètre API.
Quelles sont les capacités de raisonnement du modèle ?
Les modèles de la famille Gemini 2.5 pensent « à travers leurs pensées avant de répondre », ce qui améliore les performances et la précision, en particulier pour les questions nécessitant un raisonnement multi-étapes.

Bonjour, je m’appelle Manu Dibango et j’ai 37 ans. Cadre supérieur dans l’administration, je suis passionné par la gestion et l’organisation. Bienvenue sur Camernews où je partage ma veille sur les nouvelles technologies et l’innovation.