Dans une nouveauté révolutionnaire, Google dévoile le 7ème génération d’Ironwood TPU et le système Lyria de création musicale par texte, transformant ainsi la façon dont nous interagissons avec la technologie. Ces avancées promettent d’optimiser la lisibilité et d’améliorer nos expériences numériques comme jamais auparavant.
Sommaire :
Google annonce le TPU Ironwood de 7e génération
Lors de l’événement Cloud Next 2025, Google a révélé son dernier Tensor Processing Unit (TPU) de 7e génération baptisé **Ironwood**. Ce TPU est présenté comme l’accélérateur IA personnalisé le plus performant et évolutif de l’entreprise à ce jour. En outre, il se distingue par sa grande efficacité énergétique et représente une avancée majeure dans les modèles génératifs.
Qu’est-ce que le TPU Ironwood ?
Le TPU Ironwood est spécifiquement conçu pour l’inférence, permettant ainsi des performances optimales dans les applications d’intelligence artificielle. Selon Google, ce TPU marque un tournant significatif dans le développement de l’intelligence artificielle, passant de modèles réactifs fournissant des informations en temps réel à des modèles proactifs capables de générer des données et des idées. Cela nous plonge dans ce que Google appelle l’« ère de l’inférence », où les agents IA récupèrent et génèrent des informations de manière collaborative.
Ironwood représente un changement fondamental dans la manière dont l’intelligence artificielle est développée et implémentée.
Conçu pour gérer les exigences de modèles cognitifs, le TPU Ironwood prend en charge les Modèles de Langage de Grande Taille (LLM), les Méthodes de Mélange d’Experts (MoE) et les tâches avancées de raisonnement. Pour répondre à ces besoins, il a été optimisé pour minimiser le mouvement des données et la latence, tout en réalisant d’importantes manipulations de tenseurs.
Avec le TPU Ironwood, nous avons mis en place un réseau à faible latence et à large bande passante pour favoriser la communication synchronisée à grande échelle.
Caractéristiques et performances
Les clients de Google Cloud peuvent accéder à une configuration comprenant 256 ou 9 216 puces. Chaque puce peut atteindre un pico de 4 614 TFLOPs, permettant à un pod complet de pouvoir traiter jusqu’à 42,5 Exaflops. Pour mettre cela en perspective, cela équivaut à « plus de 24 fois la puissance informatique du plus grand supercalculateur au monde, El Capitan, qui offre seulement 1,7 Exaflops par pod.”
Le TPU Ironwood offre ainsi une performance par watt deux fois supérieure à celle du Trillium de 6e génération annoncé en 2024, totalisant 192 Go de mémoire à large bande par puce, contre seulement 32 Go pour le Trillium.
Pathways et d’autres modèles avancés
**Pathways** est le runtime distribué de Google qui alimente son infrastructure d’entraînement et d’inférence à grande échelle. Il est désormais accessible aux clients de Google Cloud, facilitant l’intégration avec les plateformes existantes et la gestion des ressources.
Gemini 2.5 Flash
Un autre modèle mentionné est le **Gemini 2.5 Flash**, qui se positionne comme le modèle de travail de Google, optimisé pour la latence et le coût. Disponible prochainement sur Vertex AI, il introduit un raisonnement dynamique et contrôlable. Ce modèle ajuste automatiquement le temps de traitement en fonction de la complexité de la requête, permettant des réponses plus rapides pour des demandes simples.
La flexibilité de Gemini 2.5 Flash est essentielle pour optimiser les performances dans des applications à fort volume et sensibles aux coûts.
Modèles génératifs AI
Google annonce également que son modèle **Lyria** de génération de musique à partir de texte sera bientôt disponible pour les clients d’entreprise sur Vertex AI. Ce modèle a la capacité de générer des audio de haute qualité dans divers genres, permettant aux entreprises de créer rapidement des bandes sonores adaptées à leur identité de marque.
Lyria permet de surmonter des obstacles, permettant la création de morceaux musicaux personnalisés en quelques minutes, parfaitement alignés avec l’humeur et le rythme de votre contenu.
Un exemple de prompt pourrait être : « Créez un morceau de bebop à haute énergie, mettant en avant des solos éblouissants de saxophone et de trompette. Le piano doit fournir un accompagnement percussif et des basses dynamiques, alors que les percussions devraient dynamiser l’énergie. L’auditeur doit sentir l’excitation d’un club de jazz enfumé.»
Fonctionnalités de Veo 2
Parallèlement, **Veo 2** bénéficie de nouvelles fonctionnalités d’édition permettant d’altérer des séquences existantes. Ces fonctionnalités incluent :
- Inpainting : permet des éditions propres et professionnelles sans retouche manuelle, en supprimant des images ou logos indésirables.
- Outpainting : étend le cadre de séquences vidéo existantes pour optimiser les contenus pour le web et les plateformes mobiles.
Améliorations d’Imagen 3
**Imagen 3 Editing** a également été amélioré pour permettre la reconstruction de portions d’images manquantes ou endommagées, ainsi que la suppression d’objets.
D’autre part, **Chirp 3** représente le modèle de compréhension et de génération audio de Google, offrant des « voix HD » en 35 langues avec plusieurs options de locuteurs, en plus de nouvelles fonctionnalités permettant de séparer et d’identifier les locuteurs dans des enregistrements multi-locuteurs pour une meilleure transcription.
Les entreprises peuvent ainsi personnaliser les centres d’appels et développer un contenu accessible tout en garantissant une identité de marque cohérente.
Engagement en matière de sécurité
Pour assurer un usage responsable, Google a intégré **SynthID** de DeepMind, qui insère des filigranes invisibles dans chaque image, vidéo et audio générées par Imagen, Veo et Lyria.
Pour plus d’informations sur les technologies IA et les dernières innovations, consultez le site de Google Cloud.
Qu’est-ce que l’Ironwood TPU ?
L’Ironwood TPU est le septième processeur de traitement tensoriel de Google, conçu pour être le plus performant et évolutif à ce jour, tout en étant économe en énergie et spécifiquement conçu pour l’inférence.
Comment l’Ironwood TPU améliore-t-il les modèles d’IA ?
L’Ironwood TPM permet de passer de modèles d’IA réactifs à des modèles proactifs qui génèrent des insights et des interprétations, marquant ainsi l’« ère de l’inférence » où les agents d’IA récupèrent et génèrent des données de manière proactive.
Quelles sont les caractéristiques techniques de l’Ironwood TPU ?
L’Ironwood TPU offre jusqu’à 4 614 TFLOPs de puissance de calcul par puce et permet des configurations allant de 256 à 9 216 puces, avec des performances par watt deux fois supérieures à celles de la génération précédente, Trillium.
Qu’est-ce que Gemini 2.5 Flash ?
Gemini 2.5 Flash est un modèle de Google qui met l’accent sur la faible latence et les coûts, permettant une « raison dynamique et contrôlable », ce qui est particulièrement utile pour les cas d’utilisation à fort volume comme le service client et le traitement d’informations en temps réel.

Bonjour, je m’appelle Manu Dibango et j’ai 37 ans. Cadre supérieur dans l’administration, je suis passionné par la gestion et l’organisation. Bienvenue sur Camernews où je partage ma veille sur les nouvelles technologies et l’innovation.