Analyse d’image : BDM évalue les principaux outils d’IA
Avec l’évolution rapide des outils d’intelligence artificielle, l’analyse d’image est devenue l’une des fonctionnalités les plus discutées. En 2025, des géants comme ChatGPT, Google Gemini, Claude, et Microsoft Copilot se disputent le devant de la scène, chacun proposant des technologies uniques pour traiter et analyser des visuels. L’analyse d’image permet aux utilisateurs de soumettre une photo ou un graphique afin de recevoir une description détaillée, des conseils pratiques, ou même des interprétations. BDM a réalisé des tests sur plusieurs de ces outils pour examiner leur capacité à répondre à des requêtes complexes illustrées par des images.
Pour ces tests, trois images très distinctes ont été utilisées, chacune assortie d’un prompt spécifique. Voici un résumé des résultats obtenus :
- Une capture d’écran de l’interface Discord : Le prompt demandait des instructions sur l’accès aux réglages du micro.
- Un graphique issu d’une étude de Ahrefs : Le prompt invitait à décrire et analyser le graphique en détail.
- Une photo d’un Pentax ME Super : Le prompt interrogeait sur le modèle et la manière d’ouvrir le logement de la pellicule.
Chaque IA a été évaluée sur plusieurs critères : la précision de l’analyse, la clarté de la réponse et la richesse des informations fournies. Ceci a permis de dégager des tendances dans la performance des différentes plateformes. L’analyse approfondie s’est révélée cruciale pour comprendre les capacités uniques de chaque modèle.
Performances de ChatGPT dans l’analyse d’image
ChatGPT, développé par OpenAI, s’est montré particulièrement réactif lors de l’analyse des images soumises. Dans les trois cas proposés, il a rapidement formulé des réponses précises. Concernant l’interface de Discord, il a non seulement identifié correctement les éléments nécessaires pour accéder aux paramètres du micro, mais a aussi fourni une description détaillée des différents sous-menus à consulter.
Pour le graphique, bien que la réponse soit concise, ChatGPT a montré une bonne interprétation des chiffres, donnant des informations pertinentes sur les données présentées. Cependant, une petite erreur a été notée concernant le modèle de l’appareil photo ; ChatGPT a utilisé une référence incorrecte, bien qu’il ait fourni des instructions claires sur l’ouverture du logement de la pellicule.
| Criteres | Performance |
|---|---|
| Précision de l’analyse | Excellente |
| Clarté de la réponse | Bonne |
| Richesse de l’information | Bonne |
Évaluation de Google Gemini dans l’analyse d’image
Dans notre enquête, Google Gemini a montré des performances solides, notamment lors de l’analyse du graphique. Bien que le modèle prenne un moment pour formuler ses réponses, ce temps d’attente est compensé par la précision et la clarté de ses analyses. En effet, Gemini a fourni une interprétation très approfondie du graphique, structurant sa réponse de manière efficace.
Concernant la capture d’écran de Discord, Gemini a répondu de manière compétente, mais a été légèrement moins détaillé que ChatGPT dans son explication. L’analyse de la photo de l’appareil photo a également révélé une différence de ton dans le rendu des données : alors que Gemini a reconnu le modèle d’appareil photo, il a laissé en suspens certaines spécificités, offrant des suggestions plutôt qu’une affirmation définitive.
Les retours des utilisateurs ont souvent loué sa capacité à afficher des recommandations en fin de réponse, révélant une flexibilité dans l’interaction générée.
| Criteres | Performance |
|---|---|
| Précision de l’analyse | Bonne |
| Clarté de la réponse | Excellente |
| Richesse de l’information | Excellente |
Analyse approfondie des performances de Claude
Passons à Claude, un modèle développé par Anthropic. Les résultats de son évaluation ont montré des performances mixtes. D’un côté, Claude a rapidement saisi ce qui était demandé dans chaque prompt, mais de l’autre, il n’a pas toujours enrichi ses réponses avec des détails supplémentaires. Son approche était directe, mais parfois trop succincte, notamment lors de l’analyse du graphique, où il peinait à fournir des informations analytiques suffisantes.
Pour l’interface de Discord, Claude a bien compris la tâche à accomplir et a proposé une solution adéquate, mais a manqué d’explications détaillées sur les sous-menus. Concernant l’appareil photo, bien qu’il ait identifié le modèle, il a révélé une assurance excessive dans des erreurs d’interprétation.
| Criteres | Performance |
|---|---|
| Précision de l’analyse | Acceptable |
| Clarté de la réponse | Bon |
| Richesse de l’information | Minime |
Capacités d’analyse d’image de Perplexity
Perplexity, bien qu’il ne soit pas principalement conçu pour l’analyse d’image, a tout de même relevé le défi avec un certain succès. Cette plateforme a utilisé ses capacités de moteur de recherche pour afficher des résultats intéressants. Son interprétation de l’interface Discord et du graphique a été assez précise, mais il a rencontré des difficultés importantes avec l’appareil photo.
La performance de Perplexity réside dans sa capacité à décrire des graphiques et à détecter des éléments pertinents. Toutefois, il a fait preuve d’une tendance à orienter les réponses de manière subjective, particulièrement lors de l’analyse du graphique de Ahrefs.
| Criteres | Performance |
|---|---|
| Précision de l’analyse | Satisfaisante |
| Clarté de la réponse | Bonne |
| Richesse de l’information | Minime |
Comparaison finale : Microsoft Copilot et ses concurrents
Pour clôturer cette évaluation, Microsoft Copilot a été testé et s’est impressionné par sa capacité à traiter des requêtes complexes. Avec une excellente reconnaissance des éléments de l’interface Discord, il a également démontré une compréhension approfondie du graphique. En revanche, il a commis des erreurs critiques dans les données interprétées, ce qui a affaibli sa performance globale.
Malgré des résultats impressionnants dans les réponses sur Discord et le modèle photographié, les erreurs sur les données chiffrées du graphique soulèvent des préoccupations sur la fiabilité des résultats générés. Cela démontre que même les outils les plus puissants doivent continuer à évoluer pour garantir des performances optimales.
| Criteres | Performance |
|---|---|
| Précision de l’analyse | Bonne |
| Clarté de la réponse | Excellente |
| Richesse de l’information | Variable |

Bonjour, je m’appelle Manu Dibango et j’ai 37 ans. Cadre supérieur dans l’administration, je suis passionné par la gestion et l’organisation. Bienvenue sur Camernews où je partage ma veille sur les nouvelles technologies et l’innovation.


