Description

AIBalance : Arbitrage Environnemental de l'IA Générative

Réalisé dans le cadre du Hackathon ADEME 2026 sur l'impact environnemental de l'IA générative.

https://github.com/DocLama/AiBalance

Contexte:

Les modèles d'IA générative sont adoptés massivement par les entreprises et les particuliers, mais leur coût énergétique reste largement opaque. Aujourd'hui, les utilisateurs choisissent un modèle sur la base de sa performance perçue, sans disposer d'aucune information sur son empreinte environnementale. Or, les écarts de consommation entre modèles sont considérables : pour une même tâche, certains consomment jusqu'à 170 fois plus d'énergie que d'autres, sans apporter de gain significatif en qualité de réponse.

Notre projet pose une question simple : peut-on recommander le modèle le plus sobre à qualité équivalente, en fonction de ce que l'utilisateur demande ?

Ce que nous avons construit:

Nous avons croisé trois sources de données issues de la plateforme Compar:IA pour analyser 109 modèles d'IA sur 18 catégories de tâches. Notre pipeline exploite 495 534 conversations, 164 212 votes de préférence utilisateur et 96 739 réactions qualitatives individuelles.

À partir de ces données, nous avons développé un moteur de recommandation qui, pour un prompt donné, identifie automatiquement le type de tâche, évalue les modèles sur des critères qualitatifs spécifiques à cette tâche, et recommande le modèle le plus économe en énergie parmi ceux qui offrent une qualité équivalente au meilleur.

Le moteur propose trois modes de fonctionnement : un mode "performance" qui privilégie la qualité, un mode "green" qui privilégie la sobriété, et un mode "balanced" qui équilibre les deux.

Principaux résultats:

Notre simulation montre qu'en redirigeant chaque requête vers le modèle équivalent le plus sobre, on pourrait économiser 49,4% de l'énergie totale consommée, sans dégradation perceptible de la qualité. Ce chiffre repose sur un test de non infériorité (seuil de 3%) inspiré de la méthodologie de Wellek (2010).

Nous montrons également que le classement des modèles change significativement selon la catégorie de tâche. Un modèle excellent en génération de code peut se révéler médiocre en rédaction créative, et inversement. C'est cette variabilité qui donne tout son sens à une recommandation personnalisée par usage.

Concernant l'empreinte carbone, nous avons mappé chaque modèle à son fournisseur cloud avec des PUE (Power Usage Effectiveness) sourcés dans les rapports officiels de Google (1.09), AWS (1.15), Microsoft (1.16) et Scaleway (1.25). Nos estimations montrent qu'un modèle hébergé en France émet environ 9,5 fois moins de CO₂ qu'un modèle équivalent hébergé en Chine, à consommation énergétique égale, en raison de la différence de mix électrique (nucléaire vs charbon).

Données utilisées:

Les données proviennent de la plateforme Compar:IA et comprennent trois fichiers : les conversations (énergie mesurée en kWh, tokens générés, catégories de tâches, paramètres des modèles), les votes (préférences utilisateurs dans des duels A/B avec critères qualitatifs : utilité, créativité, clarté, correction, profondeur, respect des consignes), et les réactions (like/dislike et évaluations qualitatives par message individuel).

Le score de transparence par entreprise est issu du Foundation Model Transparency Index de Stanford (décembre 2025).

Livrables:

Le projet produit 18 visualisations interactives Plotly couvrant l'ensemble de l'analyse : heatmap des win rates par catégorie, fronts de Pareto, analyse du gaspillage énergétique, simulation globale, sensibilité au seuil d'équivalence, impact carbone par fournisseur cloud, et validation par ablation study.

Un dashboard web statique (déployable sur Netlify) intègre l'ensemble de ces visualisations et présente les résultats de manière accessible.

Le code source complet (notebook Jupyter, dashboard) est disponible sur GitHub.

Équipe:

-Alexis Fabre
-Edwin Li
-Karim Merkache
-Walid Mouaoued

Thématique
Environnement et énergie
Type
Application
Mots clés
opendatauniversity
Dernière mise à jour
13 avril 2026
Date de création
12 avril 2026

Vues

2 jeux de données associés

Il n'y a pas encore d'API associées