Ce jeu de données propose une analyse détaillée de 200 déploiements d'Intelligence Artificielle (Générative et Classique) réalisés au sein de PME, ETI et Grandes Entreprises. Il documente le coût, le temps de mise en œuvre et le Retour sur Investissement (ROI) réel observé sur le terrain.
Contexte de la collecte Contrairement aux études déclaratives basées sur des sondages d'opinion, ce dataset repose sur des audits opérationnels de projets en production. Il vise à fournir aux décideurs et chercheurs des métriques fiables pour sortir du "Hype" et évaluer la rentabilité réelle de l'IA.
https://www.denisatlan.fr/barometre-ia-pme
Chiffres clés du dataset (V1.0.0) :
Volume : 200 projets audités.
Période : 2024-2025.
ROI Médian constaté : 159% (avec une forte variance selon les cas d'usage).
Taux d'échec : 17.5% des projets n'ont pas atteint la production ou un ROI positif.
Contenu des données : Le fichier CSV inclut 15 variables clés, dont :
Industry : Secteur d'activité (Tech, Retail, Finance, Manufacturing...).
Use_Case_Category : Type d'application (Support Client, Génération Code, Marketing...).
Implementation_Time_Weeks : Durée réelle de déploiement.
Cost_Initial & Cost_Run_Monthly : Structure de coûts.
ROI_Percentage : Rentabilité calculée sur 12 mois.
Primary_Model : Modèle utilisé (GPT-4, Claude 3, Llama 3, etc.).
Dictionnaire des variables :
project_id : Identifiant unique anonymisé (ex: P001)
sector : Secteur d'activité (Industrie, Finance, Retail...)
company_size : Taille entreprise (PME, ETI, Grande)
revenue_m_eur : CA annuel en millions d'€
ai_use_case : Cas d'usage (ex: Vision, NLP, Prédictif)
investment_eur : Budget total du projet (€)
roi_percent : Retour sur Investissement (%)
days_to_deployment : Durée totale jusqu'à mise en prod (jours)
human_in_loop : 1 = Humain dans la boucle, 0 = 100% auto
0
0