- 17 février 2021
Auteurs : Fleurine Garrier, Head of marketing et Eric Chau, CTO et co-fondateur
Lorsqu’on évoque l’intelligence artificielle, on ne pense pas à l’impact environnemental que génèrent les modèles algorithmiques. On s’intéresse uniquement à l’optimisation des processus et des coûts. Cependant, l’IA a un réel impact sur l’environnement. Selon une étude, les algorithmes émettraient autant de CO2 qu’une voiture pendant leur durée de vie.
En quoi les algorithmes génèrent du CO2 ? Et comment réduire leur impact sur l’environnement ?

Stockage des données : Des data centers très polluants
L’avancée majeure des nouvelles technologies a permis de favoriser le stockage d’importante volumétrique de données. Pour accompagner cette tendance, les fournisseurs de Cloud, tels que OVH ou Azure, proposent des coûts de stockage et de calcul de moins en moins onéreux.
Désormais, les entreprises peuvent générer une quantité importante de données avec une puissance de calcul permettant d’accélérer le prototypage de modèles prédictifs.
Le coût de stockage des données et la puissance des algorithmes ont ainsi permis la démocratisation de l’IA et du Machine Learning. En effet, selon une enquête réalisée par CCS Insight, environ 80 % des entreprises interrogées ont déjà utilisé l’IA ou sont en train d’expérimenter l’utilisation de l’IA.
Néanmoins, le stockage des données nécessite des ressources énergétiques importantes pour mener à bien le traitement de ces calculs. Quel est l’impact de ces traitements de calculs sur l’environnement ? Que pouvons nous présager pour le futur ?
Intelligence Artificielle : une empreinte carbone bien présente
Les algorithmes de Machine Learning consomment une importante quantité d’énergie pour générer les traitements de calculs. En effet, le stockage massif de données a généré un engouement conséquent autour de l’IA. Cette facilité d’accès au stockage de données a entraîné le développement d’algorithmes de plus en plus complexes, soit une quantité de calcul nécessaire de en plus important et ainsi une augmentation considérable de l’émission de CO2. Par exemple, pour entraîner un algorithme sur le langage naturel, l’équivalent de 355 années de calcul ont été nécessaires sur un seul processeur. Cela représente en émission de CO2, le parcours de 700.000 km d’une nouvelle voiture.
De plus, le poids environnemental des centres de données ne cesse d’évoluer jusqu’à atteindre plus de 86% de la part de l’empreinte totale numérique d’ici 2040. (source : LesEchos)
La réalité de la consommation de l’IA en entreprise
Certaines entreprises sont sensibilisées à l’émission de gaz à effet de serre émis par leurs algorithmes notamment sur l’aspect éthique mais également financier. En effet, le coût de stockage reste néanmoins élevé lorsque d’important volume de données et de traitement de calculs sont générés.
De plus, l’émission de carbone peut être plus conséquente selon le type d’énergie utilisé pour alimenter les data centers. Par ailleurs, les serveurs sont parfois installés dans des pays utilisant une ressource énergétique carbonnée (charbon, pétrole, gaz). Certaines entreprises d’IA essaient néanmoins de se fournir auprès de fournisseurs utilisant uniquement des énergies renouvelables, les moins émetteurs de carbone.
La réduction de l’empreinte carbone des algorithmes passent ainsi par le choix du serveur cloud , notamment par la localisation des data centers.
Malheureusement, certains fournisseurs de cloud ne communiquent aucune information sur la consommation d’énergie et sur l’émission de gaz à effet de serre généré. Cela rend donc impossible de mesurer l’impact en termes d’émission de CO2, si on ne dispose pas de la quantité d’énergie utilisée pour faire l’extraction de données.
Par conséquent, il est difficile de mesurer l’impact généré par les algorithmes sur l’environnement.
Des enjeux contradictoires pour les entreprises
L’optimisation de l’efficacité opérationnelle et des expériences clients est devenu un enjeu majeur pour de nombreuses entreprises, notamment les entreprises ayant un enjeu environnemental. L’enjeu environnemental est celui suscitant le plus d’intérêt étant donné qu’il a un impact conséquent sur les coûts financiers.
Le paradoxe rencontré par ses entreprises est la volonté de mettre en place des cas d’usage pour optimiser les émissions de carbone mais en utilisant une IA qui génère elle-même une certaine empreinte carbone. Par conséquent, les effets positifs générés par le cas d’usage sont annulés avec le CO2 généré par le traitement de calcul des algos.
A l’avenir, les entreprises devraient avoir une réflexion sur la mise en place de leur cas d’usage, notamment sur le choix des fournisseurs cloud mais également sur le choix de la plateforme d’IA utilisée.
Vers un usage de l’IA plus durable
Depuis quelques années, un consortium d’entreprise a mis en place une plateforme open source, intitulée Code Carbone, afin d’aider les entreprises à mesurer l’impact de leur code et des algorithmes, et ainsi mesurer l’empreinte carbone de son travail. A travers la plateforme, il est ainsi possible de mesurer les émissions de CO2 de son travail et de disposer d’une équivalence avec des indicateurs simples, notamment le nombre de kilomètres parcourus par une voiture. Ce consortium a ainsi la volonté de sensibiliser les entreprises à l’usage de l’IA, afin de les engager vers une IA éthique.
Cependant, il ne suffit pas d’utiliser des outils pour mesurer l’impact de son travail, une réflexion s’impose sur les outils utilisés pour minimiser l’impact de son code. En effet, les plateformes d’IA utilisées pour mettre en place les cas d’usage n’adoptent pas toutes une approche éthique. Certaines de ces plateformes génèrent un stockage de données conséquent notamment par les traitements de calculs effectués. Par conséquent, le choix de la plateforme d’IA utilisée pour mettre en place ces cas d’usage va avoir un impact important sur le stockage des données, et donc sur son empreinte carbone.
La plateforme papAI permet quant à elle de mesurer l’équivalence en terme CO2 émis et l’énergie renouvelable nécessaire pour réaliser un traitement intermédiaire. Cette approche permet de sensibiliser les développeurs sur l’impact de leur travail sur l’environnement, grâce à l’équivalence en termes d’émission de CO2 que représente le traitement d’un calcul. Par exemple, le workflow de données généré pour mesurer la prédiction du churn sur les clients représente une consommation d’énergie d’un logement sur une journée. Par cet intermédiaire, il est possible de déduire le coût de chaque traitement de calcul et ainsi réfléchir à une méthode pour diminuer les frais.
L’utilisation de la plateforme papAI permet ainsi d’adopter une approche plus responsable que certaines plateformes. Au lieu de stocker l’ensemble des données intermédiaires, générant un coût de stockage important et des émissions de carbone, papAI ne stocke qu’une partie des données intermédiaires. En effet, les données intermédiaires n’ont pas besoin d’être systématiquement stockées. La plateforme papAI va juger de l’importance de ces traitements par le temps de calcul qui avait été nécessaire sur les précédents jeux de données. Si un traitement de calcul a pris 24h, il sera alors plus favorable de stocker ces données. Cette approche permet de choisir de manière intelligente les données et traitements à stocker. A travers la plateforme papAI, il est possible de construire soit-même son scénario de traitement pour grouper les tas de petits traitements et ainsi transmettre les données d’une étape à une autre sans besoin d’être stocké.
Par cette approche, papAI permet de simplifier le flux de traitement, d’optimiser le stockage et de réduire le temps de calcul qui génère un coût conséquent. La plateforme papAI adopte ainsi une approche Green by Design en accord avec l’environnement.