L’état de l’art de l’IA : les principaux points à retenir du rapport 2025 sur l’indice d’intelligence artificielle de Stanford

Sommaire

SUIVEZ-NOUS SUR LINKEDIN

L’IA évolue à une vitesse telle qu’il est difficile de prendre une photo qui capture l’état de l’art. En ce sens, le rapport sur l’indice d’intelligence artificielle, préparé par l’Institut pour l’intelligence artificielle centrée sur l’humain de l’Université de Stanford, est fondamental.

L’IA évolue si rapidement que toute image de l’état de l’art est susceptible d’être floue. Cependant, la vitesse des progrès ne peut nous dispenser de réfléchir aux directions que prend l’évolution de l’IA.

Pour tenter de répondre à cette question, il est fortement recommandé de consulter l’Artificial Intelligence Index Report, l’une des études les plus faisant autorité au monde sur l’évolution de l’IA.

Compilé chaque année par l’Institute for Human-Centered Artificial Intelligence (HAI) de l’Université de Stanford, le rapport de l’indice fournit une analyse approfondie des tendances, des avancées technologiques, des applications industrielles et des impacts socio-économiques les plus pertinents de l’IA.

L’édition 2025, fruit des travaux de plus de 50 chercheurs et auteurs, raconte en 8 chapitres et plus de 500 pages l’impact de l’IA sur la recherche, la société, l’économie et la gouvernance mondiale.

Dans cet article, nous vous proposons un résumé clair et concis des 12 principaux points à retenir du rapport. Pour de plus amples informations, veuillez consulter le rapport complet.

Les 12 principaux points à retenir du rapport 2025 sur l’indice d’intelligence artificielle

1. Les performances de l’IA dans les benchmarks les plus complexes continuent de s’améliorer

En 2023, de nouveaux benchmarks tels que MMMU, GPQA et SWE-bench ont été introduits, dans le but de tester les limites des systèmes d’IA avancés. Expliquons brièvement ce qu’ils sont :

  • le MMMU (Massive Multi-discipline Multimodal Understanding) est un test qui évalue la capacité de l’IA à comprendre des contenus complexes et multimodaux (par exemple, du texte et des images) dans différentes disciplines académiques, telles que l’histoire, la biologie, l’économie. Il est utilisé pour mesurer le raisonnement sur des matériaux similaires à ceux que l’on trouve dans les examens universitaires.
  • le GPQA (Graduate-Level Physics Question Answering) est une référence avec des questions de physique avancées, similaires à celles rencontrées dans un doctorat. Il est utilisé pour tester la capacité d’un modèle d’IA à raisonner sur des problèmes scientifiques de haute difficulté.
  • Le SWE-bench (Software Engineering Benchmark) évalue la capacité de l’IA à lire, comprendre et corriger du code logiciel réel issu de projets open source. Il est très utile de comprendre l’efficacité de l’IA en tant qu’assistant de programmation.

Un an plus tard, les modèles d’IA ont montré des améliorations notables, avec des augmentations de 18,8 %, 48,9 % et 67,3 % respectivement sur les trois nouveaux benchmarks. D’énormes progrès ont également été réalisés dans la génération de vidéos de haute qualité, avec des modèles d’IA qui, dans certaines circonstances, ont surpassé les humains dans les tâches de programmation avec des budgets de temps limités.

Le rapport de l’indice souligne toutefois que l’évaluation de l’IA est encore trop centrée sur les performances techniques et propose d’aller au-delà des repères classiques, en adoptant des méthodes plus complètes qui incluent les impacts sociaux, environnementaux, économiques et éthiques. Ce n’est qu’ainsi qu’il sera possible de comprendre si un système d’IA est vraiment « meilleur » et utile pour la société.

2. L’IA est de plus en plus intégrée dans la vie quotidienne

L’IA fait de plus en plus partie de la vie quotidienne. En 2023, la FDA (Food and Drug Administration, une autorité réglementaire américaine dans le secteur pharmaceutique équivalente à l’EMA européenne et à l’AIFA italienne), a approuvé 223 dispositifs médicaux basés sur l’IA, contre seulement 6 approuvés en 2015.

Les voitures autonomes sont également une réalité dans l’industrie automobile : les taxis autonomes de Waymo assurent plus de 150 000 trajets autonomes par semaine dans plusieurs villes américaines, dont San Francisco, Phoenix et Los Angeles, tandis que la flotte Apollo Go de Baidu est active dans de nombreuses villes chinoises.

Mais même dans la vie de tous les jours, les smartphones avec des assistants IA intégrés pour améliorer la recherche d’informations ou l’édition des photos que nous prenons tous les jours sont une réalité pour de plus en plus de personnes.

3. Les entreprises misent sur l’IA, ce qui génère des investissements et une adoption record

À l’échelle mondiale, les investissements des entreprises dans l’IA ont atteint 252,3 milliards de dollars en 2024, avec une croissance de 44,5 % des investissements privés et une augmentation de 12,1 % des fusions et acquisitions par rapport à 2023.

Le secteur de l’IA générative est en plein essor, les investissements privés dans Gen AI atteignant 33,9 milliards de dollars en 2024, soit une augmentation de 18,7 % par rapport à 2023. Le secteur représente aujourd’hui plus de 20 % de l’ensemble des investissements privés liés à l’intelligence artificielle.

Les investissements privés dans le secteur de l’IA sont particulièrement concentrés aux États-Unis, où ils ont atteint 109,1 milliards de dollars en 2024.

L’utilisation professionnelle, c’est-à-dire l’adoption de l’IA, est passée de 55 % l’année précédente à 78 % à l’échelle mondiale, bien que des différences régionales subsistent. En Italie, par exemple, les données de l’Observatoire de l’intelligence artificielle du Politecnico di Milano montrent un écart d’adoption de l’IA entre les grandes entreprises et les PME.

La part de ceux qui ont déclaré utiliser l’IA générative dans au moins une fonction commerciale a également plus que doublé à l’échelle mondiale, passant de 33 % à 71 %. Parmi les facteurs à l’origine de cette augmentation de l’utilisation de l’IA Gen dans l’entreprise, il y a aussi des programmes d’adoption de plus en plus efficaces, comme le montre par exemple le cas de Dojo, la communauté d’adoption de Microsoft Copilot développée par la société de design Logotel pour Italgas.

Une idée importante qui ressort du rapport sur l’indice 2025 est celle relative à la productivité. L’édition précédente faisait déjà état d’études démontrant l’impact positif de l’intégration de l’IA sur la productivité des entreprises et sur la réduction des écarts de compétences parmi les travailleurs. En 2025, cette tendance est corroborée par un nombre croissant de recherches.

4. Les États-Unis dirigent le développement de modèles d’IA phares, mais la Chine rattrape son retard

En ce qui concerne l’IA, le leadership américain (et plus particulièrement la région de San Francisco) semble incontesté pour le moment. Les États-Unis ont produit 40 modèles d’IA notables en 2024, contre 15 pour la Chine.

Cependant, les modèles chinois atteignent des niveaux de performance presque égaux, ce qui réduit considérablement l’écart avec des benchmarks tels que MMLU et HumanEval. La Chine est également en tête pour le nombre de publications scientifiques et de brevets liés à l’IA.

Et ce n’est pas tout : le rapport de l’Index concerne 2024 et ne prend donc pas en compte le phénomène de Deepseek, une startup chinoise qui a acquis une notoriété internationale en janvier 2025 avec le lancement de son modèle de langage DeepSeek-R1, un chatbot disponible gratuitement sur iOS et Android.

Deepseek a rapidement grimpé dans les classements, devenant l’application gratuite la plus téléchargée aux États-Unis et dépassant ChatGPT. Le succès de DeepSeek a également eu un impact immédiat sur les marchés financiers, faisant chuter les actions de sociétés telles que Nvidia et Alphabet. Bien que ces entreprises aient par la suite récupéré leurs pertes, l’affaire « Deepseek » est emblématique de la façon dont la Chine pourrait sérieusement saper le leadership américain dans le domaine de l’IA dans un avenir proche.

5. L’écosystème de l’IA responsable évolue, mais de manière inégale

Selon la base de données des incidents d’IA, un référentiel public qui recueille et documente ces incidents afin de surveiller les risques concrets liés à l’utilisation de l’IA dans le monde réel, le nombre d’incidents liés à l’IA signalés est passé à 233 en 2024, soit une augmentation de 56,4 % par rapport à 2023.

Les incidents liés à l’IA sont définis comme des dysfonctionnements, des abus ou des conséquences néfastes causés par les systèmes d’intelligence artificielle. Bien que leur nombre augmente fortement, les pratiques habituelles d’évaluation de leur sécurité et de leur équité sont encore rares.

Il est vrai que de nouvelles références telles que HELM Safety et FACTS ont vu le jour. La première évalue la sécurité des modèles de langage en testant leur comportement dans des scénarios sensibles, tels que l’utilisation abusive ou la génération de contenus dangereux. La seconde mesure la justesse factuelle des réponses d’un modèle dans un dialogue réaliste, ce qui permet d’identifier les erreurs et les hallucinations.

Malgré ces signes positifs timides, la plupart des entreprises reconnaissent les risques sans prendre de mesures concrètes. Les gouvernements, en revanche, font preuve d’une accélération dans la réglementation de l’IA responsable, comme expliqué au point 8.

6. L’optimisme mondial à l’égard de l’IA augmente, mais avec de fortes différences régionales

Les pays asiatiques tels que la Chine, l’Indonésie et la Thaïlande font preuve d’une grande confiance dans les avantages de l’IA. En Amérique du Nord et en Europe occidentale, cependant, un point de vue plus sceptique prévaut. Cependant, même dans les pays les plus critiques, la confiance augmente par rapport aux années précédentes, ce qui témoigne d’une ouverture croissante à l’égard de l’IA.

7. L’IA devient plus efficace, rentable et accessible

Le coût d’utilisation de modèles similaires à GPT-3.5 a chuté de plus de 280 fois en moins de deux ans. Les progrès matériels et l’essor des modèles open source font tomber les barrières à l’entrée. Les modèles à poids ouvert rivalisent désormais avec les modèles à poids fermé en termes de performances également.

8. Les gouvernements augmentent les investissements et la réglementation de l’IA

En 2024, les États-Unis ont doublé le nombre de réglementations fédérales sur l’IA par rapport à l’année précédente. Toujours en 2024, l’AI Act est entré en vigueur en Europe, un règlement destiné à réglementer le développement et l’utilisation de l’IA dans la Région dans les années à venir, mais qui n’a pas été sans controverse.

Dans le même temps, des pays comme le Canada, la Chine, la France et l’Arabie saoudite ont annoncé des plans de plusieurs milliards de dollars pour l’infrastructure de l’IA. L’attention institutionnelle est aujourd’hui mondiale et transversale.

9. L’enseignement de l’IA et de l’informatique se développe, mais les inégalités persistent

Deux tiers des pays du monde proposent désormais des programmes d’informatique dans l’enseignement obligatoire. Cependant, des obstacles subsistent dans les pays ayant des problèmes d’infrastructure. Aux États-Unis, la plupart des éducateurs pensent que l’IA devrait faire partie de la formation de base, mais peu se sentent prêts à l’enseigner.

10. L’industrie s’accélère, mais la concurrence aux frontières devient féroce

Près de 90 % des modèles d’IA pertinents en 2024 ont été produits par des entreprises, mais la différence entre les modèles phares se réduit. L’écart entre le premier et le dixième modèle dans le classement des performances est tombé à 5,4 %, ce qui indique une densité et une concurrence croissantes au sommet de l’industrie.

11. L’IA reçoit une reconnaissance suprême pour son impact sur la science

En 2024, deux prix Nobel ont été décernés pour des contributions liées à l’IA : l’un en chimie (pour AlphaFold, un système développé par Google DeepMind qui a révolutionné la biologie structurale en prédisant avec une très grande précision la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés), et l’autre en physique (pour les réseaux de neurones). Le prestigieux prix Turing a été décerné aux pionniers de l’apprentissage par renforcement. C’est une confirmation de l’importance centrale que prend l’IA dans la recherche scientifique.

12. La complexité des raisonnements reste un défi non résolu pour l’IA

L’ajout de mécanismes tels que le raisonnement en chaîne de pensée a fait progresser les performances des grands modèles de langage (LLM) dans le raisonnement. Cependant, l’IA continue d’échouer dans des tâches qui nécessitent de la logique, de la planification et de la généralisation dans des contextes complexes. Ces lacunes limitent la fiabilité des modèles dans des domaines critiques tels que la médecine (à quelques exceptions près, dans des tâches uniques telles que la reconnaissance d’images diagnostiques), la finance et la justice.

Pour comprendre ce que l’IA excelle et ce qu’elle ne fait pas, et par conséquent ce qu’il est bon de demander à l’IA et ce sur quoi maintenir un contrôle humain élevé, il peut être intéressant de lire la réflexion d’Ethan Mollick, co-directeur du laboratoire génératif d’IA de l’Université de Wharton et l’un des experts les plus influents sur le sujet de l’IA.

En conclusion : l’optimisme grandit, mais la confiance dans l’IA reste un défi majeur

Le rapport AI Index 2025 dresse le tableau d’un domaine qui évolue non seulement rapidement sur le plan technique, mais qui est aussi profondément lié à la vie quotidienne, à l’économie et à la politique mondiale.

Les progrès des benchmarks, l’innovation matérielle et la réduction des coûts d’utilisation laissent entrevoir des technologies de plus en plus puissantes et accessibles. L’impact sur la science et la médecine, avec des modèles de plus en plus sophistiqués et des capacités de diagnostic supérieures dans certains domaines, est tangible et prometteur. L’optimisme quant au potentiel de l’IA à apporter de vastes avantages à la société augmente également à l’échelle mondiale.

Malgré cette augmentation, les différences régionales et le défi persistant des raisonnements complexes nous rappellent que le chemin de l’IA est encore long et complexe.

De plus, les questions liées à l’impact environnemental, à la désinformation, à l’équité de ces technologies et aux préjugés (biais) dont elles se nourrissent restent ouvertes. Comme le rappellent Yolanda Gil et Raymond Perrault, co-directeurs du rapport, en introduction, « la confiance reste un défi majeur ». Qui sait si l’édition de l’année prochaine du rapport marquera également des progrès significatifs dans cette direction.

Autres articles