Accueil / Technologie / Wikipedia signe des accords d’accès prioritaire avec grandes firmes IA

Wikipedia signe des accords d’accès prioritaire avec grandes firmes IA

Wikipedia signe des accords d’accès prioritaire aux données avec de grandes entreprises d’IA

Jeudi, la Wikimedia Foundation a annoncé des accords d’accès API avec Microsoft, Meta, Amazon, Perplexity et Mistral AI, élargissant ses efforts pour inciter les grandes entreprises technologiques à payer pour un accès API à haut volume au contenu de Wikipedia, que ces entreprises utilisent pour entraîner des modèles d’IA comme Microsoft Copilot et ChatGPT.

Ces accords signifient que la plupart des principaux développeurs d’IA ont désormais adhéré au programme Wikimedia Enterprise de la fondation, une filiale commerciale qui vend un accès API à haut débit aux 65 millions d’articles de Wikipedia à des vitesses et des volumes supérieurs à ceux fournis par les API publiques gratuites. Le contenu de Wikipedia reste librement accessible sous licence Creative Commons, mais le programme Enterprise facture un accès plus rapide et à plus haut volume aux données. La fondation n’a pas divulgué les conditions financières des accords.

Les nouveaux partenaires rejoignent Google, qui a signé un accord avec Wikimedia Enterprise en 2022, ainsi que des entreprises plus petites comme Ecosia, Nomic, Pleias, ProRata et Reef Media. Les revenus aident à compenser les coûts d’infrastructure de l’organisation à but non lucratif, qui s’appuie autrement sur de petits dons publics tout en voyant son contenu devenir un élément de base des données d’entraînement pour les modèles d’IA.

« Wikipedia est un composant essentiel du travail de ces entreprises technologiques qu’elles doivent trouver comment soutenir financièrement », a déclaré Lane Becker, président de Wikimedia Enterprise, à Reuters. « Il nous a fallu un peu de temps pour comprendre le bon ensemble de caractéristiques et de fonctionnalités à offrir si nous voulons faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale… mais tous nos partenaires Big Tech voient vraiment la nécessité de s’engager à soutenir le travail de Wikipedia. »

Le coût de la connaissance gratuite

La poussée pour un accès API payant fait suite à des années de hausse des coûts d’infrastructure alors que les entreprises d’IA aspiraient le contenu de Wikipedia à une échelle industrielle. En avril 2025, la fondation a rapporté que la bande passante utilisée pour télécharger du contenu multimédia avait augmenté de 50 pour cent depuis janvier 2024, les bots représentant 65 pour cent des requêtes les plus coûteuses vers l’infrastructure de base malgré seulement 35 pour cent du total des pages vues.

En octobre, la Wikimedia Foundation a révélé que le trafic humain vers Wikipedia avait chuté d’environ 8 pour cent d’une année sur l’autre après que l’organisation ait mis à jour ses systèmes de détection de bots et découvert qu’une grande partie de ce qui semblait être des visiteurs humains étaient en réalité des scrapers automatisés conçus pour échapper à la détection.

Le déclin du trafic menace la boucle de rétroaction qui a soutenu Wikipedia pendant un quart de siècle: les lecteurs visitent, certains deviennent éditeurs ou donateurs, et le contenu s’améliore ostensiblement. Mais aujourd’hui, de nombreux chatbots d’IA et résumés de moteurs de recherche répondent aux questions en utilisant le contenu de Wikipedia sans envoyer les utilisateurs sur le site lui-même.

Pendant ce temps, les propres expériences de la fondation avec l’IA générative ont rencontré la résistance des éditeurs bénévoles qui maintiennent le site. En juin, Wikipedia a suspendu un programme pilote de résumés d’articles générés par IA après que les éditeurs l’aient qualifié d’idée épouvantable et aient averti qu’il pourrait miner la confiance dans la plateforme.

Le fondateur de Wikipedia, Jimmy Wales, a déclaré à l’Associated Press qu’il accueillait favorablement l’entraînement des modèles d’IA sur les données de Wikipedia. « Je suis personnellement très heureux que les modèles d’IA s’entraînent sur les données de Wikipedia parce qu’elles sont gérées par des humains », a déclaré Wales. « Je ne voudrais pas vraiment utiliser une IA qui est entraînée uniquement sur X, vous savez, comme une IA très en colère. » Mais il a tracé une ligne sur l’accès gratuit: « Vous devriez probablement contribuer et payer votre juste part du coût que vous nous imposez. »

Cet article a été mis à jour le 16 janvier 2026 pour corriger l’implication que ces accords impliquent une licence du contenu de Wikipedia, qui reste librement accessible; les entreprises paient pour un accès API de niveau entreprise.

Répondre

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *