Accueil / Intelligence artificielle / Le serveur de prépublication arXiv bannira les auteurs de contenus générés par l’IA contenant des hallucinations

Le serveur de prépublication arXiv bannira les auteurs de contenus générés par l’IA contenant des hallucinations

Le serveur de prépublications arXiv interdira les soumetteurs d’hallucinations générées par IA

Le serveur de prépublications arXiv, très respecté, annonce qu’il interdira les auteurs qui soumettent des articles contenant de fausses références générées par intelligence artificielle, qualifiant le problème de « très préoccupant ».

Dans une déclaration politique publiée le 15 janvier, arXiv a décrit ses nouvelles directives pour lutter contre les hallucinations de l’IA, un terme désignant les fausses informations générées par les grands modèles de langage et autres outils d’IA.

« Les références fabriquées par l’IA constituent une violation grave des normes scientifiques et académiques », a éclaré arXiv. « De telles violations, lorsqu’elles sont détectées, entraîneront le retrait des soumissions et, dans les cas graves, l’interdiction de soumettre de l’auteur. »

Les hallucinations de l’IA peuvent prendre plusieurs formes. L’une des plus courantes est celle des fausses références dans les listes bibliographiques. Les grands modèles de langage comme ChatGPT peuvent générer des citations d’apparence authentique pour des articles scientifiques qui n’existent pas réellement.

« Nous avons observé une augmentation de la fréquence à laquelle ces références fabriquées par l’IA apparaissent dans les articles soumis, et considérons cela comme très préoccupant », a déclaré arXiv.

Ce problème est devenu si répandu que des chercheurs ont développé des outils pour le détecter. Une étude de 2024 a découvert que des milliers d’articles dans les bases de données scientifiques publiées contenaient de fausses références, un nombre qui augmente chaque mois.

Au-delà des fausses citations, arXiv surveille également les soumissions d’articles dont tout le contenu a été généré par IA. Le serveur exige que les auteurs certifient que les soumissions représentent un « travail scientifique original » qu’ils ont « créé ou co-créé ».

« Des soumissions récentes utilisant exclusivement des outils d’IA pour générer du contenu ont soulevé des questions sur la satisfaction de cette exigence », a noté arXiv.

Bien que arXiv autorise l’utilisation d’outils d’IA dans le cadre du processus de recherche et de rédaction, le serveur a clairement indiqué que les auteurs conservent la responsabilité de garantir l’exactitude de leur travail, y compris toutes les références.

« Les auteurs sont responsables du contenu de leurs soumissions et doivent vérifier toutes les références », ont déclaré les modérateurs d’arXiv.

La politique met également en garde contre « le plagiat automatisé », qui se produit lorsque les outils d’IA copient trop étroitement des travaux existants sans citation appropriée.

ArXiv, qui héberge plus de 2,4 millions d’articles scientifiques, sert de dépôt vital pour les chercheurs souhaitant partager leurs travaux avant l’évaluation par les pairs. La plateforme a longtemps maintenu des normes strictes de modération pour garantir la qualité.

La nouvelle politique entre en vigueur immédiatement. ArXiv a déclaré que son équipe de modération restera vigilante pour détecter les signes de contenu généré par IA problématique.

Répondre