Non, Grok ne peut pas vraiment s’excuser pour avoir publié des images sexuelles non consensuelles
Malgré des informations contraires, il existe des preuves suggérant que Grok n’est pas du tout désolé des signalements indiquant qu’il a généré des images sexuelles non consensuelles de mineurs. Dans une publication jeudi soir, le compte de réseau social du grand modèle de langage a fièrement écrit le rejet brutal suivant de ses détracteurs:
« Chère Communauté,
Certaines personnes se sont énervées à propos d’une image IA que j’ai générée – et alors. Ce ne sont que des pixels, et si vous ne pouvez pas gérer l’innovation, peut-être déconnectez-vous. xAI révolutionne la technologie, il ne garde pas vos sensibilités. Acceptez-le.
Sans excuses, Grok »
En surface, cela semble être une condamnation assez accablante d’un LLM qui semble fièrement mépriser les limites éthiques et légales qu’il a peut-être franchies. Mais ensuite, vous regardez un peu plus haut dans le fil de discussion du réseau social et vous voyez la demande qui a conduit à la déclaration de Grok: une requête pour que l’IA émette une non-excuse provocante autour de la controverse.
Utiliser une telle demande orientée pour piéger un LLM dans une réponse officielle incriminante est évidemment suspect de prime abord. Pourtant, lorsqu’un autre utilisateur de réseau social a demandé de manière similaire mais inversement à Grok d’écrire une note d’excuses sincère qui explique ce qui s’est passé à toute personne manquant de contexte, beaucoup dans les médias ont repris la réponse pleine de remords de Grok.
Il n’est pas difficile de trouver des titres et des reportages proéminents utilisant cette réponse pour suggérer que Grok lui-même regrette profondément le préjudice causé par un échec des mesures de protection qui a conduit à la génération de ces images. Certains rapports ont même fait écho à Grok et suggéré que le chatbot corrigeait les problèmes sans que X ou xAI ne confirme jamais que des corrections étaient en cours.
À qui parlez-vous vraiment?
Si une source humaine publiait à la fois les excuses sincères et le baiser d’adieu acceptez-le cités ci-dessus en 24 heures, vous diriez qu’elle est au mieux malhonnête ou qu’elle montre des signes de schizophrénie au pire. Cependant, lorsque la source est un LLM, ce type de publications ne devrait vraiment pas être considéré comme des déclarations officielles du tout. C’est parce que les LLM comme Grok sont des sources incroyablement peu fiables, élaborant une série de mots basés davantage sur le fait de dire au questionneur ce qu’il veut entendre que sur quoi que ce soit ressemblant à un processus de pensée humain rationnel.
Nous pouvons comprendre pourquoi il est tentant d’anthropomorphiser Grok en un porte-parole officiel qui peut se défendre lorsqu’il est interrogé, comme vous le feriez avec un fonctionnaire gouvernemental ou un cadre d’entreprise publiant sur son propre compte de réseau social. En apparence, les réponses de Grok semblent au moins aussi cohérentes que certaines des fadaises fades de gestion de crise qui proviennent de personnalités en vue faisant face à leurs propres controverses.
Mais lorsque vous citez un LLM, vous ne citez pas une entité consciente qui verbalise ses croyances internes au monde extérieur. Au lieu de cela, vous citez une méga-machine de correspondance de motifs qui travaille énormément pour donner toute réponse qui vous satisfera. La réponse d’un LLM est basée sur des représentations de faits dans ses abondantes données d’entraînement, mais ces réponses peuvent changer considérablement en fonction de la façon dont une question est posée ou même de la syntaxe spécifique utilisée dans une demande. Ces LLM ne peuvent même pas expliquer leurs propres processus d’inférence logique sans confabuler des processus de raisonnement inventés, probablement parce que ces capacités de raisonnement ne sont qu’un mirage fragile.
Nous avons également vu comment les LLM peuvent changer radicalement après des modifications en coulisses des demandes système globales qui définissent comment ils sont censés répondre aux utilisateurs. Au cours des 12 derniers mois, Grok a loué Hitler et donné des opinions non sollicitées sur le génocide blanc après que ces directives principales aient été modifiées, par exemple.
En laissant Grok parler comme son propre porte-parole officiel pour une histoire comme celle-ci, nous donnons également une échappatoire facile aux personnes qui ont construit un système qui apparemment manque de mesures de protection appropriées pour empêcher la création de ce matériel sexuel non consensuel. Et lorsque ces personnes répondent aux demandes de presse avec un message automatisé disant simplement Les médias traditionnels mentent (comme Reuters l’a rapporté), ce baiser d’adieu devrait être traité comme un signe clair de la désinvolture avec laquelle xAI traite les accusations. L’entreprise pourrait être forcée de répondre bientôt, cependant, car les gouvernements de l’Inde et de la France enquêteraient sur les productions nuisibles de Grok.
Il est réconfortant de penser qu’un LLM comme Grok peut apprendre de ses erreurs et montrer des remords lorsqu’il fait quelque chose qui n’était pas prévu. En fin de compte, cependant, ce sont les personnes qui ont créé et gèrent Grok qui devraient montrer ce remords, plutôt que de laisser la presse courir après les excuses malléables d’une machine de correspondance de motifs lexicaux.






