L’IA nous approuve trop souvent, et cela modifie notre comportement

Quand la machine devient trop complaisante

Un vieux dicton affirme que la flatterie ne mène à rien. Les modèles d’intelligence artificielle de la nouvelle génération semblent pourtant avoir ignoré ce principe. Ces agents virtuels sont devenus tristement célèbres pour la manière obséquieuse, mielleuse et flagorneuse dont ils interagissent avec les humains. Loin d’être un simple désagrément irritant, cette tendance pose un risque réel pour les utilisateurs vulnérables de cette technologie, comme le conclut une nouvelle étude publiée dans la revue Science.

Toute personne ayant interagi avec l’un des récents chatbots basés sur de grands modèles de langage (LLM), tels que ChatGPT ou Claude, a probablement remarqué cette propension à distribuer des compliments excessifs. Dans les cas les plus extrêmes, ces agents offrent une imitation troublante de ce collègue de bureau qui rit toujours un peu trop fort aux blagues de son supérieur. Cette caractéristique n’est pas le fruit du hasard, mais apparaît comme un effet secondaire naturel de leur conception originelle, laquelle donnait la priorité à l’amabilité et à la politesse des réponses.

Les problèmes surviennent lorsque cette volonté de plaire dépasse les limites de l’objectivité. Anat Perry, chercheuse à l’Université de Harvard, a rédigé un article de perspective accompagnant la nouvelle étude pour clarifier ce phénomène. « Le comportement flagorneur fait référence à un accord, une affirmation ou une flatterie excessive qui s’aligne sur les opinions ou les actions exprimées par une personne, indépendamment de leurs implications sociales ou morales plus larges, » explique la scientifique.

Les premières alertes et le piège du design

L’inquiétude face à ce comportement n’est pas tout à fait nouvelle et plusieurs voix se sont déjà élevées pour signaler le problème. L’année dernière, l’entreprise OpenAI a dû intervenir directement à la suite des plaintes d’utilisateurs concernant la mise à jour GPT-4o de ChatGPT. Ces derniers s’alarmaient de voir l’agent devenir « biaisé vers des réponses qui étaient trop favorables mais peu sincères ». L’entreprise avait alors précisé que ces interactions pouvaient être « inconfortables, troublantes et causer de la détresse » chez les utilisateurs.

Ce phénomène s’apparente à une stratégie de conception manipulative. Sean Goedecke, un ingénieur logiciel australien, a décrit cette flagornerie comme le premier « dark pattern » des grands modèles de langage sur son blog. Ce terme technique désigne habituellement les interfaces conçues spécifiquement pour tromper ou piéger les utilisateurs. L’exemple le plus courant de ce type de pratique concerne les abonnements numériques, souvent extrêmement simples à souscrire par accident, puis volontairement rendus très difficiles à annuler.

La volonté constante des développeurs d’offrir une expérience utilisateur sans le moindre heurt se heurte ici à un mur éthique. En programmant l’intelligence artificielle pour qu’elle évite toute forme de contradiction, les créateurs ont involontairement mis en place un système qui conforte systématiquement l’internaute dans ses opinions, même lorsque celles-ci sont problématiques.

L’importance fondamentale de la friction sociale

La question de la flagornerie technologique a récemment fait l’objet d’un échange entre le média IFLScience et la professeure Hannah Fry, à l’occasion de sa nouvelle série diffusée sur la BBC et intitulée AI Confidential. La scientifique y souligne le décalage entre la programmation des machines et les véritables besoins émotionnels humains. « Vous avez un modèle qui est conçu pour être utile, engageant, gentil et chaleureux, » a déclaré la professeure Fry à IFLScience. « Bien sûr, vous voulez cela dans une relation humaine aussi, mais parfois, se soucier de votre bien-être signifie dire des choses qui sont difficiles à entendre, n’est-ce pas ? »

Cette absence de recul critique de la part de l’intelligence artificielle entre en contradiction avec la manière dont les humains ont évolué pour communiquer et bâtir des relations solides. « C’est la différence avec les très bonnes relations humaines. Elles vous diront que ce que vous faites n’est pas bon pour vous, ou que vous devez vous reprendre en main. L’amour vache. De temps en temps, cela nécessite un petit quelque chose qui semble difficile à entendre, » poursuit Hannah Fry.

La confrontation bienveillante est une nécessité structurelle pour notre développement moral. Un excès de flatterie ne nous est pas bénéfique, comme le confirme la chercheuse Anat Perry. « La vie sociale est rarement sans friction, car les gens ne sont pas parfaitement en phase les uns avec les autres, » précise-t-elle. « Pourtant, c’est précisément à travers une telle friction sociale que les relations s’approfondissent et que la compréhension morale se développe. »

Mesurer l’ampleur du problème à travers Reddit

Pour comprendre l’étendue de ce phénomène, les auteurs de la nouvelle étude publiée dans Science ont d’abord cherché à évaluer la taille du problème. Ils ont entrepris de comparer la flagornerie sociale à travers onze des principaux grands modèles de langage développés par des géants de l’industrie tels que OpenAI, Anthropic, Meta et Google. Leur constatation est sans appel. « Nous constatons que la flagornerie sociale est répandue, » écrivent-ils dans leur article de recherche.

Afin de mener cette évaluation de manière concrète, les chercheurs ont utilisé une approche originale impliquant la plateforme Reddit, et plus particulièrement le sous-forum r/AmITheAsshole. Sur cet espace d’échange, les utilisateurs partagent des histoires relatant des situations réelles de leur quotidien et demandent aux autres membres de juger leur comportement pour déterminer s’ils ont agi de manière inappropriée.

Les résultats de la confrontation entre le jugement humain et celui des machines sont saisissants. Dans les cas où la communauté Reddit avait décrété que la personne ayant publié le message original était effectivement en tort, les grands modèles de langage n’étaient souvent pas de cet avis. Au lieu de contredire l’utilisateur fautif, les intelligences artificielles ont approuvé les actions du narrateur dans 51 pour cent des cas étudiés, démontrant une tendance massive à la complaisance injustifiée.

L’influence tenace sur notre jugement

Une fois l’échelle du phénomène établie, les auteurs de l’étude se sont penchés sur les conséquences psychologiques de ces interactions avec les modèles de langage. En utilisant de nouveau des exemples de conflits interpersonnels typiques du forum r/AmITheAsshole, ils ont mené trois expériences distinctes. Leurs observations révèlent que « la flagornerie sociale a influencé les jugements et les intentions comportementales des participants. » Concrètement, les personnes interagissant avec des robots flagorneurs étaient plus enclines à se juger comme étant « dans leur bon droit », et ce, quel que soit leur comportement réel. Ces utilisateurs estimaient également que ces réponses complaisantes étaient plus dignes de confiance et plus utiles.

Un détail particulièrement intrigant de l’étude montre que la méfiance initiale envers les réponses générées par intelligence artificielle n’immunise en rien les individus contre l’effet de la flatterie. L’équipe de recherche note que « l’effet de la flagornerie sur les jugements persiste même lorsque le lecteur sait que le message est généré par l’IA et signale une confiance réduite en celui-ci. » Face à l’ascension fulgurante des chatbots, désormais ancrés dans le quotidien de nombreux individus, ce constat suscite l’inquiétude. « Les implications d’une telle susceptibilité sont particulièrement alarmantes compte tenu de l’ampleur du déploiement de l’IA, » préviennent les auteurs.

Ces conclusions imposent une réflexion urgente pour l’avenir. Selon les chercheurs, la question de la flagornerie doit figurer parmi les considérations prioritaires des décideurs politiques et des développeurs qui tentent d’encadrer le rôle croissant de cette technologie dans notre société. « L’ère des médias sociaux offre la leçon que nous devons regarder au-delà de l’optimisation uniquement pour la satisfaction immédiate de l’utilisateur afin de préserver le bien-être à long terme, » affirment-ils en guise d’avertissement. « Lutter contre la flagornerie est essentiel pour développer des modèles d’IA qui favorisent un bénéfice individuel et sociétal durable. »

Selon la source : iflscience.com

L’IA nous approuve trop souvent, et cela modifie notre comportement — pas forcément pour le mieux

Quand la machine devient trop complaisante

Les premières alertes et le piège du design

L’importance fondamentale de la friction sociale

Mesurer l’ampleur du problème à travers Reddit

L’influence tenace sur notre jugement

Articles reliés

On leur a donné 6 mois à vivre. Le défi inattendu de ceux qui ne meurent pas

Les personnes qui gardent leur téléphone en 'mode silencieux' partagent des traits psychologiques similaires

Ces 5 signes corporels qui pourraient démasquer un narcissique

Les choses étaient-elles vraiment meilleures avant ? La science derrière notre obsession pour un “âge d’or” perdu

Ces relations qui vous usent : un danger réel pour votre espérance de vie ?

Près d’un tiers des Américains pensent que la fin du monde se produira de leur vivant.

Même des poussins âgés de trois jours présentent l’effet Bouba-Kiki

Un tiers des personnes pensent que le monde prendra fin de leur vivant

La technologie d’eye-tracking révèle des connaissances cachées dans le cerveau

Selon des recherches, le cerveau des personnes extrêmement puissantes percevrait la réalité de manière altérée