L’intelligence artificielle réinvente Néandertal : pourquoi ses images sont fausses
Auteur: Mathieu Gagnon
Une prudence nécessaire face aux algorithmes génératifs

Il existait déjà de nombreuses raisons d’aborder les résultats de l’intelligence artificielle générative avec une certaine méfiance, sans même évoquer la quantité énorme d’énergie que ces systèmes dévorent. Récemment, des scientifiques ont mis en lumière un nouveau motif de préoccupation, qui concerne directement l’interprétation de requêtes exigeant une rigueur scientifique. Ce constat émane des travaux de Matthew Magnani, de l’Université du Maine, et de Jon Clindaniel, de l’Université de Chicago.
Ces chercheurs ont entrepris de tester les capacités de ChatGPT et de DALL-E en leur demandant d’illustrer, par des mots et des images, l’apparence et le mode de vie de nos ancêtres Néandertaliens. Les résultats se sont avérés problématiques : les intelligences artificielles ont produit des images et des textes grossièrement inexacts. Alors que les Néandertaliens peuvent sembler primitifs comparés à l’Homo sapiens moderne qui déambule avec ses tablettes, ses smartphones et autres gadgets, les programmes informatiques ont, pour leur part, dramatiquement simplifié l’espèce.
Cette expérience soulève des questions fondamentales sur la fiabilité des outils numériques dans la vulgarisation scientifique. En voulant représenter le passé, ces algorithmes semblent régresser, effaçant des décennies de progrès archéologiques pour revenir à des visions obsolètes. L’étude menée par ces deux universitaires souligne à quel point la technologie, censée être de pointe, peut paradoxalement nous ramener en arrière.
Le retour des vieux stéréotypes du XXe siècle
Les résultats visuels obtenus par les chercheurs sont frappants par leur anachronisme. Les figures humaines générées apparaissent vaguement humaines, couvertes de poils et courbées, adoptant une allure simiesque. Cette posture évoque davantage les chimpanzés ou les australopithèques plus primitifs qu’une espèce qui a émergé juste avant l’Homo sapiens et qui s’est même métissée avec lui. Les images montrent des mâchoires exagérées et des arcades sourcilières proéminentes, bien plus saillantes que sur les véritables crânes de Néandertaliens.
Dans leur étude récemment publiée dans la revue Advances in Archaeological Practice, Matthew Magnani et Jon Clindaniel dressent un constat sévère : « Une majorité d’images dépeignent des figures à l’apparence humaine, légèrement voûtées, avec de grandes quantités de poils corporels. Ces représentations ont plus en commun avec les dessins de Néandertaliens du début du XXe siècle qu’avec les connaissances scientifiques contemporaines. Nos Néandertaliens version IA présentent [des caractéristiques physiques] trop extrêmes pour entrer dans la variabilité phénotypique néandertalienne. »
Il est également notable que le profil crânien généré par l’IA est drastiquement plus bas que la réalité. De plus, une omission significative a été relevée par les auteurs de l’étude : il n’y avait presque aucune représentation de femmes ou d’enfants dans les visuels produits. Bien que les images générées par des requêtes d’experts aient montré, après révision, des sujets avec moins de pilosité et des structures faciales plus précises, les défauts majeurs persistaient initialement.
L’évolution de la perception scientifique : de 1860 à nos jours

Pour comprendre l’origine de cette désinformation relayée par ChatGPT et DALL-E, il faut remonter aux années 1860, lorsque les premiers restes squelettiques de Néandertaliens ont été exhumés. À cette époque, les archéologues interprétaient ces ossements comme appartenant à un hominidé primitif, voûté et velu, dont le crâne ressemblait davantage à celui d’un chimpanzé qu’à un crâne humain. Cette vision s’est ancrée dans l’imaginaire collectif.
Les chercheurs Susan Peeters et Hub Zwart, dans une étude précédente, avaient qualifié cette ancienne interprétation de « prototype grossier de notre propre espèce ». C’était l’image dominante à la fin du XIXe siècle. Au tournant du XXe siècle, les dioramas de musées tentant de reproduire les Néandertaliens et leur environnement les dépeignaient d’une manière qui ne ressemble que vaguement à la façon dont ils sont compris aujourd’hui.
Cependant, l’accumulation de découvertes a transformé cette vision. Dès les années 1950, des preuves de comportements complexes, initialement inattendus, ont commencé à modifier l’imaginaire autour de ces hominidés. Les données génétiques les ont liés aux humains modernes. L’analyse des outils en pierre anciens, des restes de feu, des traces de plantes médicinales et des marques sur les os d’animaux nous a donné une idée précise de leur façon de chasser et de survivre. On sait même aujourd’hui que les Néandertaliens avaient peut-être trouvé le moyen de confectionner des vêtements ajustés, du moins dans une certaine mesure.
Le problème de la « boîte noire » et des données payantes

La question cruciale reste de savoir quelles informations sont utilisées pour entraîner ces intelligences artificielles génératives. Ces programmes tendent à fonctionner comme des « boîtes noires », laissant place à la spéculation. Toutefois, nous savons que ces systèmes constituent leurs ensembles de données d’entraînement en aspirant le contenu disponible sur Internet. C’est ici que le bât blesse : même si l’accès ouvert rend de nombreux articles scientifiques disponibles au public, beaucoup d’autres restent protégés par des murs payants (paywalls).
Cette barrière rend l’information scientifique récente et pointue beaucoup plus difficile à collecter pour les algorithmes. En conséquence, et parce que d’autres matériels protégés par le droit d’auteur sont inaccessibles, l’information la plus facilement récoltée s’avère souvent être la plus datée. Les idées obsolètes, mais libres d’accès, prédominent dans la masse de données ingérée par l’IA.
Ce phénomène est devenu évident lorsque Clindaniel et Magnani ont soumis aux programmes d’IA des requêtes émanant tant d’experts que de non-experts. Lorsqu’ils ont généré une centaine d’images en sollicitant DALL-E, les visuels produits étaient beaucoup plus proches des idées anciennes sur la morphologie et le mode de vie des Néandertaliens, ces vieilles conceptions étant largement disponibles gratuitement en ligne.
Textes simplistes et impact sur l’imaginaire futur
Les chercheurs ont observé des résultats légèrement moins stéréotypés lorsqu’ils ont demandé à l’IA de fournir des descriptions textuelles. Les textes générés mentionnaient effectivement des technologies néandertaliennes connues impliquant la pierre, le bois, le feu et les peaux d’animaux. L’IA suggérait également qu’ils chassaient et profitaient des plantes comestibles poussant à proximité.
Néanmoins, même dans ces descriptions écrites, les connaissances sur lesquelles l’IA s’appuyait étaient largement archaïques. Le résultat final faisait apparaître nos ancêtres hominidés comme étant moins culturellement complexes qu’ils ne l’étaient en réalité. L’IA offrait une vision simplifiée, incapable de capturer la richesse des découvertes récentes sur la sophistication de la vie néandertalienne.
La conclusion des chercheurs est sans appel quant à l’influence de ces technologies sur notre perception de l’histoire. Matthew Magnani et Jon Clindaniel affirment : « Nos recherches actuelles suggèrent que la manière dont nous structurons et rendons l’information disponible influencera directement la production de l’IA et, par extension, la manière dont nous imaginons le passé. À l’avenir, les politiques de données informeront la manière dont le matériel archéologique est écrit et visualisé. »
Selon la source : popularmechanics.com
Créé par des humains, assisté par IA.