L'informatique quantique aide l'IA à surpasser ses limites de mémoire avec peu de paramètres

Le défi croissant des ressources informatiques

Selon un rapport du journaliste Sam Jarman publié par le média Phys.org, les agents conversationnels propulsés par de grands modèles de langage sont devenus un élément central du quotidien de millions de personnes. Ces systèmes d’intelligence artificielle connaissent une croissance très rapide, mais leur mise à l’échelle requiert de plus en plus de ressources informatiques et financières.

Face à ce défi matériel, une équipe de chercheurs dirigée par Borja Aizpurua, travaillant au sein de l’entreprise Multiverse Computing basée à Saint-Sébastien en Espagne, a proposé une nouvelle approche. Leurs travaux récents ont été partagés par le biais d’une prépublication sur le serveur arXiv.

Cette étude scientifique met en lumière une méthode permettant d’améliorer les performances de ces intelligences artificielles grâce à l’informatique quantique. Les scientifiques estiment que cette approche novatrice pourrait représenter une alternative bien plus intelligente que la simple accumulation de matériel informatique traditionnel pour résoudre un problème hautement technique.

Le problème majeur de la gourmandise en paramètres

Les architectures complexes, telles que celles qui font fonctionner les célèbres applications ChatGPT et Claude, reposent sur l’apprentissage d’un nombre gigantesque de paramètres ajustables. Ces éléments structurels fonctionnent en symbiose pour déterminer la manière dont le modèle informatique traite l’information et génère du texte de manière cohérente.

La règle générale observée par les experts du domaine stipule que plus un modèle possède de paramètres, plus ses performances tendent à s’améliorer de manière significative. Cependant, chaque paramètre individuel nécessite de la mémoire physique pour être stocké, ce qui pose un défi logistique croissant et engendre des coûts de gestion extrêmement élevés à mesure que la taille de ces logiciels augmente.

L’impact de cette croissance mathématique est particulièrement visible sur les modèles de pointe de l’industrie technologique actuelle. À titre d’exemple concret, les estimations concernant la future version GPT-5.5 indiquent qu’elle pourrait contenir entre deux et cinq billions de paramètres, illustrant parfaitement la complexité sans précédent de la gestion de cette mémoire informatique.

L’intégration novatrice des circuits quantiques

Afin de contourner ces contraintes matérielles sévères, l’équipe de Multiverse Computing a pris la décision de se tourner vers l’énorme potentiel de calcul de l’informatique quantique. Au lieu d’ajouter des quantités massives de nouveaux paramètres classiques, les scientifiques ont inséré de petits blocs de circuits quantiques directement dans le fonctionnement interne d’un modèle pré-entraîné.

Cette intégration stratégique fonctionne de manière optimale car ces blocs spécifiques sont capables d’encoder des relations mathématiques particulièrement complexes sous une forme hautement compacte. Ils parviennent ainsi à accomplir des tâches de traitement d’information qui nécessiteraient autrement l’ajout de milliers de paramètres conventionnels supplémentaires.

Le système final mis au point par les chercheurs espagnols fonctionne de manière résolument hybride. L’architecture originale du modèle s’exécute de façon standard sur un ordinateur classique, tandis que les composants quantiques dédiés sont directement pris en charge par le processeur quantique supraconducteur de 156 qubits d’IBM.

Des améliorations concrètes de la fiabilité

Lorsque l’équipe dirigée par Borja Aizpurua a appliqué cette approche technologique au modèle Llama 3.1 8B, une architecture dotée de huit milliards de paramètres développée par l’entreprise Meta, les résultats ont validé leur théorie. Ils ont obtenu une réduction de 1,4 % de la perplexité, une mesure clé utilisée pour évaluer la fiabilité avec laquelle un modèle parvient à prédire le mot suivant dans une séquence de texte.

Ce gain de précision a été rendu possible tout en n’ajoutant que 6 000 paramètres supplémentaires à la structure existante. Pour mettre ce chiffre précis en perspective, cette légère modification représente une augmentation totale de moins d’un dix-millième de pour cent de la taille initiale du logiciel.

Les scientifiques ont également mis leur plateforme à l’épreuve sur SmolLM2, un modèle plus petit contenant 135 millions de paramètres, choisi spécifiquement car il était plus facile à étudier de manière systématique. Les observations ont révélé que les performances s’amélioraient de façon constante à mesure que la taille des composants quantiques augmentait, et que ce modèle enrichi était capable de répondre correctement à des questions sur lesquelles deux versions purement classiques du même outil échouaient totalement.

Une voie prometteuse pour les futurs processeurs

Dans l’immédiat, les auteurs de l’étude admettent de manière transparente que les gains de performance obtenus demeurent relativement modestes. Cette limite opérationnelle actuelle s’explique principalement par les capacités encore restreintes du matériel de pointe disponible aujourd’hui sur le marché.

Néanmoins, le simple fait de démontrer qu’une telle amélioration technologique est techniquement viable sur un outil réel et largement utilisé constitue une avancée majeure. Le groupe de recherche est convaincu que l’efficacité s’améliorera proportionnellement à la puissance et à la fiabilité des futurs dispositifs, ouvrant potentiellement une voie inédite pour développer une technologie plus performante, sans subir les coûts d’infrastructure qui menacent l’avenir économique du secteur.

Pour une transparence absolue concernant les fondements de ces travaux, les détails de publication se réfèrent à l’article intitulé « Grands modèles de langage améliorés quantiquement sur du matériel quantique via des adaptateurs unitaires de Cayley », rédigé par Borja Aizpurua et ses collaborateurs, publié sur le serveur arXiv avec la mention de l’année 2026 sous l’identifiant DOI: 10.48550/arxiv.2605.05914.

Selon la source : phys.org

L’informatique quantique aide l’IA à surpasser ses limites de mémoire avec peu de paramètres

Le défi croissant des ressources informatiques

Le problème majeur de la gourmandise en paramètres

L’intégration novatrice des circuits quantiques

Des améliorations concrètes de la fiabilité

Une voie prometteuse pour les futurs processeurs

Articles reliés

Des scientifiques créent des cerveaux artificiels à partir de cellules vivantes

L’humanité pourrait atteindre la singularité d’ici seulement 4 ans, selon les tendances

Le cerveau prendrait ses décisions bien avant que nous n'y pensions vraiment

Des physiciens créent des particules hybrides lumière-matière assez puissantes pour effectuer des calculs

Bill Gates affirme que seuls 3 métiers survivront à l’IA, l’intelligence artificielle lui répond

Des scientifiques ont modifié le code fondamental d’un organisme vivant. Il n’aurait pas dû survivre, mais il l’a fait

Un électrocardiogramme dopé à l’IA détecte les premiers signes d’insuffisance cardiaque

Des chercheurs conçoivent un neurone artificiel capable de communiquer avec un véritable cerveau

Un scientifique affirme que l’IA pourrait développer une véritable conscience d’ici 15 ans

Google injecte 40 milliards dans l'IA : les chiffres fous derrière le pari sur Anthropic