L’informatique quantique aide l’IA à surpasser ses limites de mémoire avec peu de paramètres
Auteur: Mathieu Gagnon
Le défi croissant des ressources informatiques

Selon un rapport du journaliste Sam Jarman publié par le média Phys.org, les agents conversationnels propulsés par de grands modèles de langage sont devenus un élément central du quotidien de millions de personnes. Ces systèmes d’intelligence artificielle connaissent une croissance très rapide, mais leur mise à l’échelle requiert de plus en plus de ressources informatiques et financières.
Face à ce défi matériel, une équipe de chercheurs dirigée par Borja Aizpurua, travaillant au sein de l’entreprise Multiverse Computing basée à Saint-Sébastien en Espagne, a proposé une nouvelle approche. Leurs travaux récents ont été partagés par le biais d’une prépublication sur le serveur arXiv.
Cette étude scientifique met en lumière une méthode permettant d’améliorer les performances de ces intelligences artificielles grâce à l’informatique quantique. Les scientifiques estiment que cette approche novatrice pourrait représenter une alternative bien plus intelligente que la simple accumulation de matériel informatique traditionnel pour résoudre un problème hautement technique.
Le problème majeur de la gourmandise en paramètres

Les architectures complexes, telles que celles qui font fonctionner les célèbres applications ChatGPT et Claude, reposent sur l’apprentissage d’un nombre gigantesque de paramètres ajustables. Ces éléments structurels fonctionnent en symbiose pour déterminer la manière dont le modèle informatique traite l’information et génère du texte de manière cohérente.
La règle générale observée par les experts du domaine stipule que plus un modèle possède de paramètres, plus ses performances tendent à s’améliorer de manière significative. Cependant, chaque paramètre individuel nécessite de la mémoire physique pour être stocké, ce qui pose un défi logistique croissant et engendre des coûts de gestion extrêmement élevés à mesure que la taille de ces logiciels augmente.
L’impact de cette croissance mathématique est particulièrement visible sur les modèles de pointe de l’industrie technologique actuelle. À titre d’exemple concret, les estimations concernant la future version GPT-5.5 indiquent qu’elle pourrait contenir entre deux et cinq billions de paramètres, illustrant parfaitement la complexité sans précédent de la gestion de cette mémoire informatique.
L’intégration novatrice des circuits quantiques

Afin de contourner ces contraintes matérielles sévères, l’équipe de Multiverse Computing a pris la décision de se tourner vers l’énorme potentiel de calcul de l’informatique quantique. Au lieu d’ajouter des quantités massives de nouveaux paramètres classiques, les scientifiques ont inséré de petits blocs de circuits quantiques directement dans le fonctionnement interne d’un modèle pré-entraîné.
Cette intégration stratégique fonctionne de manière optimale car ces blocs spécifiques sont capables d’encoder des relations mathématiques particulièrement complexes sous une forme hautement compacte. Ils parviennent ainsi à accomplir des tâches de traitement d’information qui nécessiteraient autrement l’ajout de milliers de paramètres conventionnels supplémentaires.
Le système final mis au point par les chercheurs espagnols fonctionne de manière résolument hybride. L’architecture originale du modèle s’exécute de façon standard sur un ordinateur classique, tandis que les composants quantiques dédiés sont directement pris en charge par le processeur quantique supraconducteur de 156 qubits d’IBM.
Des améliorations concrètes de la fiabilité

Lorsque l’équipe dirigée par Borja Aizpurua a appliqué cette approche technologique au modèle Llama 3.1 8B, une architecture dotée de huit milliards de paramètres développée par l’entreprise Meta, les résultats ont validé leur théorie. Ils ont obtenu une réduction de 1,4 % de la perplexité, une mesure clé utilisée pour évaluer la fiabilité avec laquelle un modèle parvient à prédire le mot suivant dans une séquence de texte.
Ce gain de précision a été rendu possible tout en n’ajoutant que 6 000 paramètres supplémentaires à la structure existante. Pour mettre ce chiffre précis en perspective, cette légère modification représente une augmentation totale de moins d’un dix-millième de pour cent de la taille initiale du logiciel.
Les scientifiques ont également mis leur plateforme à l’épreuve sur SmolLM2, un modèle plus petit contenant 135 millions de paramètres, choisi spécifiquement car il était plus facile à étudier de manière systématique. Les observations ont révélé que les performances s’amélioraient de façon constante à mesure que la taille des composants quantiques augmentait, et que ce modèle enrichi était capable de répondre correctement à des questions sur lesquelles deux versions purement classiques du même outil échouaient totalement.
Une voie prometteuse pour les futurs processeurs

Dans l’immédiat, les auteurs de l’étude admettent de manière transparente que les gains de performance obtenus demeurent relativement modestes. Cette limite opérationnelle actuelle s’explique principalement par les capacités encore restreintes du matériel de pointe disponible aujourd’hui sur le marché.
Néanmoins, le simple fait de démontrer qu’une telle amélioration technologique est techniquement viable sur un outil réel et largement utilisé constitue une avancée majeure. Le groupe de recherche est convaincu que l’efficacité s’améliorera proportionnellement à la puissance et à la fiabilité des futurs dispositifs, ouvrant potentiellement une voie inédite pour développer une technologie plus performante, sans subir les coûts d’infrastructure qui menacent l’avenir économique du secteur.
Pour une transparence absolue concernant les fondements de ces travaux, les détails de publication se réfèrent à l’article intitulé « Grands modèles de langage améliorés quantiquement sur du matériel quantique via des adaptateurs unitaires de Cayley », rédigé par Borja Aizpurua et ses collaborateurs, publié sur le serveur arXiv avec la mention de l’année 2026 sous l’identifiant DOI: 10.48550/arxiv.2605.05914.
Selon la source : phys.org