L’intelligence artificielle passe à la vitesse de la lumière : une percée optique majeure qui menace les géants du calcul
Auteur: Adam David
Le goulot d’étranglement de l’IA enfin dépassé ?

L’avancée fulgurante de l’intelligence artificielle, notamment avec les grands modèles de langage (LLM), se heurte depuis quelques années à une barrière physique : la vitesse de traitement des données. Mais des chercheurs affirment avoir trouvé une solution radicale. En remplaçant l’électricité par la lumière, ils pourraient effectuer les calculs fondamentaux de l’IA en une seule étape et à une vitesse quasiment instantanée.
Cette architecture informatique optique, développée par l’Université Aalto en Finlande, n’est pas seulement plus rapide ; elle promet d’être beaucoup moins énergivore que les systèmes électroniques actuels, ouvrant la voie à des modèles d’IA d’une taille et d’une complexité jusqu’ici inimaginables, peut-être même à l’IA générale.
Quand le tenseur fait flancher le GPU

Pour comprendre l’ampleur de cette percée, il faut se pencher sur la mécanique interne des LLM. Le cœur de presque tout traitement informatique moderne, y compris l’IA, repose sur le calcul tensoriel. Quand un modèle comme GPT est entraîné à reconnaître une image ou à générer du texte, il doit organiser des quantités massives d’informations sous forme de « tenseurs » – imaginez un gigantesque classeur numérique étiqueté pour accélérer l’accès aux données.
Si cette méthode est efficace, le volume de données à traiter aujourd’hui est tel que les systèmes électroniques classiques, dominés par les processeurs graphiques (GPU), sont poussés à leurs limites. La vitesse, l’évolutivité et, surtout, la consommation énergétique des fermes de GPU sont devenues le principal goulot d’étranglement limitant la taille maximale que les modèles d’IA peuvent atteindre.
L’énigme du calcul optique parallèle

C’est là qu’intervient l’optique. Depuis longtemps, les chercheurs savent que les systèmes basés sur la lumière sont intrinsèquement plus rapides et beaucoup moins gourmands en énergie que leurs homologues électroniques. Le problème, c’est que les systèmes optiques traditionnels ne pouvaient pas fonctionner en parallèle de manière efficace, contrairement aux milliers de GPU interconnectés qui constituent la colonne vertébrale des entraînements chez OpenAI ou Google.
Il faut dire que si certains estiment qu’il suffirait d’ajouter toujours plus de GPU pour atteindre des formes d’IA très puissantes, d’autres considèrent qu’un changement radical d’architecture est indispensable pour atteindre la capacité de calcul requise. L’équipe finlandaise a décidé de s’attaquer à cette limite structurelle du calcul optique.
Le projet POMMM : une opération instantanée

L’équipe du département d’électronique et de nanoingénierie de l’université Aalto propose une nouvelle architecture baptisée « multiplication matricielle optique parallèle » (POMMM). Leur démonstration est saisissante : le système parvient à effectuer simultanément plusieurs calculs tensoriels complexes en une seule impulsion lumineuse.
« Notre méthode effectue les mêmes types d’opérations que les GPU actuels, comme les convolutions et les couches d’attention, mais à la vitesse de la lumière », a expliqué Yufeng Zhang, membre du groupe de photonique. Concrètement, au lieu de s’appuyer sur des circuits électroniques qui transfèrent des charges, les chercheurs utilisent les propriétés physiques de la lumière pour effectuer les calculs de manière massivement parallèle.
De la donnée numérique à l’interaction physique

Dans l’architecture POMMM, les données numériques ne sont plus vues comme des bits mais sont encodées dans l’amplitude et la phase des ondes lumineuses. En les transformant en propriétés physiques d’un champ optique, les chercheurs permettent aux champs de lumière d’interagir et de fusionner, réalisant ainsi naturellement des opérations mathématiques complexes, comme les multiplications tensorielles.
Pour rendre le concept plus tangible, M. Zhang a utilisé une analogie parlante : « Imaginez que vous êtes un douanier qui doit inspecter chaque colis à l’aide de plusieurs machines, puis les trier. Normalement, vous les traitez un par un. Notre méthode de calcul optique fusionne tous les colis et toutes les machines : en un seul passage de lumière, toutes les inspections et le tri s’effectuent instantanément et en parallèle. » De plus, ces opérations s’effectuent passivement lors de la propagation de la lumière, sans nécessiter de contrôle actif ni d’énergie supplémentaire.
Vers une IA générale à faible énergie

L’impact de cette avancée est double. Premièrement, elle résout un verrou fondamental entravant l’évolution du calcul optique en permettant le parallélisme. Deuxièmement, le potentiel en matière de réduction de la consommation énergétique est colossal, un point crucial alors que l’empreinte carbone des data centers d’IA est en constante augmentation.
Bien que l’étude, publiée dans Nature Photonics, se concentre sur l’informatique à usage général, elle sous-entend un chemin direct vers l’IA générale. « Cela permettra de créer une nouvelle génération de systèmes informatiques optiques, accélérant considérablement les tâches complexes d’IA dans une multitude de domaines », a indiqué Yufeng Zhang. L’équipe d’Aalto, dirigée par Zhipei Sun, espère intégrer cette technologie directement sur des puces photoniques, permettant des processeurs optiques à très faible consommation d’énergie.
le compte à rebours est lancé

En offrant une alternative viable et massivement plus rapide aux architectures électroniques saturées, la multiplication matricielle optique parallèle représente potentiellement l’un des plus grands sauts technologiques de ces dernières années dans le domaine de l’IA. Si les défis de l’industrialisation sont encore nombreux, l’objectif des chercheurs est de déployer l’architecture POMMM au niveau du matériel des grandes entreprises technologiques d’ici seulement trois à cinq ans. La course vers le futur du calcul ne fait que commencer.
Ce contenu a été créé avec l’aide de l’IA.