En thermodynamique, l’état d’équilibre d’un système est caractérisé par plusieurs paramètres, appelés variables d’état, tels que le volume, la température, la pression . Ces variables d’état et leurs caractérisations sont elles-mêmes des fonctions d’état du système. On pourrait aussi en langage courant utiliser le terme de constantes d’observation.
Il s’agit là de l’essentiel du travail scientifique. Les humains pensaient jusqu’à présent être les seules créatures vivantes qui en soient explicitement capables. Ils l’auraient du aux performances exceptionnelles de leur cerveaux, s’exerçant au sein de cultures sociales dites scientifiques orientées depuis de longues années vers la recherche de ces variables d’état. Aujourd’hui des chercheurs pensent avoir mis au point des programmes en Intelligence Artificielle AI qui en seraient également capables.
Et si des pans entiers de l’univers nous étaient opaques simplement parce que nous ne les observons pas de la bonne manière ? Pour répondre à cette question, des ingénieurs ont décidé d’interroger un système d’apprentissage automatique concernant certains phénomènes physiques. Des résultats étonnants en sont ressortis, les chercheurs étant incapables de comprendre le « langage mathématique » utilisé pour leur création.
« Je me suis toujours demandé, si nous rencontrions une race extraterrestre intelligente, auraient-ils découvert les mêmes lois physiques que nous, ou pourraient-ils décrire l’univers d’une manière différente ? », s’interroge Hod Lipson, l’un des scientifiques ayant mené ces recherches, dans un communiqué de Columbia University. C’est un peu avec cette idée en tête qu’une équipe d’ingénieurs a conçu un programme basé sur l’apprentissage automatique destiné à l’observation de phénomènes physiques.
Les résultats des recherches ont été publiés dans la revue Nature Computational Science le 25 juillet. On en trouvera ci-dessous ci-dessous les références et l’abstract. .
En effet, comme le rappellent les scientifiques, l’observation et la compréhension des variables ont toujours précédé les grandes théories physiques. « Pendant des millénaires, les gens connaissaient les objets se déplaçant rapidement ou lentement, mais ce n’est que lorsque la notion de vitesse et d’accélération a été formellement quantifiée que Newton a pu aboutir à sa célèbre loi du mouvement F = MA », note par exemple Hod Lipson. Il est donc tout à fait plausible de supposer que des phénomènes physiques peuvent encore nous demeurer inaccessibles simplement parce que nous n’avons pas encore compris leurs règles de fonctionnement. « Quelles autres lois manquons-nous simplement parce que nous n’avons pas les variables ? », résume ainsi Qiang Du, qui a codirigé les travaux.
Afin de mener leur expérience à bien, les scientifiques ont donc d’abord « nourri » leur programme avec des vidéos brutes de phénomènes déjà bien identifiés. Par exemple, ils lui ont proposé une vidéo d’un double pendule oscillant, qui est connu pour avoir exactement quatre « variables d’état » — l’angle et la vitesse angulaire de chacun des deux bras. L’algorithme qu’ils ont utilisé est spécialement conçu pour observer des phénomènes physiques via ce type de vidéo, et pour en « rechercher l’ensemble minimal de variables fondamentales qui décrivent pleinement la dynamique observée ».
Il a fallu quelques heures d’analyses seulement pour produire une réponse à la question « par combien de variables ce phénomène peut-il être décrit » : Réponse 4.. « Nous estimions que cette réponse était assez proche, d’autant plus que l’IA avait seulement accès à des séquences vidéo brutes, sans aucune connaissance de la physique ou de la géométrie. Mais nous voulions savoir quelles étaient réellement les variables, pas seulement leur nombre », décrit Hod Lipson. C’est là que les choses se sont compliquées pour les chercheurs.
En effet, les quatre variables identifiées par le programme ne semblaient correspondre à rien de connu. Seules deux d’entre elles pouvaient vaguement correspondre à l’angle des bras. « Nous avons essayé de corréler les autres variables avec tout ce à quoi nous pouvions penser : les vitesses angulaires et linéaires, l’énergie cinétique et potentielle, et diverses combinaisons de quantités connues. Mais rien ne semblait correspondre parfaitement », explique Boyuan Chen. L’équipe était pourtant convaincue que le programme avait trouvé un ensemble valide de quatre variables, car elle avait fait la preuve que ses prédictions étaient bonnes. Ils en sont donc arrivés à une conclusion : ils n’étaient simplement pas en mesure de comprendre le « langage mathématique » utilisé pour leur création.
Ils ont ensuite poursuivi l’expérience en validant un certain nombre de systèmes physiques qu’ils connaissaient, puis en alimentant l’IA avec des vidéos dont ils ne connaissaient pas les « réponses » exactes. Un danseur-des-vents (Un danseur-des-vents est un tube de matière textile de forme vaguement humanoïde, maintenu gonflé à l’aide d’un ventilateur fixé à sa base. Les danseurs-des-vents sont couramment utilisés comme dispositifs publicitaires et dans les évènements festifs). devant un parking de voitures d’occasion, pour lequel le programme a trouvé 8 variables, une lampe à lave, qui a aussi produit 8 variables, et un feu de cheminée, qui a renvoyé 24 variables. Reste donc à savoir à quoi correspondent exactement ces variables. Pourraient-elles être les indices de nouveaux principes de physique ?
« Peut-être que certains phénomènes semblent énigmatiquement complexes parce que nous essayons de les comprendre en utilisant le mauvais ensemble de variables. Dans les expériences, le nombre de variables était le même à chaque redémarrage de l’IA, mais les variables spécifiques étaient différentes à chaque fois. « Il existerait ainsi d’autres façons de décrire l’univers et il est tout à fait possible que nos choix ne soient pas parfaits », selon les scientifiques.
Référence
Automated discovery of fundamental variables hidden in experimental data
volume2, pages 433–442 (2022)
Published: 25 July 2022
Abstract
All physical laws are described as mathematical relationships between state variables. These variables give a complete and non-redundant description of the relevant system. However, despite the prevalence of computing power and artificial intelligence, the process of identifying the hidden state variables themselves has resisted automation. Most data-driven methods for modelling physical phenomena still rely on the assumption that the relevant state variables are already known. A longstanding question is whether it is possible to identify state variables from only high-dimensional observational data. Here we propose a principle for determining how many state variables an observed system is likely to have, and what these variables might be. We demonstrate the effectiveness of this approach using video recordings of a variety of physical dynamical systems, ranging from elastic double pendulums to fire flames. Without any prior knowledge of the underlying physics, our algorithm discovers the intrinsic dimension of the observed dynamics and identifies candidate sets of state variables.