Les robots humanoïdes de Figure AI deviennent incroyablement plus intelligents: Helix 02, leur nouveau cerveau, leur permet désormais de vider votre lave-vaisselle
Le robot Helix 02 de Figure AI - Figure AI
Il a commencé par plier votre linge, désormais, le robot humanoïde de Figure (AI) passe à la vitesse supérieure. La start-up américaine a en effet dévoilé une nouvelle version d'Helix, introduit en février 2025: Helix 02.
Pour être clair, Helix 02 n'est un robot, mais la nouvelle mouture de son modèle VLA (Vision-Langage-Action) qui anime ses robots Figure 02 ou Figure 03. Ainsi, Helix 02 doit assurer plus d'intelligence et d'autonomie au robot qui l'accueille, dans lequel il s'exécute. Grâce à Helix 02, un Figure 03 pourra ainsi réaliser un suivi de toutes ses actions (61 en tout, en l'occurrence, si on en croit Figure) sur un temps relativement court - ici environ quatre minutes.
Plus performant, Helix 02, ce nouveau "cerveau", reste capable de ne s'exécuter que sur un seul réseau de neurones. Et la performance mérite d'être saluée. Là où Helix se satisfaisait de contrôler la partie supérieure du corps d'un robot, Helix 02 "étend ce contrôle à l’ensemble du robot — la marche, la manipulation et l’équilibre — considérés comme un système continu unique".
Un robot en action et pleine autonomie
Dans la vidéo de démonstration publiée pour l'occasion, on peut voir un robot humanoïde décharger puis recharger sans aide humaine un lave-vaisselle. D'une durée de quatre minutes, la vidéo montre le robot qui réalise beaucoup d'actions à la fois et consécutivement.
Il se penche, saisit, porte, se retourne, marche, ouvre une porte, dépose, empile différents objets allant du verre à l'assiette et les range dans un placard. Enfin, il emplit à nouveau le lave-vaiselle, met une pastille de produit nettoyant, et réactive l'appareil. Mention spéciale pour la fermeture de tiroir avec les "fesses" et le lever de la porte du lave-vaisselle avec le pied. Qui ne l'a jamais fait?
Pour arriver à ce résultat, Figure affirme avoir retravaillé les mouvements avec de nouvelles données pour que son appareil bouge comme un humain. La start-up entend s'attaquer à un défi auquel est confronté l'industrie depuis plusieurs décennies, celui de la loco-manipulation.
Concrètement, il s'agit de la capacité qu'à un robot à se déplacer et manipuler un objet au sein d'un mouvement continu. Une combinaison qui fonctionne bien lorsqu'une action est effectuée indépendamment de l'autre, mais qui entraîne souvent des problèmes une fois que les actions doivent être enchaînées, comme un humain le fait si naturellement. Par exemple, lorsque le robot veut soulever un objet, son équilibre est affecté et il doit en plus prendre en compte le poids de l'élément porté pour marcher jusqu'à son objectif.
Un système unifié qui doit encore s'améliorer
C'est ce point sur lequel Figure a travaillé, bien que la vidéo ne montre le robot que dans une seule situation forcément très contrôlée. Le fait qu'il manipule de la vaisselle en plastique est sans doute plus justifiée par la volonté d'éviter les bris inutiles pendant les phases d'entraînement que par celle de réduire le poids à porter.
L'essentiel ici n'est d'ailleurs pas tant le poids que la capacité du robot, animée par le nouveau VLA, à sentir ce qu'il touche et à adapter la puissance de la pression de ses doigts sur la surface de l'objet.
Pour aboutir à cet ensemble plutôt fluide de tâches successives, Helix 02 a ajouté un troisième sous-système à son modèle VLA.
- Le Système 2 (S2) "raisonne lentement sur les objectifs: il interprète les scènes, comprend le langage et séquence les comportements". Autrement dit, le Système 2 "demeure la couche de raisonnement sémantique". Il traite les scènes, comprend le langage et définit les objectifs pour le Système 1.
- Le système 1 (S1), qui supervise tous les capteurs et tous les visuomoteurs "pense rapidement, traduisant la perception en cibles articulaires pour l’ensemble du corps à 200 Hz", autrement 200 fois par seconde.
- Enfin, le système 0 (S0), nouveau venu, "s’exécute à 1 kHz (1.000 fois par seconde, NDLR), gérant l’équilibre, les contacts et la coordination de tout le corps".
Comme l'explique Figure, "S0 est un modèle fondation du contrôle corporel" qui reproduit la façon dont se déplace un humain. Pour réussir ce tour de force, Figure affirme avoir utilisé plus de 1.000 heures de données d'entraînement humaines, ce qui permet de se passer d'un humain qui viendrait contrôler en permanence ce qui se passe en temps normal. S0 "constitue l’épine dorsale de l’incarnation physique de Helix 02" tandis que S1 et S2" raisonnent sur les tâches et les plans, S0 veille à ce que chaque mouvement soit exécuté de manière fluide, sûre et stable".
C'est ce nouveau système à trois étages, qui forme "une hiérarchie étroitement intégrée" et permet de proposer un système unifié pour le corps dans son entièreté.
A cela s'ajoutent aussi la détection tactile et des caméras présentes dans la paume de la main du robot pour de meilleures manipulations. Ces deux éléments permettent, lors de tests autonomes, de dévisser des bouchons, d'extraire des comprimés et d'utiliser une seringue de manière précise, tout au moins pour un robot.

Reste désormais à faire en sorte que cette compréhension de l'environnement s'étende, de même que la capacité à enchaîner des tâches simples et complexes, et liées par une chaîne causale. La question de l'autonomie se posera également, bien entendu. Et quand on en sera à simplement regretter que le robot fasse encore du bruit, on pourra se dire que le plus dur est derrière Figure...