Figure AI hat Helix 02 veröffentlicht. Es ist das größte Update ihres KI-Systems seit dem ursprünglichen Helix-Launch vor einem Jahr. Ein einziges neuronales Netzwerk kontrolliert jetzt den kompletten Roboter. Arme, Beine, Finger, Kopf, alles läuft durch dasselbe System.
Letztes Jahr zeigte Helix, dass ein einzelnes Netzwerk den Oberkörper steuern kann. Helix 02 erweitert das auf den gesamten Roboter. Gehen, Greifen, Balancieren passieren nicht mehr als getrennte Module, die aneinandergereiht werden. Sie sind ein kontinuierlicher Prozess.
Das klingt nach einem kleinen Unterschied, ist aber fundamental. Die klassische Robotik funktioniert nach dem Prinzip: Laufen, Stoppen, Stabilisieren, Greifen, wieder Laufen. Jeder Übergang ist eine potenzielle Fehlerquelle. Helix 02 denkt nicht in diesen Übergängen. Es denkt in einem durchgehenden Strom von Wahrnehmung und Aktion.
Die Drei-Schichten-Architektur
Figure hat das System in drei Ebenen aufgeteilt, die sie System 0, 1 und 2 nennen.
System 2 ist die langsamste Schicht. Sie interpretiert Szenen, versteht Sprache und plant Verhaltenssequenzen. Hier passiert das semantische Denken: “Geh zum Geschirrspüler und öffne ihn.”
System 1 läuft bei 200 Hertz und übersetzt Wahrnehmung in Ganzkörper-Gelenkziele. Es verbindet alle Sensoren mit allen Aktuatoren. Kopfkameras, Handflächenkameras, taktile Fingersensoren und Propriozeption fließen rein, komplette Körperkontrolle kommt raus.
System 0 ist die schnellste Schicht bei 1.000 Hertz. Sie kümmert sich um Balance, Kontakt und Koordination. Das Interessante daran: System 0 hat 109.504 Zeilen handgeschriebenes C++ ersetzt. Ein 10-Millionen-Parameter Netzwerk, trainiert auf über 1.000 Stunden menschlicher Bewegungsdaten übernimmt jetzt die Arbeit, die vorher explizit programmiert werden musste.
Die Geschirrspüler-Demo
Figure zeigt eine dreiminütige Demo, in der der Roboter einen Geschirrspüler ein- und ausräumt. Komplett autonom, keine Resets, keine menschliche Intervention. Das sind 61 aufeinanderfolgende Loco-Manipulation-Aktionen.
Was mich dabei am meisten beeindruckt hat, ist nicht das Greifen selbst. Es ist, wie der Roboter seinen ganzen Körper nutzt. Wenn seine Hände voll sind, schließt er eine Schublade mit der Hüfte. Er hebt die Geschirrspülertür mit dem Fuß an. Das sind keine programmierten Tricks, sondern emergente Verhaltensweisen aus dem Training.
Der dynamische Bereich ist enorm. Dasselbe Netzwerk produziert millimetergenaue Fingerbewegungen und raumfüllende Lokomotion. Figure spricht von vier Größenordnungen Unterschied.
Taktile Sensoren und Handflächenkameras
Helix 02 nutzt zum ersten Mal die neuen Hardware-Features des Figure 03. Jede Fingerspitze hat taktile Sensoren, die Kräfte ab drei Gramm erkennen können. Das reicht, um eine Büroklammer zu spüren. In jeder Handfläche sitzt außerdem eine Kamera für visuelles Feedback, wenn Objekte von der Kopfkamera verdeckt sind.
Figure demonstriert vier Aufgaben, die ohne diese Sensorik nicht möglich wären. Das Aufschrauben eines Flaschendeckels erfordert kontinuierliche Drehmoment-Kontrolle ohne Abrutschen. Das Extrahieren einer einzelnen Pille aus einer Medikamentenbox verlangt Präzision auf Millimeter-Niveau. Das Dosieren von exakt fünf Millilitern aus einer Spritze braucht kraftgeregelte Aktuierung. Und das Herausfischen kleiner Metallteile aus einem Haufen zeigt robuste Greifauswahl unter Verdeckung.
Loco-Manipulation, also gleichzeitiges Gehen und Manipulieren, gilt seit Jahrzehnten als eines der härtesten ungelösten Probleme der Robotik. Nicht weil beides einzeln schwer wäre, sondern weil sie sich gegenseitig beeinflussen. Hebe etwas auf und deine Balance ändert sich. Mach einen Schritt und deine Reichweite ändert sich.
Die meisten demonstrierten Humanoiden können beeindruckende kurze Sequenzen zeigen. Springen, Tanzen, Yoga-Posen. Aber fast alle teilen eine Limitation: Sie sind nicht wirklich steuerbar. Sie spielen offline geplante Bewegungen ab. Wenn sich etwas unerwartet ändert, bricht das Verhalten zusammen. Helix 02 ist Figures Versuch, dieses Problem durch einen einheitlichen Lernansatz zu lösen.
Quelle
