Am 2. April 2026 hat das kalifornische Startup Generalist AI sein neues Foundation Model GEN-1 veröffentlicht. Die Zahlen klingen fast zu gut: 99 Prozent Erfolgsrate bei physischen Aufgaben, dreifache Geschwindigkeit gegenüber dem Vorgänger, und eine Stunde roboterspezifische Daten reicht für die Adaption an neue Aufgaben. Wenn das stimmt, ist das der größte Sprung in der Robotik-KI seit Jahren.
Was GEN-1 kann
Die Kernzahlen im Überblick:
- – Erfolgsrate: 99 % bei Standardaufgaben (Vorgänger GEN-0: ~64 %)
- – Geschwindigkeit: Karton-Montage in 12 Sekunden statt 34 Sekunden
- – Datenanforderung: Eine Stunde roboterspezifische Daten für neue Aufgaben
- – Trainingsbasis: Über 500.000 Stunden physische Interaktionsdaten
Das Modell arbeitet direkt auf Rohdaten der Bewegung, keine handgeschriebenen Regeln, keine aufwändige Szenarien-Programmierung. Vortraining auf einem riesigen Datensatz, dann leichtgewichtige Spezialisierung. Das ist exakt das Playbook, das bei großen Sprachmodellen funktioniert hat.
Das wirklich Interessante: Improvisation
Was GEN-1 von bisherigen Robotik-Modellen unterscheidet, ist die Fähigkeit zur Improvisation. Wenn ein Objekt rutscht, ein Teil fehlt oder sich die Umgebung verändert, passt das Modell sein Verhalten an, statt einfach zu stoppen oder die vorprogrammierte Bewegung blind weiterzuführen.
Das klingt trivial, ist aber in der Robotik der heilige Gral. Industrieroboter scheitern seit Jahrzehnten an genau diesem Problem: Sie können eine Aufgabe perfekt ausführen solange alles exakt so ist wie im Training. In der echten Welt rutschen Dinge, fallen Teile, stehen Hindernisse im Weg. Hier macht GEN-1 den Unterschied.
Technisch basiert das auf Custom-Compute-Kernels, Paged Attention für Echtzeit-Inferenz und Reinforcement Learning aus echten Erfahrungen. Generalist AI hat das gesamte Stack von Grund auf für Physical AI optimiert.
Bisher war das größte Problem der Robotik nicht die Hardware, denn die wird jedes Jahr besser und billiger. Das Problem war die Software. Jeder Roboter brauchte für jede Aufgabe einen separaten Controller, manuell programmiert und fragil.
GEN-1 dreht diese Logik um: Ein Modell, vortrainiert auf halbe Million Stunden physischer Interaktion, das sich in einer Stunde auf eine neue Aufgabe adaptieren lässt. Wenn das skaliert, bedeutet es, dass die Kosten für neue Roboter-Fähigkeiten um Größenordnungen sinken.
Quelle
