Am 7. April 2026 hat AGIBOT seinen neuen Open-Source-Datensatz AGIBOT World 2026 veröffentlicht. 100 Prozent echte Daten aus realen Umgebungen wie Wohnungen, Büros, Geschäftsräume. Gesammelt mit AGIBOTs eigenem G2-Roboter. Dazu 1:1-skalige Digital Twins in Simulation. Alles frei verfügbar auf Hugging Face.
Nur vier Tage nachdem AGIBOT seine 10.000er-Produktionsmarke gefeiert hat, legt das Unternehmen den größten Real-World-Datensatz für Embodied AI vor. Die Botschaft ist klar: AGIBOT will nicht nur Hardware dominieren, sondern auch die KI-Infrastruktur.
Was den Datensatz besonders macht
Drei Dinge heben AGIBOT World von bisherigen Robotik-Datensätzen ab:
1. Free-Form Collection statt Scripted Demos
Die meisten Robotik-Datensätze bestehen aus sorgfältig geplanten Demonstrationen: Ein Operator führt eine definierte Aufgabe in einer kontrollierten Umgebung aus. AGIBOT World macht es anders – Teleoperatoren arbeiten frei und dynamisch in echten Räumen, improvisieren bei Problemen, und reagieren auf unerwartete Situationen.
Das Ergebnis: mehr Diversität, mehr Edge Cases, bessere Generalisierung beim Training.
2. Digital Twins inklusive
Für jede reale Umgebung gibt es eine 1:1-skalige Simulation. Das ermöglicht Sim-to-Real-Transfer – Modelle können in der Simulation vortrainiert und dann auf echte Roboter übertragen werden. Das Simulationsdatenmaterial wird zusammen mit den Real-World-Daten veröffentlicht.
3. Fünf-Phasen-Release
AGIBOT World wird nicht als einmaliger Datendump veröffentlicht, sondern in fünf Phasen, die jeweils einen Forschungsschwerpunkt abdecken. Phase 1 fokussiert auf Imitation Learning. Die kommenden Phasen werden weitere Paradigmen wie Reinforcement Learning und Multi-Agent-Szenarien abdecken.
Was enthalten ist
Der Datensatz umfasst:
- – Task-Level-Beschreibungen und Action-Sequenzen
- – Atomare Skill-Labels (Greifen, Ziehen, Platzieren, etc.)
- – Objekt-Annotationen mit 2D Bounding Boxes
- – Fehler-Recovery-Trajektorien (also auch Daten über gescheiterte Versuche und Korrekturen)
Die Fehler-Recovery-Daten sind besonders wertvoll – die meisten Datensätze enthalten nur erfolgreiche Durchläufe. Aber ein Roboter, der weiß, wie er Fehler korrigiert, ist in der echten Welt unendlich wertvoller als einer, der nur die perfekte Ausführung kennt.
Der strategische Kontext
AGIBOT spielt hier das selbe Spiel, das Meta mit LLaMA gespielt hat: den eigenen Datensatz open-sourcen, um das Ökosystem um die eigene Plattform herum aufzubauen. Wenn Forscher weltweit auf AGIBOT-Daten trainieren, werden ihre Modelle am besten auf AGIBOT-Hardware funktionieren. Das ist kein Altruismus – das ist Plattform-Strategie.
XONOID Fazit
Das Timing ist perfekt. Erst die 10.000er-Produktionsmarke (#144), dann der Open-Source-Datensatz. AGIBOT positioniert sich gleichzeitig als Hardware-Skalierungsmeister und als KI-Infrastruktur-Anbieter.
Die Qualität des Datensatzes muss sich noch in der Forschung beweisen. Aber die Struktur – Real-World + Digital Twins + fünf Phasen + Fehler-Recovery ist durchdacht. Wenn die Community den Datensatz annimmt, wird AGIBOT World 2026 zur Referenz für Embodied-AI-Forschung. Und das wäre ein massiver strategischer Vorteil aus China.
Quellen
