En 2026, le débat sur la valeur commerciale du pré-entraînement vidéo VLA dans le domaine de l’intelligence incarnée s’intensifie. D’une part, l’enthousiasme pour le financement est élevé, d’autre part, les scepticismes persistent. Certains considèrent que former des robots avec des vidéos Internet n’est qu’une tendance passagère difficilement applicable à l’industrie. Cependant, l’entreprise sud-coréenne RLWRLD, bénéficiant d’un financement de 60 milliards de wons sud-coréens, soit 41,8 millions de dollars, offre un aperçu concret de la valeur technique et commerciale de cette approche.
Ce qui distingue RLWRLD, c’est son choix de ne pas utiliser des vidéos disponibles librement sur Internet, mais de se concentrer sur des scénarios réels en enregistrant les processus opérationnels dans des environnements tels que les hôtels et les entrepôts. Cette méthode permet aux robots de s’adapter à des tâches répétitives et standardisées dans l’industrie des services sans nécessiter de transformation de l’environnement.
Deux modèles de formation vidéo coexistent : l’utilisation de vidéos en ligne pour développer rapidement la cognition des modèles, et l’approche de RLWRLD qui s’appuie sur des vidéos de scénarios réels pour une mise en œuvre commerciale stable. Cette dernière est particulièrement adaptée aux marchés japonais et sud-coréen, confrontés à une pénurie de main-d’œuvre due au vieillissement de la population. Les robots formés avec des données réelles s’intègrent facilement dans les environnements de travail existants, offrant une solution flexible et à faible coût.
À l’inverse, l’approche chinoise, illustrée par Qianxun Intelligence, utilise des vidéos en ligne pour un pré-entraînement général, complétée par des données spécifiques pour affiner les scénarios. Bien que cette méthode permette une expansion rapide, elle présente des limitations en termes de stabilité et de standardisation des opérations. Les différences entre ces deux approches reflètent les réalités industrielles distinctes de chaque marché.

