La Chine progresse dans le domaine de l’intelligence artificielle en utilisant des puces nationales pour bien plus que l’inférence de modèles. Meituan, une entreprise leader dans la livraison de repas, a dévoilé LongCat-2.0, un modèle de langage de grande envergure doté de 1,6 trillion de paramètres et d’une fenêtre contextuelle de 1 million de tokens. Cela le positionne aux côtés de modèles majeurs tels que le V4-pro de DeepSeek. LongCat-2.0 se distingue en étant le premier modèle à un trillion de paramètres entièrement entraîné et inféré sur un cluster de puissance informatique domestique de 50 000 cartes. Contrairement à DeepSeek-V4-pro, qui utilisait des puces locales uniquement pour l’inférence, LongCat-2.0 les a employées à la fois pour le pré-entraînement et l’inférence. Le pré-entraînement est une phase gourmande en ressources où le modèle d’IA apprend à partir de vastes ensembles de données. L’accomplissement de Meituan souligne sa capacité à effectuer des entraînements à grande échelle sur des plateformes matérielles alternatives, en utilisant des superpods ASIC d’IA conçus pour des tâches spécifiques.

