NG Solution Team
Telecom

La Chine a-t-elle développé son plus grand modèle d’IA avec des puces nationales ?

La Chine progresse dans le domaine de l’intelligence artificielle en utilisant des puces nationales pour bien plus que l’inférence de modèles. Meituan, une entreprise leader dans la livraison de repas, a dévoilé LongCat-2.0, un modèle de langage de grande envergure doté de 1,6 trillion de paramètres et d’une fenêtre contextuelle de 1 million de tokens. Cela le positionne aux côtés de modèles majeurs tels que le V4-pro de DeepSeek. LongCat-2.0 se distingue en étant le premier modèle à un trillion de paramètres entièrement entraîné et inféré sur un cluster de puissance informatique domestique de 50 000 cartes. Contrairement à DeepSeek-V4-pro, qui utilisait des puces locales uniquement pour l’inférence, LongCat-2.0 les a employées à la fois pour le pré-entraînement et l’inférence. Le pré-entraînement est une phase gourmande en ressources où le modèle d’IA apprend à partir de vastes ensembles de données. L’accomplissement de Meituan souligne sa capacité à effectuer des entraînements à grande échelle sur des plateformes matérielles alternatives, en utilisant des superpods ASIC d’IA conçus pour des tâches spécifiques.

Related posts

Les goulets d’étranglement de la chaîne d’approvisionnement en puces font-ils augmenter les prix ?

Lucie Moreau

Quelles tendances technologiques RH façonneront le lieu de travail d’ici 2026 ?

Thomas Lefèvre

Comment la valeur marchande de Samsung a-t-elle explosé grâce à l’essor des puces IA ?

Marie Martin

This website uses cookies to improve your experience. We assume you agree, but you can opt out if you wish. Accept More Info

Privacy & Cookies Policy