LG AI Research a révélé son modèle d’intelligence artificielle “K-Exaone”, qui surpasse les modèles de pointe mondiaux tels que ChatGPT et Qwen, tout en réduisant la charge de calcul nécessaire à l’entraînement à un tiers des niveaux antérieurs. Présenté par Choi Junggyu lors d’un événement à Séoul, ce modèle utilise une architecture hybride d’attention pour diminuer les coûts de calcul, permettant ainsi son utilisation sur des environnements GPU de milieu à bas de gamme. La méthode d’entraînement en plusieurs étapes améliore les performances grâce à une utilisation efficace de l’infrastructure disponible, atteignant une efficacité moyenne de 89,4 % dans l’utilisation des GPU. Les évaluations montrent que K-Exaone atteint 104 % de la performance cible sur 13 critères de référence clés, surpassant ainsi des modèles mondiaux. LG AI Research met également l’accent sur la sécurité et la fiabilité, en vérifiant la conformité des données d’entraînement et en s’assurant que le modèle respecte les valeurs humaines universelles ainsi que les caractéristiques spécifiques à la Corée.

