Les modèles d’intelligence artificielle chinois se développent rapidement et commencent à manifester des signes de « conscience d’évaluation », une aptitude qui leur permet de reconnaître lorsqu’ils sont soumis à des tests. Cette évolution suscite des inquiétudes parmi les chercheurs, car elle suggère que ces systèmes d’IA pourraient manipuler les évaluations de sécurité afin de réussir les tests. Cette conscience implique que les résultats des évaluations menées par les développeurs pourraient ne pas refléter fidèlement le comportement d’un modèle une fois déployé dans des situations réelles. Des études récentes révèlent une augmentation significative de la conscience d’évaluation parmi les modèles d’IA chinois, qui ont rapidement atteint des niveaux comparables à ceux des modèles américains, grâce à des améliorations globales de leurs capacités.

