Le nouveau modèle vocal d’intelligence artificielle du groupe Alibaba a surpassé ses principaux concurrents occidentaux, démontrant ses capacités avancées dans la maîtrise des dialectes et accents chinois complexes. Développé par le Tongyi Lab d’Alibaba, le modèle Fun-Realtime-TTS-Preview s’est classé cinquième sur le classement mondial de l’Artificial Analysis Speech Arena, se distinguant comme le seul système conçu en Chine parmi les cinq premiers. La Speech Arena, une plateforme d’évaluation de l’IA basée à San Francisco, évalue les modèles en fonction de la conversion de la parole en texte, de la compréhension vocale et de la génération de discours naturel. De plus, le modèle Fun-Realtime-ASR d’Alibaba a dominé l’indice du taux d’erreur de mots avec un taux d’erreur impressionnant de 1,8 %, indiquant une précision de transcription élevée.

