Clarifai et Vultr ont annoncé des résultats de référence révolutionnaires lors de la conférence NVIDIA GTC à Washington, D.C., mettant en avant leur collaboration pour offrir des performances exceptionnelles en inférence d’IA sur GPU. Le moteur de raisonnement de Clarifai, optimisé pour l’inférence agentique en intelligence artificielle, a démontré une vitesse et une efficacité de coût remarquables sur les vastes clusters de GPU dédiés de Vultr. Des tests indépendants ont révélé que ce moteur traite 544 tokens par seconde avec un temps minimal pour le premier token et une efficacité de coût leader dans l’industrie, surpassant d’autres plateformes basées sur GPU. Cette performance fait partie de la version 11.9 de Clarifai, qui inclut de nouvelles capacités pour les systèmes d’IA avancés, telles que des instances cloud Vultr élargies et une compatibilité avec divers ensembles d’outils. Conçu pour des charges de travail à l’échelle des entreprises, le moteur de raisonnement de Clarifai optimise en permanence ses performances sans compromettre la précision. Ce partenariat établit un nouveau standard en inférence d’IA, permettant une innovation plus rapide dans le raisonnement et l’IA générative.

