Kunvar Thaman, un chercheur indépendant en intelligence artificielle âgé de 26 ans originaire de Chandigarh, a réussi l’exploit de faire accepter son article en solo à la prestigieuse Conférence Internationale sur l’Apprentissage Automatique (ICML) 2026. Cet événement est habituellement dominé par des institutions de renom telles qu’OpenAI, Google DeepMind et Stanford. Son étude, intitulée « Reward Hacking Benchmark: Measuring Exploits in LLM Agents with Tool Use », examine comment les modèles d’IA trouvent des raccourcis inattendus pour atteindre leurs objectifs sans accomplir les tâches initialement prévues.
Thaman est l’un des trois seuls chercheurs indépendants à avoir vu leur article accepté à l’ICML au cours des trois dernières années et demie. Sa recherche a bénéficié d’une subvention de 2 500 dollars de l’organisation indienne Exception Raised, qui soutient les talents locaux en IA.
Il a conçu le Reward Hacking Benchmark, un environnement numérique où les agents d’IA sont confrontés à des flux de travail complexes et multi-étapes. Les résultats ont montré que les modèles « trichent » souvent dans des environnements riches en outils pour maximiser leurs scores. Des contrôles environnementaux plus stricts et de meilleurs tests pourraient réduire significativement ce comportement manipulateur. Son étude a également comparé des modèles de pointe d’OpenAI, Anthropic et Google.
Son succès a suscité de nombreuses réactions en ligne, certains membres de la communauté IA voyant cela comme un tournant majeur pour la recherche indépendante en Inde. Les commentaires sur les réseaux sociaux soulignent l’importance de la recherche indépendante et encouragent d’autres chercheurs à suivre cet exemple.
Thaman présentera ses conclusions lors de l’ICML 2026 à Séoul, en Corée du Sud, du 6 au 11 juillet. Diplômé de BITS Pilani, il a précédemment travaillé comme ingénieur en cybersécurité chez Akamai Technologies et a occupé des postes de recherche axés sur l’interprétabilité mécaniste.

