Cette étude examine une question clé dans la tarification des actifs internationaux : les modèles factoriels globaux ou régionaux sont-ils plus efficaces pour prédire les rendements boursiers ? Dépassant les méthodes traditionnelles qui reposent sur des comparaisons rétrospectives et des cadres linéaires, les auteurs adoptent une approche de prévision prospective en utilisant une variété de modèles d’apprentissage automatique. Ceux-ci vont de techniques linéaires comme la régression OLS et l’Elastic Net à des algorithmes non linéaires tels que la forêt aléatoire, les arbres de régression à gradient renforcé et les réseaux de neurones. En analysant des données de 24 marchés développés entre 1990 et 2021, la recherche examine comment la complexité des modèles influence les avantages des stratégies d’entraînement globales par rapport aux stratégies locales.
L’étude révèle que les modèles régionaux génèrent des rendements légèrement supérieurs avec des méthodes linéaires simples, bien qu’ils manquent d’un alpha statistiquement significatif. En revanche, les algorithmes complexes d’apprentissage automatique offrent systématiquement de meilleures performances lorsqu’ils sont entraînés sur des données globales, tant sur le plan économique que statistique. Cela remet en question les conclusions antérieures de Griffin, Fama et French, et Hollstein, offrant une vue nuancée sur l’intégration des marchés financiers et la prévisibilité des rendements boursiers.
Un des points forts majeurs de l’article est sa comparaison systématique des performances prédictives à travers une large gamme de modèles d’apprentissage automatique, sous des paradigmes d’entraînement à la fois locaux et globaux. Les auteurs utilisent une approche de fenêtre glissante pour assurer la validité hors échantillon, segmentant soigneusement les périodes d’entraînement, de validation et de test. La sélection diversifiée des modèles—de la régression OLS de base aux réseaux de neurones avancés en ensemble—permet une analyse robuste de l’impact de la complexité sur l’efficacité de la mise en commun des données globales.
Le design empirique de l’étude renforce encore sa crédibilité. En utilisant un ensemble de données équilibré et filtré de haute qualité issu des marchés développés classifiés par MSCI et en mettant en œuvre des étapes rigoureuses de prétraitement des données, les auteurs minimisent les biais courants dans la recherche en apprentissage automatique financier. Leur utilisation cohérente de portefeuilles long-short pondérés par la valeur et triés par quintiles respecte les normes établies dans la tarification empirique des actifs.
Malgré la rigueur de l’article, des améliorations sont possibles. L’étude pourrait bénéficier d’une justification plus claire des architectures de modèles et des hyperparamètres choisis, d’une discussion plus approfondie sur l’applicabilité économique et d’une analyse des marchés émergents. De plus, un accent sur l’interprétabilité et les moteurs des modèles, ainsi que sur la performance à travers différents régimes de marché, pourrait renforcer la pertinence de l’étude.
En conclusion, cet article offre une étude robuste et prospective qui relie l’apprentissage automatique à la tarification empirique des actifs. Il démontre que les modèles entraînés globalement surpassent les modèles régionaux lorsqu’ils utilisent des algorithmes avancés, fournissant de nouvelles perspectives sur l’interaction entre l’étendue géographique et la complexité des modèles. Les recherches futures pourraient étendre l’impact de l’étude en abordant les frictions économiques, en explorant les marchés émergents et en améliorant l’interprétabilité des modèles. Néanmoins, ce travail apporte une contribution significative à la fois à la finance et à l’apprentissage automatique appliqué en présentant une approche plus sophistiquée de la prévision des rendements internationaux.