Nicolas Le Roux
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2020
Nicolas Le Roux est titulaire d’une chaire en IA Canada-CIFAR à Mila et professeur associé à l’École d’informatique de l’Université McGill et Département d’informatique et de recherche opérationnelle (DIRO) de l’Université de Montréal. Il est chercheur scientifique à Microsoft Research à Montréal.
Il s’intéresse à la façon dont l’interaction entre le bruit et la courbure affecte la vitesse de convergence et la généralisation en optimisation stochastique. Il cherche également à comprendre la dynamique de l’optimisation en apprentissage par renforcement, en particulier les méthodes de gradient de politique.
Prix
- Finaliste pour le prix du meilleur article, Conférence internationale sur l’intelligence artificielle et les statistiques, 2022
- Colauréat du prix Lagrange en optimisation continue, Society for Industrial and Applied Mathematics (SIAM), 2018
Publications Pertinentes
- Sordoni, A., Yuan, X., Côté, M-A., Pereira, M., Trischler, A., Xiao, Z., Hosseini, A., Niedtner, F. et Le Roux, N. (2023). « Joint Prompt Optimization of Stacked LLMs using Variational Inference ». Thirty-seventh Conference on Neural Information Processing Systems.
- Vaswani, S., Bachem, O., Totaro, S., Müller, R., Garg, S., Geist, M., Machado, M.C., Castro, P.S. et Le Roux, N. (2022). « A general class of surrogate functions for stable and efficient reinforcement learning ». AISTATS (pp. 8619-8649).
- Thomas, V., Pedregosa, F., Merriënboer, B., Manzagol, P.A., Bengio, Y., & Le Roux, N. (2020). « On the interplay between noise and curvature and its effect on optimization and generalization ». International Conference on Artificial Intelligence and Statistics.
- Z. Ahmed, N. Le Roux, M. Norouzi et D. Schuurmans (2019). « Understanding the impact of entropy on policy optimization ». International Conference on Machine Learning, 151-160.
- Le Roux, N., Bengio, Y. (2008). « Representational power of restricted Boltzmann machines and deep belief networks », Neural Computation, 20(6):1631-1649.
- Bengio, Y., Paiement, J. F., Vincent, P., Delalleau, O., Le Roux, N., Ouimet, M. (2003). « Out-of-sample extensions for lle, isomap, mds, eigenmaps, and spectral clustering », Advances in Neural Information Processing Systems, 16, p. 177-184.