Marc G. Bellemare
La nomination
Membre auxiliaire
Titulaire de chaire en IA Canada-CIFAR
Apprentissage automatique, apprentissage biologique
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2019
Titulaire de chaire en IA Canada-CIFAR – Mandat renouvelé – 2024
Marc G. Bellemare est titulaire d’une chaire en IA Canada-CIFAR à Mila, membre auxiliaire du programme Apprentissage automatique, apprentissage biologique du CIFAR, professeur associé à l’École d’informatique de l’Université McGill et directeur scientifique à Reliant AI, une jeune pousse de Montréal et Berlin spécialisée dans l’apprentissage par renforcement pour les données.
Ses recherches se situent au carrefour de l’apprentissage par renforcement et de la modélisation générative. De ses travaux découlent des contributions théoriques et pratiques, y compris l’apprentissage par renforcement distributionnel, une théorie de l’exploration d’espaces d’états hautement dimensionnels, la mise au point du très efficace Arcade Learning Environment pour l’évaluation d’agents artificiels et l’apprentissage profond par renforcement appliqué. Il a précédemment dirigé la conception de systèmes d’apprentissage par renforcement pour contrôler la flotte de ballons stratosphériques Loon. Il étudie maintenant l’application de l’apprentissage par renforcement à de grands modèles de langage et l’apprentissage par représentation pour l’apprentissage par renforcement à grande échelle.
Prix
- Prix du meilleur article, Advances in Neural Processing Systems, 2021
- Prix du meilleur article, Atelier d’exploration dans l'apprentissage par renforcement d’ICML, 2019
- Prix du meilleur article, Symposium sur l’apprentissage par renforcement et prise de décision, 2019
Publications Pertinentes
- Bellemare, M., Dabney, W., Rowland, M. (2023). Distributional reinforcement learning. MIT Press.
- D’Oro, P., Schwarzer, M., Nikishin, E., Bacon, P., Bellemare, M., Courville, A. (2022). Sample-efficient reinforcement learning by breaking the replay ratio barrier.
- Agarwal, R., Schwarzer, M., Castro P. S., Courville A., Bellemare, Marc G. (2021). « Deep reinforcement learning at the edge of the statistical precipice », Advances in Neural Information Processing Systems.
- Bellemare, M. G., Candido, S., Castro, P. S., Gong, J., Machado, M. C., Moitra, S., Ponda, S. S., Wang, Z. (2020). « Autonomous navigation of stratospheric balloons using reinforcement learning », Nature.
- François-Lavet, V., Henderson, P., Islam, R., Bellemare, M. G., Pineau, J. (2018). An introduction to deep reinforcement learning, Now Foundations and Trends, 156 p.
- Bellemare, M. G., Dabney, W., Munos, R. (2017). « A distributional perspective on reinforcement learning », Proceedings of the 34th International Conference on Machine Learning, PMLR 70:449-458.
- Bellemare, M., Srinivasan, S., Ostrovski, G., Schaul, T., Saxton, D., Munos, R. (2016). « Unifying count-based exploration and intrinsic motivation », Advances in Neural Information Processing Systems, 29:1471-1479.