
Amir-massoud Farahmand
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Amir-massoud Farahmand est titulaire d’une chaire en IA Canada-CIFAR à l’Institut Vecteur et professeur adjoint au département d’informatique de l’Université de Toronto.
Ses recherches portent sur l’apprentissage automatique et l’apprentissage par renforcement. Il s’intéresse à la compréhension des principes nécessaires à l’apprentissage par renforcement pour les agents adaptatifs en situation réelle. Ces agents interagissent avec leur environnement, collectent des données et les utilisent non seulement pour prédire, mais aussi pour gérer l’environnement, dans le but de maximiser leurs performances à long terme. Amir-massoud Farahmand s’intéresse en particulier à la résolution de problèmes industriels complexes à l’aide des principes développés pour la conception d’agents adaptatifs.
Prix
- Prix du meilleur lecteur critique, International Conference on Learning Representations (ICLR), 2018
- Prix du meilleur lecteur critique, International Conference on Learning Representations (ICML), 2015
- Bourse postdoctorale CRSNG, 2012-2014
- Prix d’excellence pour une thèse de doctorat, département d’informatique, Université de l’Alberta, 2011-2012
- Candidat préapprouvé au programme de Bourse postdoctorale de R et D industrielle (BPRDI), CRSNG, 2012
Publications Pertinentes
- Farahmand, A. M. (2018). « Iterative Value-Aware Model Learning », Advances in Neural Information Processing Systems, 31:9090-9101.
- Farahmand, A. M., Barreto, A., Nikovski, D. (2017). « Value-aware loss function for model-based reinforcement learning », Proceedings of the 20th International Conference on Artificial Intelligence and Statistics, PMLR 54:1486-1494.
- Farahmand, A. M., Ghavamzadeh, M., Szepesvári, C., Mannor, S. (2016). « Regularized policy iteration with nonparametric function spaces », The Journal of Machine Learning Research, 17(1):4809-4874.
- Farahmand, A. M., Munos, R., Szepesvári, C. (2010). « Error propagation for approximate policy and value iteration », Advances in Neural Information Processing Systems, 23.
- Farahmand, A. M., Ghavamzadeh, M., Szepesvári, C., Mannor, S. (2008). « Regularized policy iteration », Advances in Neural Information Processing Systems, 21:441-448.
Soutenez-nous
Le CIFAR est un organisme de bienfaisance enregistré qui reçoit le soutien des gouvernements du Canada, de l’Alberta et du Québec, ainsi que de fondations, de donateurs individuels, d’entreprises et de partenaires canadiens et internationaux.