Rupam Mahmood
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2020
Rupam Mahmood est professeur adjoint au département d’informatique de l’Université de l’Alberta, titulaire de chaire en IA Canada-CIFAR et membre de l’Institut de l’intelligence artificielle de l’Alberta (Amii). Il est directeur du laboratoire sur l’apprentissage profond et l’intelligence artificielle. Il est également conseiller scientifique pour Kindred inc. et membre du corps professoral de NextAI.
Les travaux de Rupan Mahmood se situent au carrefour de l’apprentissage par renforcement, de l’apprentissage continu et de l’apprentissage robotique. Il se concentre sur la mise au point d’algorithmes d’apprentissage par représentation profonde pour résoudre les problèmes liés à l’apprentissage continu, comme l’extensibilité, l’oubli catastrophique et la perte de plasticité, dans le but ultime de construire des systèmes autonomes d’apprentissage continu, comme des robots vivant librement. Avant de se joindre à l’Université de l’Alberta, il a dirigé l’équipe de recherche en IA de la société de robotique Kindred AI, où il a mis au point SenseAct, la première boîte à outils à code source libre et la première trousse de tâches de référence pour l’apprentissage reproductible en temps réel avec divers robots physiques.
Prix
- Prix du président de zone, Conférence internationale sur l’apprentissage par représentation, 2023
- Prix du lecteur critique par excellence, Conférence sur les systèmes de traitement de l’information neuronale, 2023
- Prix du lecteur critique par excellence, Conférence sur les systèmes de traitement de l’information neuronale, 2022
Publications Pertinentes
- Elsayed, M. et Mahmood, A. R. (2024). « Addressing loss of plasticity and catastrophic forgetting in continual learning ». Publié dans Actes de la 12e conférence internationale sur l’apprentissage par représentation.
- Che, F., Xiao, C., Mei, J., Dai, B., Gummadi, R., Ramirez, O. A., Harris, C. K., Mahmood, A. R. et Schuurmans, D. (2024). « Target networks and over-parameterization stabilize off-policy bootstrapping with function approximation ». Publié dans Actes de la 41e conférence internationale sur l’apprentissage automatique.
- Wang, Y., Vasan, G. et Mahmood, A. R. (2023). « Real-time reinforcement learning for vision-based robotics utilizing local and remote computers ». Publié dans Actes de la Conférence internationale sur la robotique et l’automatisation de 2023.
- Chan, A., Silva, H., Lim, S., Kozuno, T., Mahmood, A. R., & White, M. (2022). Greedification operators for policy optimization: Investigating forward and reverse kl divergences. In the Journal of Machine Learning Research (JMLR).
- Mahmood, A. R., Komer, B. J., Korenkevych, D. (2020). Demande de brevet américain (USPTO), no 16/560, 761.
- Mahmood, A. R., Korenkevych, D., Vasan, G., Ma, W., Bergstra, J. (2018). « Benchmarking reinforcement learning algorithms on real-world robots », Proceedings of the 2nd Annual Conference on Robot Learning (CoRL), p. 561-591.