Csaba Szepesvari
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2020
Csaba Szepesvári est titulaire d’une chaire en IA Canada-CIFAR à l’Amii et professeur au département d’informatique de l’Université de l’Alberta.
Il travaille sur la théorie de l’apprentissage par renforcement, en créant et en analysant des algorithmes qui apprennent de manière efficace et effective tout en interagissant avec leur environnement de manière séquentielle. Il s’intéresse aux problèmes découlant des interactions continues d’une machine avec son environnement alors qu’elle essaie de découvrir une bonne façon d’interagir avec lui de manière autonome. Ces problèmes d’apprentissage interactif en ligne sont étudiés dans diverses disciplines, notamment en « théorie du double contrôle », une branche de la théorie du contrôle, ou en apprentissage automatique dans le domaine de l’apprentissage par renforcement.
Prix
- Boursier, AAAI, 2023
- Boursier, European Laboratory for Learning and Intelligent Systems, 2019
- Prix Test of Time, ECML/PKDD, 2016
- 2e meilleur article, UAI, 2014
- Prix d’excellence pour un article, ICML, 2014
- Prix de l’instructeur inspirant, Société interdépartementale des étudiants en sciences de l’University de l’Alberta, 2012
- Prix du nouveau professeur, Alberta Ingenuity, 2008
Publications Pertinentes
- Liu, Q., Netrapalli, P., Szepesvari, C., & Jin, C. (2023). « Optimistic MLE: A generic model-based algorithm for partially observable sequential decision making ». In Proceedings of the 55th Annual ACM Symposium on Theory of Computing (pp. 363-376).
- Weisz, G., György, A., Kozuno, T., & Szepesvári, C. (2022). « Confident approximate policy iteration for efficient local planning in -realizable MDPs ». In Advances in Neural Information Processing Systems 35 (pp. 25547-25559).
- Zhou, D., Gu, Q., & Szepesvari, C. (2021). « Nearly minimax optimal reinforcement learning for linear mixture Markov decision processes ». In Conference on Learning Theory (pp. 4532-4576).
- Lattimore, T., Szepesvári, C. (2020). Bandit algorithms, Presses universitaires de Cambridge.
- Szepesvári, C. (2010). « Algorithms for reinforcement learning », Synthesis Lectures on Artificial Intelligence and Machine Learning, 4(1), 1-103.
- Kocsis, L., Szepesvári, C. (2006). « Bandit based Monte-Carlo planning », European Conference on Machine Learning, p. 282-293.