David Krueger
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2025
David Krueger est titulaire d’une chaire en IA Canada-CIFAR à Mila et professeur adjoint à l’Université de Montréal. Ses travaux portent sur la réduction du risque d’extinction de l’humanité par l’intelligence artificielle (x-risque IA) par le biais de la recherche technique ainsi que par l’éducation, la sensibilisation, la gouvernance et la défense des droits de la personne. Ses travaux s’attachent à analyser et à réduire les risques associés aux systèmes d’intelligence artificielle avancés, tels que les agents propulsés par l’IA et les grands modèles de langage. Ses recherches antérieures couvraient de nombreux domaines de l’apprentissage profond, de l’alignement de l’IA, de la sécurité de l’IA et de l’éthique de l’IA, notamment les modes de défaillance de l’alignement, la manipulation algorithmique, l’interprétabilité, la robustesse et la compréhension de la manière dont les systèmes d’IA apprennent et se généralisent. David Krueger a occupé précédemment les fonctions de professeur adjoint à l’université de Cambridge et de directeur de la recherche au UK AI Security Institute.
Publications Pertinentes
- Krasheninnikov, D., Krasheninnikov, E., Mlodozeniec, B., Maharaj, T. et Krueger, D. (2024). « Implicit meta-learning may lead language models to trust more reliable sources », International Conference on Machine Learning.
- Chan, A., Salganik, R., He, Z., Burden, J., Duan, Y., Rismani, S., Markelius, A., Collins, K., Molamohammadi, M., Pang, C., Langosco, L., Voudouris, K., Zhao, W., Krasheninnikov, D., Lin, M., Mayhew, A., Bhatt, U., Weller, A., Krueger, D. et Maharaj, T. (2023). « Harms from increasingly agentic algorithmic systems », ACM Conference on Fairness, Accountability, and Transparency.
- Joar Skalse, Niki Howe, Dmitrii Krasheninnikov, David Krueger (2022), « Defining and Characterizing Reward Gaming », Neural Information Processing Systems.
- Langosco, L. D., Koch, J., Sharkey, L., Pfau, J., et Krueger, D. (2022). « Goal misgeneralization in deep reinforcement learning », International Conference on Machine Learning.
- Krueger, D., Caballero, E., Jacobsen, J.-H., Zhang, A., Binas, J., Zhang, D., Le Priol, R. et Courville, A. (2021). « Out-of-distribution generalization via risk extrapolation (REx) », International Conference on Machine Learning.