À Propos
Les robots et autres agents artificiels peuvent apprendre à résoudre des tâches avec un rendement surhumain; cependant, lorsqu’ils sont confrontés à une tâche différente, le processus d’apprentissage recommence à zéro. Les recherches de Benjamin Rosman visent à comprendre comment les connaissances acquises lors de la résolution d’une tâche peuvent être réutilisées pour la suivante, en s’inspirant de la capacité des humains à décomposer des problèmes complexes en éléments réutilisables. Par conséquent, si un robot a déjà maîtrisé les techniques nécessaires pour ouvrir une porte et apporter le café, il devrait pouvoir réutiliser ces connaissances pour résoudre des problèmes ultérieurs, y compris pour les réaliser simultanément. Grâce à cette décomposition, les humains peuvent aussi préciser en toute sécurité les objectifs requis et interpréter facilement le comportement du robot.
Prix
- Prix de supervision de la Faculté des sciences, Université de Witwatersrand, 2022
- Bourse Friedel Sellschop, Université de Witwatersrand, 2022
- Faculty Research Award, Google, 2018
- Fonds de jeune chercheur, CSIR, 2014
Publications Pertinentes
- Nangue Tasse, G., James, S. et Rosman, B. (2020). A Boolean task algebra for reinforcement learning. Advances in Neural Information Processing Systems, 33, 9497-9507.
- Van Niekerk, B., James, S., Earle, A. et Rosman, B. (2019, May). Composing value functions in reinforcement learning. In International Conference on Machine Learning (pp. 6401-6409). PMLR.
- Rosman, B., Hawasly, M. et Ramamoorthy, S. (2016). Bayesian policy reuse. Machine Learning, 104(1), 99-127.
Soutenez-nous
Le CIFAR est un organisme de bienfaisance enregistré qui reçoit le soutien des gouvernements du Canada, de l’Alberta et du Québec, ainsi que de fondations, de donateurs individuels, d’entreprises et de partenaires canadiens et internationaux.