À Propos
Les robots et autres agents artificiels peuvent apprendre à résoudre des tâches avec un rendement surhumain; cependant, lorsqu’ils sont confrontés à une tâche différente, le processus d’apprentissage recommence à zéro. Les recherches de Benjamin Rosman visent à comprendre comment les connaissances acquises lors de la résolution d’une tâche peuvent être réutilisées pour la suivante, en s’inspirant de la capacité des humains à décomposer des problèmes complexes en éléments réutilisables. Par conséquent, si un robot a déjà maîtrisé les techniques nécessaires pour ouvrir une porte et apporter le café, il devrait pouvoir réutiliser ces connaissances pour résoudre des problèmes ultérieurs, y compris pour les réaliser simultanément. Grâce à cette décomposition, les humains peuvent aussi préciser en toute sécurité les objectifs requis et interpréter facilement le comportement du robot.
Prix
- Prix de supervision de la Faculté des sciences, Université de Witwatersrand, 2022
- Bourse Friedel Sellschop, Université de Witwatersrand, 2022
- Faculty Research Award, Google, 2018
- Fonds de jeune chercheur, CSIR, 2014
Publications Pertinentes
- Nangue Tasse, G., James, S. et Rosman, B. (2020). A Boolean task algebra for reinforcement learning. Advances in Neural Information Processing Systems, 33, 9497-9507.
- Van Niekerk, B., James, S., Earle, A. et Rosman, B. (2019, May). Composing value functions in reinforcement learning. In International Conference on Machine Learning (pp. 6401-6409). PMLR.
- Rosman, B., Hawasly, M. et Ramamoorthy, S. (2016). Bayesian policy reuse. Machine Learning, 104(1), 99-127.