Título : Exploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approach
Autor(es) : Delgado, Tomás
Sánchez Sorondo, Marco
Braberman, Víctor
Uchitel, Sebastián
Fecha de publicación : 8-jul-2023
Tipo de publicación: Documento de conferencia
Versión: Enviado
Publicado en: 33rd International Conference on Automated Planning and Scheduling. Prague, Czech Republic. 2023
Areas del conocimiento : Ciencias Naturales y Exactas
Ciencias de la Computación e Información
Ciencias de la Computación
Otros descriptores : Artificial intelligence
Controller synthesis
Resumen : In this work, we propose a new method for obtaining heuristics based on Reinforcement Learning (RL). The synthesis algorithm is thus framed as an RL task with an unbounded action space and a modified version of DQN is used. With a simple and general set of features that abstracts both states and actions, we show that it is possible to learn heuristics on small versions of a problem that generalize to the larger instances, effectively doing zero-shot policy transfer. Our agents learn from scratch in a highly partially observable RL task and outperform the existing heuristic overall, in instances unseen during training.
URI / Handle: https://hdl.handle.net/20.500.12381/3418
Recursos relacionados en REDI: https://hdl.handle.net/20.500.12381/3417
https://hdl.handle.net/20.500.12381/3419
https://hdl.handle.net/20.500.12381/3420
DOI: https://doi.org/10.48550/arXiv.2210.05393
Institución responsable del proyecto: Universidad de Buenos Aires.
Financiadores: Agencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovación
Universidad de Buenos Aires
Agencia Nacional de Investigación e Innovación
Identificador ANII: IA_1_2022_1_173516
Nivel de Acceso: Acceso abierto
Licencia CC: Reconocimiento 4.0 Internacional. (CC BY)
Aparece en las colecciones: Publicaciones de ANII

Archivos en este ítem:
archivo  Descripción Tamaño Formato
2210.05393v2.pdfDescargar 1.33 MBAdobe PDF

Las obras en REDI están protegidas por licencias Creative Commons.
Por más información sobre los términos de esta publicación, visita: Reconocimiento 4.0 Internacional. (CC BY)