Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.rights.licenseReconocimiento 4.0 Internacional. (CC BY)-
dc.contributor.authorDelgado, Tomáses
dc.contributor.authorSánchez Sorondo, Marcoes
dc.contributor.authorBraberman, Víctores
dc.contributor.authorUchitel, Sebastiánes
dc.date.accessioned2024-02-16T13:30:44Z-
dc.date.available2024-02-16T13:30:44Z-
dc.date.issued2023-07-08-
dc.identifier.urihttps://hdl.handle.net/20.500.12381/3418-
dc.description.abstractIn this work, we propose a new method for obtaining heuristics based on Reinforcement Learning (RL). The synthesis algorithm is thus framed as an RL task with an unbounded action space and a modified version of DQN is used. With a simple and general set of features that abstracts both states and actions, we show that it is possible to learn heuristics on small versions of a problem that generalize to the larger instances, effectively doing zero-shot policy transfer. Our agents learn from scratch in a highly partially observable RL task and outperform the existing heuristic overall, in instances unseen during training.es
dc.description.sponsorshipAgencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovaciónes
dc.description.sponsorshipUniversidad de Buenos Aireses
dc.description.sponsorshipAgencia Nacional de Investigación e Innovaciónes
dc.language.isoenges
dc.relation.urihttps://hdl.handle.net/20.500.12381/3417es
dc.relation.urihttps://hdl.handle.net/20.500.12381/3419-
dc.relation.urihttps://hdl.handle.net/20.500.12381/3420-
dc.rightsAcceso abierto*
dc.source33rd International Conference on Automated Planning and Scheduling. Prague, Czech Republic. 2023es
dc.subjectArtificial intelligencees
dc.subjectController synthesises
dc.titleExploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approaches
dc.typeDocumento de conferenciaes
dc.subject.aniiCiencias Naturales y Exactas-
dc.subject.aniiCiencias de la Computación e Información-
dc.subject.aniiCiencias de la Computación-
dc.identifier.aniiIA_1_2022_1_173516es
dc.type.versionEnviadoes
dc.identifier.doihttps://doi.org/10.48550/arXiv.2210.05393-
dc.anii.institucionresponsableUniversidad de Buenos Aires.es
dc.anii.subjectcompleto//Ciencias Naturales y Exactas/Ciencias de la Computación e Información/Ciencias de la Computaciónes
Aparece en las colecciones: Publicaciones de ANII

Archivos en este ítem:
archivo Descripción Tamaño Formato  
2210.05393v2.pdf1.33 MBAdobe PDFDescargar

Las obras en REDI están protegidas por licencias Creative Commons.
Por más información sobre los términos de esta publicación, visita: Reconocimiento 4.0 Internacional. (CC BY)