Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.rights.licenseReconocimiento 4.0 Internacional. (CC BY)-
dc.contributor.advisorUchitel, Sebastiánes
dc.contributor.advisorBraberman, Víctores
dc.contributor.authorDelgado, Tomáses
dc.date.accessioned2024-02-16T12:54:28Z-
dc.date.available2024-02-16T12:54:28Z-
dc.date.issued2023-05-02-
dc.identifier.urihttps://hdl.handle.net/20.500.12381/3417-
dc.description.abstractEn esta tesis desarrollamos un primer método para aprender una heurística que guíe la exploración a partir de la experiencia. En primer lugar, definimos una tarea de aprendizaje por refuerzo para la cual el agente representa una política de exploración. Luego, mostramos una forma de usar Q-Learning abstrayendo tanto estados como acciones en un conjunto de features. Esta abstracción hace posible el aprendizaje y la generalización, pero genera un alto grado de observabilidad parcial. La evaluación empírica muestra que, a pesar de la falta de garantías teóricas, es posible aprender consistentemente políticas competitivas en las instancias de entrenamiento. Más aún, las políticas inducidas en instancias grandes superan en promedio a la mejor heurística desarrollada por humanos, empujando la frontera de problemas resueltos en algunos de los dominios del benchmark.es
dc.description.sponsorshipAgencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovaciónes
dc.description.sponsorshipUniversidad de Buenos Aireses
dc.description.sponsorshipAgencia Nacional de Investigación e Innovaciónes
dc.language.isospaes
dc.publisherUniversidad de Buenos Aireses
dc.relation.urihttps://hdl.handle.net/20.500.12381/3418-
dc.relation.urihttps://hdl.handle.net/20.500.12381/3419-
dc.relation.urihttps://hdl.handle.net/20.500.12381/3420-
dc.rightsAcceso abierto*
dc.subjectSíntesis de controladoreses
dc.subjectAprendizaje por refuerzoes
dc.subjectRedes neuronaleses
dc.titleAprendiendo políticas de exploración generales para escalar la síntesis de controladores discretoses
dc.typeTrabajo final de gradoes
dc.subject.aniiCiencias Naturales y Exactas-
dc.subject.aniiCiencias de la Computación e Información-
dc.subject.aniiCiencias de la Computación-
dc.identifier.aniiIA_1_2022_1_173516es
dc.type.versionPublicadoes
dc.anii.subjectcompleto//Ciencias Naturales y Exactas/Ciencias de la Computación e Información/Ciencias de la Computaciónes
Aparece en las colecciones: Publicaciones de ANII

Archivos en este ítem:
archivo  Descripción Tamaño Formato
Tesis Tomas Delgado.pdfDescargar 1.69 MBAdobe PDF

Las obras en REDI están protegidas por licencias Creative Commons.
Por más información sobre los términos de esta publicación, visita: Reconocimiento 4.0 Internacional. (CC BY)