Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Optimización interactiva en sistemas cognitivos de planifica

No description
by

Paula Toselli

on 28 March 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Optimización interactiva en sistemas cognitivos de planifica

Nacimiento del Tema...
¿Qué es IRL?
Objetivo del Plan
Muchas gracias...!
Casos de Estudio
Comenzando a trabajar...
El concepto de Inverse Reinforcemente Learning (IRL) hace referencia a una METODOLOGÍA que permite, y simplifica, el modelado del CONOCIMIENTO EXPERTO HUMANO a través de las funciones de recompensa que generan las POLÍTICAS DE APRENDIZAJE extensibles incluso para los Estados que no había visto antes.
Desarrollo y prueba de algoritmos, abstracciones, utilizando aprendizaje por refuerzos inverso (IRL) para incorporar la optimización interactiva en sistemas cognitivos de planificación y scheduling de tareas integrando simulación y conocimiento experto del dominio.
Planta de manufactura de envases plásticos donde los recursos críticos son extrusores que pueden procesar distintos tipos de productos con distintas velocidades y calidades.

Planta de formulación/envasado/empaquetado/despacho de una gran variedad de productos lácteos donde existen un riguroso test de calidad y a menudo se necesitan operaciones de reformulación que el operador debe gestionar adecuadamente para evitar que impacten excesivamente en los plazos y condiciones de entrega de las órdenes en proceso.
Investigar, comprender, profundizar en conceptos relacionados a IRL con GP
Trabajar sobre un ejemplo didáctico.
Desarrollar un Toolbox de IRL
Paula Toselli
Optimización interactiva en sistemas cognitivos de planificación y scheduling
integrando aprendizaje por refuerzos inverso con conocimiento experto

Trabajos Previos
Relación con RL
Nonlinear Inverse Reinforcement Learning with Gaussian Processes.
Autor: Levine
Full transcript