En este repositorio encontrarán los codigos fuentes utilizados en el laboratorio del curso de Sistemas Inteligentes para el período 2018-02 de la Universidad Central de Chile.
Estos algoritmos presentan agentes cognitivos que resuelven problemas de Reinforcement Learning, se han trabajado dos agentes principalmente:
Este agente se ha probado con el entorno de CartPole (v0 y v1), el cual simula el problema de pole balancing, siendo resuelto en los primeros 200 episodios.
- Política de selección de acción
aleatoria, epsilon-greedy. - Vector de Estados en representación Discreta.
- Disminucion en valores iniciales de alpha y epsilon.
- Selección de acción interactiva (Interactive Reinforcement Learning)
Para la implementación del entorno se utiliza Gym de OpenAI con sus funciones de envoltura (Wrapper) para modificar funcionalidades.
Este agente fué desarrollado para el entorno de CliffWalking para comparar los diferentes métodos de Temporal Difference Learning.
- Implementa el método de SARSA.
- Implementado el método de Q-learning.
- Selección de acción interactiva (Interactive Reinforcement Learning)