Value based method

In this repository we're trying to solve 2 openAI Gym's env using two policy based methods: Hill climbing and Cross-Entropy method

Hill Climbing

Hill_Climbing.ipynb is an implementation of hill climbing with adaptive noise scaling for OpenAI Gym's Cartpole environment.

CEM.ipynb is an implementation of the cross-entropy method for OpenAI Gym's MountainCarContinuous environment.

For more well explained methods for policy based method here's a good blog:

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
CEM.ipynb		CEM.ipynb
Hill_Climbing.ipynb		Hill_Climbing.ipynb
README.md		README.md
checkpoint.pth		checkpoint.pth