zuma-flow

Ai learns to play zuma

baseline evaluation with random policy, 10 episodes: 81.0

todo:

[ ] add verbose mode to zumaEnvirnment

[ ] learn dqn
[ ] implement dqn with 1D action space :(
[ ] research other multi-dimentional action space solutions :)

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
Handlers		Handlers
.gitignore		.gitignore
LICENSE		LICENSE
Main.py		Main.py
README.md		README.md
ZumaEnvirnment.py		ZumaEnvirnment.py
baselineEval.py		baselineEval.py
requirements.txt		requirements.txt
test.py		test.py