RL Maze Project (DQN / Gymnasium)

A self-contained reinforcement learning project where an agent learns to navigate randomly generated mazes.

Features

Custom Gymnasium environment: GridMazeEnv
DQN agent in PyTorch with:
- Experience replay
- Target network
- Epsilon-greedy exploration with linear decay
- Gradient clipping
Train/Evaluate scripts and model checkpointing
Deterministic training via --seed

Quickstart

python -m venv .venv
# macOS/Linux
source .venv/bin/activate
# Windows (PowerShell)
# .venv\Scripts\Activate.ps1

pip install -r requirements.txt

# Train DQN on a fixed maze (seeded for reproducibility)
python rl_maze/train_dqn.py --episodes 400 --maze-size 9 --seed 42 --save-dir runs/dqn_9x9

# Evaluate on randomized mazes of the same size (generalization)
python rl_maze/evaluate.py --episodes 100 --maze-size 9 --seed 123 --load runs/dqn_9x9/best.pt

Metrics (suggested KPIs)

Success rate: fraction of episodes reaching the goal
Average steps to goal (over successful episodes)
Episode return (reward)
Wall bump rate: attempted moves into walls / steps

Structure

rl_maze_project/
├── README.md
├── requirements.txt
└── rl_maze
    ├── __init__.py
    ├── agents
    │   ├── __init__.py
    │   ├── dqn.py
    │   └── replay_buffer.py
    ├── envs
    │   ├── __init__.py
    │   └── grid_maze_env.py
    ├── evaluate.py
    └── train_dqn.py

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
rl_maze		rl_maze
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RL Maze Project (DQN / Gymnasium)

Features

Quickstart

Metrics (suggested KPIs)

Structure

About

Uh oh!

Releases

Packages

Languages

bme2003/reinforcement_learning_agent

Folders and files

Latest commit

History

Repository files navigation

RL Maze Project (DQN / Gymnasium)

Features

Quickstart

Metrics (suggested KPIs)

Structure

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages