Reinforcement learning experiments

Learning RL by implementing and analysing different RL methods.

Directory	Game	Number of agents	RL method
nim-dqn	Nim-21	2	Deep Q-network
nim-a2c	Nim-21	2	Advantage Actor Critic
matching-pennies-a2c	Matching Pennies	2	Advantage Actor Critic
snake-a2c	Snake	1	Advantage Actor Critic
snake-ppo	Snake	1	Proximal Policy Optimisation

Provide feedback

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
matching-pennies-a2c		matching-pennies-a2c
nim-a2c		nim-a2c
nim-dqn		nim-dqn
snake-a2c		snake-a2c
snake-ppo		snake-ppo
.gitignore		.gitignore
README.md		README.md