Planejamento Probabilístico e Aprendizado por Reforço

Este repositório contém o projeto sendo desenvolvido para a disciplina SIN5021 - Planejamento Probabilístico e Aprendizado por Reforço , ministrada no primeiro semestre de 2021 por Valdinei Freire da Silva. Esse trabalho visa aplicar algoritmos de aprendizado por reforço no jogo ~~da galinha~~ Freeway do Atari 2600, assim como a discretização do ambiente para a aplicação de algoritmos ótimos.

Notebooks: Construção do ambiente discreto, algoritmo value iteration, policy iteration, Deep Q-Learning Network. O resultado para o algoritmo Proximal Policy Optimization é proveniente de uma mistura entre as implementações de ikostrikov e AlessandroPomponio;
PDF: Proposta, entrega parcial do projeto e o artigo final.

Veja o artigo final aqui

Agente no início do treinamento e pouco motivado:

Agente após algumas dezenas de milhares de passos e muito motivado:

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
Gifs		Gifs
Notebooks		Notebooks
PDF		PDF
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Gifs

Gifs

Notebooks

Notebooks

PDF

PDF

README.md

README.md

Repository files navigation

Planejamento Probabilístico e Aprendizado por Reforço

About

Releases

Packages

Languages

matiasvinicius/Planning-and-Reinforcement-Learning

Folders and files

Latest commit

History

Repository files navigation

Planejamento Probabilístico e Aprendizado por Reforço

About

Topics

Resources

Stars

Watchers

Forks

Languages