Plato-GPT-2

Transformer implementation from scratch written on Py-Torch. Optimized for CUDA runtime, designed to integrate seamlessly with Azure ML workspaces

Modularized version. Currently clocked at 85.04M parameters Automatic training pipeline configured for Azure ML.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
outputs		outputs
samples		samples
src		src
.gitignore		.gitignore
README.md		README.md
data.txt		data.txt
more.txt		more.txt
trainer_script.ipynb		trainer_script.ipynb

Provide feedback