Redundancy-Infused SGD for Distributed Optimization of Deep Learning Models

This is a preliminary implementation of the ICML 2019 paper:

Haddadpour, F., Kamani, M.M., Mahdavi, M., & Cadambe, V. "Trading Redundancy for Communication: Speeding up Distributed SGD for Non-convex Optimization." International Conference on Machine Learning. 2019.

Instruction

You can download each dataset using:

python generate_cifar_tfrecords.py --data-dir=./cifar10 --dataset cifar10

Then you can run RI-SGD using this script:

python main.py --data-dir=./cifar10 \
                --num-gpus=8 \
                --train-steps=45000 \
                --variable-strategy GPU \
                --job-dir=./log/ri-sgd/cifar10-ri-redun25-step50 \
                --run-type multi \
                --redundancy=0.25  \
                --sync-step=50 \
                --dataset cifar10 \
                --eval-batch-size=128

python main.py --data-dir=./cifar10 \
                --num-gpus=8 \
                --train-steps=45000 \
                --variable-strategy GPU \
                --job-dir=./log/ri-sgd/cifar10-ri-sync \
                --run-type sync \
                --redundancy=0.0  \
                --dataset cifar10 \
                --eval-batch-size=128

where redundancy is equal to $\mu$ in paper and sync-step is equal to $\tau$ in paper.

Citation

@inproceedings{haddadpour2019trading,
  title={Trading Redundancy for Communication: Speeding up Distributed SGD for Non-convex Optimization},
  author={Haddadpour, Farzin and Kamani, Mohammad Mahdi and Mahdavi, Mehrdad and Cadambe, Viveck},
  booktitle={International Conference on Machine Learning},
  pages={2545--2554},
  year={2019}
}

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
LICENSE		LICENSE
README.md		README.md
cifar.py		cifar.py
generate_cifar_tfrecords.py		generate_cifar_tfrecords.py
main.py		main.py
model_base.py		model_base.py
model_base1.py		model_base1.py
resnet_model.py		resnet_model.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LICENSE

LICENSE

README.md

README.md

cifar.py

cifar.py

generate_cifar_tfrecords.py

generate_cifar_tfrecords.py

main.py

main.py

model_base.py

model_base.py

model_base1.py

model_base1.py

resnet_model.py

resnet_model.py

utils.py

utils.py

Repository files navigation

Redundancy-Infused SGD for Distributed Optimization of Deep Learning Models

Instruction

Citation

About

Releases

Packages

Languages

License

mmkamani7/RI-SGD

Folders and files

Latest commit

History

Repository files navigation

Redundancy-Infused SGD for Distributed Optimization of Deep Learning Models

Instruction

Citation

About

Topics

Resources

License

Stars

Watchers

Forks

Languages