Speech enhancement models using spectrograms as features

Speech-Enhancement-Models

Speech enhancement models:MLP, Auto-encoder, GAN

Dataset

The dataset is the speech enhancment dataset built by the University of Edinburgh. DataShare.

Requirements

PyTorch

conda install pytorch torchvision -c pytorch

librosa

pip install librosa

Notes:

The audios should be sliced into pieces with equal time length. Then do Short Time Fourier Transform on them, turn them into a 2D matirx. Then we use CNN to extract features from them.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
__pycache__		__pycache__
README.md		README.md
cascade_model.py		cascade_model.py
data_preprocess.py		data_preprocess.py
data_preprocess_new.py		data_preprocess_new.py
datasets.py		datasets.py
draft.py		draft.py
mlp_model.py		mlp_model.py
model_trainer.py		model_trainer.py
resgan_model.py		resgan_model.py
simple_generator.py		simple_generator.py
train.py		train.py
utils.py		utils.py
visualize_model.py		visualize_model.py
wgan.py		wgan.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speech enhancement models using spectrograms as features

Speech-Enhancement-Models

Dataset

Requirements

Notes:

About

Releases

Packages

Languages

ANYMS-A/Speech-Enhancement-Models

Folders and files

Latest commit

History

Repository files navigation

Speech enhancement models using spectrograms as features

Speech-Enhancement-Models

Dataset

Requirements

Notes:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages