Skip to content

Google Colab (without Gradio) notebook for generating AI song covers. YouTube download audio, best voice separation, RVC inference, automatic sound mixing.

License

Notifications You must be signed in to change notification settings

self-destruction/AiAutoCover

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 

Repository files navigation

✨ AiAutoCover

Данный блокнот позволяет заменить голос в песне всего в несколько кликов. Вам понадобятся ссылка на YouTube и ссылка на модель вокала. Всё, нейро-кавер готов! Не нужно ничего устанавливать. Все вычисления происходят на серверах гугл (около 2 часов в день - бесплатно).
Используются open-source модели и репозиторий UVR для отделения вокала от инструментала, RVC для преобразования вокала, SadTalker для анимирования лица (если используете блокнот с SadTalker).
Open In Colab - AI Auto Cover
Open In Colab - AI Auto Cover + SadTalker

💪 Как работает

Установка и подготовка

Подготовка к работе включает в себя установку зависимостей (UVR + RVC), скачивание исходного аудио и модели вокала.

Обработка аудио

Здесь происходит отделение вокала от инструментала. Далее происходит дополнительная обработка от реверберации и эха, а также, есть возможность поэкспериментировать с настройками преобразования голоса. Затем происходит преобразование вокала с использованием выбранной модели

Пост-обработка и финальные штрихи

После преобразования вокала следует пост-обработка, которая включает в себя компрессию, нормализацию, лёгкую реверберацию и разведение по стерео-панораме. Затем вокал и инструментал смешиваются обратно, и вуаля, ваш кавер готов!

Анимирование фотографии

Используя блокнот с SadTalker можно заставить "петь" под готовый кавер любую фотографию.

Повторное использование

Система позволяет возвращаться к любому предыдущему шагу без необходимости запускать полный процесс заново. Например, вы можете загрузить другую модель вокала и преобразовать её, не возвращаясь к отделению вокала от инструмента.

📌 TODO

Вот некоторые вещи, которые я планирую добавить или улучшить:

Прикрутить Google Drive

Сейчас каждый раз приходится скачивать репозитории и устанавливать зависимости, так что первым делом надо сделать Google Drive основным хранилищем. Это облегчит жизнь и сэкономит время.

DeepFake в v2: клипы на новом уровне

На следующем этапе планирую прикрутить DeepFake, чтобы можно было не только делать аудио-каверы, но и менять лица в клипах. Во прикол будет!

Интеграция с SoundCloud, Spotify, Apple Music и другими платформами

Думаю, будет удобно, если добавить возможность напрямую скачивать треки из музыкальных стриминговых сервисов, таких как SoundCloud, Spotify или Apple Music. Наверное, это упростит процесс и сделает его ещё быстрее.

💬 Задать вопрос

Все предложения и замечания приветствуются! Пожалуйста, используйте специальные каналы для вопросов и обсуждений. Помощь гораздо ценнее, если она предоставляется публично, чтобы ею могли воспользоваться больше людей.

Type Platforms
🚨 Баг-репорты GitHub Трекер
🎁 Feature Requests & Идеи GitHub Pull Requests

👩‍💻 Контрибьютеры и поддержка 🐸

Спасибо NeuroDonu за помощь ❤

Star History Chart

 

About

Google Colab (without Gradio) notebook for generating AI song covers. YouTube download audio, best voice separation, RVC inference, automatic sound mixing.

Topics

Resources

License

Stars

Watchers

Forks