Skip to content

Latest commit

 

History

History
443 lines (354 loc) · 28.4 KB

README_ru.md

File metadata and controls

443 lines (354 loc) · 28.4 KB

Price Python 3.10 GitHub package version License: MIT v1.0 Habr Articles YouTube Chanel Hugging Face Models

[EN]


Большое обновление Wunjo v2

Привет! Ваша поддержка имеет решающее значение для ускорения выпуска новых обновлений для Community Edition (CE). Ваше участие вдохновляет меня на улучшение функций, выпуск новых версий, таких как интеграция улучшенного клонирования голосов, биржа публичных ссылок, контролируемый рестайлинг контента и другие возможностей.

Уже доступно

Профессиональная (Pro) версия доступна для скачивания wunjo.online. Версия для сообщества будет доступна позже.

Если вы задались вопросом, какая помощь может потребоваться для проекта, тогда:

  • Расскажите другим: Поделитесь проектом с друзьями и пригласите их присоединиться к сообществу.
  • Оставайтесь на связи: Подпишитесь на проект Wunjo на GitHub и следите за мной в социальных сетях, чтобы первыми узнавать об обновлениях. Вы можете найти меня по wladradchenko в социальных сетях и wladblog в Telegram.
  • Поддержите на Boosty: Ваша поддержка на Boosty поможет определить, какие функции из Professional версии будут перенесены в CE.
Что нового в обновлении? Откройте этот список, чтобы увидеть полный обзор на YouTube.
Обзор
video

О проекте

Wunjo использует возможности нейронных сетей для предоставления передовых решений в области синтеза речи, клонирования голосов, изменения и рестайлинга контента, а также создания deepfake. Официальный сайт wunjo.online.

Попробуйте прямо сейчас
video
Откройте список, чтобы увидеть больше подробностей.

В версии 1.6 Wunjo поддерживает несколько языков для клонирования голосов и синтеза речи, обучение моделей TTS, распознавание речи в реальном времени, улучшение аудио, многоязычный интерфейс и использование ключевого слова "pass" в функции video-to-video.

Новая версия 2.0 представляет полностью переработанный интерфейс, улучшенную производительность, усовершенствованную функцию смены лиц, генератор лиц несуществующих людей и анализатор deepfake. Также включены улучшения в синхронизацию губ, улучшение контента, удаление объектов, текста и фона, а также изменение и переработка контента и его компонентов с использованием текстовых подсказок. Дополнительно, публичные ссылки позволяют вам пользоваться и делиться ссылками на развернутое приложение с вашими друзьями.

Будущие обновления будут включать возврат и улучшение отсутствующих аудиофункций из версии 1.6, делая их еще лучше.

Доступно как в бесплатной Community Edition, так и в подписной Professional Edition на wunjo.online, Wunjo подходит для широкого круга пользователей, от начинающих до профессионалов, обеспечивая конфиденциальность за счет работы локально на вашем устройстве.

Почему стоит выбрать Wunjo Community Edition?

  • Все-в-одном: Всеобъемлющий инструмент, удовлетворяющий как голосовые, так и визуальные потребности в области ИИ.
  • Удобство для пользователя: Разработан для всех, от начинающих до профессионалов.
  • Приватность прежде всего: Работает локально на вашем компьютере, обеспечивая сохранность ваших данных.
  • Открытый код и бесплатно: Пользуйтесь улучшениями, разработанными сообществом, и используйте приложение бесплатно.

Почему стоит выбрать Wunjo Professional?

  • Больше функций: Первый доступ к обновлениям, дополнительные и более продвинутые функции.
  • Публичные ссылки: Разместите свое собственное серверное (ПК) приложение, доступное из любой точки мира.
  • Неограниченная производительность: Обрабатывайте несколько задач одновременно для увеличения общей производительности.

Шагните в будущее креативности с использованием ИИ вместе с Wunjo.

Запуск

Требуется Python версии 3.10 и ffmpeg.

Подробные инструкции по установке Wunjo CE с GitHub см. в разделе [Запуск проекта с GitHub](https://github.com/wladradченко/wunjo.wladradkova.ru/wiki/How-to-install-the-application#launch- project-from-github) в вики.

Как собрать под Windows?
video

Вы найдете на сайте официальные установщики на Windows/Ubuntu или портативные версии.

Примеры

Откройте списки, чтобы просмотреть подробную информацию о требованиях и примерах.

1. Синтез речи и клонирование голоса

Доступно в Wunjo CE 1.6.

2. Анимация лица из изображения
Оригинал Фиксированное лицо + Улучшение лица
original static_enhancer
3. Анимация рта из видео
Оригинал Анимация рта Анимация рта + Улучшение лица
original move_enhancer static_enhancer
4. Замена лица по одному фото
Оригинал фото Оригинал видео Замена лица + Улучшение окружения
original original static_enhancer
5. Удаление объектов с видео
Оригинал С удалением машины
original original
6. Автоматичесское получение масок объектов

Вы можете сохранить из видео обьекты с вырезанным прозрачным или цветным фоном

Оригинал Полученная маска из изображений
original original
7. Преобразование видео в видео по текстовой подсказке (Только на GPU)

Большее разрешение видео, дает лучше качество для нарисованных кадров. Максимальное разрешение видео зависит от количество VRAM.

Разрешение результата 512x512 и используется модель для дипфейков

Оригинал Блондин + Коричневый пиджак
original pass

Разрешение результата 512x512 кастомная модель stable diffusion

Кроме того, вы можете использовать свою собственную модель stable diffusion для перерисовки видео или объектов в видео с разной временной шкалой.

Оригинал Пропуск объекта + Изменение фона
original pass
Изменение объекта + Улучшение видео Изменение объекта + Улучшение аниме
full_change full_change

Ограничения разрешения видео по VRAM графического процессора

32 GB 23 GB 18 GB 14 GB 10 GB 8 GB 7 GB
1280x1280 1080x1080 1024x1024 768x768 640x640 576x576 512x512
8. Дипфейк эмоций [Experimental]

Это экспериментальная функция, которая находится в стадии разработки, но вы можете прямо сейчас взглянуть на некоторый ее функционал в Wunjo CE 1.6.

Оригинал Радость Злость
original original original
Страх Грусть Отвращение
original original original

Обновления

Обновление 2.0.0
  • Полностью переработанный интерфейс для настольных и мобильных устройств, с нуля.
  • Улучшенная производительность с обработкой нескольких задач одновременно, стабильность и более быстрая обработка.
  • Улучшенная функциональность замены лиц теперь поддерживает несколько замен лиц в разные моменты времени через API.
  • Введен генератор лиц несуществующих людей.
  • Добавлен анализатор deepfake для различения подлинного контента от манипулированных медиа.
  • Улучшенная синхронизация губ для более плавных анимаций и устранения дефектов подбородка.
  • Выбор маски в реальном времени для безупречного редактирования.
  • Добавлен выбор области для удаления текста.
  • Разделены задачи по удалению объектов и удалению фона для большей точности. Теперь вы можете создавать видео с использованием хромакея.
  • Введен собственный файловый менеджер для эффективного управления файлами в приложении.
  • Улучшено взаимодействие с нейронными сетями, включая безупречное скачивание из интернета.
  • Легкий переключатель между клиентским и серверным приложением и обратно.
  • Поддержка нескольких пользователей с настраиваемыми ограничениями на одновременные задачи и использование памяти (ОЗУ, видеопамять, длительность, размер, количество одновременных задач).
  • Внутренние подсказки для оптимизации качества контента.
  • Умный генератор подсказок для стилизации видео и объектов.
Обзор запланированных обновлений
  • Биржа публичных ссылок.
  • Полный контроль над преобразованием контента и его компонента текстовыми подсказками.
  • Клонирование голоса на мульти языки.
  • Улучшение разделения звуков.
  • Добавление новых языков в интерфейс.
  • Улучшение профиля пользователя.
  • Улучшение статуса готовности контента.

Поддержка

Вы можете поддержать автора проекта в развитии его творческих идей на Boosty или CloudTips. Благодаря Boosty, у вас будет возможность голосовать за то, какой функционал из Professional версии, появятся в Community Edition в новых обновлениях. Существуют и другие способы поддержать развитие проекта, подробнее на странице.

Boosty CloudTips
пицца кофе

Донаты

Я выражаю искреннюю благодарность следующим людям, которые щедро поддержали этот проект посредством пожертвований:

  • Monogo - 10000 руб.
  • S. - 4500 руб.
  • Konstantin Kravtsov - 3000 руб.
  • LEO - 500 руб.
  • Несколько участников, которые предпочли остаться анонимными или предпочли не публиковаться в списке. Ваша поддержка очень ценна.

Я искренне ценю щедрость всех сторонников проекта. Ваш вклад позволяет продолжать улучшать и поддерживать этот проект.

Контакт

Автор: Wladislav Radchenko

Почта: [email protected]

Проект: https://github.com/wladradchenko/wunjo.wladradchenko.ru

Сайт приложения: wladradchenko.ru/wunjo

Предпосылки

Wunjo (Ву́ньо) происходит из древнего рунического алфавита и представляет радость и удовлетворение, что может быть связано с идеей использования приложения для создания увлекательной и выразительной речи. Вуньо (ᚹ) — восьмая руна старшего и англосаксонского футарка. До введения буквы W в латинский алфавит вместо неё в английском языке использовалась буква Ƿynn (Ƿƿ), происходящая от этой руны.

Зависимости

Wunjo создан на основе замечательных результатов различных проектов с открытым исходным кодом. Каждый интегрированный компонент отражает стремление к улучшению и адаптации существующих технологий в рамках совместной разработки с открытым исходным кодом. В списке ниже представлены проекты, которые были адаптированы и улучшены для включения в Wunjo:

  • Синтез речи и клонирование голоса: Адаптированные версии Tacotron 2, Waveglow и улучшена версия Real-Time Voice Cloning от первоначального решения с добавлением VoiceFixer
  • Пользовательский интерфейс и упаковка: Реализация Flask UI и BeeWare
  • Обработка звука: Адаптированная версия Open-Unmix для разделения звука
  • Анимация и улучшение лица: Адаптированные версии Wav2lip, Face Utils
  • Улучшение изображений и видео: Адаптированная версия Real-ESRGAN для улучшения качества видео и изображений
  • Обработка и сегментация видео: Адаптации Segment Anything, Rerender a Video, GMFlow, ControlNet и обновленная реализация Ebsynth
  • AI Art Generation: Адаптация Stable Diffusion для изменения видео текстовыми запросами

Я выражаю благодарность первоначальным авторам этих технологий. Их новаторская работа сыграла важную роль в расширении возможностей Wunjo. Для постоянного хранения и управления версиями моделей, которые я лично обучил, используется Hugging Face Model Storage. Если вы заинтересованы в том, чтобы внести свой вклад в Wunjo, особенно в области клонирования голоса для новых языков, не стесняйтесь предлагать свои модели или обращаться к сотрудничеству через GitHub или Hugging Face.

[вернуться наверх]