Wunjo Community Edition (CE)

Документация о проекте
Сообщить об ошибке · Предложить улучшения · Видео курс

Большое обновление Wunjo v2

Привет! Ваша поддержка имеет решающее значение для ускорения выпуска новых обновлений для Community Edition (CE). Ваше участие вдохновляет меня на улучшение функций, выпуск новых версий, таких как интеграция улучшенного клонирования голосов, биржа публичных ссылок, контролируемый рестайлинг контента и другие возможностей.

Уже доступно

Профессиональная (Pro) версия доступна для скачивания wunjo.online. Версия для сообщества будет доступна позже.

Если вы задались вопросом, какая помощь может потребоваться для проекта, тогда:

Расскажите другим: Поделитесь проектом с друзьями и пригласите их присоединиться к сообществу.
Оставайтесь на связи: Подпишитесь на проект Wunjo на GitHub и следите за мной в социальных сетях, чтобы первыми узнавать об обновлениях. Вы можете найти меня по wladradchenko в социальных сетях и wladblog в Telegram.
Поддержите на Boosty: Ваша поддержка на Boosty поможет определить, какие функции из Professional версии будут перенесены в CE.

Что нового в обновлении? Откройте этот список, чтобы увидеть полный обзор на YouTube.

Обзор

О проекте

Wunjo использует возможности нейронных сетей для предоставления передовых решений в области синтеза речи, клонирования голосов, изменения и рестайлинга контента, а также создания deepfake. Официальный сайт wunjo.online.

Попробуйте прямо сейчас

Откройте список, чтобы увидеть больше подробностей.

В версии 1.6 Wunjo поддерживает несколько языков для клонирования голосов и синтеза речи, обучение моделей TTS, распознавание речи в реальном времени, улучшение аудио, многоязычный интерфейс и использование ключевого слова "pass" в функции video-to-video.

Новая версия 2.0 представляет полностью переработанный интерфейс, улучшенную производительность, усовершенствованную функцию смены лиц, генератор лиц несуществующих людей и анализатор deepfake. Также включены улучшения в синхронизацию губ, улучшение контента, удаление объектов, текста и фона, а также изменение и переработка контента и его компонентов с использованием текстовых подсказок. Дополнительно, публичные ссылки позволяют вам пользоваться и делиться ссылками на развернутое приложение с вашими друзьями.

Будущие обновления будут включать возврат и улучшение отсутствующих аудиофункций из версии 1.6, делая их еще лучше.

Доступно как в бесплатной Community Edition, так и в подписной Professional Edition на wunjo.online, Wunjo подходит для широкого круга пользователей, от начинающих до профессионалов, обеспечивая конфиденциальность за счет работы локально на вашем устройстве.

Почему стоит выбрать Wunjo Community Edition?

Все-в-одном: Всеобъемлющий инструмент, удовлетворяющий как голосовые, так и визуальные потребности в области ИИ.
Удобство для пользователя: Разработан для всех, от начинающих до профессионалов.
Приватность прежде всего: Работает локально на вашем компьютере, обеспечивая сохранность ваших данных.
Открытый код и бесплатно: Пользуйтесь улучшениями, разработанными сообществом, и используйте приложение бесплатно.

Почему стоит выбрать Wunjo Professional?

Больше функций: Первый доступ к обновлениям, дополнительные и более продвинутые функции.
Публичные ссылки: Разместите свое собственное серверное (ПК) приложение, доступное из любой точки мира.
Неограниченная производительность: Обрабатывайте несколько задач одновременно для увеличения общей производительности.

Шагните в будущее креативности с использованием ИИ вместе с Wunjo.

Запуск

Требуется Python версии 3.10 и ffmpeg.

Подробные инструкции по установке Wunjo CE с GitHub см. в разделе [Запуск проекта с GitHub](https://github.com/wladradченко/wunjo.wladradkova.ru/wiki/How-to-install-the-application#launch- project-from-github) в вики.

Как собрать под Windows?

Вы найдете на сайте официальные установщики на Windows/Ubuntu или портативные версии.

Примеры

Откройте списки, чтобы просмотреть подробную информацию о требованиях и примерах.

1. Синтез речи и клонирование голоса

Доступно в Wunjo CE 1.6.

Русский синтезированный голос из текста
Английский голос клонированный из ранее синтезированного русского голоса
Китайский голос клонированный из ранее синтезированного русского голоса
Оригинальный отрывок песни
Извлечение голоса из песни
Клонирование голоса из песни

2. Анимация лица из изображения

Оригинал	Фиксированное лицо + Улучшение лица

3. Анимация рта из видео

Оригинал	Анимация рта	Анимация рта + Улучшение лица

4. Замена лица по одному фото

Оригинал фото	Оригинал видео	Замена лица + Улучшение окружения

5. Удаление объектов с видео

Оригинал	С удалением машины

6. Автоматичесское получение масок объектов

Вы можете сохранить из видео обьекты с вырезанным прозрачным или цветным фоном

Оригинал	Полученная маска из изображений

7. Преобразование видео в видео по текстовой подсказке (Только на GPU)

Большее разрешение видео, дает лучше качество для нарисованных кадров. Максимальное разрешение видео зависит от количество VRAM.

Разрешение результата 512x512 и используется модель для дипфейков

Оригинал	Блондин + Коричневый пиджак

Разрешение результата 512x512 кастомная модель stable diffusion

Кроме того, вы можете использовать свою собственную модель stable diffusion для перерисовки видео или объектов в видео с разной временной шкалой.

Оригинал	Пропуск объекта + Изменение фона

Изменение объекта + Улучшение видео	Изменение объекта + Улучшение аниме

Ограничения разрешения видео по VRAM графического процессора

32 GB	23 GB	18 GB	14 GB	10 GB	8 GB	7 GB
1280x1280	1080x1080	1024x1024	768x768	640x640	576x576	512x512

8. Дипфейк эмоций [Experimental]

Это экспериментальная функция, которая находится в стадии разработки, но вы можете прямо сейчас взглянуть на некоторый ее функционал в Wunjo CE 1.6.

Оригинал	Радость	Злость

Страх	Грусть	Отвращение

Обновления

Обновление 2.0.0

Полностью переработанный интерфейс для настольных и мобильных устройств, с нуля.
Улучшенная производительность с обработкой нескольких задач одновременно, стабильность и более быстрая обработка.
Улучшенная функциональность замены лиц теперь поддерживает несколько замен лиц в разные моменты времени через API.
Введен генератор лиц несуществующих людей.
Добавлен анализатор deepfake для различения подлинного контента от манипулированных медиа.
Улучшенная синхронизация губ для более плавных анимаций и устранения дефектов подбородка.
Выбор маски в реальном времени для безупречного редактирования.
Добавлен выбор области для удаления текста.
Разделены задачи по удалению объектов и удалению фона для большей точности. Теперь вы можете создавать видео с использованием хромакея.
Введен собственный файловый менеджер для эффективного управления файлами в приложении.
Улучшено взаимодействие с нейронными сетями, включая безупречное скачивание из интернета.
Легкий переключатель между клиентским и серверным приложением и обратно.
Поддержка нескольких пользователей с настраиваемыми ограничениями на одновременные задачи и использование памяти (ОЗУ, видеопамять, длительность, размер, количество одновременных задач).
Внутренние подсказки для оптимизации качества контента.
Умный генератор подсказок для стилизации видео и объектов.

Обзор запланированных обновлений

Биржа публичных ссылок.
Полный контроль над преобразованием контента и его компонента текстовыми подсказками.
Клонирование голоса на мульти языки.
Улучшение разделения звуков.
Добавление новых языков в интерфейс.
Улучшение профиля пользователя.
Улучшение статуса готовности контента.

Поддержка

Вы можете поддержать автора проекта в развитии его творческих идей на Boosty или CloudTips. Благодаря Boosty, у вас будет возможность голосовать за то, какой функционал из Professional версии, появятся в Community Edition в новых обновлениях. Существуют и другие способы поддержать развитие проекта, подробнее на странице.

Boosty	CloudTips

Донаты

Я выражаю искреннюю благодарность следующим людям, которые щедро поддержали этот проект посредством пожертвований:

Monogo - 10000 руб.
S. - 4500 руб.
Konstantin Kravtsov - 3000 руб.
LEO - 500 руб.
Несколько участников, которые предпочли остаться анонимными или предпочли не публиковаться в списке. Ваша поддержка очень ценна.

Я искренне ценю щедрость всех сторонников проекта. Ваш вклад позволяет продолжать улучшать и поддерживать этот проект.

Контакт

Автор: Wladislav Radchenko

Почта: i@wladradchenko.ru

Проект: https://github.com/wladradchenko/wunjo.wladradchenko.ru

Сайт приложения: wladradchenko.ru/wunjo

Предпосылки

Wunjo (Ву́ньо) происходит из древнего рунического алфавита и представляет радость и удовлетворение, что может быть связано с идеей использования приложения для создания увлекательной и выразительной речи. Вуньо (ᚹ) — восьмая руна старшего и англосаксонского футарка. До введения буквы W в латинский алфавит вместо неё в английском языке использовалась буква Ƿynn (Ƿƿ), происходящая от этой руны.

Зависимости

Wunjo создан на основе замечательных результатов различных проектов с открытым исходным кодом. Каждый интегрированный компонент отражает стремление к улучшению и адаптации существующих технологий в рамках совместной разработки с открытым исходным кодом. В списке ниже представлены проекты, которые были адаптированы и улучшены для включения в Wunjo:

Синтез речи и клонирование голоса: Адаптированные версии Tacotron 2, Waveglow и улучшена версия Real-Time Voice Cloning от первоначального решения с добавлением VoiceFixer
Пользовательский интерфейс и упаковка: Реализация Flask UI и BeeWare
Обработка звука: Адаптированная версия Open-Unmix для разделения звука
Анимация и улучшение лица: Адаптированные версии Wav2lip, Face Utils
Улучшение изображений и видео: Адаптированная версия Real-ESRGAN для улучшения качества видео и изображений
Обработка и сегментация видео: Адаптации Segment Anything, Rerender a Video, GMFlow, ControlNet и обновленная реализация Ebsynth
AI Art Generation: Адаптация Stable Diffusion для изменения видео текстовыми запросами

Я выражаю благодарность первоначальным авторам этих технологий. Их новаторская работа сыграла важную роль в расширении возможностей Wunjo. Для постоянного хранения и управления версиями моделей, которые я лично обучил, используется Hugging Face Model Storage. Если вы заинтересованы в том, чтобы внести свой вклад в Wunjo, особенно в области клонирования голоса для новых языков, не стесняйтесь предлагать свои модели или обращаться к сотрудничеству через GitHub или Hugging Face.

[вернуться наверх]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_ru.md

README_ru.md

Wunjo Community Edition (CE)

Большое обновление Wunjo v2

Уже доступно

О проекте

Запуск

Примеры

Разрешение результата 512x512 и используется модель для дипфейков

Разрешение результата 512x512 кастомная модель stable diffusion

Ограничения разрешения видео по VRAM графического процессора

Обновления

Поддержка

Донаты

Контакт

Предпосылки

Зависимости

Files

README_ru.md

Latest commit

History

README_ru.md

File metadata and controls

Wunjo Community Edition (CE)

Большое обновление Wunjo v2

Уже доступно

О проекте

Запуск

Примеры

Разрешение результата 512x512 и используется модель для дипфейков

Разрешение результата 512x512 кастомная модель stable diffusion

Ограничения разрешения видео по VRAM графического процессора

Обновления

Поддержка

Донаты

Контакт

Предпосылки

Зависимости