GitHub - viking-man/self_agent: Personal assistant using Agent modulation with dialog, drawing, video and music playback.

Self_Agent 宁宁小助理

介绍视频：https://www.bilibili.com/video/BV1wW421w7Ue/

程序主体框架使用flask作为前后端链接，对话记忆存储使用SQLite轻量存储，代理内部使用LangChain作为处理框架，梳理用户请求、分发对应处理工具、定制执行逻辑，语音处理使用Whisper、GPT_SOVITS，画图使用StableDiffusion模型等。

整体架构图

整体思路

程序的整体思路是仿照电影剧本，设计出不同用户请求下需要执行的定制逻辑，智能体本身判断、分发，内置大模型作为剧本之外的补充和细节部分的优化

基本流程

->前端读取音频信息
->flask服务端
->whsiper转化成文本
->agent梳理用户请求并分发
->agent-tool定制化处理逻辑
->agent总结并输出最终结果
->GPT_SOVITS文本转为音频信息
->前端直接播放音频文件

使用说明

Agent使用的文本转语音tts模型和语音转文本whisper模型的推理比较耗计算资源和内存，不推荐无GPU电脑使用。如果不想使用tts模型，可以自行在routes类中修改。

使用流程

python版本需要为3.10

下载程序

git clone [email protected]:viking-man/self_agent.git

下载必备程序
1. ffmpeg
配置本地文件：app/agent_openai/custom_config.py

配置项	配置解释	示例	网址
RAPID_API_KEY	Google搜索用到的rapid-api-key	"3b5dd7d5f5mshd78f146dc498a60p143d49jsn07023d199"	https://rapidapi.com/UnlimitedAPI/api/google-web-search1
STABLE_DIFFUSION_MODEL_PATH	本地下载的stable-diffusion模型文件路径	"G:\data\stablediffusion\models\dream\ghostmix_v20Bakedvae.safetensors"	https://civitai.com/models
MUSIC_DIRECTORY	Spotify音乐存储路径	"E:\music\spotify\songs"
SPOTIFY_CLIENT_ID	Spotify-APP的client_id	"55ed24ee34534fe48d1"	https://developer.spotify.com/dashboard
SPOTIFY_CLIENT_SECRET	Spotify-APP的client_secret	"55ed24ee34534fe48d1"	https://developer.spotify.com/dashboard
ENABLE_SOVITS	是否使用GPT_SOVITS的TTS工具，具体使用情况查询后面的github地址	True	https://github.com/RVC-Boss/GPT-SoVITS
BERT_PATH	GPT_SOVITS相关	/GPT-SoVITS/GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large	https://github.com/RVC-Boss/GPT-SoVITS
CNHUBERT_BASE_PATH	GPT_SOVITS相关	/pretrained_models/cnhubert_base_path	https://github.com/RVC-Boss/GPT-SoVITS
GPT_MODEL_PATH	GPT_SOVITS相关	/GPT-SoVITS/GPT_weights/ningning-e15.ckpt	https://github.com/RVC-Boss/GPT-SoVITS
SOVITS_MODEL_PATH	GPT_SOVITS相关	/GPT-SoVITS/SoVITS_weights/ningning_e8_s80.pth	https://github.com/RVC-Boss/GPT-SoVITS
EXAMPLE_WAV	GPT_SOVITS相关	/GPT_SoVITS/prepare_datasets/stage.wav_1266880_1398080.wav
EXAMPLE_TEXT	GPT_SOVITS相关	我爱大自然，我爱人间一切美好的东西
EXAMPLE_TEXT_LANG	GPT_SOVITS相关	all_zh

GPT_SOVITS模型下载地址：https://huggingface.co/lj1995/GPT-SoVITS/tree/main

初始化项目虚拟环境

  python -m venv venv
  . venv/bin/activate

windows用户在使用python -m venv venv创建虚拟环境后，通过命令cd venv/Scripts/到Scripts目录，直接使用activate命令激活创建的虚拟环境

安装对应python包 pip install \external\package\GPT_SoVITS-1.0.tar.gz 安装GPT_SOVITS引用包

pip install -r requirements.txt

初始化对应数据库

flask db init
flask db migrate
flask db upgrade

配置本地参数
运行启动

flask run
网页打开环境运行地址

127.0.0.1:5000

注意事项

.flaskenv中的OPENAI_API_KEY需要换成你自己的openai_api_key，这个可能不好用，建议直接export OPENAI_API_KEY=your_api_key
chatgpt_proxy中需要填写你自己的openai_api_key
whsiper第一次使用会默认下载medium的模型，大概1.3G，需要等待；如果觉得转换效果不好或者响应太慢，可以到WhisperModel.py文件中将medium换成small或者large

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
app		app
external		external
LICENSE		LICENSE
README.md		README.md
config.py		config.py
requirements.txt		requirements.txt
run.py		run.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

app

app

external

external

LICENSE

LICENSE

README.md

README.md

config.py

config.py

requirements.txt

requirements.txt

run.py

run.py

utils.py

utils.py

Repository files navigation

Self_Agent 宁宁小助理

介绍视频：https://www.bilibili.com/video/BV1wW421w7Ue/

程序主体框架使用flask作为前后端链接，对话记忆存储使用SQLite轻量存储，代理内部使用LangChain作为处理框架，梳理用户请求、分发对应处理工具、定制执行逻辑，语音处理使用Whisper、GPT_SOVITS，画图使用StableDiffusion模型等。

整体架构图

整体思路

基本流程

使用说明

使用流程

注意事项

About

Releases

Packages

Languages

License

viking-man/self_agent

Folders and files

Latest commit

History

Repository files navigation

Self_Agent 宁宁小助理

介绍视频：https://www.bilibili.com/video/BV1wW421w7Ue/

程序主体框架使用flask作为前后端链接，对话记忆存储使用SQLite轻量存储，代理内部使用LangChain作为处理框架，梳理用户请求、分发对应处理工具、定制执行逻辑，语音处理使用Whisper、GPT_SOVITS，画图使用StableDiffusion模型等。

整体架构图

整体思路

基本流程

使用说明

使用流程

注意事项

About

Topics

Resources

License

Stars

Watchers

Forks

Languages