RolePlayGLM

基于ChatGLM-6B使用ptuning进行微调，实现类instruction的效果

介绍

由于ChatGLM-6B 不支持instruction，所以在进行角色扮演任务时具有不稳定性。本项目通过模板生成超小语料数据集，使用ptuning 进行微调，实现角色扮演的效果。
📜 通过外挂知识库的方式进行角色背景设定。

Python 3.10

示例

基本信息问答

知识库配置

TODOs

基本信息
背景设定
性格、情绪

使用

安装依赖

# 安装ChatGLM-6B所需依赖
$ pip install -r chatglm_6b/requirements.txt
# 安装ptuning依赖
$ pip install rouge_chinese nltk jieba datasets
# 安装本项目所需依赖
$ pip install -r requirements.txt

训练模型

可以删除 train_instruction.sh 中的--quantization_bit参数，不使用量化。
```
# 构造数据集
$ python dataset.py
# 训练
$ bash train_instruction.sh
```
从 Google Drive 下载已经训练的权重文件，放在 ckpt 目录下，跳过此步骤。
运行
```
$ bash web_demo.sh
```
访问
浏览器直接打开 http://127.0.0.1:7860

硬件

推理

量化	显存(GB)
FP16（无量化）	14
INT4	6

训练

量化	显存(GB)	速度(s/it)	loss
FP16（无量化）	15	6.28	0.0021
INT4	7	8.95	0.0012

以上数据为单张RTX 3090显卡的测试结果
epoch: 50

感谢

ChatGLM-6B 提供基础模型
langchain-ChatGLM 提供知识库解决方案

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
chatglm_6b @ d2fcbc7		chatglm_6b @ d2fcbc7
ckpt		ckpt
data		data
knowledge		knowledge
ui		ui
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
dataset.py		dataset.py
dataset_template.py		dataset_template.py
requirements.txt		requirements.txt
train_instruction.sh		train_instruction.sh
web_demo.py		web_demo.py
web_demo.sh		web_demo.sh

License

vissurra/RolePlayGLM

Folders and files

Latest commit

History

Repository files navigation

RolePlayGLM

介绍

示例

基本信息问答

知识库配置

TODOs

使用

硬件

推理

训练

感谢

About

Topics

Resources

License

Stars

Watchers

Forks

Languages