Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

AttributeError: 'FakeTokenizer' object has no attribute 'encode' #335

Open
WangZY1111 opened this issue Jan 4, 2024 · 12 comments
Open

AttributeError: 'FakeTokenizer' object has no attribute 'encode' #335

WangZY1111 opened this issue Jan 4, 2024 · 12 comments

Comments

@WangZY1111
Copy link

Traceback (most recent call last):
File "finetune_visualglm.py", line 194, in
training_main(args, model_cls=model, forward_step_function=forward_step, create_dataset_function=create_dataset_function, collate_fn=data_collator)
File "/home/wangzy/anaconda3/envs/LVM/lib/python3.8/site-packages/sat/training/deepspeed_training.py", line 67, in training_main
train_data, val_data, test_data = make_loaders(args, hooks['create_dataset_function'], collate_fn=collate_fn)
File "/home/wangzy/anaconda3/envs/LVM/lib/python3.8/site-packages/sat/data_utils/configure_data.py", line 200, in make_loaders
train = make_dataset(**data_set_args, args=args, dataset_weights=args.train_data_weights, is_train_data=True)
File "/home/wangzy/anaconda3/envs/LVM/lib/python3.8/site-packages/sat/data_utils/configure_data.py", line 126, in make_dataset_full
d = create_dataset_function(p, args)
File "finetune_visualglm.py", line 160, in create_dataset_function
dataset = FewShotDataset(path, image_processor, tokenizer, args)
File "finetune_visualglm.py", line 118, in init
input0 = tokenizer.encode("", add_special_tokens=False)
AttributeError: 'FakeTokenizer' object has no attribute 'encode'

how can I solve it

@Tom98714
Copy link

你好,这个问题解决了吗,我也遇到这个问题了

@xiongxiaochu
Copy link

遇到这个问题+1,请问解决了吗?

@Tom98714
Copy link

Tom98714 commented Jan 30, 2024 via email

@Tom98714
Copy link

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

@xiongxiaochu
Copy link

xiongxiaochu commented Jan 30, 2024

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

visual-glm修改成了本地路径,chatglm那个没看到修改的位置

@Tom98714
Copy link

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

都修改成了本地路径,我们这边机器无法访问huggingface

你需要提前把所需要的模型,和分词器都下载到本地,然后在把路径修改到相应路径
这里是sat模型下载链接
https://www.wisemodel.cn/models/ZhipuAI/VisualGLM-6B-SAT/file

@Tom98714
Copy link

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

visual-glm修改成了本地路径,chatglm那个没看到修改的位置

这里是huggingface的镜像网站,请仔细阅读
https://hf-mirror.com/

@xiongxiaochu
Copy link

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

都修改成了本地路径,我们这边机器无法访问huggingface

你需要提前把所需要的模型,和分词器都下载到本地,然后在把路径修改到相应路径 这里是sat模型下载链接 https://www.wisemodel.cn/models/ZhipuAI/VisualGLM-6B-SAT/file

image 通过cli-demo下载了,长这样是对的吗?

@Tom98714
Copy link

遇到这个问题+1,请问解决了吗?

请检查所有的模型路径和分词器路径是否为本地路径,默认是THUDM/Visualglm-6b,如果本地运行的话,需要把路径修改到本地的相应位置,如果能直接访问到huggingface,应该不会发生这个问题

都修改成了本地路径,我们这边机器无法访问huggingface

你需要提前把所需要的模型,和分词器都下载到本地,然后在把路径修改到相应路径 这里是sat模型下载链接 https://www.wisemodel.cn/models/ZhipuAI/VisualGLM-6B-SAT/file

image 通过cli-demo下载了,长这样是对的吗?

是的

@xiongxiaochu
Copy link

https://hf-mirror.com/

那分词器是也需要放在visualglm-6b文件夹下吗?

@Tom98714
Copy link

https://hf-mirror.com/

那分词器是也需要放在visualglm-6b文件夹下吗?

是的,全都需要,都需要提前准备好,并修改相应配置文件、代码中的路径

@xiongxiaochu
Copy link

https://hf-mirror.com/

那分词器是也需要放在visualglm-6b文件夹下吗?

是的,全都需要,都需要提前准备好,并修改相应配置文件、代码中的路径

收到,把model_config.json里的tokenizer_type改成本地chatglm的路径就可以了~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants