infer_lora_finetuning.py在加载模型的时候，不能使用多卡加载，单卡12G加载会报显存溢出。 #7

steamfeifei · 2023-06-29T10:38:05Z

infer_lora_finetuning.py在加载模型的时候，不能使用多卡加载，单卡12G加载会报显存溢出。
有什么办法可以配置多卡加载模型吗？

ssbuild · 2023-06-30T00:41:34Z

权重量化，保存权重，然后去小卡推理。

steamfeifei · 2023-06-30T01:59:13Z

我在问“你是谁？”，这样的问题，进行了lora微调，出来的结果还是和原来的类似。这种有什么办法让它纠正过来吗？

ssbuild · 2023-06-30T02:24:45Z

喂数据

Provide feedback