请问 fast_inference分支是否主要是针对 python web 框架做了改动，没有针对单机多GPU的推理做优化？ #1077

jamesljl · 2024-05-11T05:28:50Z

请问 fast_inference分支是否主要就是把原来 python 的 uvicorn 改成了 fastapi，但没有针对单机多GPU的推理做优化？

jamesljl · 2024-05-11T05:34:15Z

如果要配置单机多 GPU，是否直接改为 os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2,3" 类似这样就可以了？
还是需要使用 nn.DataParallel 将模型 wrap 一下？

XXXXRT666 · 2024-05-11T23:49:06Z

我记得不支持多卡推理

Provide feedback