支持跨主机部署模型推理 #1472

lordk911 · 2024-05-10T15:26:13Z

vLLM官方文档称可利用ray实现模型多机推理

xinference launch model 时只能选择本机的显卡，希望可以支持跨主机部署模型推理

qinxuye · 2024-05-10T15:32:10Z

这么做在 xinf 中实现并不难，但我比较质疑多机 TP 的效率。

lordk911 · 2024-05-10T23:30:57Z

这么做在 xinf 中实现并不难，但我比较质疑多机 TP 的效率。

嗯，好处是可以低成本去验证大尺寸模型，来为硬件投入做参考；对产品自身来讲也是个比较好的宣传点。

zhanghaiqiangshigezhu · 2024-05-16T05:44:56Z

目前xinference支持一个模型部署在多台机器上么？

zhanghaiqiangshigezhu · 2024-05-16T05:48:40Z

这么做在 xinf 中实现并不难，但我比较质疑多机 TP 的效率。

目前xinference支持一个模型部署在多台机器上么？

zhanghaiqiangshigezhu · 2024-05-16T05:49:03Z

这么做在 xinf 中实现并不难，但我比较质疑多机 TP 的效率。

嗯，好处是可以低成本去验证大尺寸模型，来为硬件投入做参考；对产品自身来讲也是个比较好的宣传点。

目前xinference支持一个模型部署在多台机器上么？

XprobeBot added this to the v0.11.0 milestone May 10, 2024

XprobeBot modified the milestones: v0.11.0, v0.11.1 May 11, 2024

XprobeBot modified the milestones: v0.11.1, v0.11.2 May 17, 2024

XprobeBot modified the milestones: v0.11.2, v0.11.3 May 24, 2024

XprobeBot modified the milestones: v0.11.3, v0.11.4 May 31, 2024

Provide feedback