TritonModelException: inference request batch-size must be <= 128 for 'cls_pp' #12135

sheiy · 2024-05-17T05:58:03Z

系统环境/System Environment：
版本号/Version：Paddle：
PaddleOCR：问题相关组件/Related components：
运行指令/Command Code：

FROM registry.baidubce.com/paddlepaddle/fastdeploy:1.0.7-gpu-cuda11.4-trt8.5-21.10
COPY ./models-gpu.tar /ocr_serving/
WORKDIR /ocr_serving
RUN tar -xf models-gpu.tar
RUN rm models-gpu.tar
EXPOSE 8000
CMD ["fastdeployserver","--model-repository=/ocr_serving/models"]

完整报错/Complete Error Message：

The text was updated successfully, but these errors were encountered:

sheiy · 2024-05-17T05:58:31Z

麻烦问下需要怎么处理啊直接修改配置吗？这个max_batch_size是什么意思？我只传了一张图
改了这个batchSize直接启动不了了

zhangyubo0722 · 2024-05-23T08:16:29Z

OCR套件并不支持Triton部署，请问你是在哪里看到的命令或文档呢

sheiy · 2024-05-24T05:46:43Z

@zhangyubo0722 https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/ocr/PP-OCR/serving/fastdeploy_serving
那能否给我一个适合部署成api接口的文档呢

paddle-bot bot assigned zhangyubo0722 May 17, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TritonModelException: inference request batch-size must be <= 128 for 'cls_pp' #12135

TritonModelException: inference request batch-size must be <= 128 for 'cls_pp' #12135

sheiy commented May 17, 2024

sheiy commented May 17, 2024 •

edited

zhangyubo0722 commented May 23, 2024

sheiy commented May 24, 2024

TritonModelException: inference request batch-size must be <= 128 for 'cls_pp' #12135

TritonModelException: inference request batch-size must be <= 128 for 'cls_pp' #12135

Comments

sheiy commented May 17, 2024

sheiy commented May 17, 2024 • edited

zhangyubo0722 commented May 23, 2024

sheiy commented May 24, 2024

sheiy commented May 17, 2024 •

edited