分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 #3878

4399123 · 2025-01-09T03:40:56Z

问题确认 Search before asking

我已经搜索过问题，但是没有找到解答。I have searched the question and found no related answer.

请提出你的问题 Please ask your question

我是用paddleseg 里的seaformer_base模型训练，将训练后的模型使用ACT工具压缩，并转化到了onnx模型，但是这个onnx模型无法转化到tensrrt模型，用于工程部署

4399123 · 2025-01-17T08:19:16Z

有没有人回答一下

David-dotcom666 · 2025-01-24T00:59:50Z

有没有人回答一下

我转过liteseg,ocrnet还可以，你的seaformer_base转onnx后，onnx可以使用吗？如果onnx可以使用,转trt报什么错误？还是不报错，只是trt模型不能使用呢？

David-dotcom666 · 2025-01-24T05:10:05Z

有没有人回答一下

有没有人回答一下

我转过liteseg,ocrnet还可以，你的seaformer_base转onnx后，onnx可以使用吗？如果onnx可以使用,转trt报什么错误？还是不报错，只是trt模型不能使用呢？

我刚试了下，我这边是可以转onnx再转trt进行正常预测的。转onnx我用的是paddle2onnx，tensorrt版本8.5.1.7，没有进行ACT压缩。

4399123 · 2025-02-05T09:54:47Z

有没有人回答一下

有没有人回答一下

我转过liteseg,ocrnet还可以，你的seaformer_base转onnx后，onnx可以使用吗？如果onnx可以使用,转trt报什么错误？还是不报错，只是trt模型不能使用呢？

我刚试了下，我这边是可以转onnx再转trt进行正常预测的。转onnx我用的是paddle2onnx，tensorrt版本8.5.1.7，没有进行ACT压缩。

我主要在测试ACT压缩，正常paddle->onxx->trt 我是跑通了的，paddle->ACT->onnx可以走通，但是onnx->trt没走通，我主要想知道ACT压缩后的模型部署到trt上要特定部署框架吗，没办法onnx->trt吗？如果是的话那这个所谓的自动压缩算法就很鸡肋了，根本就是催牛逼用的，没实用价值

4399123 · 2025-02-12T06:58:29Z

???官方没有人出来回答一下吗

owllight11 · 2025-03-04T11:51:13Z

???官方没有人出来回答一下吗

找到解决方法了吗？我试了官方的几个量化后的模型，都没法用trtexec转换

0x3878f · 2025-03-04T14:57:49Z

???官方没有人出来回答一下吗

有报错日志吗？可以帮忙分析下是否是paddle2onnx的问题

owllight11 · 2025-03-05T03:03:14Z

这个问题大概率是版本差异导致的，给需要将paddleslim 量化后的模型使用trtexec工具转换的参考：
具体流程为:

paddle2onnx --model_dir model --model_filename model.pdmodel --params_filename model.pdiparams --save_file output.onnx --opset_version 16 --enable_onnx_checker True --deploy_backend tensorrt --save_calibration_file calibration.cache
trtexec --onnx=output.onnx --saveEngine=output.engine --int8 --explicitBatch --verbose --calib=calibration.cache
这里会遇到几个问题：
(1) tensorrt 10.x 版本使用trtexec可以导出fp16 32模型，导出int8加载calibration.cache会报错，但是不加载可以导出
(2) 加载engine进行推理时如果遇到pycuda._driver.LogicError: cuMemcpyHtoDAsync failed: invalid argument，一个解决方法是在trtexec导出时设置输入尺寸如：--shapes=input:1x3x640x640。但是这样在trtexec导出前需要将onnx模型的输入名称从"x"改为"input"，要同时修改节点和引用的名称
(3) 我测试下来一个可以正常导出的版本是 TensorRT8.6 EA paddlepaddle-gpu==3.0.0b2 paddle2onnx==1.3.1 在我测试时使用paddle2onnx 2.x版本以及TensorRT8.6 GA都会出现莫名其妙的报错

4399123 added the question Further information is requested label Jan 9, 2025

4399123 changed the title ~~分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 后的模型，无法导出onnx模型~~ 分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 Jan 9, 2025

TingquanGao assigned Sunting78 Jan 9, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 #3878

分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 #3878

4399123 commented Jan 9, 2025 •

edited

Loading

4399123 commented Jan 17, 2025

David-dotcom666 commented Jan 24, 2025

David-dotcom666 commented Jan 24, 2025

4399123 commented Feb 5, 2025

4399123 commented Feb 12, 2025

owllight11 commented Mar 4, 2025

0x3878f commented Mar 4, 2025

owllight11 commented Mar 5, 2025

分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 #3878

分割模型使用PaddleSlim的Auto Compression Toolkit(ACT) 压缩后，导出了onnx模型，但是这个onnx模型无法转化到tensorRT模型 #3878

Comments

4399123 commented Jan 9, 2025 • edited Loading

问题确认 Search before asking

请提出你的问题 Please ask your question

4399123 commented Jan 17, 2025

David-dotcom666 commented Jan 24, 2025

David-dotcom666 commented Jan 24, 2025

4399123 commented Feb 5, 2025

4399123 commented Feb 12, 2025

owllight11 commented Mar 4, 2025

0x3878f commented Mar 4, 2025

owllight11 commented Mar 5, 2025

4399123 commented Jan 9, 2025 •

edited

Loading