littlebot
Published on 2025-04-13 / 1 Visits
0

【源码】基于Python的CvT模型TensorRT部署优化

项目简介

本项目由摆一摆队在TRT2022复赛中贡献,选取公开的视觉Transformer模型CvT,将其部署到TensorRT上进行优化运行。项目实现了模型从PyTorch到ONNX的转换,对ONNX模型进行必要修改,最终用TensorRT对模型优化。

项目的主要特性和功能

  • 模型转换与修改:完成从PyTorch到ONNX的模型转换,针对TensorRT需求修改ONNX模型,如修改Squeeze操作指定压缩维度。
  • TensorRT优化:用TensorRT对修改后的ONNX模型优化,实现推理加速并保持精度。
  • 性能评估:在ImageNet数据集上评估模型精度和性能,对比PyTorch、ONNX Runtime和TensorRT的推理速度。

安装使用步骤

环境配置

  • 下载Nvidia官方提供的docker镜像,创建并启动容器。
  • 在容器内安装1.7.1版本的PyTorch和TorchVision,以及本项目所需依赖包。

数据准备

准备ImageNet数据集,按特定格式组织数据。

模型转换

  • 加载预训练模型权重,将模型从PyTorch格式转为ONNX格式。
  • 修改ONNX模型的计算图,确保TensorRT能正确解析。

TensorRT部署

使用TensorRT对修改后的ONNX模型进行解析和优化,得到优化后的模型。

性能评估

在ImageNet数据集上评估模型的精度和性能,对比PyTorch、ONNX Runtime和TensorRT的推理速度。

注意:项目代码需在已配置好的Docker容器内运行,以确保环境一致性和资源隔离。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】