基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
生活随笔
收集整理的這篇文章主要介紹了
基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
1)量化:High-Bit(>2b): QAT, PTQ, QAFT; Low-Bit(≤2b)/Ternary and Binary: QAT
2)剪枝:正常、規(guī)整和分組卷積結(jié)構(gòu)剪枝
3)針對(duì)特征(A)二值量化的BN融合(訓(xùn)練量化后,BN參數(shù) —> conv的偏置b)
4)High-Bit量化的BN融合(訓(xùn)練量化中,先融合再量化,融合:BN參數(shù) —> conv的權(quán)重w和偏置b)
對(duì)比實(shí)驗(yàn)如下,相關(guān)代碼下載地址:下載地址
| 類型 | W(Bits) | A(Bits) | Acc | GFLOPs | Para(M) | Size(MB) | 壓縮率 | 損失 |
|---|---|---|---|---|---|---|---|---|
| 原模型(nin) | FP32 | FP32 | 91.01% | 0.15 | 0.67 | 2.68 | *** | *** |
| 采用分組卷積 |
總結(jié)
以上是生活随笔為你收集整理的基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于pytorch量化感知训练(mnis
- 下一篇: 【camera-radar】基于ROS的