日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

python int32 int8_Int8量化-介绍(一)

發布時間:2023/12/19 68 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python int32 int8_Int8量化-介绍(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前 言

本系列的目是詳細敘述當前移動端Int8的方方面面,從最底層的Int8的匯編層實現原理以及匯編性能優化手段,到中間層的移動框架的配套代碼實現(標準就以NCNN為例吧),以及上層對應的PC端量化方法(各種論文思路)總結及實現,和最后模型端re-train的方法、策略及指標介紹。

此外,利用PowerPerf(一種專門針對ARM CPU應用性能優化而開發的調試工具)對卷積kernel(匯編算子)各項硬件參數指標進行量化優化也是本文的重點,旨在提煉出一套通用的匯編代碼調優方法論,從而使得PowerPerf能適用于所有移動端CPU性能優化場景。

第一章 背景

1.1量化背景

盡管模型size在不斷地壓縮,但是其計算量通常還是有一兩百MFLOPS的樣子,這個計算量對于目前的(中低端)移動端CPU算力來說,還是有點吃力的,因此模型端做了最大的努力,移動端也要不甘示弱努力加油!

通常移動端加速的方案時分CPU派跟GPU派的,目前在低端機型上arm的mali GPU性能較差,所以基本配備的還是CPU方案,而中高端機其配備的GPU大部分就是高通的了,其性能整體比CPU強勁,因此,目前在不同的定位平臺上不同的方案各有優勢,各自根據具體的場景適配選擇方案即可。圖1-1 ARM芯片規劃圖

上圖1-1是前一陣子(2018.7.12)ARM在騰訊做介紹的ppt,可以看到性能可觀!!!可以看到arm在cpu這塊會針對性地加強AI能力,我們再看個截圖:圖1-2 ARM芯片ML部分

看紅色框內信息可知a

總結

以上是生活随笔為你收集整理的python int32 int8_Int8量化-介绍(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。