日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

tensorflow量化策略详解

發布時間:2024/4/18 编程问答 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 tensorflow量化策略详解 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

第一種,混合量化--僅量化權重

該方式將浮點型的權重量化為int8整型,可將模型大小直接減少75%、提升推理速度最大3倍。該方式在推理的過程中,需要將int8量化值反量化為浮點型后再進行計算,如果某些Ops不支持int8整型量化,那么其保存的權重依然是浮點型的,即部分支持int8量化的Ops其權重保存為int8整型且存在quantize和dequantize操作,否則依然是浮點型的,因而稱該方式為混合量化。該方式可達到近乎全整型量化的效果,但存在quantize和dequantize操作其速度依然不夠理想

?

第二種,全整型量化--權重和激活值都進行量化

該方式則試圖將權重、激活值及輸入值均全部做int8量化,并且將所有模型運算操作置于int8下進行執行,以達到最好的量化效果。為了達到此目的,我們需要一個具有代表性的小數據集,用于統計激活值和輸入值等的浮點型范圍,以便進行精準量化。

全整型量化的輸入輸出依然是浮點型的,但如果某些Ops未實現該方法,則轉化是沒問題的且其依然會自動保存為浮點型

總結

以上是生活随笔為你收集整理的tensorflow量化策略详解的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。