日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

CPU指令集——AVX2

發布時間:2023/12/25 综合教程 65 生活家
生活随笔 收集整理的這篇文章主要介紹了 CPU指令集——AVX2 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.查看CPU所支持的指令集

  • 對于windows系統,可借助CPU-Z工具,可查看當前CPU所支持的指令集:
  • 對于Linux系統,可運行cat /proc/cpuinfo | grep flags來查看當前CPU所支持的指令集:

由此可知,Intel i7-7700CPU支持AVX2指令集,但是不支持AVX-512指令集。
AVX512-IFMA為Intel AVX512指令集的一個extension擴展集,主要用于加速整數運算。
根據https://medium.com/@hdevalence/even-faster-edwards-curves-with-ifma-8b1e576a00e9 可知,其基于AVX512-IFMA的實現是AVX2速度的1.5倍。

目前支持AVX512-IFMA指令集的CPU主要有Cannon Lake(如Intel? Core™ i3-8121U Processor)和Ice Lake系列處理器:

2. SIMD

SIMD的全稱為:Single Instruction stream Multiple Data streams,對應的中文名為:單指令流多數據流。
SIMD為并行計算中的一種。
計算機架構Flynn分類法(1966年提出),根據指令流和數據流的并發數量分為:

  • Single instruction stream single data stream(SISD),典型的串行機。
  • Single instruction stream multiple data streams(SIMD),即單一指令可同時操作多個不同的數據流。指令可以pipeline方式順序執行,也可通過多個功能單元并行執行。
  • Multiple instruction streams single data stream(MISD),多條指令對應一個數據流。該架構除用于容錯場景外(如多個系統同時操作相同的數據流,必須達成相同的結果),不常用。
  • Multiple instruction streams multiple data streams(MIMD),多個自治處理器同時對不同的數據執行不同的指令。MIMD包括多核超標量處理器和分布式系統。

3. AVX

AVX為在CPU處理器上實現SIMD操作的指令集。主要衍化流程為:

  • AVX,全稱為:Advanced Vector Extensions(又名,Sandy Bridge New Extensions),是Intel和AMD微服務器x86指令集的extension擴展。

  • AVX2擴充到了支持256bit的整數運算指令,引入了Fused-Multiply-Add(FMA)運算。所謂FMA,即可通過單一指令實現 A = A ? B + C A=A*B+C A=A?B+C計算。

  • AVX-512通過使用新的EVEX prefix編碼方式,將AVX擴充到了支持512-bit運算。

Intel AVX introduces support for 256-bit wide SIMD registers (YMM0-YMM7 in operating modes that are 32-bit or less, YMM0-YMM15 in 64-bit mode). The lower 128-bits of the YMM registers are aliased to the respective 128-bit XMM registers.
AVX硬件由16個256bitYMM寄存器(YMM0~YMM15)和1個32-bit control/status控制/狀態MXCSR寄存器組成。其中YMM寄存器的低128位與Intel SSE指令集的128-BIT XMM寄存器復用。

AVX指令集遵循IEEE-754規范,其中的32-bit浮點數為單精度浮點數(float),64-bit浮點數為雙精度浮點數(double)。因為AVX中的YMM寄存器為256-bit,所以若存儲單精度浮點數32-bit,可存儲8個,若存儲雙精度浮點數64-bit,可存儲4個。


盡管VGX并不要求內存對齊,但是內存對齊有助于提升性能。如對于128-bit訪問的16字節對齊和對于256-bit訪問的32字節對齊。

MXCSR寄存器的0~5位除非使用LDMXCSRFXRSTOR命令清理,否則將保持不變,分別代表無效的操作:denormal、除0、overflow、underflow和精度。

4. AVX2指令集

根據《Intel? Advanced Vector Extensions Programming Reference.pdf》有:

  • 1) PMULUDQ – Multiply Packed Unsigned Doubleword Integers


  • 2)vpunpckldq- Unpack Low Data




  • 3)vpunpckhdq- Unpack High Data




  • 4)VPSHUFD- Shuffle Packed Doublewords



  • 5)VPBLENDD – Blend Packed Dwords


  • 6)VPERMD – Full Doublewords Element Permutation

  • 7)VPSRLVD——Variable Bit Shift Right Logical


參考資料:
[1] https://www.cpuid.com/softwares/cpu-z.html
[2] https://medium.com/@hdevalence/even-faster-edwards-curves-with-ifma-8b1e576a00e9
[3] https://en.wikipedia.org/wiki/AVX-512
[4] https://en.wikipedia.org/wiki/Advanced_Vector_Extensions
[5] https://software.intel.com/en-us/articles/introduction-to-intel-advanced-vector-extensions
[6] https://en.wikipedia.org/wiki/SIMD
[7] 《Intel? Advanced Vector Extensions Programming Reference.pdf》

總結

以上是生活随笔為你收集整理的CPU指令集——AVX2的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。