numa节点_鲲鹏性能优化十板斧之前言 | 鲲鹏处理器NUMA简介与性能调优五步法
鯤鵬處理器NUMA簡介
隨著現(xiàn)代社會信息化、智能化的飛速發(fā)展,越來越多的設備接入互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng),從而催生了龐大的計算需求。但是功耗墻問題以功耗和冷卻兩大限制極大的影響了單核算力的發(fā)展。為了滿足智能世界快速增長的算力需求,多核架構成為最重要的演進方向。傳統(tǒng)的多核方案采用的是SMP(Symmetric Multi-Processing)技術,即對稱多處理器結構,如圖1-1所示。在對稱多處理器架構下,每個處理器的地位都是平等的,對內(nèi)存的使用權限也相同。任何一個程序或進程、線程都可以分配到任何一個處理器上運行,在操作系統(tǒng)的支持下,可以達到非常好的負載均衡,讓整個系統(tǒng)的性能、吞吐量有較大提升。但是,由于多個核使用相同的總線訪問內(nèi)存,隨著核數(shù)的增長,總線將成為瓶頸,制約系統(tǒng)的擴展性和性能。
圖1-1 對稱多處理器SMP架構
鯤鵬處理器支持NUMA(Non-uniform memory access, 非統(tǒng)一內(nèi)存訪問)架構,能夠很好的解決SMP技術對CPU核數(shù)的制約。NUMA架構將多個核結成一個節(jié)點(Node),每一個節(jié)點相當于是一個對稱多處理機(SMP),一塊CPU的節(jié)點之間通過On-chip Network通訊,不同的CPU之間采用Hydra Interface實現(xiàn)高帶寬低時延的片間通訊,如圖1-2所示。在NUMA架構下,整個內(nèi)存空間在物理上是分布式的,所有這些內(nèi)存的集合就是整個系統(tǒng)的全局內(nèi)存
每個核訪問內(nèi)存的時間取決于內(nèi)存相對于處理器的位置,訪問本地內(nèi)存(本節(jié)點內(nèi))會更快一些。Linux內(nèi)核從2.5版本開始支持NUMA架構,現(xiàn)在的操作系統(tǒng)也提供了豐富的工具和接口,幫助我們完成就近訪問內(nèi)存的優(yōu)化和配置。所以,使用鯤鵬處理器所實現(xiàn)的計算機系統(tǒng),通過適當?shù)男阅苷{(diào)優(yōu),既能夠達成很好的性能,又能夠解決SMP架構下的總線瓶頸問題,提供更強的多核擴展能力,以及更好更靈活的計算能力。
圖1-2 NUMA架構
性能調(diào)優(yōu)五步法
性能優(yōu)化通常可以通過如下五個步驟完成。
表1-1 性能優(yōu)化的通用步驟
在性能調(diào)優(yōu)經(jīng)驗比較少或者對系統(tǒng)的軟硬件并不是非常了解時,可以參考使用五步法的模式逐步展開性能調(diào)優(yōu)的工作。對于有豐富調(diào)優(yōu)經(jīng)驗的工程師,或者對系統(tǒng)的性能瓶頸已經(jīng)有深入洞察的專家,也可以采用其他方法或過程展開優(yōu)化工作。
更多精彩內(nèi)容,請滑至頂部點擊右上角關注小宅哦~
總結
以上是生活随笔為你收集整理的numa节点_鲲鹏性能优化十板斧之前言 | 鲲鹏处理器NUMA简介与性能调优五步法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nginx 重定向_虚拟机中安装ngin
- 下一篇: order by 子查询_视图,子查询,