数据中心
數據中心
- 前言
- 一、數據中心的概念
- 二、數據中心的基本單元——服務器
- 三、數據中心地址
- 四、數據中心的能耗
- 參考文獻
前言
現如今,各種類型的數據正在以爆炸性的方式迅速增長,大數據的出現正迫使企業不斷提升自身以數據中心為平臺的數據處理能力。同時,云計算、虛擬化等技術正不斷為數據中心的發展帶來新的推動力,并正在改變傳統數據中心的模式。本章將介紹數據中心的概念,數據中心的發展歷史,數據中心的組成單元一一服務器,以及數據中心的選址及能耗問題。
一、數據中心的概念
數據中心(DataCenter)通常是指在一個物理空間內實現信息的集中處理、存儲、傳輸、交換、管理,而計算機設備、服務器設備、網絡設備、存儲設備等通常認為是網絡核心機房的關鍵設備。
關鍵設備運行所需要的環境因素,如供電系統、制冷系統、機柜系統、消防系統、監控系統等通常被認為是關鍵物理基礎設施。
電子機房主要有計算機機房、電信機房、控制機房、屏蔽機房等。這些機房既有電子機房的共性,也有各自的特點,其所涵蓋的內容不同,功能也各異。
(一)計算機機房 計算機機房內放置重要的數據處理設備、存儲設備、網絡傳輸設備及機房保障設備。計算機機房的建設應考慮以上設備的正常運行,確保信息數據的安全性以及工作人員身心健康的需要。 大型計算機機房一般由無人區機房、有人區機房組成。無人區機房一般包括小型機機房、服務器機房、存儲機房、網絡機房、介質存儲間、空調設備間、UPS設備間、配電間等;有人區機房一般包括總控中心機房、研發機房、測試機房、設備測試間、設備維修存儲間、緩沖間、更衣室、休息室等。 中、小型計算機機房可將小型機機房、服務器機房、存儲機房等合并為一個主機房。
(二)電信機房 電信機房是每個電信運營商的寶貴資源,合理、有效、充分地利用電信機房,對于設備的運行維護、快速處理設備故障、降低成本、提高企業的核心競爭力等具有十分重要的意義。 電信機房一般是按不同的功能和專業來區分和布局的,通常分為設備機房、配套機房和輔助機房。 設備機房是用于安裝某一類通信設備,實現某一種特定通信功能的建筑空間,便于完成相應專業內的操作、維護和生產,一般由傳輸機房、交換機房、網絡機房等組成。配套機房是用于安裝保證通信設施正常、安全和穩定運行設備的建筑空間,一般由計費中心、網管監控室、電力電池室、變配電室和油機室等組成。 輔助機房是除通信設施機房以外,保障生產、辦公、生活需要的用房,一般由運維辦公室、運維值班室、資料室、備品備件庫、消防保安室、新風機房、鋼瓶間和衛生間等組成。在一般智能建筑中通信機房經常與計算機網絡機房合建。
(三)控制機房 隨著智能化建筑的發展,為實現對建筑中智能化樓宇設備的控制,必需設立控制機房。控制機房相對于數據機房、電信機房而言,機房面積較小,功能比較單一,對環境要求稍低。但卻關系到智能化建筑的安全運行及設備、設施的正常便用。 控制機房包括樓宇智能控制機房、保安監控機房、消防控制室、衛星接收機房、視頻會議控制機房等。這些控制機房的共同特點是機房內均有操作人員工作,在保證電子設備運行的同時還要保證操作人員的身體需要。根據設備及操作的要求,這些控制機房也有其相應的特點。(1)樓宇智能控制機房。主要用于安放樓宇智能控制的主機及控制設備,對智能建筑內的公共照明、空調系統、電梯及建筑內的風、水、電等機電設備進行實時監控,以確保智能建筑的安全運行。(2)保安監控機房。內設監控主機及終端顯示設備,對建筑各出入口、車庫、走道、電梯轎箱等處進行視頻監控、防盜報警等。(3)消防控制室。是火災自動報警和聯動系統的控制中心,也是火災時滅火指揮和信息中心,具有十分重要的地位和作用。《高層民用建筑設計防火規范》和《建筑設計防火規范》等對消防監控機房的設置范圍、位置、建筑耐火性能都作了明確規定,并對其主要功能提出原則性要求。(4)衛星接收機房。主要用于安放衛星接收機、調制解調器、混合器、放大器、有線光纜接入設備、各頻段接受顯示器等。衛星接收機房一般是位于建筑頂層,有利于衛星電視信號的傳輸。(5)視頻會議控制機房。主要用于安放視頻會議主控單元(MCU)、調音臺、音響擴聲系統、信號傳輸設備、控制臺設備、信號源機柜等。但由于一般的視頻會議控制機房面積較小,在設備布置時應根據房間的具體情況靈活布置。
(四)屏蔽機房 為了有效地防止電磁干擾式噪聲、輻射對電子設備和測量儀器的影響,并嚴防電子信號泄漏從而威脅到機密信息的安全,國家機關、軍隊、公安、銀行、鐵路等單位需要建立屏蔽機房。有保密要求的數據機房應建設屏蔽機房,確保數據在處理過程中,其信號不泄漏,從而滿足數據保密的要求。一些對抗電磁干擾要求較高的環境,如通信設備的測試試驗室等場所,需要建設屏蔽機房,以防止外界電磁信號的干擾。有強電磁干擾設備的機房應進行相應的電磁屏蔽處理,以避免干擾臨近機房設備的正常還行。
二、數據中心的基本單元——服務器
什么是服務器
服務器是指能向網絡用戶提供特定服務的軟件和硬件。這個服務器的定義包含了以下兩個方面的內容:一方面,服務器的作用是為網絡提供特定的服務,而人們通常會以服務器所能提供的服務來命名服務器,如提供文件共享服務的服務器稱為文件服務器,提供打印隊列共享服務的服務器稱為打印服務器等;另一方面,服務器是軟件和硬件的統一體,特定的服務程序需要運行在特定的硬件或一般通用的微機上才能完成服務功能,由服務程序完成服務策略,并通過硬件實現所需的服務,如文件服務依靠大容量硬盤,打印服務需要高速打印機。
由于整個網絡的用戶均依靠不同的服務器提供不同的網絡服務,因此,網絡服務器是網絡資源管理和共享的核心。網絡服務器的性能對整個網絡的共享性能有著決定性的影響。
服務器分類
按照不同的分類標準,服務器分為許多種。
1、按網絡規模劃分
按網絡規模劃分,服務器分為工作組級服務器、部門級服務器、企業級服務器。
工作組級服務器用于聯網計算機在幾十臺左右或者對處理速度和系統可靠性要求不高的小型網絡,其硬件配置相對比較低,可靠性不是很高。
部門級服務器用于聯網計算機在百臺左右、對處理速度和系統可靠性中等的中型網絡,其硬件配置相對較高,其可靠性居于中等水平。
企業級服務器用于聯網計算機在數百臺以上、對處理速度和數據安全要求最高的大型網絡,硬件配置最高,系統可靠性要求最高。
需要注意的是,這三種服務器之間的界限并不是絕對的,而是比較模糊的,比如工作組級服務器和部門級服務器的區別就不是太明顯,有的干脆統稱為“工作組/部門級”服務器。
2、按架構劃分
按照服務器的結構,可以分為CISC架構的服務器和RISC架構的服務器。
CISC架構主要指的是采用英特爾架構技術的服務器,即我們常說的“PC服務器”;RISC架構的服務器指采用非英特爾架構技術的服務器,如采用Power PC、Alpha、PA-RISC、Sparc等RISC CPU的服務器。
RISC架構服務器的性能和價格比CISC架構的服務器高得多。近幾年來,隨著PC技術的迅速發展,IA架構服務器與RISC架構的服務器之間的技術差距已經大大縮小,用戶基本上傾向于選擇IA架構服務器,但是RISC架構服務器在大型、關鍵的應用領域中仍然居于非常重要的地位。
3、按用途劃分
按照使用的用途,服務器又可以分為通用型服務器和專用型(或稱“功能型”)服務器,如實達的滄海系列功能服務器。
通用型服務器是沒有為某種特殊服務專門設計的可以提供各種服務功能的服務器,當前大多數服務器是通用型服務器。
專用型(或稱“功能型”)服務器是專門為某一種或某幾種功能專門設計的服務器,在某些方面具有與通用型服務器有所不同。如光盤鏡像服務器是用來存放光盤鏡像的,那么需要配備大容量、高速的硬盤以及光盤鏡像軟件。
4、按外觀劃分
按照服務器的外觀,可以分為臺式服務器(又稱“塔式服務器”)和機架式服務器。
臺式服務器有的采用大小與立式PC臺式機大致相當的機箱,有的采用大容量的機箱,像一個碩大的柜子一樣,有的臺式服務器可以利用外掛導軌改裝成機架式服務器。
機架式服務器的外形看起來不像計算機,而是像交換機,有1U(1U=1.75英寸)、2U、4U等規格。
服務器硬件
其實服務器系統的硬件構成與我們平常所接觸的電腦有眾多的相似之處,主要的硬件構成仍然包含如下幾個主要部分:中央處理器、內存、芯片組、I/O總線、I/O設備、電源、機箱和相關軟件。這也成了我們選購一臺服務器時所主要關注的指標。
整個服務器系統就像一個人,處理器就是服務器的大腦,而各種總線就像是分布于全身肌肉中的神經,芯片組就像是骨架,而I/O設備就像是通過神經系統支配的人的手、眼睛、耳朵和嘴;而電源系統就像是血液循環系統,它將能量輸送到身體的所有地方。
對于一臺服務器來講,服務器的性能設計目標是如何平衡各部分的性能,使整個系統的性能達到最優。如果一臺服務器有每秒處理1000個服務請求的能力,但網卡只能接受200個請求,而硬盤只能負擔150個,而各種總線的負載能力僅能承擔100個請求的話,那這臺服務器得處理能力只能是100個請求/秒,有超過80%的處理器計算能力浪費了。 所以設計一個好服務器的最終目的就是通過平衡各方面的性能,使得各部分配合得當,并能夠充分發揮能力。我們可以從這幾個方面來衡量服務器是否達到了其設計目的;R:Reliability——可靠性;A:Availability——可用性;S:Scalability——可擴展性;U:Usability——易用性;M:Manageability——可管理性,即服務器的RASUM衡量標準。
由于服務器在網絡中提供服務,那么這個服務的質量對承擔多種應用的網絡計算環境是非常重要的,承擔這個服務的計算機硬件必須有能力保障服務質量。這個服務首先要有一定的容量,能響應單位時間內合理數量的服務器請求,同時這個服務對單個服務請求的響應時間要盡量快,還有這個服務要在要求的時間范圍內一直存在。
如果一個WEB服務器只能在1分鐘里處理1個主頁請求,1個以外的其他請求必須排隊等待,而這一個請求必須要3分鐘才能處理完,同時這個WEB服務器在1個小時以前可以訪問到,但一個小時以后卻連接不上了,這種WEB服務器在現在的Internet計算環境里是無法想象的。
現在的WEB服務器必須能夠同時處理上千個訪問,同時每個訪問的響應時間要短,而且這個WEB服務器不能停機,否則這個WEB服務器就會造成訪問用戶的流失。
為達到上面的要求,作為服務器硬件必須具備如下的特點:性能,使服務器能夠在單位時間內處理相當數量的服務器請求并保證每個服務的響應時間;可靠性,使得服務器能夠不停機;可擴展性,使服務器能夠隨著用戶數量的增加不斷提升性能。因此我們說不能把一臺普通的PC作為服務器來使用,因為,PC遠遠達不到上面的要求。這樣我們在服務器的概念上又加上一點就是服務器必須具有承擔服務并保障服務質量的能力。這也是區別低價服務器和PC的差異的主要方面。
在信息系統中,服務器主要應用于數據庫和Web服務,而PC主要應用于桌面計算和網絡終端,設計根本出發點的差異決定了服務器應該具備比PC更可靠的持續運行能力、更強大的存儲能力和網絡通信能力、更快捷的故障恢復功能和更廣闊的擴展空間,同時,對數據相當敏感的應用還要求服務器提供數據備份功能。而PC機在設計上則更加重視人機接口的易用性、圖像和3D處理能力及其他多媒體性能。
服務器內存
服務器內存重要性闡述
服務器運行著企業關鍵業務,一次內存錯誤導致的宕機將使數據永久丟失。本身內存作為一種電子器件,很容易出現各種錯誤。
因此,面臨著企業事實的壓力和本身的不足,各個廠商都早已積極推出自己獨特的服務器內存技術,像HP的“在線備份內存”和熱插拔鏡像內存;IBM的ChipKill內存技術和熱更換和熱增加內存技術。而隨著企業信息系統的擴展所需,內存的密度和容量也將會得到相應的發展。
服務器內存性能探討
服務器內存也是內存,它與我們平常在電腦城所見的普通內存在外觀和結構上沒有什么實質性的區別,它主要是在內存上引入了一些新的技術,僅從外觀上是不得出什么結論的。這樣或許你就擔心了,如果別人拿普通PC機的內存條當服務器內存條賣給你,咋辦?這一般來說可以放心,其可能性幾乎為零。因為普通PC機上的內存在服務器上一般是不可用的,這也說明服務器內存不能隨便為了貪便宜而用普通PC機的內存來替代就可了事。
如今常用的服務器內存主要有SDRAM和DDR二類,還有另一種RAMBUS內存,是一種高性能、芯片對芯片接口技術的新一代存儲產品。現在剛興起的DDR2,也逐漸延伸到服務器內存。現代Hynix在2010年六月份已經開始量產供服務器和工作站使用的DDR2內存了。
而從技術層面來說,之所以與普通內存有著區別,都是因為ECC。這是ErrorChecking and Correcting的簡寫。它廣泛應用于各種領域的計算機指令中。ECC和奇偶校驗(Parity)類似。然而,在那些Parity只能檢測到錯誤的地方,ECC實際上可以糾正絕大多數錯誤。經過內存的糾錯,計算機的操作指令才可以繼續執行。這在無形中也就保證了服務器系統的穩定可靠。但ECC技術只能糾正單比特的內存錯誤,當有多比特錯誤發生的時候,ECC內存會生成一個不可隱藏(non-maskable interrupt)的中斷(NMI),系統將會自動中止運行。
服務器CPU
服務器CPU,顧名思義,就是在服務器上使用的CPU(Central Processing Unit中央處理器)。接觸過局域網絡的讀者一定知道,服務器是網絡中的重要設備,要接受成千上萬用戶的訪問,因此對服務器具有大數據量的快速吞吐、超強的穩定性、長時間運行等嚴格要求。所以才將CPU比喻成計算機的“大腦”,同時CPU也是衡量服務器性能的首要指標。
目前,服務器的CPU仍按CPU的指令系統來區分,通常分為CISC型CPU和RISC型CPU兩類,后來又出現了一種64位的VLIM(Very Long Instruction Word超長指令集架構)指令系統的CPU。
CISC型CPU
CISC是英文“Complex Instruction Set Computer”的縮寫,中文意思是“復雜指令集”,它是指英特爾生產的x86(intel CPU的一種命名規范)系列CPU及其兼容CPU(其他廠商如AMD,VIA等生產的CPU),它基于PC機(個人電腦)體系結構。這種CPU一般都是32位的結構,所以我們也把它成為IA-32 CPU。(IA: Intel Architecture,Intel架構)。CISC型CPU目前主要有intel的服務器CPU和AMD的服務器CPU兩類。
RISC型CPU
RISC是英文“Reduced Instruction Set Computing ”的縮寫,中文意思是“精簡指令集”。它是在CISC(Complex Instruction Set Computer)指令系統基礎上發展起來的,相對于CISC型CPU ,RISC型CPU不僅精簡了指令系統,還采用了一種叫做“超標量和超流水線結構”,架構在同等頻率下,采用RISC架構的CPU比CISC架構的CPU性能高很多,這是由CPU的技術特征決定的。RISC型CPU與Intel和AMD的CPU在軟件和硬件上都不兼容。
[編輯]
服務器的選擇原則[2]
服務器是指客戶機/服務器(或瀏覽器用服務器)網絡上的一些機器,管理著應用程序、數據和網絡資源。客戶機請求服務,而服務器提供服務。早期的服務器主要用來管理數據文件或網絡打印機。現在,服務器則用來完成其他各種服務,如網絡管理、各種各樣的信息服務處理、基礎安全性的訪問等。
服務器可以是集中式服務器,也可以是專用服務器。集中式服務器是指將網絡上的多項任務集中到單個主機上,可用來處理網絡上的所有打印機、應用程序和數據共享任務。集中式服務器必須是高性能的計算機,以便及時、有效地處理網絡上的各種請求。專用服務器則是指一臺服務器主機只對應于一種服務,如應用程序服務器、數據文件服務器、電子郵件服務器、打印服務器等,專用服務器可以支持不同客戶,因為負載分布于多臺機器上。
總之,從邏輯上看,服務器是對應于客戶機的一種服務,一種服務程序。
作為服務器的計算機一般是高檔微型計算機或小型計算機。一般而言,選擇服務器時通常要考慮以下幾個方面的性能指標。
1)可管理性
可管理性是指服務器的管理是否方便、快捷,應用軟件是否豐富。在可管理性方面,基于Widows NT/2000平臺的個人計算機服務器要優于Unix服務器。
2)可用性
可用性是指在一般時間內服務器可供訪問者正常使用的時間的百分比。.提高可用性有兩個方面的考慮:減少硬件平均故障時間和利用專用功能機制。專用功能機制可在出現故障時自動執行系統或部件切換機制,以避免或減少意外停機。
3)高性能
這是指服務器綜合性能指標要高。主要要求在運行速度、磁盤空間、容錯能力、擴展能力、穩定性、監測功能及電源等方面具有較高的性能指標。尤其是硬盤和電源的熱插拔性能、網卡的自適應能力的性能指標要高。
4)可擴展性
為了使服務器隨負荷的增加而平穩升級,井保證服務器工作的穩定性和安全性,必須考慮服務器的可擴展性能。首先在機架上要有為硬盤和電源的增加而留有的充分空間,其次主機上的插槽不但要種類齊全,而且要有一定的余量。
5)模塊化
模塊化是指電源、網卡、SCSI卡、硬盤等部件為模塊化結構,且都是有熱插拔功能,可以在線維護,從而使系統停機的可能性大大減少。特別是分布式電源技術可使每個重要部件都有自己的電源。
以上幾個方面是所有網站在選購服務器時要重點考慮的因素。它們之間既互相影響,又各自獨立。在具體使用時,這些方面的重要性因服務器工作任務的不同也有輕重之分,因此必須綜合權衡。此外,晶牌、價格、售后服務及廠商實力等因素也需要考慮在內。
網絡服務器[3]
網絡服務器是計算機局域網的核心部件。網絡操作系統是在網絡服務器上運行的,網絡服務器的效率直接影響整個網絡的效率。因此,一般要用高檔計算機或專用服務器計算機作為網絡服務器。網絡服務器主要有以下4個作用。
·運行網絡操作系統,控制和協調網絡中各計算機之間的工作,最大限度地滿足用戶的要求,并做出響應和處理。
·存儲和管理網絡中的共享資源,如數據庫、文件、應用程序、磁盤空間、打印機、繪圖儀等。
·為各工作站的應用程序服務,如采用客戶/服務器(Client/Server)結構使網絡服務器不僅擔當網絡服務器,而且還擔當應用程序服務器。
·對網絡活動進行監督及控制,對網絡進行實際管理,分配系統資源,了解和調整系統運行狀態,關閉/啟動某些資源等。
刀片服務器vs.機架服務器vs.塔式服務器
如今的服務器有幾種不同的種類和配置。在數據中心中,采用刀片服務器、機架服務器還是塔式服務器的決策將影響數據中心的性能、空間、預算以及可擴展性。
如今的服務器有幾種不同的種類和配置。在數據中心中,采用刀片服務器、機架服務器還是塔式服務器的決策將影響數據中心的性能、空間、預算以及可擴展性。
以下是機架式服務器、刀片式服務器、塔式服務器的快速入門指南:用戶可以了解它們的優缺點,以及每種類型如何適合其服務器需求。
在深入探討之前,先簡要了解一下一些基本信息:
?機架服務器通常安裝在10英尺高的標準機架上,從而使數據中心可以有效地部署數十個機架的服務器。
?刀片服務器是安裝在服務器機柜中采用小型電路板的服務器,是在緊湊環境中實現高處理能力的絕佳選擇。
?塔式服務器具有高度的優化和自定義功能,使用戶可以根據自己的需求匹配更高的配置。
什么是機架服務器?
機架服務器是安裝在機架內部的服務器。機架服務器通常是支持廣泛的應用程序和計算基礎架構的通用服務器。服務器垂直堆疊在機架中,以節省數據中心的空間。
標準化機架以1.75英寸高、19英寸寬的單位(U)計量。機架式服務器通過垂直倍增的方法適應這些尺寸,這意味著機架服務器的高度可能是1U、4U、10U或更高,例如和2016年推出的10英尺高的70U機架一樣。另外還制造了符合機架單元標準的附加設備,因此用戶可以充分利用機架空間。
機架式服務器專業版
?獨立式:每個機架式服務器都有作為獨立或網絡系統運行所需的一切:其自身的電源、CPU和內存。這使得機架式服務器能夠運行密集的計算操作。
?效率:機架式服務器可高效利用有限的數據中心空間,并且能夠通過額外的內存、存儲和處理器輕松擴展。如果管理員共享或集群服務器數據以獲得冗余,則熱插拔機架式服務器在操作上很簡單。
?經濟高效:以較低的成本提高管理和能源效率。
機架服務器的缺點
?電源使用:緊湊的機架需要更多的冷卻裝置,這會增加能源成本。大量的機架服務器將總體上提高能源需求。
?維護:密集的機架需要更多的故障排除和管理時間。
什么是刀片服務器?
刀片服務器是由多個模塊化電路板構建而成。大多數刀片服務器由CPU、網絡控制器和內存構建而成,也有一些刀片服務器配備內部存儲驅動器。其他任何組件(例如開關、端口和電源連接器)都通過機箱共享。
刀片服務器機箱通常采用機架通用的尺寸,從而可以節省部署空間。管理員可以將刀片服務器集群化,或者將每臺刀片服務器作為單獨的服務器進行管理和操作,例如將應用程序和最終用戶分配給特定的刀片服務器。他們的模塊化架構支持熱插拔操作。在刀片服務器外部有一個小手柄,因此插拔或更換刀片服務器很簡單。
刀片服務器具有強大的處理能力,可以滿足復雜的計算需求。如果數據中心具有足夠的散熱和能量來支持密集的基礎設施,則它們可以擴展到更高的性能級別。
刀片服務器專業版
?低能耗:單獨的機箱為多個刀片服務器供電,而不是為一個機架中的多臺服務器供電和冷卻。這樣可以減少能源消耗。
?處理能力:刀片服務器提供更高的處理能力,同時占用更小的空間。
?多用途:它們可以承載主操作系統和虛擬機監控程序、數據庫、應用程序、Web服務和其他企業級流程和應用程序。
?可用性:刀片服務器環境簡化了集中式監視和維護、負載平衡以及集群故障轉移。熱插拔還有助于提高系統可用性。
刀片服務器的缺點
?前期成本:隨著時間的推移,由于簡化管理界面、降低能耗,將會降低運營費用。但是,初始投資、部署和配置成本可能很高。
?能源成本:高密度的刀片服務器需要先進的環境控制。為了保持刀片服務器的性能,加熱、冷卻和通風都是必要的開支。
什么是塔式服務器?
塔式服務器是采用獨立機箱的服務器。它們使用最少的組件和軟件進行制造,因此中型企業和客戶可以針對特定任務大量定制服務器。例如,塔式服務器通常不附帶其他組件,如高級顯卡、更多內存或外圍設備。
塔式服務器通常面向那些希望定制其服務器并維護自定義升級路徑的客戶。例如,客戶可以將塔式服務器配置為通用服務器、通信服務器、Web服務器或使用HTTP協議集成的網絡服務器。用戶可以訂購他們需要的定制服務,或者在塔式服務器運送到他們的站點時自己定制。另一種使用情況是小型企業需要一個功能強大的服務器來運行多個流程和應用程序。
塔式服務器從外觀上看與臺式機類似,而且和臺式機一樣,不共享輸入設備。多臺塔式服務器安裝將需要單獨的鍵盤、鼠標和顯示器;或者可以共享外圍設備的開關。它們可以像任何其他類型的服務器一樣共享網絡存儲。
塔式服務器專業版
?高效的可擴展性:塔式服務器配置最少,因此它可以根據業務需要對其進行定制和升級,它們比滿載的服務器價格更低。
?冷卻成本低:由于組件密度低,冷卻塔式服務器的成本低于緊湊的機架式服務器或刀片服務器。
塔式服務器的缺點
?升級費用。許多客戶購買塔式服務器是為了定制,而不是為了降低投資成本。高端硬件組件和軟件將顯著提高其價格。
?占用空間大:塔式服務器不適合放在機架中,并占用更多的數據中心空間。需要打開機箱以進行故障排除和添加或升級內部組件。
?需要進行外圍設備管理:在多個塔式服務器環境中,IT團隊必須配備交換機或將外部設備重新插入每臺單服務器。
刀片式服務器vs.機架式服務器vs.塔式服務器的概覽
這三種類型的服務器都可以在數據中心工作。用戶根據自己的實際需求進行選擇。以下是關于適合用戶的計算需求和數據中心構建的占地面積和架構。
三、數據中心地址
數據中心是全球協作的特定設備網絡,用來在internet網絡基礎設施上傳遞、加速、展示、計算、存儲數據信息。
在今后的發展中,數據中心也將會成為企業競爭的資產,商業模式也會因此發生改變。隨著數據中心應用的廣泛化,人工智能、網絡安全等也相繼出現,更多的用戶都被帶到了網絡和手機的應用中。隨著計算機和數據量的增多,人們也可以通過不斷學習積累提升自身的能力,是邁向信息化時代的重要標志。
數據中心是全球協作的特定設備網絡,用來在因特網絡基礎設施上傳遞、加速、展示、計算、存儲數據信息。數據中心大部分電子元件都是由低直流電源驅動運行的。
數據中心的產生致使人們的認識從定量、結構的世界進入到不確定和非結構的世界中,它將和交通、網絡通訊一樣逐漸成為現代社會基礎設施的一部分,進而對很多產業都產生了積極影響。不過數據中心的發展不能僅憑經驗,還要真正的結合實踐,促使數據中心發揮真正的價值作用,促使社會的快速變革。
隨著數據中心行業在全球的蓬勃發展,隨著社會經濟的快速增長,數據中心的發展建設將處于高速時期,再加上各地政府部門給予新興產業的大力扶持,都為數據中心行業的發展帶來了很大的優勢。隨著數據中心行業的大力發展,將來在很多城市中都會有很大的發展空間,一些大型的數據中心也會越來越多。2017年全球經歷了前所未有的自然災害之后,很多數據中心管理人員都在積極制定災難恢復計劃。例如就可以通過云計算工具對電力使用的功率進行限制,在遭遇停電時間時將允許以降低的功率繼續運行,可以為電力企業的正常運行提供有效的保障。還可以利用數據中心指定備份計劃,對服務器的操作進行拓展,就不需要通過關閉和重啟服務器操作。
數據中心是與人力資源、自然資源一樣重要的戰略資源,在信息時代下的數據中心行業中,只有對數據進行大規模和靈活性的運用,才能更好的去理解數據,運用數據,才能促使我國數據中心行業快速高效發展,體現出國家發展的大智慧。海量數據的產生,也促使信息數據的收集與處理發生了重要的轉變,企業也從實體服務走向了數據服務。產業界需求與關注點也發生了轉變,企業關注的重點轉向了數據,計算機行業從追求的計算能力轉變為數據處理能力,軟件業也將從編程為主向數據為主轉變,云計算的主導權也將從分析向服務轉變。
在信息時代下,數據中心的產生,更多的網絡內容也將不再由專業網站或者特定人群所產生,而是由全體網民共同參與。隨著數據中心行業的興起,網民參與互聯網、貢獻內容也更加便捷,呈現出多元化。巨量網絡數據都能夠存儲在數據中心,數據價值也會越來越高,可靠性能也在進一步加強。
常見故障
數據中心網絡常見的通訊故障主要集中在:硬件故障、系統故障兩個類別:
(1)硬件故障:
數據中心是通過無數計算機硬件組成的,硬件出現問題,就會導致部分功能無法正常發揮或運作。無論是設備、線路、端口,哪一點出現故障,都會導致網絡通訊故障的出現。硬件方面的故障相對比較容易查找,例如線路故障,一般的成因就是線路明顯的老化或者破損,而影響到了整體網絡的運營;再比如,端口故障,計算機端口作為數據中心網絡的重要環節,若出現接觸不良、損壞等傳輸問題,就會影響到整體網絡的運行。硬件故障只要進行逐一排查,就可以及時進行更換處理,相對比較好解決。
(2)系統故障:
數據中心是計算機領域比較熱門的研究之一,因此研究技術十分成熟。計算機網絡構成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模塊化、層次化、扁平化的設計思路與虛擬化的分割管理技術,將成千上萬臺設備,以單元為單位進行劃分,逐一進行管理。通過分層、遞歸的結構進行聯結,盡可能的避免了所謂“關鍵節點”的存在。這樣組合也形成了良好的冗余與容錯性,如果其中出現故障的某一個或某幾個單元,沒有被檢測出來,也不至于影響數據中心的整體運行。但是如果超出一定比例,就會在影響數據中心網絡的高速運行,拉慢網絡通訊的速度,所以仍舊需要針對性的查找故障進行處理。
故障處理
(1)分析故障現象:
一般來說由于構成組件比較復雜,故障也呈現出不同的表現方式。因此想要對于故障進行分析,就要先了解故障的現象。例如,應用方面出現了支付系統支付不了,網頁難以打開等問題,那么就要逐一檢查相關的故障點,有哪幾個故障是上述表現,如,線路故障,端口故障等,就要更換線路、端口等設備。因此,需要針對數據中心網絡的幾種常見的故障進行收集與整理,根據現象,進行檢索、查找。
(2)測試并確認故障范圍,進行故障點定位。
所有的應用業務是在這些物理硬件正常運行的基礎上開展的,其中某些硬件出現問題就會導致故障。根據故障的表現,需要針對各個部分進行篩選檢查,例如,對于服務器進行測試,檢查網絡設備等。針對問題表現,進行逐一排除,最終敲定故障點所在位置。
(3)如果以上硬件故障都已經排除,那么就是計算機系統的故障,這一故障需要建立故障模型進行診斷,根據PMC模型進行定義。通過分層測試的方法,查找問題單元,即正常單元測試正常單元、正常單元測試故障單元、故障單元測試故障單元、故障單元測試正常單元等四種。其中后三種的檢測結果都是故障,因此就可以通過分層測量的方式,建立有限個單元,通過矩陣以及螢火蟲算法重點FAFD算法對于其他單元進行診斷,最終確定故障的系統是哪個或者哪幾個單元的。當然也可以通過鏡像、流量統計、抓包等其他手段確定故障所在的設備范圍,進而縮小范圍,集中處理某一個或者幾個設備。
(4)收集重要的數據信息。
在進行故障處理時,通過收集設備的日志、診斷、操作記錄等信息資料,將這些數據資料進行匯總,條件允許的情況下,建立故障數據庫,對于常見問題可以做到“出現即處理”,對于沒有出現過的故障,可以繼續收集進數據庫。總之,必要的信息收集,有利于日后更好的查找故障原因,確保數據中心網絡健康、平穩運行。
發展前景
數據中心
在信息時代下,數據中心也為更多企業帶來了便利和經濟效益,例如騰訊公司的QQ,幾乎每一個手機用戶都有。還有百度的出現,可以為用戶提供更便捷和智能的各種搜索服務,用戶可以在百度中準確地獲取病癥的原因、癥狀、治療信息等,還可以通過百度在線咨詢醫生,在線掛號,大大降低了人們獲得醫療信息和服務的門檻。還有阿里巴巴的云計算、微信等出現,更一步的促進了數據中心的發展。在今后的發展中,數據中心也將會成為企業競爭的資產,商業模式也會因此發生改變。隨著數據中心應用的廣泛化,人工智能、網絡安全等也相繼出現,更多的用戶都被帶到了網絡和手機的應用中。隨著計算機和數據量的增多,人們也可以通過不斷學習積累提升自身的能力,是邁向信息化時代的重要標志。
冷卻技術
數據中心冷卻技術的發展有以下趨勢。
一、末端冷卻設備貼近服務器
以前數據中心機房普通采用房間級空調,地板下送風的冷卻方式。該方式建設成本低,機房利用率高,用于解決3~5kW的單機柜發熱。但隨著機架式、刀片式服務器在機房大量應用,單機柜內設備數量、功率密度、發熱密度都有顯著提高。傳統的機房級空調已經不能解決IT設備的散熱問題,行級空調、背板空調應運而生。這種新型的空調末端更貼近熱源,能解決局部熱點、高發熱密度的問題,通過近距離的冷量傳輸,減小風機功耗,達到節能。不論房間級空調,還是行級空調、背板空調,都是先冷卻空氣,再通過冷空氣與服務器的CPU進行熱交換來降溫。由于空氣的換熱效率、熱流密度很低,空冷服務器有冷卻能耗高、噪聲大、設備密度低等問題。為解決超高功率密度IT設備散熱難題,數據中心開始采用液冷技術,使用工作流體作為中間熱量傳輸的媒介,將熱量從發熱區傳遞到遠處再進行冷卻。液冷技術冷卻效率顯著高于風冷散熱,可有效解決高密度服務器的散熱問題,降低冷卻系統能耗而且減少噪聲。
二、重視冷卻系統節能
隨著數據中心的競爭加劇,運營成本的壓力增大,冷卻系統的節能研究迫在眉睫。隨著耐高溫服務器的出現,越來越多的數據中心逐步嘗試開發使用free-cooling(自然冷卻)。自然冷源的利用主要有以下2種方向。
1、新風直接冷卻
典型的案例就是Facebook在美國俄勒岡州普林維爾的數據中心。室外新風經過濾處理后,進行加濕降溫,然后通過風扇墻送入機架的進風口,室外新風經服務器加熱后排到室外。這種方式對室外空氣質量的要求高,寧夏中衛的一些數據中心嘗試應用了該技術。
2、利用深層湖水、江水冷卻
典型的案例是湖南省資興市東江湖數據中心。東江湖為我國中南地區最大的人工湖,冷水資源豐富。東江湖面積160平方千米,蓄水量8.12×109立方米。其下游小東江水溫常年低于10℃,水流穩定且水質達到國家一級標準。全年90%的時間不需要機械制冷,采用江水直冷冷卻,預計年平均PUE為1.15。
應用
一個數據中心的主要目的是運行應用來處理商業和運作的組織的數據。這樣的系統屬于并由組織內部開發,或者從企業軟件供應商那里買。像通用應用有ERP和CRM系統。一個數據中心也許只關注于操作體系結構或者也提供其他的服務。常常這些應用由多個主機構成,每個主機運行一個單一的構件。通常這種構件是數據庫,文件服務器,應用服務器,中間件以及其他的各種各樣的東西。數據中心也常常用于非工作站點的備份。公司也許預定被數據中心提供的服務。這常常聯合備份磁帶使用。備份能夠將服務器本地的東西放在磁帶上,然而,磁帶存放場所也易受火災和洪水的安全威脅。較大的公司也許發送他們的備份到非工作場所。這個通過回投而能夠被數據中心完成。加密的備份能夠通過Internet發送到另一個數據中心,安全保存起來。為了災難恢復,各種大的硬件供應商開發了移動設備解決方案,能夠安裝并在短時間內可操作。供應商像思科系統,Sun微系統,IBM和HP開發的系統能夠用于這個目的。
四、數據中心的能耗
數據中心能效指標對新建數據中心方案設計和在用數據中心運維管理等方面都具有十分重要的作用。目前,已經有幾十種針對數據中心性能進行評價的指標,PUE、ASHRAE 90.4、CADE、EEUE等指標主要對數據中心能效進行評估。除了數據中心整體能效指標外,亦有大量針對數據中心設備、子系統等方面的能效評估指標,其中包括微模塊、空調、服務器的能效指標。從設備級到系統級的能耗評價指標,在指導數據中心技術演進、設備研發、綠色運維、能耗模型優化等方面具有重要的意義。本文將主要介紹PUE、微模塊和服務器的能效指標,從數據中心整體、子系統、設備3個維度梳理能效指標。
2007年,綠色網格(The Green Grid)提出PUE的概念,公式(1)為PUE的定義公式。
(1)
其中,Ptotal為數據中心總耗電,包含IT設備耗電、制冷耗電、照明耗電等;PIT為數據中心中IT設備耗電。在數據中心耗電中,IT設備耗電所占的比重越高,證明越少的電能被應用于制冷、照明等,能源利用效率越高。根據公式可知,PUE的值應該大于1,且其值越接近于1時,數據中心能源效率越高。
目前,PUE能效指標是業界公認的、影響范圍較大的評估指標,我國政府、企業、科研機構都將PUE作為評估數據中心能效的重要依據。以PUE計算公式為基準,針對不同數據中心的特點和計算要求,PUE的計算方法會略有不同。以Google為例,公式(2)為其公布的PUE計算公式。
(2)
其中,ESIS代表對冷卻裝置、照明、辦公場所及一些聯網設備進行供電的設施變電站的能源消耗,EITS代表對服務器、網絡、存儲設備和機房空調(CRAC)進行供電的IT變電站的能源消耗,ETX代表中高壓變壓器損耗,EHV代表高壓電纜損耗,ELV代表低壓電纜損耗,EF代表現場燃料(包括天然氣和燃油)的能源消耗,ECRAC CRAC代表能源消耗,EUPS代表對服務器、網絡和存儲設備的不間斷供電(UPS)造成的能量損耗,ENet1代表類型1單位分電站供給的機房能源。根據Google官方的說明,采用以上方法得到的PUE結果更加苛刻。
(2)微模塊能效指標
微模塊集配電、制冷、監控、照明等于一體,可快速安裝部署,是近年來數據中心領域研究的重點之一。模塊化的數據中心由多個相對獨立的微模塊系統組成,微模塊的能耗情況直接影響著數據中心的整體能耗情況。2018年11月,TGG(中國)發布《微模塊產品PUE測試規范》,在標準方面對微模塊能效指標、測量環境、測量步驟等進行規范。其中,微模塊PUE定義與數據中心PUE定義相似,是微模塊產品總輸入能耗(IMDC Total Energy)與微模塊產品IT設備能耗(IMDC IT Equipment Energy)的比值。為了統一測試條件,更加客觀地評價不同條件下微模塊的能效指標,測試規范要求測試在焓差實驗室進行。測試規范又考慮了IT負載對PUE的影響,在模擬室外側溫度分別為-5℃、5℃、15℃、25℃、35℃的情況下,測量微模塊IT負載為25%、50%、75%、100%情況下的PUE值。最終通過公式(3),得到微模塊在不同地區某個負載下的全年平均PUE。其中,PUEaPUEe分別代表室外溫度-5℃35℃時,某個負載下的PUE值;Ta~Tb代表某個地區全年溫度分布系數。
3)服務器能效指標
研究機構和企業一直都在對服務器、存儲設備、網絡設備等進行能耗與節能的研究,以期可以制定評價標準、研發評測工具、推動節能技術發展。美國環境保護署(EPA)聯合Intel、IBM、DELL等公司,于2009年發布能源之星服務器規范1.0版本,該規范成為業界較權威的服務器能效標準,并且規范在持續更新之中。在服務器電源方面,規范對電源效率和功率因素進行規范;在服務器方面,規范根據不同類型的服務器種類對空閑功耗情況提出要求,同時也對服務器的擴展組件功耗進行規范。
三、能耗模型建立過程
能耗模型建立過程中,應當遵循全系統、精確、快速、通用性、彈性、簡單等原則。圖1為能耗模型的建立過程,并將對能耗建立過程進行分析。
(1)能耗組成與關聯情況分析
通過對數據中心總體架構、設備組成與分布、IT設備部署等情況進行分析,進而分析數據中心能耗組成、占比情況,并對影響能耗的因素進行逐一梳理;在得到數據中心設備能耗組成與環境條件后,對設備間、設備與環境間的關聯和影響關系進行分析,為能耗模型選擇建立基礎。
(2)能耗模型選擇
通過對能耗組成和關聯情況的分析,并結合數據中心能耗數據采集和設備自動化控制等方面的因素,從數據中心總體、子系統、設備3個層級,綜合選擇適用于數據中心能耗建模、易于數據中心能耗優化的模型。同時,能耗模型宜根據數據中心實際情況和3個層級各自的特點,分別選擇聚類、線性回歸、深度學習等數據挖掘方法。
(3)能耗數據采集
數據是建模的關鍵,為實現能耗模型的建立,需使用傳感器對數據中心實時運行數據進行采集。
(4)能耗模型訓練與調優
模型和數據選擇完成后,需要完成對模型的訓練;在訓練過程中,應當調整參數不斷優化模型,并利用新生成的數據對模型的效果進行驗證和改進。
(5)能耗模型應用
能耗建模的最終目的是通過能耗模型服務于數據中心能耗管理,提高能效。建模完成后可以對數據中心能耗情況進行預測,并為能效優化提供基礎支撐。
能耗數據采集和建模方法選擇是能耗建模的關鍵,其中能耗數據采集主要完成溫度、負載、IT設備、UPS、空調等環境信息與設備狀態的實時數據采集;能耗建模是以外部數據、歷史數據、實時數據等為基礎,結合聚類、線性回歸算法、非線性回歸算法、深度學習等數學模型,從而構建準確的能耗模型;能耗模型主要應用于數據中心狀態預測、資源調度優化等方面。其中,能耗數據采集、能耗建模是數據中心能耗模型建立的重要步驟。
(一)能耗數據采集
數據中心能耗模型的建立依賴于數據中心監控數據的獲取,而實時能耗分析與預測、設備動態調控等都對數據中心實時監測有更高的要求。因此,數據中心能耗模型建立的基礎之一是進行能耗數據的采集。能耗數據采集主要包括以下方面:
(1)IT設備運行與負載情況:包含服務器、交換機、存儲系統等設備,可以通過監控和采集上述設備的CPU、內存、流量等信息,實現設備業務運行狀態的監控。
(2)數據中心硬件設備能耗數據:包含IT設備、供配電設備、制冷設備、照明設備等,應當從不同層級、不同粒度上監控設備及模塊的電流、電壓等相關信息。
(3)非IT類設備狀態信息:包含空調、UPS等設備,主要監測設備的負載率、運行設置等情況。
(4)數據中心環境監測數據:包含數據中心內部機房溫度和濕度、外部天氣環境溫度和濕度等,其中制冷系統的送回風溫度等也應是重點監控信息。
能耗數據采集是能耗模型建立的基礎,全面而詳細的數據,有利于模型建立、能耗預測等后續工作的開展。因此,數據采集應當覆蓋數據中心的各個方面,目前國內外數據中心建設、運維公司都在數據中心安裝了大量的傳感器,以便于實時了解數據中心的各種狀態。根據Google在數據中心方面公開的資料,目前其數據中心的幾千個傳感器,實時采集溫度、耗電量、泵速、設備運行設定等數據。相對而言,國內數據中心目前整體數據監控與采集仍然粗放,為實現能耗模型建立、精細化管理等目標,首先需要建立完善的狀態監控與數據采集系統。
(二)能耗建模方法
學術界與產業界提出了諸多能耗模型的建立方法,部分方案已經通過實踐驗證,并取得了較好的效果。本文將主要對聚類、線性回歸、深度學習3種模型建立方式進行討論。
(1)基于聚類的能耗模型優化方案
聚類是一種無監督學習的方法,可以在無任何先知前提下,根據物體本身特性對其類別進行劃分。將聚類算法應用于能耗模型,可以快速簡單地發現不同能耗狀態之間的關系,從而對能耗狀態類別進行劃分,并制定每種狀態下的類別優化策略,實現能耗模型建立與能效優化的目標。
利用聚類進行能耗模型的建立與能效優化的過程中,首先應選擇合適的聚類算法;然后調整參數實現對采集數據的類簇劃分;再選取各個類簇中心,以其為研究基礎,探討能效優化的方法。在數據中心運維管理實踐中,已經采用了聚類的方法。以聚類作為構建能耗模型的方法,優點是簡單易行,但存在精度不高、優化方案工作量大等方面的問題。
(2)基于線性回歸的能耗模型優化方案
回歸分析通過建立模型,研究自變量與因變量之間的關系。在變量關系分析、預測、時間序列問題研究等方面具有重要的作用。回歸分析又可分為線性回歸、邏輯回歸等不同的方法。而多元線性回歸模型是能耗建模分析中常用的方法,其主要討論因變量與多個自變量之間的線性關系。公式(4)為多元線性回歸模型的計算公式。
(4)
線性回歸不僅可以對數據中心總體能耗模型進行擬合,同時也應用在服務器、制冷系統等設備和子系統的能耗模型建立上。相對聚類,線性回歸能夠更加精準的建立能耗模型,但是當能耗變量較多、數據量較大時,模型建立將變得困難。
(3)基于深度學習的能耗模型優化方案
隨著數據中心建設水平的不斷提高,一方面監控設備的采樣能力不斷增強,采集數據的種類和數量都不斷增多;另一方面,數據中心設備的自動化水平不斷提高,集中化的精細式管控成為可能。多樣與全面的數據,讓構建更加優秀的模型成為可能,集中化的設備管控為數據中心能耗的降低提供基礎;然而,與之而來的就是更加復雜的能耗模型構建,該模型需要根據每個數據中心的不同特點,建立設備間的相互影響關系,以及不同環境下設備的實時調控方式。
上述問題對傳統能耗模型構建方式、傳統設備調度策略帶來了挑戰。于是,各個機構開始嘗試利用深度學習建立模型,并制定數據中心資源調度優化規則。通過深度學習訓練CNN、RNN等神經網絡,實現構建數據中心能耗模型,形成資源調度策略的目標。根據Google的公開資料,目前其已經將深度學習應用于數據中心能耗的管理。圖2為Google應用深度學習管理能耗前后的PUE變化,應用深度學習后,制冷能耗減少40%,PUE降低約15%。利用深度學習能夠通過處理大量的數據,建立更加復雜的模型;但與此同時,也對能耗數據采集、自動化控制等方面提出了更高的要求。
參考文獻
鄂大偉主編.計算機網絡與應用技術.中國物資出版社,1998年01月第1版.
勞動和社會保障部教材辦公室組織編寫.電子商務師、高級電子商務師.中國勞動社會保障出版社,2003.10.
李丕賢,劉德山主編.大學計算機基礎.人民郵電出版社,2008.9.
石述紅.信息時代的數據中心[J].數字通信世界,2018,(11):136.
顏仕禮.數據中心網絡常見通訊故障分析與處理[J].通訊世界,2019,26(1):141.
潘俊,王克勇,王晨平, 等.簡述數據中心冷卻技術發展趨勢[J].電信快報,2019,(2):43-44.
王少鵬、王樹嶺《信息通信技術與政策》2019年第2期
總結
- 上一篇: Nginx源码安装(CentOS7)
- 下一篇: protues7 使用笔记