SCCM 2012系列之一 Operations Manager 关键概念
Operations Manager 關(guān)鍵概念
1. Operations Manager 的用途
? ? ?大小型企業(yè)通常依賴于其計(jì)算環(huán)境提供的服務(wù)和應(yīng)用程序。 IT 部門(mén)負(fù)責(zé)確保這些關(guān)鍵服務(wù)和應(yīng)用程序的性能和可用性。 這意味著,IT 部門(mén)需要知道何時(shí)存在問(wèn)題、找到問(wèn)題所在以及斷定問(wèn)題的原因,最好是在應(yīng)用程序的用戶遇到問(wèn)題之前。 企業(yè)中的計(jì)算機(jī)和設(shè)備越多,此項(xiàng)任務(wù)就越復(fù)雜。
如果在環(huán)境中使用 Operations Manager,則可以更加輕松地監(jiān)視多個(gè)計(jì)算機(jī)、設(shè)備、服務(wù)和應(yīng)用程序。 操作控制臺(tái)(如下圖所示)允許你檢查環(huán)境中所有監(jiān)視對(duì)象的運(yùn)行狀況、性能和可用性,并有助于你確定和解決問(wèn)題。Operations Manager 將告訴你哪些監(jiān)視的對(duì)象不正常,在找到問(wèn)題時(shí)發(fā)送警報(bào),并提供信息以幫助你確定問(wèn)題的原因以及可能的解決方案。 作為管理員,通過(guò)選擇要監(jiān)視的計(jì)算機(jī)和設(shè)備,并導(dǎo)入為特定功能和應(yīng)用程序提供監(jiān)視的管理包,你可以配置將要監(jiān)視的內(nèi)容。
2. Operations Manager 基礎(chǔ)結(jié)構(gòu)
如果安裝 Operations Manager,則將創(chuàng)建一個(gè)管理組。 管理組是功能的基本單位。 管理組至少包含管理服務(wù)器、操作數(shù)據(jù)庫(kù)以及報(bào)表數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)。
管理服務(wù)器是對(duì)管理組進(jìn)行管理以及與數(shù)據(jù)庫(kù)通信的焦點(diǎn)。 打開(kāi)操作控制臺(tái)并連接到管理組時(shí),你就會(huì)連接到該管理組的管理服務(wù)器。 根據(jù)計(jì)算環(huán)境的規(guī)模,管理組可以包含單個(gè)管理服務(wù)器或多個(gè)管理服務(wù)器。
操作數(shù)據(jù)庫(kù)是一個(gè) SQL Server 數(shù)據(jù)庫(kù),此數(shù)據(jù)庫(kù)包含管理組的所有配置數(shù)據(jù),并存儲(chǔ)為管理組收集和處理的所有監(jiān)視數(shù)據(jù)。 操作數(shù)據(jù)庫(kù)保留短期數(shù)據(jù),默認(rèn)情況下保留 7 天。
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)是一個(gè)存儲(chǔ)監(jiān)視和警報(bào)數(shù)據(jù)以備歷史查詢的 SQL Server 數(shù)據(jù)庫(kù)。 寫(xiě)入到 Operations Manager 數(shù)據(jù)庫(kù)的數(shù)據(jù)也會(huì)寫(xiě)入到數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù),以便報(bào)告始終包含當(dāng)前數(shù)據(jù)。 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)保留長(zhǎng)期數(shù)據(jù)。
安裝 Operations Manager 報(bào)表功能時(shí),管理組還包含一個(gè)報(bào)表服務(wù)器,此服務(wù)器利用數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)建立并提供報(bào)表。
管理組的這些核心組件可以存在于單一服務(wù)器上,也可以分布在多臺(tái)服務(wù)器中,如下圖所示。
管理服務(wù)器
管理服務(wù)器的作用是對(duì)管理組配置進(jìn)行管理,管理代理并與其通信,以及與管理組中的數(shù)據(jù)庫(kù)通信。
管理組可以包含多臺(tái)管理服務(wù)器以提供其他功能和連續(xù)的可用性。 將兩臺(tái)或更多臺(tái)管理服務(wù)器添加到管理組后,管理服務(wù)器會(huì)變?yōu)?span style="color:#c0504d;font-family:'微軟雅黑', 'microsoft yahei';">資源池 的一部分,并且會(huì)在池成員中分?jǐn)偣ぷ鳌?如果資源池的一個(gè)成員出現(xiàn)故障,則資源池中的其他成員將獲取該成員的工作負(fù)荷。 添加新管理服務(wù)器后,新管理服務(wù)器會(huì)自動(dòng)從資源池內(nèi)的現(xiàn)有成員那里獲取一些工作。 資源池中的所有成員將管理不同的一組遠(yuǎn)程對(duì)象;在任意給定時(shí)間,相同池中的兩個(gè)成員將不會(huì)同時(shí)管理同一對(duì)象。
網(wǎng)關(guān)服務(wù)器是一種特殊類型的管理服務(wù)器。 利用網(wǎng)關(guān)服務(wù)器,可以監(jiān)視不受信任域中的計(jì)算機(jī)。 有關(guān)詳細(xì)信息,請(qǐng)參閱 Monitoring Across Untrusted Boundaries(跨不信任的邊界進(jìn)行監(jiān)視)。
代理
Operations Manager“代理”是安裝在計(jì)算機(jī)上的一項(xiàng)服務(wù)。 代理會(huì)收集數(shù)據(jù)、將采樣數(shù)據(jù)與預(yù)定義的值進(jìn)行比較、創(chuàng)建警報(bào)并運(yùn)行響應(yīng)。 管理服務(wù)器會(huì)接收配置并將配置分發(fā)到受監(jiān)視的計(jì)算機(jī)上的代理。
所有代理均要向管理組中的一個(gè)管理服務(wù)器報(bào)告。 此管理服務(wù)器稱為代理的主管理服務(wù)器。
代理根據(jù)管理服務(wù)器發(fā)送的配置觀察受監(jiān)視的計(jì)算機(jī)上的數(shù)據(jù)源并收集信息。 此代理還計(jì)算監(jiān)視的計(jì)算機(jī)以及監(jiān)視的計(jì)算機(jī)上的對(duì)象的運(yùn)行狀況狀態(tài),并向管理服務(wù)器報(bào)告。 監(jiān)視的對(duì)象的運(yùn)行狀況變化或其他條件滿足時(shí),代理將生成警報(bào)。 這樣,操作員可以知道有些東西需要注意。 通過(guò)將有關(guān)監(jiān)視對(duì)象的運(yùn)行狀況數(shù)據(jù)提供給管理服務(wù)器,代理提供設(shè)備及其主持的所有應(yīng)用程序的運(yùn)行狀況的最新?tīng)顟B(tài)。
可以將代理配置為充當(dāng)代理程序。 代理程序是一個(gè)能夠代表計(jì)算機(jī)或網(wǎng)絡(luò)設(shè)備(而不是其主機(jī))將數(shù)據(jù)轉(zhuǎn)發(fā)給管理服務(wù)器的代理。 例如,可以啟用安裝在 SQL 群集物理節(jié)點(diǎn)上的代理以用作代理來(lái)監(jiān)視群集資源。 代理程序能夠?qū)崿F(xiàn)監(jiān)視無(wú)法安裝代理的計(jì)算機(jī)和設(shè)備。 有關(guān)詳細(xì)信息,請(qǐng)參閱 Agentless Monitoring(無(wú)代理監(jiān)視)。
服務(wù)
在被監(jiān)視的計(jì)算機(jī)上,Operations Manager 代理作為 System Center Management 運(yùn)行狀況服務(wù)被列出。 System Center Management 運(yùn)行狀況服務(wù)收集性能數(shù)據(jù)、執(zhí)行任務(wù)等。 即使服務(wù)無(wú)法與它所報(bào)告到的管理服務(wù)器通信,它仍會(huì)在被監(jiān)視計(jì)算機(jī)的磁盤(pán)上繼續(xù)運(yùn)行并將收集的數(shù)據(jù)和事件排隊(duì)。 當(dāng)恢復(fù)連接時(shí),System Center 管理運(yùn)行狀況服務(wù)會(huì)將收集的數(shù)據(jù)和事件發(fā)送到管理服務(wù)器。
| System Center Management 運(yùn)行狀況服務(wù)有時(shí)也稱為運(yùn)行狀況服務(wù)。 |
System Center Management 運(yùn)行狀況服務(wù)還會(huì)在管理服務(wù)器上運(yùn)行。 在管理服務(wù)器上,System Center Management 運(yùn)行狀況服務(wù)會(huì)運(yùn)行監(jiān)視工作流并管理憑據(jù)。 為了運(yùn)行工作流,System Center Management 運(yùn)行狀況服務(wù)會(huì)使用指定的憑據(jù)啟動(dòng) MonitoringHost.exe 進(jìn)程。 這些進(jìn)程監(jiān)視和收集事件日志數(shù)據(jù)、性能計(jì)數(shù)器數(shù)據(jù)、Windows Management Instrumentation (WMI) 數(shù)據(jù),并運(yùn)行諸如腳本之類的操作。
管理服務(wù)器還運(yùn)行 System Center Data Access 服務(wù)及 System Center Management Configuration 服務(wù)。
System Center Data Access 服務(wù)為操作控制臺(tái)提供操作數(shù)據(jù)庫(kù)的訪問(wèn)權(quán)限,并將數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)。
System Center Management Configuration 服務(wù)對(duì)管理組的關(guān)系和拓?fù)溥M(jìn)行管理。 它還將管理包分發(fā)給受監(jiān)視的對(duì)象。
管理包
System Center 管理服務(wù)運(yùn)行的工作流由管理包來(lái)定義。 管理包定義代理收集并返回到特定應(yīng)用程序或技術(shù)的管理服務(wù)器的信息。 例如,BizTalk 服務(wù)器管理包包含規(guī)則和監(jiān)視器,這些規(guī)則和監(jiān)視器收集并評(píng)估對(duì)于確保 BizTalk 服務(wù)器應(yīng)用程序的運(yùn)行狀況和效率非常重要的事件和操作。
當(dāng) Operations Manager 在計(jì)算機(jī)上安裝代理后,它會(huì)將初始配置發(fā)送給該代理。 初始配置包括管理包中的對(duì)象發(fā)現(xiàn)。 管理包定義對(duì)象類型,如應(yīng)用程序和功能,這些類型的對(duì)象將在 Operations Manager 已經(jīng)發(fā)現(xiàn)的計(jì)算機(jī)上受到監(jiān)視。 代理會(huì)將數(shù)據(jù)發(fā)送到管理服務(wù)器,該管理服務(wù)器將標(biāo)識(shí)在計(jì)算機(jī)上發(fā)現(xiàn)的對(duì)象的實(shí)例。 然后該管理服務(wù)器會(huì)向代理發(fā)送適用于每個(gè)計(jì)算機(jī)的發(fā)現(xiàn)對(duì)象的管理包元素,如規(guī)則和監(jiān)視器。
規(guī)則定義從計(jì)算機(jī)中收集的事件和性能數(shù)據(jù),以及如何處理收集的信息。 考慮規(guī)則的一個(gè)簡(jiǎn)單方式就是 If/Then 語(yǔ)句。 例如,應(yīng)用程序的管理包可能包含以下這些規(guī)則,如:
如果事件日志中顯示一條表明應(yīng)用程序正在關(guān)閉的消息,則創(chuàng)建警報(bào)。
如果加載源文件失敗,則收集指明此次失敗的事件。
如這些示例所示,規(guī)則可以創(chuàng)建警報(bào),并收集事件或性能數(shù)據(jù),代理會(huì)將這些事件或性能數(shù)據(jù)發(fā)送到管理服務(wù)器。 規(guī)則也可以運(yùn)行腳本,例如允許規(guī)則嘗試重新啟動(dòng)已失敗的應(yīng)用程序。
發(fā)現(xiàn)的對(duì)象具有運(yùn)行狀況狀態(tài),在操作控制臺(tái)中此狀態(tài)表現(xiàn)為綠色(成功或正常)、×××(警告)或紅色(嚴(yán)重或不正常)。 監(jiān)視器定義受監(jiān)視對(duì)象的特定方面的運(yùn)行狀況狀態(tài)。 例如,磁盤(pán)驅(qū)動(dòng)器容量監(jiān)視器可能會(huì)將綠色定義為小于 85% 的填充百分比,將×××定義為大于 85% 的填充百分比,將紅色定義為大于 90% 的填充百分比。 可以將監(jiān)視器配置為在狀態(tài)發(fā)生變化時(shí)生成警報(bào)。
如何發(fā)現(xiàn)和監(jiān)視對(duì)象
下圖是如何發(fā)現(xiàn)和監(jiān)視對(duì)象的簡(jiǎn)化圖。
管理員可將 Operations Manager 配置為搜索要管理的計(jì)算機(jī)。 有關(guān)發(fā)現(xiàn)計(jì)算機(jī)的詳細(xì)信息,請(qǐng)參閱 Managing Discovery and Agents(管理發(fā)現(xiàn)和代理)。
滿足指定條件且尚未被管理的計(jì)算機(jī)會(huì)被標(biāo)識(shí)出來(lái)。
Operations Manager 代理已安裝在發(fā)現(xiàn)的計(jì)算機(jī)上。
代理請(qǐng)求配置數(shù)據(jù),然后管理服務(wù)器會(huì)從包含要發(fā)現(xiàn)的類的已安裝管理包中發(fā)送代理配置數(shù)據(jù)。 例如,如果安裝了 Windows Server 操作系統(tǒng)管理包,則管理服務(wù)器將向代理發(fā)送操作系統(tǒng)類。
代理會(huì)將配置數(shù)據(jù)與計(jì)算機(jī)進(jìn)行比較,標(biāo)識(shí)它發(fā)現(xiàn)的任何對(duì)象,并將信息返回給管理服務(wù)器。 例如,代理會(huì)將以下信息返回給管理服務(wù)器:計(jì)算機(jī)上存在 Windows Server 2008 R2 操作系統(tǒng)的實(shí)例。
管理服務(wù)器會(huì)從已安裝的管理包中向代理發(fā)送適用于發(fā)現(xiàn)的對(duì)象的所有監(jiān)視邏輯。 例如,代理將接收適用于 Windows Server 2008 R2 的所有監(jiān)視邏輯。
代理會(huì)應(yīng)用諸如規(guī)則和監(jiān)視器之類的監(jiān)視邏輯,運(yùn)行工作流以及將數(shù)據(jù)返回給管理服務(wù)器。
當(dāng)發(fā)現(xiàn)的對(duì)象發(fā)生變化時(shí),如正在添加或卸載應(yīng)用程序,代理會(huì)將更新的信息發(fā)送給管理服務(wù)器,然后該管理服務(wù)器會(huì)發(fā)送更新的監(jiān)視邏輯。
| Operations Manager 也可以發(fā)現(xiàn)和監(jiān)視網(wǎng)絡(luò)設(shè)備以及運(yùn)行 UNIX 和 Linux 操作系統(tǒng)的計(jì)算機(jī),并且可以提供無(wú)代理監(jiān)視。 有關(guān)詳細(xì)信息,請(qǐng)參閱操作指南中的 Operations Manager Monitoring Scenarios(Operations Manager 監(jiān)視方案)。 |
代理和管理服務(wù)器之間的通信
Operations Manager 代理會(huì)將警報(bào)和發(fā)現(xiàn)數(shù)據(jù)發(fā)送給主管理服務(wù)器,此服務(wù)器會(huì)將數(shù)據(jù)寫(xiě)入操作數(shù)據(jù)庫(kù)。 此代理還會(huì)將事件、性能和狀態(tài)數(shù)據(jù)發(fā)送給主管理服務(wù)器,此服務(wù)器會(huì)將數(shù)據(jù)同時(shí)寫(xiě)入操作數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)。
代理會(huì)根據(jù)每個(gè)規(guī)則和監(jiān)視器的計(jì)劃參數(shù)發(fā)送數(shù)據(jù)。 對(duì)于優(yōu)化的收集規(guī)則,只有當(dāng)計(jì)數(shù)器樣本與先前樣本之差達(dá)到指定容差(如 10%)時(shí),才會(huì)傳輸數(shù)據(jù)。 這將有助于減少網(wǎng)絡(luò)流量以及操作數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量。
此外,所有代理會(huì)按定期計(jì)劃向管理服務(wù)器發(fā)送數(shù)據(jù)包,此數(shù)據(jù)包稱為檢測(cè)信號(hào);默認(rèn)情況下,每 60 秒發(fā)送一次。 檢測(cè)信號(hào)的用途是驗(yàn)證代理的可用性以及代理與管理服務(wù)器之間的通信。 有關(guān)檢測(cè)信號(hào)的詳細(xì)信息,請(qǐng)參閱 How Heartbeats Work in Operations Manager(檢測(cè)信號(hào)在 Operations Manager 中的工作原理)。
對(duì)于每個(gè)代理,Operations Manager 將運(yùn)行運(yùn)行狀況服務(wù)觀察程序,此程序從管理服務(wù)器的角度監(jiān)視遠(yuǎn)程運(yùn)行狀況服務(wù)的狀態(tài)。
轉(zhuǎn)載于:https://blog.51cto.com/adam1943/1296342
總結(jié)
以上是生活随笔為你收集整理的SCCM 2012系列之一 Operations Manager 关键概念的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: HDU 1828 Picture 线段树
- 下一篇: 搭建DNS服务器