系统架构设计师 - 系统可靠性设计
文章目錄
- 1 可靠性分析
- 故障樹分析方法
- 失效模型及效應分析方法
- 2 可靠性設計原則
- 3 可靠性設計方法
- 避錯設計
- 容錯設計
- 恢復快設計
- N版本冗余設計
- 冗余設計
- 檢錯設計
- 檢錯對象:
- 檢錯延時
- 實現方式
- 處理方式
- 降低系統復雜度設計
- 4.可靠性子特性
1 可靠性分析
故障樹分析方法
自頂向下,從頂事件(最不希望發生的、對設備、人員影響最大的事件)開始,逐步向下分析導致頂事件發生的原因,直至到基礎事件。分析故障原因的組合方式或發生概率。
步驟:故障樹建立 - 定性分析 - 定量分析
失效模型及效應分析方法
在系統分析初期,對失效模型進行分析,分析其故障原因及其后果影響,建立解決方案,減少或避免故障,提前發現風險進行解決,提高系統可靠性。
步驟:系統定義 - 故障模型分析 - 故障原因分析 - 故障后果分析 - 解決方案分析
2 可靠性設計原則
1.可靠性設計是系統設計的一部分,在系統架構設計階段既要考慮,但可靠性設計不能與其他系統設計原則沖突。
2.可靠性設計是在保證系統功能的前提下,以保障、提高系統可靠性為目標。
3.可靠性設計需要建立可靠性目標,但不宜龐大,應排在系統功能、用戶需求。開發經費之后考慮。
3 可靠性設計方法
避錯設計
代碼審查、代碼走查、測試先行、測試
容錯設計
恢復快設計
以一組軟件操作為容錯單元。把程序塊改為恢復快(一個恢復快包含多個功能相同、算法實現方式不同的程序塊,一個運行文本,多個備份文本,形成動態備份,當運行文本失效時,備份文本替換)。一個系統內。后向恢復。
N版本冗余設計
以模塊或版本為容錯單元。設計多個模塊或版本,對它們相同初始條件、相同輸出的情況下產生的輸出,進行多數投票表決,以避免模塊或版本因失效而提供錯誤服務,從而提高可靠性。多個系統間。前向恢復。
冗余設計
以系統為容錯單元。設計多個功能相同,訪問路徑、實現方式、算法不同的系統作為備份,當運行系統失效時,備份系統進行替換。
檢錯設計
檢錯對象:
檢查點:容易發生錯誤、或者發生錯誤后對設備、人員、功能影響很大的功能
檢查內容:具有代表性、易于判斷的目標
檢錯延時
如果檢錯事件長到影響系統失效的正常報警,就要考慮更換檢錯對象或更換檢錯的實現方式。
實現方式
1.正常返回結果,如果結果不在正常范圍內,報警;2.設置超時時間,超過設定的延時則報警;3.設置狀態標志位
處理方式
通常采取:查出故障 - 中斷軟件系統運行 - 報警 。 是否中斷系統運行取決于系統的實時性要求
降低系統復雜度設計
在保證系統正常功能性的前提下,優化系統架構結構、優化數據流流向、簡化算法、簡化程序代碼以降低系統復雜度,從而提高系統可靠性。
4.可靠性子特性
錯 易 成
容錯性
易恢復性
成熟性
總結
以上是生活随笔為你收集整理的系统架构设计师 - 系统可靠性设计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Centos7 Docker容器操作_入
- 下一篇: Git Windows安装手册