产品可靠性需求
一?可靠性指標(biāo)
可靠性需求反映了系統(tǒng)在一定條件下無(wú)故障地運(yùn)行的能力。
計(jì)算公式
可靠性 =?總的有效運(yùn)行時(shí)間 /?總運(yùn)行時(shí)間。
可靠性分為硬件可靠性和軟件可靠性。
1?硬件可靠性
硬件可能會(huì)出現(xiàn)故障。出現(xiàn)故障的原因是,設(shè)備元器件都是有使用壽命的,時(shí)間長(zhǎng)了元器件就可能壞掉。整機(jī)的故障率受所有元器件的故障率的影響。為降低整機(jī)故障率,我們就要選用更優(yōu)質(zhì)的元器件。
硬件可靠性可以通過三個(gè)指標(biāo)來評(píng)估。
a?平均無(wú)故障時(shí)間
所有設(shè)備平均多長(zhǎng)時(shí)間發(fā)生一次故障。
b?維護(hù)響應(yīng)時(shí)間
如果設(shè)備出現(xiàn)故障,就需要維修,維修人員應(yīng)盡快到達(dá)現(xiàn)場(chǎng),在企服產(chǎn)品中,如果對(duì)方承諾提供 7*24?小時(shí)維修服務(wù),并且1小時(shí)達(dá)到現(xiàn)場(chǎng),那么該公司的維修能力很強(qiáng)。這個(gè)指標(biāo)被稱為維護(hù)響應(yīng)時(shí)間。
c?平均維護(hù)時(shí)間
維修人員在達(dá)到現(xiàn)場(chǎng)后,就應(yīng)該盡快修好產(chǎn)品。在設(shè)計(jì)硬件時(shí),就要考慮如何盡快修好。比如,設(shè)備電源支持熱插拔,如果電源壞了,不用關(guān)機(jī)也能更換電源,這樣維修時(shí)間就很短。要多長(zhǎng)時(shí)間才能修好,這個(gè)時(shí)間被稱為平均維護(hù)時(shí)間。平均維護(hù)時(shí)間是指修復(fù)一次故障所需的總時(shí)間,該時(shí)間包含維護(hù)響應(yīng)時(shí)間,修好所用的時(shí)間等。
綜上所述,硬件可靠性是平均無(wú)故障時(shí)間、平均維護(hù)時(shí)間的綜合反映。如果一歀硬件產(chǎn)品的可靠性強(qiáng),那么該產(chǎn)品用的時(shí)間長(zhǎng)(體現(xiàn)可靠性),并且壞的次數(shù)少(體現(xiàn)平均無(wú)故障時(shí)間),壞了以后維修快(體現(xiàn)平均維護(hù)時(shí)間)。
硬件可靠性的提升體現(xiàn)在兩方面。一方面,硬件要能穩(wěn)定運(yùn)行,無(wú)故障。另一方面,設(shè)備要支持冗余備份,如系統(tǒng)支持雙電源,當(dāng)一個(gè)電源壞了時(shí),另一個(gè)仍然可用。
硬件可靠性還會(huì)受環(huán)境的影響。硬件對(duì)環(huán)境的濕度和溫度都有要求,不適宜的溫度和濕度將造成硬件故障。其要求又分硬件工作時(shí)的溫度和濕度要求、硬件存放時(shí)的溫度和濕度要求。
2?軟件可靠性
軟件可靠性和硬件可靠性是類似的,也有平均無(wú)故障時(shí)間、平均維護(hù)時(shí)間等指標(biāo)。
首先,軟件可靠性是建立在硬件可靠性之上的。如果沒有硬件的正常工作,軟件的正常工作就無(wú)從談起。為了避免硬件故障導(dǎo)致軟件不可用,我們將軟件安裝在多臺(tái)設(shè)備上。此時(shí),如果一臺(tái)設(shè)備壞掉了,也不會(huì)影響軟件的使用。
其次,在設(shè)計(jì)軟件的時(shí)候應(yīng)設(shè)計(jì)一些功能,來提升其可靠性。常見的是設(shè)計(jì)一些便于排錯(cuò)、便于恢復(fù)系統(tǒng)的功能,如定期進(jìn)行數(shù)據(jù)備份,這樣軟件就可以快速?gòu)腻e(cuò)誤中恢復(fù),也避免人為因素造成系統(tǒng)損壞。
最后,軟件可靠性也包括系統(tǒng)的完整性。如果不出現(xiàn)數(shù)據(jù)丟失,就說明數(shù)據(jù)完整性比較好。但是系統(tǒng)不同,對(duì)完整性的要求也不同。比如,視頻直播對(duì)數(shù)據(jù)完整性的要求比較低,偶爾丟失幾個(gè)數(shù)據(jù),并需影響視頻的觀看。
二?產(chǎn)品經(jīng)理工作
產(chǎn)品經(jīng)理應(yīng)與研發(fā)人員協(xié)商,共同定義可靠性需求。我們將產(chǎn)品經(jīng)理分為軟件產(chǎn)品經(jīng)理和硬件產(chǎn)品經(jīng)理,他們的主要工作如下。
軟件產(chǎn)品經(jīng)理的工作。比如,定義備份功能,如餐飲軟件要支持?jǐn)?shù)據(jù)備份。這樣數(shù)據(jù)在設(shè)備上壞掉后就可快速恢復(fù),并且該恢復(fù)功能要有圖形界面。定義數(shù)據(jù)完整性的要求,如說明該業(yè)務(wù)對(duì)數(shù)據(jù)完整性的要求高不高。
硬件產(chǎn)品經(jīng)理的工作。比如,定義硬件規(guī)格,如硬件要支持冗余電源,支持雙路供電等。再如,定義告警機(jī)制。當(dāng)硬件出現(xiàn)某些故障,可以通過短信、界面和指示燈方式告知用戶。
三?可靠性指標(biāo)匯總
| 可靠性需求 | |
| 平均無(wú)故障時(shí)間 | 產(chǎn)品出現(xiàn)故障的時(shí)間平均值,如電腦的平均無(wú)故障時(shí)間為15年,就是說電腦平均算起來,15年出故障。 |
| 平均維護(hù)時(shí)間 | 產(chǎn)品出現(xiàn)故障后平均完成維修的時(shí)間,包括在途時(shí)間和到達(dá)現(xiàn)場(chǎng)的維修時(shí)間,如果平均維護(hù)時(shí)間為0.5小時(shí) |
| 維護(hù)響應(yīng)時(shí)間 | 從發(fā)現(xiàn)故障到開始維修所需要的時(shí)間,比如,要求公司支持 7*24?小時(shí)隨時(shí)響應(yīng),且1小時(shí)內(nèi)開始維修,這就是對(duì)維護(hù)響應(yīng)時(shí)間的要求 |
| 可靠性 | 可靠性 =?總的有效運(yùn)行時(shí)間 /?總運(yùn)行時(shí)間。如果一項(xiàng)業(yè)務(wù)的可靠性為99.999%,則在1年時(shí)間內(nèi),該業(yè)務(wù)中斷5.26分 |
| 硬件環(huán)境需求 | |
| 溫度要求 | 分工作時(shí)和不工作時(shí)的溫度要求,如工作溫度為 -10攝氏度~40攝氏度 |
| 濕度要求 | 過高的濕度也會(huì)造成硬件故障,如濕度要求是 0%~95% |
四?可靠性和可用性的異同
可靠性和可用性的概念很類似。區(qū)別是,可靠性是從系統(tǒng)角度講產(chǎn)品有沒有問題,可用性是從用戶角度講產(chǎn)品有沒有問題。兩者含義類似但視角不相同,產(chǎn)品不可靠并不一定意味著產(chǎn)品不可用。
比如,服務(wù)器硬件如果頻繁出現(xiàn)故障,則說明硬件可靠性不好。但可靠性不好,不能說明系統(tǒng)不可用。因?yàn)橐粋€(gè)設(shè)備壞了,其他設(shè)備仍可用,所以產(chǎn)品還是可用的。再如,服務(wù)器支持雙電源冗余備份,如果其中一個(gè)電源經(jīng)常壞,我們可以說系統(tǒng)可靠性不好。但另外一個(gè)電源仍能讓系統(tǒng)工作,并去影響系統(tǒng)的可用性。
現(xiàn)在的大多數(shù)大型軟件系統(tǒng)或物聯(lián)網(wǎng)系統(tǒng),都是在硬件不可靠的前提下,提升用戶的可用性的。比如,即使某些網(wǎng)絡(luò)設(shè)備壞了,現(xiàn)在的互聯(lián)網(wǎng)體系也能正常上網(wǎng),因?yàn)閿?shù)據(jù)還可以通過其他設(shè)備傳輸。再如,現(xiàn)在各種云平臺(tái)也能在任意服務(wù)器損壞的情況下,做到不丟失數(shù)據(jù)和不停止服務(wù),因?yàn)橐慌_(tái)服務(wù)壞了,其他服務(wù)器還照常工作。在現(xiàn)實(shí)生活中,我們用的網(wǎng)盤沒有出現(xiàn)過數(shù)據(jù)丟失,也是因?yàn)樵诜?wù)器端做了數(shù)據(jù)備份。
總結(jié)
- 上一篇: openstack--3--控制节点安装
- 下一篇: windows服务器安全事件日志事件编号