两次服务器灾难事故的反思
????假期真快,這都是第5天了,開(kāi)始整合服務(wù)器版本的linux.其實(shí)可不必使用ubuntu service,使用Cent OS系統(tǒng)已經(jīng)幾年了,用著很穩(wěn)定,也順手;但近期兩次沒(méi)有必要的,人為原因的宕機(jī),不得不重新考慮現(xiàn)實(shí)情況,如何建立正規(guī)的項(xiàng)目管理流程.
??? 本來(lái)8臺(tái)服務(wù)器好好地跑著,沒(méi)有什么問(wèn)題;開(kāi)發(fā)隊(duì)伍中,有人抱怨不給root密碼,不好部署程序,我管理上忙些,就把root密碼給出來(lái)了,這下子"災(zāi)難"來(lái)了,兩個(gè)哥們動(dòng)了系統(tǒng)配置文件,本意可能是實(shí)現(xiàn)開(kāi)機(jī)啟動(dòng)程序,但在SSH下,直接拷貝了網(wǎng)頁(yè)上的內(nèi)容,粘貼進(jìn)去了,事后我相當(dāng)無(wú)語(yǔ)了.
??? 最后更讓我無(wú)語(yǔ)的是,系統(tǒng)故障后,沒(méi)有第一時(shí)間報(bào)告,私自改了N多東西,最嚴(yán)重后果,這臺(tái)客戶(hù)端服務(wù)器宕機(jī),造成無(wú)法給客戶(hù)演示系統(tǒng).我是相當(dāng)?shù)臒o(wú)語(yǔ),考慮不是故意的,加上這件事,在項(xiàng)目管理流程上出了問(wèn)題,沒(méi)有追責(zé).
??? 第二次的系統(tǒng)故障,更讓我無(wú)語(yǔ)了,編譯服務(wù)器直接死掉,究其原因,有人想升級(jí)編譯器的版本,導(dǎo)致系統(tǒng)死掉,話(huà)說(shuō)回來(lái):就算升級(jí)成功了,編譯器版本和工程服務(wù)器上的版本不一致,程序也不能運(yùn)行呀.不懂又在瞎搞,是一種工作態(tài)度問(wèn)題.
??? 這次事件,更加顯露了項(xiàng)目管理上的嚴(yán)重漏洞.反思良久,更改掉了所有系統(tǒng)的密碼,規(guī)定,所有程序模塊只要在開(kāi)發(fā)機(jī)穩(wěn)定運(yùn)行,就算成功,往工程服務(wù)器上部署時(shí),由專(zhuān)業(yè)人員統(tǒng)一部署與管理.公司研發(fā)隊(duì)伍初創(chuàng),還不能和大公司的研發(fā)管理相比.
??? 項(xiàng)目開(kāi)發(fā)中,所有程序員的開(kāi)發(fā)機(jī)使用ubuntu 14.04桌面版,為了更好適應(yīng)這個(gè)現(xiàn)實(shí)情況,把部分服務(wù)器系統(tǒng)換成ubuntu server,主要是降低開(kāi)發(fā)難度,建立一個(gè)完整的開(kāi)發(fā)生態(tài)鏈:利用ubuntu簡(jiǎn)單,易用的特點(diǎn),整合資源,建立一個(gè)上手快的開(kāi)發(fā)環(huán)境.
??? 更換了服務(wù)器系統(tǒng)后,由于些許的不同,必然面臨一些新問(wèn)題,程序打包,系統(tǒng)的克隆,這又減慢了項(xiàng)目的開(kāi)發(fā)進(jìn)度.
/*****************************************************************************************/
????由此及彼,其它方面不好的地方一并列出:
??? 管理流程不好,很致命的.再加上剛初建的研發(fā)隊(duì)伍,人員之間需要磨合,項(xiàng)目風(fēng)險(xiǎn)加大了很多,不改革就會(huì)死掉,今年這個(gè)小長(zhǎng)假,讓我時(shí)間反思項(xiàng)目上的種種問(wèn)題:
? ? 1.致命拖沓的采購(gòu),導(dǎo)致硬件不能生產(chǎn)調(diào)試,無(wú)法和軟件聯(lián)調(diào).
? ? 2.軟件人員的自我修養(yǎng)與業(yè)務(wù)技能低下問(wèn)題.
? ? 3.項(xiàng)目總體進(jìn)度緩慢的問(wèn)題.
? ? 4.最致命的是公司不能按時(shí)發(fā)工資,人員積極性不高的問(wèn)題.
? ? 5.公司過(guò)多申請(qǐng)項(xiàng)目材料整理,導(dǎo)致無(wú)效工作的問(wèn)題.
? ? 6.整個(gè)公司對(duì)研發(fā)部門(mén)的重要性全然不知,基本上以做貿(mào)易的思想管理公司.??
?? 能解決的都是技術(shù)問(wèn)題,其它公司層面的問(wèn)題是個(gè)人無(wú)法解決的,人員離職率必然較大,種種原因說(shuō)明,項(xiàng)目已經(jīng)很危險(xiǎn)了.做為一個(gè)項(xiàng)目的管理者,好提前預(yù)防這個(gè)風(fēng)險(xiǎn),全力思考中.
???
轉(zhuǎn)載于:https://blog.51cto.com/qtlinux/1560766
總結(jié)
以上是生活随笔為你收集整理的两次服务器灾难事故的反思的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 几个常用的eclipse快捷键
- 下一篇: MySQL数据库备份和还原的常用命令小结