运维的基本知识点及分类工作
目錄:
- 什么是Linux運維
- 運維的分類
- 基礎(chǔ)運維的常見工作
- Linux運維工作發(fā)展過程
- Linux運維日常使用軟件和技能
- 運維工程師要掌握的技能
什么是Linux運維
- 運維是指大型組織已經(jīng)建立好的網(wǎng)絡(luò)軟硬件的維護(hù),就是要保證業(yè)務(wù)上的上線與運作的正常
- 在運轉(zhuǎn)的過程中,對他進(jìn)行維護(hù),集合了網(wǎng)絡(luò)、系統(tǒng)、數(shù)據(jù)庫、開發(fā)、安全、監(jiān)控于一身的技術(shù)
- 運維又包括DBA運維,網(wǎng)站運維,虛擬化運維,監(jiān)控運維,游戲運維等等
運維的分類
系統(tǒng)運維(SYS):
1. 負(fù)責(zé)IDC、網(wǎng)絡(luò)、CDN和基礎(chǔ)服務(wù)的建設(shè)(LVS、NTP、DNS);
2. 負(fù)責(zé)資產(chǎn)管理,服務(wù)器選型、交付和維修,網(wǎng)絡(luò)建設(shè)、LVS負(fù)載均衡和SNAT建設(shè)
系統(tǒng)運維的工作職責(zé)
'''1.IDC數(shù)據(jù)中心建設(shè)''' # 收集業(yè)務(wù)需求,預(yù)估未來數(shù)據(jù)中心的發(fā)展規(guī)模 # 骨干網(wǎng)的分布,數(shù)據(jù)中心建筑,以及Internet接入 # 網(wǎng)絡(luò)攻擊防御能力、擴(kuò)容能力、空間預(yù)留、外接專線能力、現(xiàn)場服務(wù)支撐能力等方面評估選型數(shù)據(jù)中心'''2.網(wǎng)絡(luò)建設(shè) ''' # 設(shè)計及規(guī)劃生產(chǎn)網(wǎng)絡(luò)架構(gòu) # 包括:數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)、傳輸網(wǎng)架構(gòu)、CDN網(wǎng)絡(luò)架構(gòu)等,以及網(wǎng)絡(luò)調(diào)優(yōu)等日常運維工作。'''3.LVS 負(fù)載均衡 ''' # LVS 是整個站點架構(gòu)中的流量入口,根據(jù)網(wǎng)絡(luò)規(guī)模和業(yè)務(wù)需求,構(gòu)建負(fù)載均衡集群。 # 完成網(wǎng)絡(luò)與業(yè)務(wù)服務(wù)器的銜接,提供高性能、高可用的負(fù)載調(diào)度能力,以及統(tǒng)一的網(wǎng)絡(luò)層防攻擊能力。'''4.CDN 規(guī)劃和建設(shè) ''' # CDN 工作劃分為第三方和自建兩部分 # 根據(jù)業(yè)務(wù)發(fā)展趨勢,規(guī)劃CDN新節(jié)點建設(shè)布局 # 完善CDN業(yè)務(wù)及監(jiān)控,保障CDN 系統(tǒng)穩(wěn)定、高效運行 # 分析業(yè)務(wù)加速頻道的文件特性和數(shù)量,制定最優(yōu)的加速策略和資源匹配 # 負(fù)責(zé)用戶劫持等CDN日常故障排查工作'''5.服務(wù)器選型、交付和維護(hù) ''' # 負(fù)責(zé)服務(wù)器的測試選型,包含服務(wù)器整機(jī)、部件的基礎(chǔ)性測試和業(yè)務(wù)測試,降低整機(jī)功率,提升機(jī)架部署密度等'''6.OS、內(nèi)核選型和 OS 相關(guān)維護(hù)工作 ''' # 負(fù)責(zé)整體平臺的 OS 選型、定制和內(nèi)核優(yōu)化,以及 Patch 的更新和內(nèi)部版本發(fā)布 # 建立基礎(chǔ)的YUM包管理和分發(fā)中心,提供常用包版本庫 # 跟進(jìn)日常各類 OS 相關(guān)故障 # 針對不同的業(yè)務(wù)類型,提供定向的優(yōu)化支持'''7.資產(chǎn)管理 CMDB ''' # 記錄和管理運維相關(guān)的基礎(chǔ)物理信息,包括: 數(shù)據(jù)中心、網(wǎng)絡(luò)、機(jī)柜、服務(wù)器、ACL、IP等各種資源信息 # 制定有效的流程,確保信息的準(zhǔn)確性; # 開放API接口,為自動化運維提供數(shù)據(jù)支持'''8.基礎(chǔ)服務(wù)建設(shè) ''' # 業(yè)務(wù)對 DNS、NTP、SYSLOG 等基礎(chǔ)服務(wù)的依賴非常高,需要設(shè)計高可用架構(gòu)避免單點,提供穩(wěn)定的基礎(chǔ)服務(wù)應(yīng)用運維(SRE):
應(yīng)用運維負(fù)責(zé)線上服務(wù)的變更、服務(wù)狀態(tài)監(jiān)控、服務(wù)容災(zāi)和數(shù)據(jù)備份等工作,對服務(wù)進(jìn)行例行排查、故障應(yīng)急處理等工作
工作職責(zé)如下:設(shè)計評審、服務(wù)管理、資源管理、例行檢查、預(yù)案管理、數(shù)據(jù)備份。
業(yè)務(wù)運維工作細(xì)則
1)監(jiān)控線上的服務(wù)質(zhì)量
2)響應(yīng)異常/處理突發(fā)故障
3)在線發(fā)布/升級產(chǎn)品
4)和相應(yīng)產(chǎn)品線的研發(fā)和測試協(xié)調(diào)處理產(chǎn)品問題
應(yīng)用運維的工作職責(zé)
'''1.設(shè)計評審 ''' # 在產(chǎn)品研發(fā)階段,參與產(chǎn)品設(shè)計評審,從運維的角度提出評審意見,使服務(wù)滿足運維準(zhǔn)入的高可用要求。'''2.服務(wù)管理 ''' # 負(fù)責(zé)制定線上業(yè)務(wù)升級變更及回滾方案,并進(jìn)行變更實施 # 能夠發(fā)現(xiàn)服務(wù)上的缺陷,及時通報并推進(jìn)解決 # 完善監(jiān)控內(nèi)容,提高報警準(zhǔn)確度 # 在線上服務(wù)出現(xiàn)故障時,第一時間響應(yīng)'''3.資源管理 ''' # 對各服務(wù)的服務(wù)器資產(chǎn)進(jìn)行管理,梳理服務(wù)器資源狀況、數(shù)據(jù)中心分布情況、網(wǎng)絡(luò)專線及帶寬情況 # 能夠合理使用服務(wù)器資源,根據(jù)不同服務(wù)的需求,分配不同配置的服務(wù)器,確保服務(wù)器資源的充分利用'''4.例行檢查 ''' # 根據(jù)制定的服務(wù)排查點,對服務(wù)進(jìn)行定期檢查 # 對排查過程中發(fā)現(xiàn)的問題,及時進(jìn)行追查,排除可能存在的隱患'''5.預(yù)案管理 ''' 確定服務(wù)所需的各項監(jiān)控、系統(tǒng)指標(biāo)的閾值或臨界點,以及出現(xiàn)該情況后的處理預(yù)案。 建立和更新服務(wù)預(yù)案文檔,并根據(jù)日常故障情況不斷補(bǔ)充完善,提高預(yù)案完備性。'''6.數(shù)據(jù)備份 ''' # 制定數(shù)據(jù)備份策略,按規(guī)范進(jìn)行數(shù)據(jù)備份工作。 # 保證數(shù)據(jù)備份的可用性和完整性,定期開展數(shù)據(jù)恢復(fù)性測試。運維開發(fā)
1. 是給應(yīng)用運維開發(fā)運維工具和運維平臺的
2. 主要包含的平臺:工單系統(tǒng)、CMDB、監(jiān)控系統(tǒng)、ELK日志系統(tǒng)、CI/CD、LDAP、FAQ、培訓(xùn)系統(tǒng)、OpenStack平臺
數(shù)據(jù)庫運維(DBA):
1. 數(shù)據(jù)庫運維負(fù)責(zé)數(shù)據(jù)存儲方案設(shè)計、數(shù)據(jù)庫表設(shè)計、索引設(shè)計和SQL優(yōu)化,
2. 對數(shù)據(jù)庫進(jìn)行變更、監(jiān)控、備份、高可用設(shè)計等工作,詳細(xì)的工作內(nèi)容如下
3. 設(shè)計評審、容量規(guī)劃、數(shù)據(jù)備份與災(zāi)備、數(shù)據(jù)庫監(jiān)控、數(shù)據(jù)庫安全、數(shù)據(jù)庫高可用和性能優(yōu)化
4. 自動化系統(tǒng)建設(shè)、運維研發(fā)、運維平臺、監(jiān)控系統(tǒng)、自動化部署系統(tǒng)
運維安全(SEC):
1. 運維安全負(fù)責(zé)網(wǎng)絡(luò)、系統(tǒng)和業(yè)務(wù)等方面的安全加固工作
2. 進(jìn)行常規(guī)的安全掃描、滲透測試,進(jìn)行安全工具和系統(tǒng)研發(fā)以及安全事件應(yīng)急處理
3. 工作內(nèi)容如下:安全制度建立、安全培訓(xùn)、風(fēng)險評估、安全建設(shè)、安全合規(guī)、應(yīng)急響應(yīng)。
基礎(chǔ)運維的常見工作
服務(wù)監(jiān)控技術(shù):
包括監(jiān)控平臺的研發(fā)、應(yīng)用,服務(wù)監(jiān)控準(zhǔn)確性、實時性、全面性的保障
服務(wù)故障管理:
包括服務(wù)的故障預(yù)案設(shè)計,預(yù)案的自動化執(zhí)行,故障的總結(jié)并反饋到產(chǎn)品/系統(tǒng)的設(shè)計層面進(jìn)行優(yōu)化以提高產(chǎn)品的穩(wěn)定性
服務(wù)容量管理:
測量服務(wù)的容量,規(guī)劃服務(wù)的機(jī)房建設(shè),擴(kuò)容、遷移等工作
服務(wù)性能優(yōu)化:
從各個方向,包括網(wǎng)絡(luò)優(yōu)化、操作系統(tǒng)優(yōu)化、應(yīng)用優(yōu)化、客戶端優(yōu)化等,提高服務(wù)的性能和響應(yīng)速度,改善用戶體驗
服務(wù)全局流量調(diào)度:
接入服務(wù)的流量,根據(jù)容量和服務(wù)狀態(tài)在各個機(jī)房間分配流量
服務(wù)安全保障:
包括服務(wù)的訪問安全、防攻擊、權(quán)限控制等
服務(wù)自動發(fā)布部署:
部署平臺/工具的研發(fā),及平臺/工具的使用,做到安全、高效的發(fā)布服務(wù)
服務(wù)集群管理:
包括服務(wù)的服務(wù)器管理、大規(guī)模集群管理等
服務(wù)成本優(yōu)化:
盡可能降低服務(wù)運行使用的資源,降低服務(wù)運行成本
數(shù)據(jù)庫管理(DBA):
通過設(shè)計、開發(fā)和管理高性能數(shù)據(jù)庫集群,使數(shù)據(jù)庫服務(wù)更穩(wěn)定、更高效、更易于管理。
平臺化的開發(fā):
類docker等平臺的開發(fā)管理,及服務(wù)接入技術(shù)
Linux運維工作發(fā)展過程
運維的發(fā)展
Linux運維日常使用軟件和技能
運維工程師使用的運維平臺和工具
- Web服務(wù)器:apache、tomcat、nginx
- 監(jiān)控:prometheus、zabbix、openfalcon、nagios、cacti
- 自動部署:ansible、saltstack、puttet
- 負(fù)載均衡:keepalive、lvs、haproxy、nginx
- 備份工具:rsync、wget
- 問題追查:netstat、top、tcpdump、last
- 容器:docker、k8s、docker-compose、swarm
- 安全:kerberos、selinux、acl、iptables
- 虛擬化:openstack、xen、kvm
運維工程師要掌握的技能
總結(jié)
以上是生活随笔為你收集整理的运维的基本知识点及分类工作的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HTTP协议SSL协议HTTPS协议
- 下一篇: DNS_ARP_DHCP协议