CentOS 7.6 集群部署 Torque4.2.9 调度系统
前提條件:
節點:
torque安裝與配置
1、master節點torque部署:(master)即為在master節點操作
Step1:將torque-4.2.9安裝包傳到master節點內
Step2:在root用戶下,解壓文件(master節點)
Step3:安裝所需要的依賴(master 節點)
Step4:編譯安裝,其中--with-default-server=master,這個master是你的調度節點主機名,可自行根據自己的配置修改(master節點)
./configure --prefix=/usr/local/torque-4.2.9 --with-scp --with-default-server=master && make && make packages && make installStep5:復制配置文件(master)
cp contrib/init.d/{pbs_{server,sched,mom},trqauthd} /etc/init.d/Step6:啟動
for i in pbs_server pbs_sched pbs_mom trqauthd; do chkconfig --add $i; chkconfig $ion; doneStep7:設置環境變量,其中提示y/n時,輸入y繼續(master)
TORQUE=/usr/local/torque-4.2.9 echo "TORQUE=$TORQUE" >>/etc/profile echo "export PATH=\$PATH:$TORQUE/bin:$TORQUE/sbin" >>/etc/profile source /etc/profile ./torque.setup rootStep8:啟動pbs_server、pbs_sched、pbs_mom、trqauthd幾個服務(master)
qterm -t quick for i in pbs_server pbs_sched pbs_mom trqauthd; do service $i start; done說明:Torque主要是由三個主要部件組成
pbs_server??:服務守護進程,負責接收作業提交,位于服務節點上
pbs_sched??:調度守護進程,負責調度作業,位于服務節點上?
pbs_mom? :守護進程,?負責監控本機并執行作業,位于所有計算節點上
Step9:將所有的節點主機名添加到配置文件,可同時將每個節點的CPU個數添加,2代表核心數,順序、核心數可自行更改(master)
vim /var/spool/torque/server_priv/nodes?Step10:添加控制節點名稱(master)
vim /var/spool/torque/mom_priv/config 添加 pbsserver master logevent 255Step11:啟動torque,查看torque啟動狀態(master)
查看pbs服務啟動狀態
ps -e | grep pbs啟動pbs相關所有服務
for i in pbs_server pbs_sched pbs_mom trqauthd; do service $i restart; done?查看節點狀態,狀態為free即為正常
?至此,master節點部署完畢
2、node節點torque部署:這里僅演示一個節點部署方法,其它節點一樣,本次以node1節點做演示
Step1:在node1節點root目錄中創建torque目錄(node1)
mkdir torqueStep2:將master節點中的torque安裝文件復制到node1節點,確保當前在torque-4.2.9目錄中(master)
scp torque-package-{mom,clients}-linux-x86_64.sh node1:/root/torque scp contrib/init.d/{pbs_mom,trqauthd} node1:/etc/init.d/Step3:node1節點中切換到torque目錄中,執行安裝torque(node1)
./torque-package-clients-linux-x86_64.sh --install ./torque-package-mom-linux-x86_64.sh --installStep4:添加控制節點名稱(node1)
vim /var/spool/torque/mom_priv/config 添加 pbsserver master logevent 255Step5:啟動pbs服務(node1)
for i in pbs_mom trqauthd; do service $i start; doneStep6:重啟master節點pbs服務(master)
qterm -t quick service pbs_mom restart service pbs_server restart qnodes可以看到master節點和node1節點均為free狀態,至此所有部署完成
3、torque多節點調度測試
后續更新
總結
以上是生活随笔為你收集整理的CentOS 7.6 集群部署 Torque4.2.9 调度系统的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: c语言编写五十以内加减法,求用C编个大数
- 下一篇: java信息管理系统总结_java实现科