用户同步管理及集群初始配置-集群搭建步骤7
????????前面的幾個步驟執行完之后,集群就已經創建好了初步的分區,如下所示:
????????STATE為idle證明所有節點上的slurmd服務狀態是正常,但此時用戶還無法利用slurm提交作業,還需要對集群進行初始化配置以及創建用戶,并把用戶同步到所有的計算節點。
1、集群添加account
????????account屬性是slurm用戶在提交作業時需要配置的屬性之一,用于作業記賬使用。集群在初始化時,需添加系統的account,用戶提交作業時的可不指定account屬性,因為系統中有默認的account。
創建集群名字,如果在slurmdbd.conf文件中已經指定了cluster,那么這一步不需要執行,系統會自動創建。
sacctmgr add cluster hgy在集群中添加account屬性:
sacctmgr add account normal Description="Default account"此時normal會作為系統中存在的account屬性之一存在,如果創建用戶時指定了默認的account為normal,那么用戶在提交作業時無需指定account屬性,將會自動以normal的account進行提交。當然也可以為集群添加多個account。
2、用戶同步
? ? ? ?由于集群中存在多個計算節點,那么提交作業時,所有的計算節點都必須存在此用戶賬戶,并且UID需保持一致。因此在創建用戶時需指定用戶的UID,并且把用戶信息同步到所有的計算節點。此處推薦有條件的用戶采用ldap作為用戶認證管理工具,適合集群上的用戶認證機制,此次由于集群較小,沒有使用ldap。
UIDNOW=1300 useradd test -p test -d /public/home/$1 -u ${UIDNOW} -s /bin/bash scp /etc/passwd /etc/shadow /etc/group cn02:/etc/ scp /etc/passwd /etc/shadow /etc/group cn03:/etc/ scp /etc/passwd /etc/shadow /etc/group cn04:/etc/ scp /etc/passwd /etc/shadow /etc/group cn05:/etc//etc/passwd: 存儲用戶UID等相關信息的文件。
/etc/shadow: 存儲用戶密碼信息的文件
/etc/group: 存儲用戶組信息的文件。
把這三個文件同步到其他節點之后,就可以保證所有節點的用戶是一致的。
3、添加linux系統用戶到slurm中
? ? ? ? 雖然系統中存在了test用戶,但是slurm自己本身并無法識別test用戶,因此必須在slurm中添加test用戶:????????
sacctmgr -i add user test DefaultAccount=normal注意必須指定:DefaultAccount屬性,同時在管理節點的slurm.conf配置文件中需開啟如下配置:
AccountingStorageEnforce=associations用戶此時便可利用默認的account或者指定其他的account進行提交作業。
4、提交作業
? ? ? ? 不指定-A 參數,則以默認的normal屬性提交
srun -n 10 hostname? ? ? ? 指定-A參數,則以其他的記賬屬性提交
srun -A otheraccount -n 10 hostname? ? ? ? 其他常用命令請參考slurm官方網站。
總結
以上是生活随笔為你收集整理的用户同步管理及集群初始配置-集群搭建步骤7的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1-13 格式化输出
- 下一篇: 【原创】新韭菜日记58--2019061