ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果
問題描述
#查看nvdia GPU 顯卡狀態(tài) watch -n 10 nvidia-smi
發(fā)現(xiàn)顯卡Tesla k40c的溫度已經(jīng)達(dá)到74°,轉(zhuǎn)速僅僅只有49%。
查看Tesla產(chǎn)品資料,Tesla K40 工作站加速卡規(guī)格 ,可知
所以需要調(diào)整風(fēng)扇速度來降溫。
然而官方驅(qū)動(dòng)面板里也沒有了風(fēng)扇調(diào)速的選項(xiàng)
nvidia-settings方法一
sudo su - cd /etc/X11 cp -p xorg.conf xorg.conf.`date +%Y%m%d` sudo gedit xorg.conf
找到”Section Device” 這塊
添加: Option “Coolbits” “4”
保存之后,重啟機(jī)器。調(diào)節(jié)選項(xiàng)出現(xiàn),如下圖:
這時(shí)你會(huì)看到在Thermal Settings里面有一個(gè) Enable GPU Fan Settings,可手動(dòng)調(diào)節(jié)顯卡溫度。
方法二
有時(shí)會(huì)出現(xiàn)以下問題
cannot stat /etc/x11/xorg.conf no such file or directory這時(shí)需要
sudo nvidia-xconfig sudo nvidia-xconfig --cool-bits=4Using X configuration file: “/etc/X11/xorg.conf”.
Backed up file ‘/etc/X11/xorg.conf’ as ‘/etc/X11/xorg.conf.backup’
New X configuration file written to ‘/etc/X11/xorg.conf’
如若沒有變化,則需要
sudo gedit /etc/X11/xorg.conf添加 Option “Coolbits” “4” 如下
Section "Device" Identifier "Device0" Driver "nvidia" VendorName "NVIDIA Corporation" BoardName "GeForce GTX 570" Option "NoLogo" "True" Option "Coolbits" "4" EndSection然后重啟
nvidia-settings #可查看調(diào)節(jié)選項(xiàng)或者
nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUTargetFanSpeed=100"這里GPUTargetFanSpeed=100就是風(fēng)扇的速度, 100就是風(fēng)扇運(yùn)行在100%的速度, 也可以改成其它速度. 注意在新的NVIDIA驅(qū)動(dòng), GPUCurrentFanSpeed 被改成了 GPUTargetFanSpeed. 另外GPUFanControlState=1表示讓用戶可以手動(dòng)調(diào)節(jié)GPU風(fēng)扇速度.
如果你想回到GPU自動(dòng)控制風(fēng)扇速度, 運(yùn)行下面
nvidia-settings -a "[gpu:0]/GPUFanControlState=0"備注:
cannot stat /etc/x11/xorg.conf no such file or directory切記輸入
startx來重新安裝xorg,這樣會(huì)帶來更大的麻煩。重啟后再輸入密碼,然后又進(jìn)入一個(gè)登陸界面,輸入密碼,然后又回到原來的登陸界面。。。這樣一直下去,死循環(huán)了
解決方法
Alt+Ctrl+F1 #進(jìn)入控制臺(tái)界面 cd ~ #進(jìn)入你的用戶目錄 ls -ah #查看所有的文件 rm -rf .Xauth* #刪除.Xauthority文件 Alt+Ctrl+F7 #返回到登陸界面 #輸入密碼即可登入startx命令是用來啟動(dòng)X windows服務(wù)器的,運(yùn)行后在用戶目錄下生成一個(gè).Xauthority文件,正是該文件導(dǎo)致系統(tǒng)進(jìn)入死循環(huán),刪除即可。
方法三
sudo apt-get install nvclock #change GPU fan speed, write this:nvclock -f -F 70
這樣風(fēng)扇速度就會(huì)維持 fan speed will run at 70%
若無法安裝 nvclock,則需要更新源包
sudo gedit /etc/apt/sources.list添加源包
deb http://us.archive.ubuntu.com/ubuntu trusty main universe更新源包
sudo apt-get update sudo apt-get nvclock設(shè)置多顯卡降溫
nvidia-xconfig --enable-all-gpus
其余步驟同單顯卡一致。
備注:
Tesla的顯卡K40開始k系列M系列p 系列都是被動(dòng)散熱對(duì)硬件要求高。所以無法使用上述方法對(duì)風(fēng)扇調(diào)速。
Tesla C卡主要用在“臺(tái)式機(jī)”上的,為了顧慮到一般臺(tái)式機(jī)可能未考慮“散熱”問題,所以C卡上自帶風(fēng)扇,讓散熱效果好一些。而M卡是專門為“機(jī)架式電腦”設(shè)計(jì)的,絕大部分機(jī)架式電腦是一堆放在機(jī)架上的,所以內(nèi)部有更多的風(fēng)扇與導(dǎo)流設(shè)計(jì),這樣M卡就可以省略風(fēng)扇,把體積做到更小,提高單位體積的計(jì)算密度。
同樣的,M卡為集群而設(shè)計(jì),因此本身還提供更多的“監(jiān)控元件”能與“集群管理”軟件結(jié)合,管理人員可透過管理軟件監(jiān)控每一片M型GPU卡的溫度與狀態(tài),溫度過高也可透過管理軟件發(fā)出警告。C卡則缺乏這樣的功能。
每臺(tái)GPU系統(tǒng)最佳的GPU數(shù)量為2片(多卡架構(gòu)的最小數(shù)量),最多別超過4片。市面上有8片甚至到16片的方案,不僅“散熱”問題、電源供應(yīng)問題會(huì)令人提心吊膽,此外,收到PCI-E總線限制,超過4片以上的方案,都得不到“完整PCI-E帶寬”,所以GPU數(shù)量看來好像很多,但都得不到相對(duì)的性能提升。因此建議 2~4 片 GPU 的系統(tǒng),是性價(jià)比、穩(wěn)定性較優(yōu)的配置。
參考文獻(xiàn)
How can I change the nvidia GPU fan speed?
Ubuntu 12.04 Nvidia 顯卡的風(fēng)扇調(diào)速
Linux Ubuntu下運(yùn)行startx的后果
ubuntu 執(zhí)行 startx 后的一些問題
How To Install nvclock On Ubuntu 14.04 LTS
深度學(xué)習(xí)訓(xùn)練時(shí)GPU溫度過高?幾個(gè)命令,為你的GPU迅速降溫
從零開始組裝深度學(xué)習(xí)平臺(tái)(GPU散熱)
NVIDIA/Tips and tricks
NVIDIA (簡(jiǎn)體中文)
Adjust Nvidia GPU fan speed (Multiple GPUs, one monitor)
Guide for fan speed control for Nvidia cards in Linux
Tesla C卡跟M卡區(qū)別是什么?
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 支付宝绑定信用卡消费有积分吗?要手续费吗
- 下一篇: ubuntu16.04 制作gif