ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果
問題描述
#查看nvdia GPU 顯卡狀態 watch -n 10 nvidia-smi
發現顯卡Tesla k40c的溫度已經達到74°,轉速僅僅只有49%。
查看Tesla產品資料,Tesla K40 工作站加速卡規格 ,可知
所以需要調整風扇速度來降溫。
然而官方驅動面板里也沒有了風扇調速的選項
nvidia-settings方法一
sudo su - cd /etc/X11 cp -p xorg.conf xorg.conf.`date +%Y%m%d` sudo gedit xorg.conf
找到”Section Device” 這塊
添加: Option “Coolbits” “4”
保存之后,重啟機器。調節選項出現,如下圖:
這時你會看到在Thermal Settings里面有一個 Enable GPU Fan Settings,可手動調節顯卡溫度。
方法二
有時會出現以下問題
cannot stat /etc/x11/xorg.conf no such file or directory這時需要
sudo nvidia-xconfig sudo nvidia-xconfig --cool-bits=4Using X configuration file: “/etc/X11/xorg.conf”.
Backed up file ‘/etc/X11/xorg.conf’ as ‘/etc/X11/xorg.conf.backup’
New X configuration file written to ‘/etc/X11/xorg.conf’
如若沒有變化,則需要
sudo gedit /etc/X11/xorg.conf添加 Option “Coolbits” “4” 如下
Section "Device" Identifier "Device0" Driver "nvidia" VendorName "NVIDIA Corporation" BoardName "GeForce GTX 570" Option "NoLogo" "True" Option "Coolbits" "4" EndSection然后重啟
nvidia-settings #可查看調節選項或者
nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUTargetFanSpeed=100"這里GPUTargetFanSpeed=100就是風扇的速度, 100就是風扇運行在100%的速度, 也可以改成其它速度. 注意在新的NVIDIA驅動, GPUCurrentFanSpeed 被改成了 GPUTargetFanSpeed. 另外GPUFanControlState=1表示讓用戶可以手動調節GPU風扇速度.
如果你想回到GPU自動控制風扇速度, 運行下面
nvidia-settings -a "[gpu:0]/GPUFanControlState=0"備注:
cannot stat /etc/x11/xorg.conf no such file or directory切記輸入
startx來重新安裝xorg,這樣會帶來更大的麻煩。重啟后再輸入密碼,然后又進入一個登陸界面,輸入密碼,然后又回到原來的登陸界面。。。這樣一直下去,死循環了
解決方法
Alt+Ctrl+F1 #進入控制臺界面 cd ~ #進入你的用戶目錄 ls -ah #查看所有的文件 rm -rf .Xauth* #刪除.Xauthority文件 Alt+Ctrl+F7 #返回到登陸界面 #輸入密碼即可登入startx命令是用來啟動X windows服務器的,運行后在用戶目錄下生成一個.Xauthority文件,正是該文件導致系統進入死循環,刪除即可。
方法三
sudo apt-get install nvclock #change GPU fan speed, write this:nvclock -f -F 70
這樣風扇速度就會維持 fan speed will run at 70%
若無法安裝 nvclock,則需要更新源包
sudo gedit /etc/apt/sources.list添加源包
deb http://us.archive.ubuntu.com/ubuntu trusty main universe更新源包
sudo apt-get update sudo apt-get nvclock設置多顯卡降溫
nvidia-xconfig --enable-all-gpus
其余步驟同單顯卡一致。
備注:
Tesla的顯卡K40開始k系列M系列p 系列都是被動散熱對硬件要求高。所以無法使用上述方法對風扇調速。
Tesla C卡主要用在“臺式機”上的,為了顧慮到一般臺式機可能未考慮“散熱”問題,所以C卡上自帶風扇,讓散熱效果好一些。而M卡是專門為“機架式電腦”設計的,絕大部分機架式電腦是一堆放在機架上的,所以內部有更多的風扇與導流設計,這樣M卡就可以省略風扇,把體積做到更小,提高單位體積的計算密度。
同樣的,M卡為集群而設計,因此本身還提供更多的“監控元件”能與“集群管理”軟件結合,管理人員可透過管理軟件監控每一片M型GPU卡的溫度與狀態,溫度過高也可透過管理軟件發出警告。C卡則缺乏這樣的功能。
每臺GPU系統最佳的GPU數量為2片(多卡架構的最小數量),最多別超過4片。市面上有8片甚至到16片的方案,不僅“散熱”問題、電源供應問題會令人提心吊膽,此外,收到PCI-E總線限制,超過4片以上的方案,都得不到“完整PCI-E帶寬”,所以GPU數量看來好像很多,但都得不到相對的性能提升。因此建議 2~4 片 GPU 的系統,是性價比、穩定性較優的配置。
參考文獻
How can I change the nvidia GPU fan speed?
Ubuntu 12.04 Nvidia 顯卡的風扇調速
Linux Ubuntu下運行startx的后果
ubuntu 執行 startx 后的一些問題
How To Install nvclock On Ubuntu 14.04 LTS
深度學習訓練時GPU溫度過高?幾個命令,為你的GPU迅速降溫
從零開始組裝深度學習平臺(GPU散熱)
NVIDIA/Tips and tricks
NVIDIA (簡體中文)
Adjust Nvidia GPU fan speed (Multiple GPUs, one monitor)
Guide for fan speed control for Nvidia cards in Linux
Tesla C卡跟M卡區別是什么?
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 支付宝绑定信用卡消费有积分吗?要手续费吗
- 下一篇: ubuntu18.04安装pycharm