日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

nvidia-smi 命令详解

發(fā)布時(shí)間:2025/3/8 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 nvidia-smi 命令详解 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

nvidia-smi 命令詳解

簡介

nvidia-smi - NVIDIA System Management Interface program

nvidia smi(也稱為NVSMI)為來自 Fermi 和更高體系結(jié)構(gòu)系列的 nvidia Tesla、Quadro、GRID 和 GeForce 設(shè)備提供監(jiān)控和管理功能。GeForce Titan系列設(shè)備支持大多數(shù)功能,為GeForce品牌的其余部分提供的信息非常有限。NVSMI是一種跨平臺工具,支持所有標(biāo)準(zhǔn)NVIDIA驅(qū)動(dòng)程序支持的Linux發(fā)行版,以及從Windows Server 2008 R2開始的64位版本的Windows。

詳細(xì)的信息可以去手冊中查找:man nvidia-smi。

nvidia-smi 命令

直接在命令行輸入 nvidia-smi 命令應(yīng)該是各位煉丹師再熟悉不過的命令了。

注意:建議使用 watch -n 0.5 nvidia-smi 來動(dòng)態(tài)地觀察 GPU 的狀態(tài)。

通過 nvidia-smi 命令,我們會(huì)得到這樣一個(gè)信息豐富的頁面:

Tue Nov 9 13:47:51 2021 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 495.44 Driver Version: 495.44 CUDA Version: 11.5 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 NVIDIA GeForce ... Off | 00000000:17:00.0 Off | N/A | | 62% 78C P2 155W / 170W | 10123MiB / 12051MiB | 100% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 1 NVIDIA GeForce ... Off | 00000000:65:00.0 Off | N/A | |100% 92C P2 136W / 170W | 10121MiB / 12053MiB | 99% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 2 NVIDIA GeForce ... Off | 00000000:B5:00.0 Off | N/A | | 32% 34C P8 12W / 170W | 5MiB / 12053MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 3 NVIDIA GeForce ... Off | 00000000:B6:00.0 Off | N/A | | 30% 37C P8 13W / 170W | 5MiB / 12053MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | 0 N/A N/A 1258 G /usr/lib/xorg/Xorg 6MiB | | 0 N/A N/A 10426 C ...a3/envs/JJ_env/bin/python 10111MiB | | 1 N/A N/A 1258 G /usr/lib/xorg/Xorg 4MiB | | 1 N/A N/A 10427 C ...a3/envs/JJ_env/bin/python 10111MiB | | 2 N/A N/A 1258 G /usr/lib/xorg/Xorg 4MiB | | 3 N/A N/A 1258 G /usr/lib/xorg/Xorg 4MiB | +-----------------------------------------------------------------------------+

其中顯存占用和 GPU 利用率當(dāng)然是我們最常來查看的參數(shù),但是在一些情況下(比如要重點(diǎn)監(jiān)控 GPU 的散熱情況時(shí))其他參數(shù)也很有用,筆者簡單總結(jié)了一下該命令輸出的各個(gè)參數(shù)的含義如下圖:

可以看到其中各個(gè)位置的對應(yīng)含義在輸出本身中其實(shí)都已經(jīng)指出了(藍(lán)框),紅框則指出了輸出各個(gè)部分的含義,大部分輸出的作用一目了然,這里筆者將其中幾個(gè)不那么直觀的參數(shù)簡單整理一下:

  • Fan:從0到100%之間變動(dòng),這個(gè)速度是計(jì)算機(jī)期望的風(fēng)扇轉(zhuǎn)速,實(shí)際情況下如果風(fēng)扇堵轉(zhuǎn),可能打不到顯示的轉(zhuǎn)速。
  • Perf:是性能狀態(tài),從P0到P12,P0表示最大性能,P12表示狀態(tài)最小性能。
  • Persistence-M:是持續(xù)模式的狀態(tài),持續(xù)模式雖然耗能大,但是在新的GPU應(yīng)用啟動(dòng)時(shí),花費(fèi)的時(shí)間更少,這里顯示的是off的狀態(tài)。
  • Disp.A:Display Active,表示GPU的顯示是否初始化。
  • Compute M:是計(jì)算模式。
  • Volatile Uncorr. ECC:是否開啟 ECC 糾錯(cuò)。
  • type:進(jìn)程類型。C 表示計(jì)算進(jìn)程,G 表示圖形進(jìn)程,C+G 表示都有。

nvidia-smi 命令的其他參數(shù)

除了直接運(yùn)行 nvidia-smi 命令之外,還可以加一些參數(shù),來查看一些本機(jī) Nvidia GPU 的其他一些狀態(tài)。下面筆者簡單介紹幾個(gè)常用的參數(shù),其他的有需要可以去手冊中查找:man nvidia-smi。

-L

-L 參數(shù)顯示連接到系統(tǒng)的 GPU 列表。

nvidia-smi -L# 輸出: GPU 0: NVIDIA GeForce RTX 3060 (UUID: GPU-55275dff-****-****-****-6408855fced9) GPU 1: NVIDIA GeForce RTX 3060 (UUID: GPU-0a1e7f37-****-****-****-df9a8bce6d6b) GPU 2: NVIDIA GeForce RTX 3060 (UUID: GPU-38e2771e-****-****-****-d5cbb85c58d8) GPU 3: NVIDIA GeForce RTX 3060 (UUID: GPU-8b45b004-****-****-****-46c05975a9f0)

GPU UUID:此值是GPU的全球唯一不可變字母數(shù)字標(biāo)識符。它與主板上的物理標(biāo)簽無關(guān)。

-i

-i 參數(shù)指定某個(gè) GPU,多用于查看 GPU 信息時(shí)指定其中一個(gè) GPU。

-q

-q 參數(shù)查看 GPU 的全部信息。可通過 -i 參數(shù)指定查看某個(gè) GPU 的參數(shù)。

如:

nvidia-smi -i 0 -q

輸出太長了,筆者這里就不列了,大家可以自己試一下,是很完整的信息。

topo

topo 展示多GPU系統(tǒng)的拓?fù)溥B接信息,通常配合 -m 參數(shù)即 nvidia-smi topo -m,其他參數(shù)可自行查閱。

輸出如下,這里用代碼塊沒法對齊,就直接貼圖了:

這里只介紹了幾個(gè)筆者常用的參數(shù),其他參數(shù)請自行查閱手冊吧。

總結(jié)

以上是生活随笔為你收集整理的nvidia-smi 命令详解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。