Infiniband网卡安装、使用总结
最近多次安裝、使用infiniband網(wǎng)卡,每次都要到處尋找相關(guān)資料,所以決定做此總結(jié),方便查找。
1. 基礎(chǔ)知識
首先,得了解什么是RDMA,貼幾個資料:
深入淺出全面解析RDMA
RDMA技術(shù)詳解(一):RDMA概述
RDMA技術(shù)詳解(二):RDMA Send Receive操作
然后得了解如何實現(xiàn),這兩個可以有個初步了解:
RDMA編程:事件通知機制
RDMA read and write with IB verbs
編程過程,真正有用的還是官方的手冊:
RDMA Aware Networks Programming User Manual
mellanox官方社區(qū)能找到很多你需要的東西:
https://community.mellanox.com/s/
也下了個中文版,但我感覺英文版看著更好。中文版下載:
百度云: https://pan.baidu.com/s/1BkbinPMy6fwN7J5BPFadDw 提取碼: rm8i
藍奏云:https://wwa.lanzous.com/iXUd6jm7qla 密碼: 4aps
RDMA編程入門可參考的項目:
https://github.com/tarickb/the-geek-in-the-corner
https://github.com/jcxue/RDMA-Tutorial
2. 驅(qū)動安裝
下載驅(qū)動,進入網(wǎng)站選擇相應系統(tǒng)和軟件版本,archive versions這里可以下載舊版本驅(qū)動
http://www.mellanox.com/page/software_overview_ib
ubuntu16.04平臺5.0-2.1.8.0的下載鏈接為:
wget http://content.mellanox.com/ofed/MLNX_OFED-5.0-2.1.8.0/MLNX_OFED_LINUX-5.0-2.1.8.0-ubuntu16.04-x86_64.iso版本5.1之后鏈接細微變化,ubuntu18.04平臺5.1-2.5.8.0的下載鏈接為:
wget https://www.mellanox.com/downloads/ofed/MLNX_OFED-5.1-2.5.8.0/MLNX_OFED_LINUX-5.1-2.5.8.0-ubuntu18.04-x86_64.iso其它平臺和版本的驅(qū)動,可以自己修改。
掛載或解壓,如果下載的iso則掛載,若是tgz就解壓,下面是掛載命令:
sudo mount -o ro,loop MLNX_OFED_LINUX-5.0-2.1.8.0-ubuntu16.04-x86_64.iso /mnt安裝
cd /mnt sudo ./mlnxofedinstall可能會提示你安裝一堆東西,復制,安裝就可以了。
安裝成功截圖:
執(zhí)行以下命令:
sudo /etc/init.d/openibd restart sudo /etc/init.d/opensmd restart查看網(wǎng)卡狀態(tài):
sudo hca_self_test.ofed沒有 failed 就對了。
一些其它查看網(wǎng)卡信息的命令:
ibstat ibstatus ibv_devinfo ibv_devices #查看本主機的infiniband設(shè)備 ibnodes #查看網(wǎng)絡(luò)中的infiniband設(shè)備配置ip
-
ubuntu執(zhí)行:
sudo vim /etc/network/interfaces在文件中添加如下內(nèi)容:
auto enp1s0 iface enp1s0 inet static address 172.16.0.104 netmask 255.255.255.0 broadcast 172.16.0.255enp1s0是網(wǎng)卡名稱,通過ifconfig查看,address是要給infiniband網(wǎng)卡配置的ip地址。
重啟網(wǎng)絡(luò)服務:
sudo service networking restart -
centos執(zhí)行:
sudo vim /etc/sysconfig/network-scripts/ifcfg-ib0添加如下內(nèi)容:
DEVICE=ib0 BOOTPROTO=static IPADDR=172.16.0.104 NETMASK=255.255.255.0 BROADCAST=172.16.0.255 NETWORK=172.16.0.0 ONBOOT=yes重啟網(wǎng)口:
sudo ifdown ib0 sudo ifup ib0
3. 性能測試
服務端運行:
ib_send_bw -a -c UD -d mlx4_0 -i 1注意,參數(shù) -i 指定端口,在一個網(wǎng)卡有多個網(wǎng)口的時候,需要指定測試的端口,具體哪個端口,通過 ibstatus 可以看到。
客戶端運行:
ib_send_bw -a -c UD -d mlx4_0 -i 1 172.16.0.102最后面的ip地址是服務端infiniband網(wǎng)卡的ip地址。
其他測試項
ib_atomic_bw ib_atomic_lat ib_read_bw ib_read_lat ib_send_bw ib_send_lat ib_write_bw ib_write_latbw表示測試帶寬,lat表示測試延遲,參數(shù)同上,可以i通過 --help 查看。
4. 其他問題
更換網(wǎng)卡工作模式:
有些網(wǎng)卡,當你安裝好驅(qū)動后,通過 ibstatus 命令,會出現(xiàn)下面的情況:
可以看到,該網(wǎng)卡現(xiàn)在處于 Ethernet 的工作模式,如果想要切換成infiniband模式,參考如下鏈接:
https://community.mellanox.com/s/article/howto-change-port-type-in-mellanox-connectx-3-adapter
查看當前工作模式:
sudo /sbin/connectx_port_config -s輸入以下命令切換工作模式:
sudo /sbin/connectx_port_config如果提示如圖,說明不支持infiniband模式,否則,就切換成功了,再次使用一下命令可以驗證:
sudo /sbin/connectx_port_config -s不能切換到infiniband工作模式,并不代表不支持RDMA,處于Ethernet模式的網(wǎng)卡使用 RoCE 協(xié)議工作。
RDMA 協(xié)議:底層可以是以太網(wǎng)( RoCE 或者 iWARP )或者 Infiniband
有些網(wǎng)卡只支持Ethernet(RoCE),不支持Infiniband模式,也就是想從Ethernet切換到Infiniband模式時不能成功,這個要提前了解好。我目前了解到的,Connectx-3只支持Ethernet模式。
https://community.mellanox.com/s/question/0D51T00006RVtsz/connectx4-says-it-doesnt-support-linktypep1-configuration
總結(jié)
以上是生活随笔為你收集整理的Infiniband网卡安装、使用总结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Infiniband技术
- 下一篇: 志宇-RocketMQ学习