Socket:UDP协议小白
UDP(user datagram protocol)用戶數據報協議,屬于傳輸層。
首先要搞清楚網絡通信的幾個層次:
OSI 是 Open System Interconnection 的縮寫,譯為“開放式系統互聯”。
OSI 模型把網絡通信的工作分為 7 層,從下到上分別是物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。
OSI 只是存在于概念和理論上的一種模型,它的缺點是分層太多,增加了網絡工作的復雜性,所以沒有大規模應用。后來人們對 OSI 進行了簡化,合并了一些層,最終只保留了 4 層,從下到上分別是接口層、網絡層、傳輸層和應用層,這就是大名鼎鼎的 TCP/IP 模型。
我們平常使用的程序(或者說軟件)一般都是通過應用層來訪問網絡的,程序產生的數據會一層一層地往下傳輸,直到最后的網絡接口層,就通過網線發送到互聯網上去了。數據每往下走一層,就會被這一層的協議增加一層包裝,等到發送到互聯網上時,已經比原始數據多了四層包裝。整個數據封裝的過程就像俄羅斯套娃。
當另一臺計算機接收到數據包時,會從網絡接口層再一層一層往上傳輸,每傳輸一層就拆開一層包裝,直到最后的應用層,就得到了最原始的數據,這才是程序要使用的數據。
給數據加包裝的過程,實際上就是在數據的頭部增加一個標志(一個數據塊),表示數據經過了這一層,我已經處理過了。給數據拆包裝的過程正好相反,就是去掉數據頭部的標志,讓它逐漸現出原形。
我們所說的 socket 編程,是站在傳輸層的基礎上,所以可以使用 TCP/UDP 協議,但是不能干「訪問網頁」這樣的事情,因為訪問網頁所需要的 http 協議位于應用層。
兩臺計算機進行通信時,必須遵守以下原則:
- 必須是同一層次進行通信,比如,A 計算機的應用層和 B 計算機的傳輸層就不能通信,因為它們不在一個層次,數據的拆包會遇到問題。
- 每一層的功能都必須相同,也就是擁有完全相同的網絡模型。如果網絡模型都不同,那不就亂套了,誰都不認識誰。
- 數據只能逐層傳輸,不能躍層。
- 每一層可以使用下層提供的服務,并向上層提供服務。
TCP/IP 模型包含了 TCP、IP、UDP、Telnet、FTP、SMTP 等上百個互為關聯的協議,其中 TCP 和 IP 是最常用的兩種底層協議,所以把它們統稱為“TCP/IP 協議族”。
也就是說,“TCP/IP模型”中所涉及到的協議稱為“TCP/IP協議族”。
個人學習的socket 編程是基于 TCP 和 UDP 協議的,它們的層級關系如下圖所示:
UDP是面向非連接的協議,它不與對方建立連接,而是直接把數據報發給對方。UDP無需建立類如三次握手的連接,使得通信效率很高。因此UDP適用于一次傳輸數據量很少、對可靠性要求不高的或對實時性要求高的應用場景。
服務端:
(1)使用函數socket(),生成套接字文件描述符;
(2)通過struct?sockaddr_in 結構設置服務器地址和監聽端口;
(3)使用bind() 函數綁定監聽端口,將套接字文件描述符和地址類型變量(struct?sockaddr_in?)進行綁定;
(4)接收客戶端的數據,使用recvfrom() 函數接收客戶端的網絡數據;
(5)向客戶端發送數據,使用sendto() 函數向服務器主機發送數據;
(6)關閉套接字,使用close() 函數釋放資源;
客戶端:
(1)使用socket(),生成套接字文件描述符;
(2)通過struct?sockaddr_in 結構設置服務器地址和監聽端口;
(3)向服務器發送數據,sendto() ;
(4)接收服務器的數據,recvfrom() ;
(5)關閉套接字,close() ;
(1)socket()函數解讀:生成套接字文件描述符
socket() 函數用來創建套接字,確定套接字的各種屬性,然后服務器端要用 bind() 函數將套接字與特定的 IP 地址和端口綁定起來,只有這樣,流經該 IP 地址和端口的數據才能交給套接字處理。類似地,客戶端也要用 connect() 函數建立連接。
int socket(int af, int type, int protocol);//Linux下//在 Linux 下使用 <sys/socket.h> 頭文件中 socket() 函數來創建套接字
SOCKET socket(int af, int type, int protocol);//windows下
//兩者除了返回值類型不同,其他都是相同的。Windows 不把套接字作為普通文件對待,而是返回 SOCKET 類型的句柄。請看下面的例子:
SOCKET sock = socket(AF_INET, SOCK_STREAM, 0); //創建TCP套接字
1) af 為地址族(Address Family),也就是 IP 地址類型,常用的有 AF_INET 和 AF_INET6。AF 是“Address Family”的簡寫,INET是“Inetnet”的簡寫。AF_INET 表示 IPv4 地址,例如 127.0.0.1;AF_INET6 表示 IPv6 地址,例如?1030::C9B4:FF12:48AA:1A2B。
2) type 為數據傳輸方式/套接字類型,常用的有 SOCK_STREAM(流格式套接字/面向連接的套接字)?和?SOCK_DGRAM(數據報套接字/無連接的套接字)
3) protocol 表示傳輸協議,常用的有?IPPROTO_TCP 和 IPPTOTO_UDP,分別表示 TCP 傳輸協議和 UDP 傳輸協議。
有了地址類型和數據傳輸方式,還不足以決定采用哪種協議嗎?為什么還需要第三個參數呢?(因為有時TCP和UDP同時滿足兩種情況,這時候就不知道用哪種了。)
正如大家所想,一般情況下有了 af 和 type 兩個參數就可以創建套接字了,操作系統會自動推演出協議類型,除非遇到這樣的情況:有兩種不同的協議支持同一種地址類型和數據傳輸類型。如果我們不指明使用哪種協議,操作系統是沒辦法自動推演的。
本教程使用 IPv4 地址,參數 af 的值為 PF_INET。如果使用 SOCK_STREAM 傳輸數據,那么滿足這兩個條件的協議只有 TCP,因此可以這樣來調用 socket() 函數:
int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP); //IPPROTO_TCP表示TCP協議
這種套接字稱為 TCP 套接字。
如果使用 SOCK_DGRAM 傳輸方式,那么滿足這兩個條件的協議只有 UDP,因此可以這樣來調用 socket() 函數:
int udp_socket = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP); //IPPROTO_UDP表示UDP協議
這種套接字稱為 UDP 套接字。
上面兩種情況都只有一種協議滿足條件,可以將 protocol 的值設為 0,系統會自動推演出應該使用什么協議,如下所示:
int tcp_socket = socket(AF_INET, SOCK_STREAM, 0); //創建TCP套接字 int udp_socket = socket(AF_INET, SOCK_DGRAM, 0); //創建UDP套接字
大家需要記住127.0.0.1,它是一個特殊IP地址,表示本機地址,后面的教程會經常用到。
你也可以使用 PF 前綴,PF 是“Protocol Family”的簡寫,它和 AF 是一樣的。例如,PF_INET 等價于 AF_INET,PF_INET6 等價于 AF_INET6。
(2)struct?sockaddr_in 結構體解讀:設置服務器地址和監聽端口
上述提到的sockaddr_in是什么?還有一個是sockaddr ?這倆個分別是什么有什么區別
struct sockaddr?和?struct sockaddr_in?這兩個結構體用來處理網絡通信的地址。
下圖是 sockaddr 與 sockaddr_in 的對比(括號中的數字表示所占用的字節數):
sockaddr_in 結構體,sockaddr在頭文件#include <sys/socket.h>中定義,sockaddr的缺陷是:sa_data把目標地址和端口信息混在一起了:
struct sockaddr{sa_family_t sin_family; //地址族(Address Family),也就是地址類型char sa_data[14]; //IP地址和端口號
};
sockaddr_in在頭文件#include<netinet/in.h>或#include <arpa/inet.h>中定義,該結構體解決了sockaddr的缺陷,把port和addr 分開儲存在兩個變量中,如下:?
struct sockaddr_in{sa_family_t sin_family; //地址族(Address Family),也就是地址類型uint16_t sin_port; //16位的端口號struct in_addr sin_addr; //32位IP地址char sin_zero[8]; //不使用,一般用0填充
};
1) sin_family 和 socket() 的第一個參數的含義相同,取值也要保持一致。
地址族(Address Family),也就是 IP 地址類型,常用的有 AF_INET 和 AF_INET6。AF 是“Address Family”的簡寫,INET是“Inetnet”的簡寫。AF_INET 表示 IPv4 地址,例如 127.0.0.1;AF_INET6 表示 IPv6 地址,例如?1030::C9B4:FF12:48AA:1A2B。
2) sin_prot 為端口號。uint16_t 的長度為兩個字節,理論上端口號的取值范圍為 0~65536,但 0~1023 的端口一般由系統分配給特定的服務程序,例如 Web 服務的端口號為 80,FTP 服務的端口號為 21,所以我們的程序要盡量在 1024~65536 之間分配端口號。
端口號需要用 htons() 函數轉換,為什么呢?
3) sin_addr 是 struct in_addr 結構體類型的變量,下面會詳細講解。
4) sin_zero[8] 是多余的8個字節,沒有用,一般使用 memset() 函數填充為 0。上面的代碼中,先用 memset() 將結構體的全部字節填充為 0,再給前3個成員賦值,剩下的 sin_zero 自然就是 0 了。
該結構體中提到的另外一個結構體in_addr 結構體,該結構體只包含一個成員,如下所示:
struct in_addr{in_addr_t s_addr; //32位的IP地址
};
in_addr_t 在頭文件 <netinet/in.h> 中定義,等價于 unsigned long,長度為4個字節。也就是說,s_addr 是一個整數,而IP地址是一個字符串,所以需要?inet_addr() 函數進行轉換,例如:
unsigned long ip = inet_addr("127.0.0.1");
printf("%ld\n", ip);
運行結果:
13278343
至于為什么要搞的這么復雜?
為什么要搞這么復雜,結構體中嵌套結構體,而不用 sockaddr_in 的一個成員變量來指明IP地址呢?socket() 函數的第一個參數已經指明了地址類型,為什么在 sockaddr_in 結構體中還要再說明一次呢,這不是啰嗦嗎?
這些繁瑣的細節確實給初學者帶來了一定的障礙,我想,這或許是歷史原因吧,后面的接口總要兼容前面的代碼。各位讀者一定要有耐心,暫時不理解沒有關系,根據教程中的代碼“照貓畫虎”即可,時間久了自然會接受。
總結:
- 二者長度一樣,都是16個字節,即占用的內存大小是一致的,因此可以互相轉化。二者是并列結構,指向sockaddr_in結構的指針也可以指向sockaddr。
- sockaddr常用于bind、connect、recvfrom、sendto等函數的參數(為社么呢??),指明地址信息,是一種通用的套接字地址。?
bind() 第二個參數的類型為 sockaddr,而代碼中卻使用 sockaddr_in,然后再強制轉換為 sockaddr,這是為什么呢?
因為sockaddr 和 sockaddr_in 的長度相同,都是16字節,只是將IP地址和端口號合并到一起,用一個成員 sa_data 表示。要想給 sa_data 賦值,必須同時指明IP地址和端口號,例如”127.0.0.1:80“,遺憾的是,沒有相關函數將這個字符串轉換成需要的形式,也就很難給 sockaddr 類型的變量賦值,所以使用 sockaddr_in 來代替。這兩個結構體的長度相同,強制轉換類型時不會丟失字節,也沒有多余的字節。
- sockaddr_in 是internet環境下套接字的地址形式。所以在網絡編程中我們會對sockaddr_in結構體進行操作,使用sockaddr_in來建立所需的信息,最后使用類型轉化就可以了。一般先把sockaddr_in變量賦值后,強制類型轉換后傳入用sockaddr做參數的函數:sockaddr_in用于socket定義和賦值;sockaddr用于函數參數。
可以認為,sockaddr 是一種通用的結構體,可以用來保存多種類型的IP地址和端口號,而 sockaddr_in 是專門用來保存 IPv4 地址的結構體。另外還有 sockaddr_in6,用來保存 IPv6 地址,它的定義如下:
struct sockaddr_in6 { sa_family_t sin6_family; //(2)地址類型,取值為AF_INET6in_port_t sin6_port; //(2)16位端口號uint32_t sin6_flowinfo; //(4)IPv6流信息struct in6_addr sin6_addr; //(4)具體的IPv6地址uint32_t sin6_scope_id; //(4)接口范圍ID
};
正是由于通用結構體 sockaddr 使用不便,才針對不同的地址類型定義了不同的結構體。
?
擴展:
兩個函數 htons() 和 inet_addr()。
htons()作用是將端口號由主機字節序轉換為網絡字節序的整數值。(host to net)
inet_addr()作用是將一個IP字符串轉化為一個網絡字節序的整數值,用于sockaddr_in.sin_addr.s_addr。
inet_ntoa()作用是將一個sin_addr結構體輸出成IP字符串(network to ascii)。比如:
printf("%s",inet_ntoa(mysock.sin_addr));
htonl()作用和htons()一樣,不過它針對的是32位的(long),而htons()針對的是兩個字節,16位的(short)。
與htonl()和htons()作用相反的兩個函數是:ntohl()和ntohs()。?
? ?
(3)bind()函數解讀:綁定監聽端口,將套接字文件描述符和地址類型變量(struct?sockaddr_in?)進行綁定
int bind(int sock, struct sockaddr *addr, socklen_t addrlen); //Linux
int bind(SOCKET sock, const struct sockaddr *addr, int addrlen); //Windows
下面的代碼,將創建的套接字與IP地址 127.0.0.1、端口 1234 綁定:
//創建套接字
int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);//創建sockaddr_in結構體變量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr)); //每個字節都用0填充
serv_addr.sin_family = AF_INET; //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具體的IP地址
serv_addr.sin_port = htons(1234); //端口//將套接字和IP、端口綁定
bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));
sock 為 socket 文件描述符,addr 為 sockaddr 結構體變量的指針,addrlen 為 addr 變量的大小,可由 sizeof() 計算得出。
(4)recvfrom() 函數解讀:服務器端接收客戶端的網絡數據
int recvfrom(int s, void *buf, int len, unsigned int flags,struct sockaddr *from, int *fromlen);
返回值說明:
成功則返回實際接收到的字符數,失敗返回-1,錯誤原因會存于errno 中。
參數說明:
s:? ? ? ? ??socket描述符;
buf:? ? ? ?UDP數據報緩存區(包含所接收的數據);?
len:? ? ? ?緩沖區長度。?
flags:? ? 調用操作方式(一般設置為0)。?
from:? ? ?指向發送數據的客戶端地址信息的結構體(sockaddr_in需類型轉換);
fromlen:指針,指向from結構體長度值。
(5)sendto() 函數解讀:向客戶端/服務器主機發送數據
int sendto(int s, const void *buf, int len, unsigned int flags, const struct sockaddr *to, int tolen);
返回值說明:
成功則返回實際傳送出去的字符數,失敗返回-1,錯誤原因會存于errno 中。
參數說明:
s:? ? ? socket描述符;
buf:? UDP數據報緩存區(包含待發送數據);
len:? ?UDP數據報的長度;
flags:調用方式標志位(一般設置為0);
to: 指向接收數據的主機地址信息的結構體(sockaddr_in需類型轉換);
tolen:to所指結構體的長度;
示例:
(1)服務器端
//服務器端
#include <unistd.h>
#include <string.h>
#include <stdio.h>
#include <iostream>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/types.h>
#include <arpa/inet.h>#define MAXLINE 4096
#define UDPPORT 8001
#define SERVERIP "192.168.255.129"using namespace std;int main(){int serverfd;unsigned int server_addr_length, client_addr_length;char recvline[MAXLINE];char sendline[MAXLINE];struct sockaddr_in serveraddr , clientaddr;// 使用函數socket(),生成套接字文件描述符;if( (serverfd = socket(AF_INET, SOCK_DGRAM, 0)) < 0 ){perror("socket() error");exit(1);}// 通過struct sockaddr_in 結構設置服務器地址和監聽端口;bzero(&serveraddr,sizeof(serveraddr));serveraddr.sin_family = AF_INET;serveraddr.sin_addr.s_addr = htonl(INADDR_ANY);serveraddr.sin_port = htons(UDPPORT);server_addr_length = sizeof(serveraddr);// 使用bind() 函數綁定監聽端口,將套接字文件描述符和地址類型變量(struct sockaddr_in )進行綁定;if( bind(serverfd, (struct sockaddr *) &serveraddr, server_addr_length) < 0){perror("bind() error");exit(1);}// 接收客戶端的數據,使用recvfrom() 函數接收客戶端的網絡數據;client_addr_length = sizeof(sockaddr_in);int recv_length = 0;recv_length = recvfrom(serverfd, recvline, sizeof(recvline), 0, (struct sockaddr *) &clientaddr, &client_addr_length);cout << "recv_length = "<< recv_length <<endl;cout << recvline << endl;// 向客戶端發送數據,使用sendto() 函數向服務器主機發送數據;int send_length = 0;sprintf(sendline, "hello client !");send_length = sendto(serverfd, sendline, sizeof(sendline), 0, (struct sockaddr *) &clientaddr, client_addr_length);if( send_length < 0){perror("sendto() error");exit(1);}cout << "send_length = "<< send_length <<endl;//關閉套接字,使用close() 函數釋放資源;close(serverfd);return 0;
}
(2)客戶端
//客戶端
#include <unistd.h>
#include <string.h>
#include <stdio.h>
#include <iostream>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/types.h>
#include <arpa/inet.h>#define MAXLINE 4096
#define UDPPORT 8001
#define SERVERIP "192.168.255.129"using namespace std;int main(){int confd;unsigned int addr_length;char recvline[MAXLINE];char sendline[MAXLINE];struct sockaddr_in serveraddr;// 使用socket(),生成套接字文件描述符;if( (confd = socket(AF_INET, SOCK_DGRAM, 0)) < 0 ){perror("socket() error");exit(1);}//通過struct sockaddr_in 結構設置服務器地址和監聽端口;bzero(&serveraddr, sizeof(serveraddr));serveraddr.sin_family = AF_INET;serveraddr.sin_addr.s_addr = inet_addr(SERVERIP);serveraddr.sin_port = htons(UDPPORT);addr_length = sizeof(serveraddr);// 向服務器發送數據,sendto() ;int send_length = 0;sprintf(sendline,"hello server!");send_length = sendto(confd, sendline, sizeof(sendline), 0, (struct sockaddr *) &serveraddr, addr_length);if(send_length < 0 ){perror("sendto() error");exit(1);}cout << "send_length = " << send_length << endl;// 接收服務器的數據,recvfrom() ;int recv_length = 0;recv_length = recvfrom(confd, recvline, sizeof(recvline), 0, (struct sockaddr *) &serveraddr, &addr_length);cout << "recv_length = " << recv_length <<endl;cout << recvline << endl;// 關閉套接字,close() ;close(confd);return 0;
}
參考:https://blog.csdn.net/qingzhuyuxian/article/details/79736821
?
總結
以上是生活随笔為你收集整理的Socket:UDP协议小白的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 随笔:送给初次使用PCL库的小伙伴
- 下一篇: C++:多线程中的小白(1)基础概念