linux網路編程之socket(一):socket概述和位元組序、地址轉換函式

來源:互聯網
上載者:User

一、什麼是socket

socket可以看成是使用者進程與核心網路通訊協定棧的編程介面。
socket不僅可以用於原生處理序間通訊,還可以用於網路上不同主機的處理序間通訊。


socket API是一層抽象的網路編程介面,適用於各種底層網路通訊協定,如IPv4、IPv6,以及以後要講的UNIX Domain Socket。然而,各種網路通訊協定的地址格式並不相同,如所示:


IPv4和IPv6的地址格式定義在netinet/in.h中,IPv4地址用sockaddr_in結構體表示,包括16位連接埠號碼和32位IP地址,如下所示:


   struct sockaddr_in {
               sa_family_t    sin_family; /* address family: AF_INET */
               in_port_t      sin_port;   /* port in network byte order */
               struct in_addr sin_addr;   /* internet address */

char sin_zero[8]; /* pad bytes,  set to zero is ok */
           };


  /* Internet address. */
           struct in_addr {
               uint32_t       s_addr;     /* address in network byte order */

           };


IPv6地址用sockaddr_in6結構體表示,包括16位連接埠號碼、128位IP地址和一些控制欄位。UNIX Domain Socket的地址格式定義在sys/un.h中,用sockaddr_un結構體表示。各種socket地址結構體的開頭都是相同的,前16位表示整個結構體的長度(並不是所有UNIX的實現都有長度欄位,如Linux就沒有),後16位表示地址類型。IPv4、IPv6和UNIX
Domain Socket的地址類型分別定義為常數AF_INET、AF_INET6、AF_UNIX。這樣,只要取得某種sockaddr結構體的首地址,不需要知道具體是哪種類型的sockaddr結構體,就可以根據地址類型欄位確定結構體中的內容。因此,socket API可以接受各種類型的sockaddr結構體指標做參數,例如bind、accept、connect等函數,這些函數的參數應該設計成void *類型以便接受各種類型的指標,但是sock API的實現早於ANSI C標準化,那時還沒有void *類型,因此這些函數的參數都用struct
sockaddr *類型表示,即通用地址結構,如下所示:

struct sockaddr {
sa_family_t  sin_family;
char sa_data[14];
}; 


sin_family:指定該地址家族
sa_data:由sin_family決定它的形式。


在傳遞參數之前要強制類型轉換一下,例如:

struct sockaddr_in servaddr;

/* initialize servaddr *

/bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));


二、網路位元組序

位元組序
大端位元組序(Big Endian)
最高有效位(MSB:Most Significant Bit)儲存於最低記憶體位址處,最低有效位(LSB:Lowest Significant Bit)儲存於最高記憶體位址處。
小端位元組序(Little Endian)
最高有效位(MSB:Most Significant Bit)儲存於最高記憶體位址處,最低有效位(LSB:Lowest Significant Bit)儲存於最低記憶體位址處。
主機位元組序
不同的主機有不同的位元組序,如x86為小端位元組序,Motorola 6800為大端位元組序,ARM位元組序是可配置的。

網路位元組序
網路位元組序規定為大端位元組序

為使網路程式具有可移植性,使同樣的C代碼在大端和小端電腦上編譯後都能正常運行,可以調用以下庫函數做網路位元組序和主機位元組序的轉換。


#include <arpa/inet.h>

uint32_t htonl(uint32_t hostlong);

uint16_t htons(uint16_t hostshort);

uint32_t ntohl(uint32_t netlong);

uint16_t ntohs(uint16_t netshort);


這些函數名很好記,h表示host,n表示network,l表示32位長整數,s表示16位短整數。例如htonl表示將32位的長整數從主機位元組序轉換為網路位元組序,例如將IP地址轉換後準備發送。如果主機是小端位元組序,這些函數將參數做相應的大小端轉換然後返回,如果主機是大端位元組序,這些函數不做轉換,將參數原封不動地返回。

下面寫個小程式測試下主機的大小端:

 C++ Code 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
/*************************************************************************
    > File Name: byteorder.c
    > Author: Simba
    > Mail: dameng34@163.com
    > Created Time: Fri 01 Mar 2013 04:16:08 PM CST
 ************************************************************************/

#include<stdio.h>
#include<arpa/inet.h>

int main(void)
{
    unsigned int x = 0x12345678;
    unsigned char *p = (unsigned char *)&x;
    printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]);

    unsigned int y = htonl(x);
    p = (unsigned char *)&y;
    printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]);

    return 0;
}

輸出為:

simba@ubuntu:~/Documents/code/linux_programming/UNP/socket$ ./byteorder 
78 56 34 12
12 34 56 78

即本主機是小端位元組序,而經過htonl 轉換後為網路位元組序,即大端。

三、地址轉換函式

前面提到的 sockaddr_in 結構體中的成員struct in_addr sin_addr表示32位的IP地址。但是我們通常用點分十進位的字串表示IP地址,以下函數可以在字串表示和in_addr表示之間轉換。


字串轉in_addr的函數:


#include <arpa/inet.h>

int inet_aton(const char *strptr, struct in_addr *addrptr);

in_addr_t inet_addr(const char *strptr);

int inet_pton(int family, const char *strptr, void *addrptr);

注意,轉換而成的32位元是網路位元組序的。

in_addr轉字串的函數:

char *inet_ntoa(struct in_addr inaddr);

const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);

注意,傳入的32位元也是網路位元組序的。

其中inet_pton和inet_ntop不僅可以轉換IPv4的in_addr,還可以轉換IPv6的in6_addr,因此函數介面是void *addrptr。


下面寫個小程式示範一下:

 C++ Code 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
/*************************************************************************
    > File Name: addr_in.c
    > Author: Simba
    > Mail: dameng34@163.com
    > Created Time: Fri 01 Mar 2013 04:16:08 PM CST
 ************************************************************************/

#include<stdio.h>
#include<arpa/inet.h>

int main(void)
{

    unsigned int  addr = inet_addr("192.168.0.100"); //轉換後是網路位元組序(大端)
    printf("add=%u\n", ntohl(addr));

    struct in_addr ipaddr;
    ipaddr.s_addr = addr;
    printf("%s\n", inet_ntoa(ipaddr));

    return 0;
}

輸出為:

simba@ubuntu:~/Documents/code/linux_programming/UNP/socket$ ./addr_in 
add=3232235620
192.168.0.100

注意,在列印addr的時候先轉換成主機位元組序,否則輸出可能是負數。


四、通訊端類型

流式通訊端(SOCK_STREAM)
提供連線導向的、可靠的Data Transmission Service,資料無差錯,無重複的發送,且按發送順序接收。
資料報式通訊端(SOCK_DGRAM)
提供無串連服務。不提供無錯保證,資料可能丟失或重複,並且接收順序混亂。
原始通訊端(SOCK_RAW)


參考:

《Linux C 編程一站式學習》

《TCP/IP詳解 卷一》

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.