1. 程式人生 > >C++中Socket程式設計入門

C++中Socket程式設計入門

C++中Socket程式設計入門

轉載 :http://www.cnblogs.com/L-hq815/archive/2012/07/09/2583043.html
該作者也是轉載,為國外網站翻譯之作
本人在學習Socket程式設計時,在其他地方看到了不錯Socket入門文件,通俗易懂,特此轉載;
注:文中套接字即指socket

目錄

介紹

Socket程式設計讓你沮喪嗎?從man pages中很難得到有用的資訊嗎?你想跟上時代去編Internet相關的程式,但是為你在呼叫 connect() 前的bind() 的結構而不知所措?等等…

好在我已經將這些事完成了,我將和所有人共享我的知識了。如果你瞭解 C 語言並想穿過網路程式設計的沼澤,那麼你來對地方了。

讀者物件

這個文件是一個指南,而不是參考書。如果你剛開始 socket 程式設計並想找一本入門書,那麼你是我的讀者。但這不是一本完全的 socket 程式設計書。

平臺和編譯器

這篇文件中的大多數程式碼都在 Linux 平臺PC 上用 GNU 的 gcc 成功編譯過。而且它們在 HPUX平臺 上用 gcc 也成功編譯過。但是注意,並不是每個程式碼片段都獨立測試過。

正文

1.什麼是套接字?

你經常聽到人們談論著 “socket”,或許你還不知道它的確切含義。現在讓我告訴你:它是使用標準Unix 檔案描述符 (file descriptor) 和其它程式通訊的方式。 什麼? 你也許聽到一些Unix高手(hacker)這樣說過:“呀,Unix中的一切就是檔案!”那個傢伙也許正在說到一個事實:Unix 程式在執行任何形式的 I/O 的時候,程式是在讀或者寫一個檔案描述符。一個檔案描述符只是一個和開啟的檔案相關聯的整數。但是(注意後面的話),這個檔案可能是一個網路連線,FIFO,管道,終端,磁碟上的檔案或者什麼其它的東西。Unix 中所有的東西就是檔案!所以,你想和Internet上別的程式通訊的時候,你將要使用到檔案描述符。你必須理解剛才的話。現在你腦海中或許冒出這樣的念頭:“那麼我從哪裡得到網路通訊的檔案描述符呢?”,這個問題無論如何我都要回答:你利用系統呼叫 socket(),它返回套接字描述符 (socket descriptor),然後你再通過它來進行send()recv()呼叫。

“但是…”,你可能有很大的疑惑,“如果它是個檔案描述符,那麼為什 麼不用一般呼叫read()write()來進行套接字通訊?”簡單的答案是:“你可以使用!”。詳細的答案是:“你可以,但是使用send()recv()讓你更好的控制資料傳輸。”

存在這樣一個情況:在我們的世界上,有很多種套接字。有DARPA Internet 地址 (Internet 套接字),本地節點的路徑名 (Unix套接字),CCITT X.25地址 (你可以將X.25 套接字完全忽略)。也許在你的Unix 機器上還有其它的。我們在這裡只講第一種:Internet 套接字。

2.Internet 套接字的兩種型別

什麼意思?有兩種型別的Internet 套接字?是的。不,我在撒謊。其實還有很多,但是我可不想嚇著你。我們這裡只講兩種。除了這些, 我打算另外介紹的 “Raw Sockets” 也是非常強大的,很值得查閱。
那麼這兩種型別是什麼呢?一種是”Stream Sockets”(流格式),另外一種是”Datagram Sockets”(資料包格式)。我們以後談到它們的時候也會用到 “SOCK_STREAM” 和 “SOCK_DGRAM”。資料報套接字有時也叫“無連線套接字”(如果你確實要連線的時候可以用connect()。) 流式套接字是可靠的雙向通訊的資料流。如果你向套接字按順序輸出“1,2”,那麼它們將按順序“1,2”到達另一邊。它們是無錯誤的傳遞的,有自己的錯誤控制,在此不討論。

有什麼在使用流式套接字?你可能聽說過 telnet,不是嗎?它就使用流式套接字。你需要你所輸入的字元按順序到達,不是嗎?同樣,WWW瀏覽器使用的 HTTP 協議也使用它們來下載頁面。實際上,當你通過埠80 telnet 到一個 WWW 站點,然後輸入 “GET pagename” 的時候,你也可以得到 HTML 的內容。為什麼流式套接字可以達到高質量的資料傳輸?這是因為它使用了“傳輸控制協議 (The Transmission Control Protocol)”,也叫 “TCP” (請參考 RFC-793 獲得詳細資料。)TCP 控制你的資料按順序到達並且沒有錯誤。你也許聽到 “TCP” 是因為聽到過 “TCP/IP”。這裡的 IP 是指“Internet 協議”(請參考 RFC-791。) IP只是處理 Internet 路由而已。

那麼資料報套接字呢?為什麼它叫無連線呢?為什麼它是不可靠的呢?有這樣的一些事實:如果你傳送一個數據報,它可能會到達,它可能次序顛倒了。如果它到達,那麼在這個包的內部是無錯誤的。資料報也使用 IP 作路由,但是它不使用 TCP。它使用“使用者資料報協議 (User Datagram Protocol)”,也叫 “UDP” (請參考 RFC-768。)

為什麼它們是無連線的呢?主要是因為它並不象流式套接字那樣維持一個連線。你只要建立一個包,構造一個有目標資訊的IP 頭,然後發出去。無需連線。它們通常使用於傳輸包-包資訊。簡單的應用程式有:tftp, bootp等等。

你也許會想:“假如資料丟失了這些程式如何正常工作?”我的朋友,每個程式在 UDP 上有自己的協議。例如,tftp 協議每發出的一個被接受到包,收到者必須發回一個包來說“我收到了!” (一個“命令正確應答”也叫“ACK” 包)。如果在一定時間內(例如5秒),傳送方沒有收到應答,它將重新發送,直到得到 ACK。這一ACK過程在實現 SOCK_DGRAM 應用程式的時候非常重要。

3.網路理論

既然我剛才提到了協議層,那麼現在是討論網路究竟如何工作和一些 關於 SOCK_DGRAM 包是如何建立的例子。當然,你也可以跳過這一段, 如果你認為已經熟悉的話。

現在是學習資料封裝 (Data Encapsulation) 的時候了!它非常非常重要。它重要性重要到你在網路課程學習中無論如何也得也得掌握它。主要 的內容是:一個包,先是被第一個協議(在這裡是TFTP )在它的報頭(也許 是報尾)包裝(“封裝”),然後,整個資料(包括 TFTP 頭)被另外一個協議 (在這裡是 UDP )封裝,然後下一個( IP ),一直重複下去,直到硬體(物理) 層( 這裡是乙太網 )。
當另外一臺機器接收到包,硬體先剝去乙太網頭,核心剝去IP和UDP 頭,TFTP程式再剝去TFTP頭,最後得到資料。

現在我們終於講到聲名狼藉的網路分層模型 (Layered Network Model)。這種網路模型在描述網路系統上相對其它模型有很多優點。例如, 你可以寫一個套接字程式而不用關心資料的物理傳輸(序列口,乙太網,連 接單元介面 (AUI) 還是其它介質),因為底層的程式會為你處理它們。實際 的網路硬體和拓撲對於程式設計師來說是透明的。

不說其它廢話了,我現在列出整個層次模型。如果你要參加網路考試, 可一定要記住:

應用層 (Application)

表示層 (Presentation)

會話層 (Session)

傳輸層(Transport)

網路層(Network)

資料鏈路層(Data Link)

物理層(Physical)

物理層是硬體(串列埠,乙太網等等)。應用層是和硬體層相隔最遠的–它 是使用者和網路互動的地方。 這個模型如此通用,如果你想,你可以把它作為修車指南。把它對應 到 Unix,結果是:

應用層(Application Layer) (telnet, ftp,等等)

傳輸層(Host-to-Host Transport Layer) (TCP, UDP)

Internet層(Internet Layer) (IP和路由)

網路訪問層 (Network Access Layer) (網路層,資料鏈路層和物理層)

現在,你可能看到這些層次如何協調來封裝原始的資料了。

看看建立一個簡單的資料包有多少工作?哎呀,你將不得不使用 “cat” 來建立資料包頭!這僅僅是個玩笑。對於流式套接字你要作的是 send() 發 送資料。對於資料報式套接字,你按照你選擇的方式封裝資料然後使用 sendto()。核心將為你建立傳輸層和 Internet 層,硬體完成網路訪問層。 這就是現代科技。 現在結束我們的網路理論速成班。哦,忘記告訴你關於路由的事情了。 但是我不準備談它,如果你真的關心,那麼參考 IP RFC。

4.結構體

終於談到程式設計了。在這章,我將談到被套接字用到的各種資料型別。 因為它們中的一些內容很重要了。

首先是簡單的一個:socket描述符。它是下面的型別:

int

僅僅是一個常見的 int。

從現在起,事情變得不可思議了,而你所需做的就是繼續看下去。注 意這樣的事實:有兩種位元組排列順序:重要的位元組 (有時叫 “octet”,即八 位位組) 在前面,或者不重要的位元組在前面。前一種叫“網路位元組順序 (Network Byte Order)”。有些機器在內部是按照這個順序儲存資料,而另外 一些則不然。當我說某資料必須按照 NBO 順序,那麼你要呼叫函式(例如 htons() )來將它從本機位元組順序 (Host Byte Order) 轉換過來。如果我沒有 提到 NBO, 那麼就讓它保持本機位元組順序。

我的第一個結構(在這個技術手冊TM中)–struct sockaddr.。這個結構 為許多型別的套接字儲存套接字地址資訊:

struct sockaddr {

  unsigned short sa_family; /* 地址家族, AF_xxx */

  char sa_data[14]; /*14位元組協議地址*/

};

sa_family 能夠是各種各樣的型別,但是在這篇文章中都是 “AF_INET”。 sa_data包含套接字中的目標地址和埠資訊。這好像有點 不明智。

為了處理struct sockaddr,程式設計師創造了一個並列的結構: struct sockaddr_in (“in” 代表 “Internet”。)

struct sockaddr_in {

  short int sin_family; /* 通訊型別 */

  unsigned short int sin_port; /* 埠 */

  struct in_addr sin_addr; /* Internet 地址 */

  unsigned char sin_zero[8]; /* 與sockaddr結構的長度相同*/

};

用這個資料結構可以輕鬆處理套接字地址的基本元素。注意 sin_zero (它被加入到這個結構,並且長度和 struct sockaddr 一樣) 應該使用函式 bzero()memset() 來全部置零。 同時,這一重要的位元組,一個指向 sockaddr_in結構體的指標也可以被指向結構體sockaddr並且代替它。這樣的話即使 socket() 想要的是 struct sockaddr *,你仍然可以使用 struct sockaddr_in,並且在最後轉換。同時,注意 sin_family 和 struct sockaddr 中的 sa_family 一致並能夠設定為 “AF_INET”。最後,sin_port和 sin_addr 必須是網路位元組順序 (Network Byte Order)!

你也許會反對道:”但是,怎麼讓整個資料結構 struct in_addr sin_addr 按照網路位元組順序呢?” 要知道這個問題的答案,我們就要仔細的看一看這 個數據結構: struct in_addr, 有這樣一個聯合 (unions):

/* Internet 地址 (一個與歷史有關的結構) */

struct in_addr {

  unsigned long s_addr;

};

它曾經是個最壞的聯合,但是現在那些日子過去了。如果你宣告 “ina” 是資料結構 struct sockaddr_in 的例項,那麼 “ina.sin_addr.s_addr” 就儲 存4位元組的 IP 地址(使用網路位元組順序)。如果你不幸的系統使用的還是恐 怖的聯合 struct in_addr ,你還是可以放心4位元組的 IP 地址並且和上面 我說的一樣(這是因為使用了“#define”。)

5.本機轉換

我們現在到了新的章節。我們曾經講了很多網路到本機位元組順序的轉 換,現在可以實踐了! 你能夠轉換兩種型別: short (兩個位元組)和 long (四個位元組)。這個函 數對於變數型別 unsigned 也適用。假設你想將 short 從本機位元組順序轉 換為網路位元組順序。用 “h” 表示 “本機 (host)”,接著是 “to”,然後用 “n” 表 示 “網路 (network)”,最後用 “s” 表示 “short”: h-to-n-s, 或者 htons() (“Host to Network Short”)。

太簡單了… ,如果不是太傻的話,你一定想到了由”n”,”h”,”s”,和 “l”形成的正確 組合,例如這裡肯定沒有stolh() (“Short to Long Host”) 函式,不僅在這裡 沒有,所有場合都沒有。但是這裡有:

htons()–“Host to Network Short”

htonl()–“Host to Network Long”

ntohs()–“Network to Host Short”

ntohl()–“Network to Host Long”

現在,你可能想你已經知道它們了。你也可能想:“如果我想改變 char 的順序要怎麼辦呢?” 但是你也許馬上就想到,“用不著考慮的”。你也許 會想到:我的 68000 機器已經使用了網路位元組順序,我沒有必要去呼叫 htonl() 轉換 IP 地址。你可能是對的,但是當你移植你的程式到別的機器 上的時候,你的程式將失敗。可移植性!這裡是 Unix 世界!記住:在你 將資料放到網路上的時候,確信它們是網路位元組順序的。

最後一點:為什麼在資料結構 struct sockaddr_in 中, sin_addr 和 sin_port 需要轉換為網路位元組順序,而sin_family 需不需要呢? 答案是: sin_addr 和 sin_port 分別封裝在包的 IP 和 UDP 層。因此,它們必須要 是網路位元組順序。但是 sin_family 域只是被核心 (kernel) 使用來決定在數 據結構中包含什麼型別的地址,所以它必須是本機位元組順序。同時, sin_family 沒有傳送到網路上,它們可以是本機位元組順序。

6.IP 地址和如何處理它們

現在我們很幸運,因為我們有很多的函式來方便地操作 IP 地址。沒有 必要用手工計算它們,也沒有必要用”<<”操作來儲存成長整字型。 首先,假設你已經有了一個sockaddr_in結構體ina,你有一個IP地 址”132.241.5.10”要儲存在其中,你就要用到函式inet_addr(),將IP地址從 點數格式轉換成無符號長整型。使用方法如下:

ina.sin_addr.s_addr = inet_addr("132.241.5.10");

注意,inet_addr()返回的地址已經是網路位元組格式,所以你無需再呼叫 函式htonl()。 我們現在發現上面的程式碼片斷不是十分完整的,因為它沒有錯誤檢查。 顯而易見,當inet_addr()發生錯誤時返回-1。記住這些二進位制數字?(無符 號數)-1僅僅和IP地址255.255.255.255相符合!這可是廣播地址!大錯特 錯!記住要先進行錯誤檢查。

好了,現在你可以將IP地址轉換成長整型了。有沒有其相反的方法呢? 它可以將一個in_addr結構體輸出成點數格式?這樣的話,你就要用到函式 inet_ntoa()(“ntoa”的含義是”network to ascii”),就像這樣:

printf("%s",inet_ntoa(ina.sin_addr));

它將輸出IP地址。需要注意的是inet_ntoa()將結構體in-addr作為一個引數,不是長整形。同樣需要注意的是它返回的是一個指向一個字元的 指標。它是一個由inet_ntoa()控制的靜態的固定的指標,所以每次呼叫 inet_ntoa(),它就將覆蓋上次呼叫時所得的IP地址。例如:

char *a1, *a2;

……

a1 = inet_ntoa(ina1.sin_addr); /* 這是198.92.129.1 */

a2 = inet_ntoa(ina2.sin_addr); /* 這是132.241.5.10 */

printf("address 1: %s\n",a1);

printf("address 2: %s\n",a2);

輸出如下:

address 1: 132.241.5.10

address 2: 132.241.5.10

假如你需要儲存這個IP地址,使用strcopy()函式來指向你自己的字元指標。

上面就是關於這個主題的介紹。稍後,你將學習將一個類似”wintehouse.gov”的字串轉換成它所對應的IP地址(查閱域名服務)。

7.socket()函式

我想我不能再不提這個了-下面我將討論一下socket()系統呼叫。

下面是詳細介紹:

#include <sys/types.h>

#include <sys/socket.h>

int socket(int domain, int type, int protocol);

但是它們的引數是什麼? 首先,domain 應該設定成 “AF_INET”,就 象上面的資料結構struct sockaddr_in 中一樣。然後,引數 type 告訴核心 是 SOCK_STREAM 型別還是 SOCK_DGRAM 型別。最後,把 protocol 設定為 “0”。(注意:有很多種 domain、type,我不可能一一列出了,請看 socket() 的 man幫助。當然,還有一個”更好”的方式去得到 protocol,同 時請查閱 getprotobyname() 的 man 幫助。) socket() 只是返回你以後在系統呼叫種可能用到的 socket 描述符,或 者在錯誤的時候返回-1。全域性變數 errno 中將儲存返回的錯誤值。(請參考 perror() 的 man 幫助。)

8.bind()函式

一旦你有一個套接字,你可能要將套接字和機器上的一定的埠關聯 起來。(如果你想用listen()來偵聽一定埠的資料,這是必要一步–MUD 告 訴你說用命令 “telnet x.y.z 6969”。)如果你只想用 connect(),那麼這個步 驟沒有必要。但是無論如何,請繼續讀下去。

這裡是系統呼叫 bind() 的大概:

#include <sys/types.h>

#include <sys/socket.h>

int bind(int sockfd, struct sockaddr *my_addr, int addrlen);

sockfd 是呼叫 socket 返回的檔案描述符。my_addr 是指向資料結構 struct sockaddr 的指標,它儲存你的地址(即埠和 IP 地址) 資訊。 addrlen 設定為 sizeof(struct sockaddr)。 簡單得很不是嗎? 再看看例子:

#include <string.h>

#include <sys/types.h>

#include <sys/socket.h>

#define MYPORT 3490

main()

{

  int sockfd;

  struct sockaddr_in my_addr;

  sockfd = socket(AF_INET, SOCK_STREAM, 0); /*需要錯誤檢查 */

  my_addr.sin_family = AF_INET; /* host byte order */

  my_addr.sin_port = htons(MYPORT); /* short, network byte order */

  my_addr.sin_addr.s_addr = inet_addr("132.241.5.10");

  bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */

  /* don't forget your error checking for bind(): */

  bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

  ……
 }

這裡也有要注意的幾件事情。my_addr.sin_port 是網路位元組順序, my_addr.sin_addr.s_addr 也是的。另外要注意到的事情是因系統的不同, 包含的標頭檔案也不盡相同,請查閱本地的 man 幫助檔案。 在 bind() 主題中最後要說的話是,在處理自己的 IP 地址和/或埠的 時候,有些工作是可以自動處理的。

my_addr.sin_port = 0; /* 隨機選擇一個沒有使用的埠 */

my_addr.sin_addr.s_addr = INADDR_ANY; /* 使用自己的IP地址 */

通過將0賦給 my_addr.sin_port,你告訴 bind() 自己選擇合適的端 口。同樣,將 my_addr.sin_addr.s_addr 設定為 INADDR_ANY,你告訴 它自動填上它所執行的機器的 IP 地址。

如果你一向小心謹慎,那麼你可能注意到我沒有將 INADDR_ANY 轉 換為網路位元組順序!這是因為我知道內部的東西:INADDR_ANY 實際上就 是 0!即使你改變位元組的順序,0依然是0。但是完美主義者說應該處處一 致,INADDR_ANY或許是12呢?你的程式碼就不能工作了,那麼就看下面 的程式碼:

my_addr.sin_port = htons(0); /* 隨機選擇一個沒有使用的埠 */

my_addr.sin_addr.s_addr = htonl(INADDR_ANY);/* 使用自己的IP地址 */

你或許不相信,上面的程式碼將可以隨便移植。我只是想指出,既然你 所遇到的程式不會都執行使用htonl的INADDR_ANY。

bind() 在錯誤的時候依然是返回-1,並且設定全域性錯誤變數errno。

在你呼叫 bind() 的時候,你要小心的另一件事情是:不要採用小於 1024的埠號。所有小於1024的埠號都被系統保留!你可以選擇從1024 到65535的埠(如果它們沒有被別的程式使用的話)。
你要注意的另外一件小事是:有時候你根本不需要呼叫它。如果你使 用 connect() 來和遠端機器進行通訊,你不需要關心你的本地埠號(就象 你在使用 telnet 的時候),你只要簡單的呼叫 connect() 就可以了,它會檢 查套接字是否繫結埠,如果沒有,它會自己繫結一個沒有使用的本地端 口。

9.connect()程式

現在我們假設你是個 telnet 程式。你的使用者命令你得到套接字的檔案 描述符。你聽從命令呼叫了socket()。下一步,你的使用者告訴你通過埠 23(標準 telnet 埠)連線到”132.241.5.10”。你該怎麼做呢? 幸運的是,你正在閱讀 connect()–如何連線到遠端主機這一章。你可 不想讓你的使用者失望。

connect() 系統呼叫是這樣的:

#include <sys/types.h>

#include <sys/socket.h>

int connect(int sockfd, struct sockaddr *serv_addr, int addrlen);

sockfd 是系統呼叫 socket() 返回的套接字檔案描述符。serv_addr 是 儲存著目的地埠和 IP 地址的資料結構 struct sockaddr。addrlen 設定 為 sizeof(struct sockaddr)。 想知道得更多嗎?讓我們來看個例子:

#include <string.h>

#include <sys/types.h>

#include <sys/socket.h>

#define DEST_IP "132.241.5.10"

#define DEST_PORT 23

main()

{

  int sockfd;

  struct sockaddr_in dest_addr; /* 目的地址*/

  sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 錯誤檢查 */

  dest_addr.sin_family = AF_INET; /* host byte order */

  dest_addr.sin_port = htons(DEST_PORT); /* short, network byte order */

  dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);

  bzero(&(dest_addr.sin_zero),; /* zero the rest of the struct */

  /* don't forget to error check the connect()! */

  connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));

  ……
}

再一次,你應該檢查 connect() 的返回值–它在錯誤的時候返回-1,並 設定全域性錯誤變數 errno。 同時,你可能看到,我沒有呼叫 bind()。因為我不在乎本地的埠號。 我只關心我要去哪。核心將為我選擇一個合適的埠號,而我們所連線的 地方也自動地獲得這些資訊。一切都不用擔心。

10.listen()函式

是換換內容的時候了。假如你不希望與遠端的一個地址相連,或者說, 僅僅是將它踢開,那你就需要等待接入請求並且用各種方法處理它們。處理過程分兩步:首先,你聽–listen(),然後,你接受–accept() (請看下面的內容)。

除了要一點解釋外,系統呼叫 listen 也相當簡單。

int listen(int sockfd, int backlog);

sockfd 是呼叫 socket() 返回的套接字檔案描述符。backlog 是在進入 佇列中允許的連線數目。什麼意思呢? 進入的連線是在佇列中一直等待直 到你接受 (accept() 請看下面的文章)連線。它們的數目限制於佇列的允許。 大多數系統的允許數目是20,你也可以設定為5到10。

和別的函式一樣,在發生錯誤的時候返回-1,並設定全域性錯誤變數 errno。

你可能想象到了,在你呼叫 listen() 前你或者要呼叫 bind() 或者讓內 核隨便選擇一個埠。如果你想偵聽進入的連線,那麼系統呼叫的順序可 能是這樣的:

socket();

bind();

listen();

/* accept() 應該在這 */

因為它相當的明瞭,我將在這裡不給出例子了。(在 accept() 那一章的 程式碼將更加完全。)真正麻煩的部分在 accept()

11.accept()函式

準備好了,系統呼叫 accept() 會有點古怪的地方的!你可以想象發生 這樣的事情:有人從很遠的地方通過一個你在偵聽 (listen()) 的埠連線 (connect()) 到你的機器。它的連線將加入到等待接受 (accept()) 的佇列 中。你呼叫 accept() 告訴它你有空閒的連線。它將返回一個新的套接字文 件描述符!這樣你就有兩個套接字了,原來的一個還在偵聽你的那個埠, 新的在準備傳送 (send()) 和接收 ( recv()) 資料。這就是這個過程!

函式是這樣定義的:

#include <sys/socket.h>

int accept(int sockfd, void *addr, int *addrlen);

sockfd 相當簡單,是和 listen() 中一樣的套接字描述符。addr 是個指 向區域性的資料結構 sockaddr_in 的指標。這是要求接入的資訊所要去的地 方(你可以測定那個地址在那個埠呼叫你)。在它的地址傳遞給 accept 之 前,addrlen 是個區域性的整形變數,設定為 sizeof(struct sockaddr_in)。 accept 將不會將多餘的位元組給 addr。如果你放入的少些,那麼它會通過改 變 addrlen 的值反映出來。

同樣,在錯誤時返回-1,並設定全域性錯誤變數 errno。

現在是你應該熟悉的程式碼片段。

#include <string.h>

#include <sys/socket.h>

#include <sys/types.h>

#define MYPORT 3490 /*使用者接入埠*/

#define BACKLOG 10 /* 多少等待連線控制*/

main()

{

  int sockfd, new_fd; /* listen on sock_fd, new connection on new_fd */

  struct sockaddr_in my_addr; /* 地址資訊 */

  struct sockaddr_in their_addr; /* connector's address information */

  int sin_size;

  sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 錯誤檢查*/

  my_addr.sin_family = AF_INET; /* host byte order */

  my_addr.sin_port = htons(MYPORT); /* short, network byte order */

  my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */

  bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */

  /* don't forget your error checking for these calls: */

  bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

  listen(sockfd, BACKLOG);

  sin_size = sizeof(struct sockaddr_in);

  new_fd = accept(sockfd, &their_addr, &sin_size);

  ……
}

注意,在系統呼叫 send()recv() 中你應該使用新的套接字描述符 new_fd。如果你只想讓一個連線進來,那麼你可以使用 close() 去關閉原 來的檔案描述符 sockfd 來避免同一個埠更多的連線。

12.send() 和 recv()函式

這兩個函式用於流式套接字或者資料報套接字的通訊。如果你喜歡使用無連線的資料報套接字,你應該看一看下面關於sendto()recvfrom() 的章節。

send() 是這樣的:

int send(int sockfd, const void *msg, int len, int flags);

sockfd 是你想傳送資料的套接字描述符(或者是呼叫 socket() 或者是 accept() 返回的。)msg 是指向你想傳送的資料的指標。len 是資料的長度。 把 flags 設定為 0 就可以了。(詳細的資料請看 send() 的 man page)。 這裡是一些可能的例子:

char *msg = "Beej was here!";

int len, bytes_sent;

……

len = strlen(msg);

bytes_sent = send(sockfd, msg, len, 0);

……

send() 返回實際傳送的資料的位元組數–它可能小於你要求傳送的數 目! 注意,有時候你告訴它要傳送一堆資料可是它不能處理成功。它只是 傳送它可能傳送的資料,然後希望你能夠傳送其它的資料。記住,如果 send() 返回的資料和 len 不匹配,你就應該傳送其它的資料。但是這裡也 有個好訊息:如果你要傳送的包很小(小於大約 1K),它可能處理讓資料一 次傳送完。最後要說得就是,它在錯誤的時候返回-1,並設定 errno。

recv() 函式很相似:

int recv(int sockfd, void *buf, int len, unsigned int flags);

sockfd 是要讀的套接字描述符。buf 是要讀的資訊的緩衝。len 是緩 衝的最大長度。flags 可以設定為0。(請參考recv() 的 man page。) recv() 返回實際讀入緩衝的資料的位元組數。或者在錯誤的時候返回-1, 同時設定 errno。

很簡單,不是嗎? 你現在可以在流式套接字上傳送資料和接收資料了。 你現在是 Unix 網路程式設計師了!

13.sendto() 和 recvfrom()函式

“這很不錯啊”,你說,“但是你還沒有講無連線資料報套接字呢?” 沒問題,現在我們開始這個內容。 既然資料報套接字不是連線到遠端主機的,那麼在我們傳送一個包之 前需要什麼資訊呢? 不錯,是目標地址!看看下面的:

int sendto(int sockfd, const void *msg, int len, unsigned int flags,

const struct sockaddr *to, int tolen);

你已經看到了,除了另外的兩個資訊外,其餘的和函式 send() 是一樣 的。 to 是個指向資料結構 struct sockaddr 的指標,它包含了目的地的 IP 地址和埠資訊。tolen 可以簡單地設定為 sizeof(struct sockaddr)。 和函式 send() 類似,sendto() 返回實際傳送的位元組數(它也可能小於 你想要傳送的位元組數!),或者在錯誤的時候返回 -1。

相似的還有函式 recv()recvfrom()recvfrom() 的定義是這樣的:

int recvfrom(int sockfd, void *buf, int len, unsigned int flags,  

struct sockaddr *from, int *fromlen);

又一次,除了兩個增加的引數外,這個函式和 recv() 也是一樣的。from 是一個指向區域性資料結構 struct sockaddr 的指標,它的內容是源機器的 IP 地址和埠資訊。fromlen 是個 int 型的區域性指標,它的初始值為 sizeof(struct sockaddr)。函式呼叫返回後,fromlen 儲存著實際儲存在 from 中的地址的長度。

recvfrom() 返回收到的位元組長度,或者在發生錯誤後返回 -1。

記住,如果你用 connect() 連線一個數據報套接字,你可以簡單的調 用 send()recv() 來滿足你的要求。這個時候依然是資料報套接字,依然使用 UDP,系統套接字介面會為你自動加上了目標和源的資訊。

14.close()和shutdown()函式

你已經整天都在傳送 (send()) 和接收 (recv()) 資料了,現在你準備關閉你的套接字描述符了。這很簡單,你可以使用一般的 Unix 檔案描述符 的 close() 函式:

close(sockfd);

它將防止套接字上更多的資料的讀寫。任何在另一端讀寫套接字的企 圖都將返回錯誤資訊。如果你想在如何關閉套接字上有多一點的控制,你可以使用函式 shutdown()。它允許你將一定方向上的通訊或者雙向的通訊(就象close()一 樣)關閉,你可以使用:

int shutdown(int sockfd, int how);

sockfd 是你想要關閉的套接字檔案描述復。how 的值是下面的其中之 一:

0 – 不允許接受

1 – 不允許傳送

2 – 不允許傳送和接受(和 close() 一樣)

shutdown() 成功時返回 0,失敗時返回 -1(同時設定 errno。) 如果在無連線的資料報套接字中使用shutdown(),那麼只不過是讓 send()recv() 不能使用(記住你在資料報套接字中使用了 connect 後 是可以使用它們的)。

15.getpeername()函式

這個函式太簡單了。它太簡單了,以至我都不想單列一章。但是我還是這樣做了。函式 getpeername() 告訴你在連線的流式套接字上誰在另外一邊。函式是這樣的:

#include <sys/socket.h>

int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);

sockfd 是連線的流式套接字的描述符。addr 是一個指向結構 struct sockaddr (或者是 struct sockaddr_in) 的指標,它儲存著連線的另一邊的 資訊。addrlen 是一個 int 型的指標,它初始化為 sizeof(struct sockaddr)。 函式在錯誤的時候返回 -1,設定相應的 errno。

一旦你獲得它們的地址,你可以使用 inet_ntoa() 或者 gethostbyaddr() 來列印或者獲得更多的資訊。但是你不能得到它的帳號。(如果它執行著愚蠢的守護程序,這是可能的,但是它的討論已經超出了本文的範圍,請參考 RFC-1413 以獲得更多的資訊。)

16.gethostname()函式

甚至比 getpeername() 還簡單的函式是 gethostname()。它返回你程 序所執行的機器的主機名字。然後你可以使用 gethostbyname() 以獲得你 的機器的 IP 地址。

下面是定義:

#include <unistd.h>

int gethostname(char *hostname, size_t size);

引數很簡單:hostname 是一個字元陣列指標,它將在函式返回時儲存 主機名。size是hostname 陣列的位元組長度。

函式呼叫成功時返回 0,失敗時返回 -1,並設定 errno。

17.域名服務(DNS)

如果你不知道 DNS 的意思,那麼我告訴你,它代表域名服務(Domain Name Service)。它主要的功能是:你給它一個容易記憶的某站點的地址, 它給你 IP 地址(然後你就可以使用 bind(), connect(), sendto() 或者其它 函式) 。當一個人輸入:

$ telnet whitehouse.gov

telnet 能知道它將連線 (connect()) 到 “198.137.240.100”。 但是這是如何工作的呢? 你可以呼叫函式 gethostbyname()

#include <netdb.h>

struct hostent *gethostbyname(const char *name);

很明白的是,它返回一個指向 struct hostent 的指標。這個資料結構是這樣的:

struct hostent {

  char *h_name;

  char **h_aliases;

  int h_addrtype;

  int h_length;

  char **h_addr_list;

};

#define h_addr h_addr_list[0]

這裡是這個資料結構的詳細資料:

h_name – 地址的正式名稱。

h_aliases – 空位元組-地址的預備名稱的指標。

h_addrtype –地址型別; 通常是AF_INET。

h_length – 地址的位元長度。

h_addr_list – 零位元組-主機網路地址指標。網路位元組順序。

h_addr - h_addr_list中的第一地址。

gethostbyname() 成功時返回一個指向結構體 hostent 的指標,或者 是個空 (NULL) 指標。(但是和以前不同,不設定errno,h_errno 設定錯 誤資訊,請看下面的 herror()。) 但是如何使用呢? 有時候(我們可以從電腦手冊中發現),向讀者灌輸 資訊是不夠的。這個函式可不象它看上去那麼難用。

這裡是個例子:

#include <stdio.h>

#include <stdlib.h>

#include <errno.h>

#include <netdb.h>

#include <sys/types.h>

#include <netinet/in.h>

int main(int argc, char *argv[])

{

  struct hostent *h;

  if (argc != 2) { /* 檢查命令列 */

  fprintf(stderr,"usage: getip address\n");

  exit(1);

  }

  if ((h=gethostbyname(argv[1])) == NULL) { /* 取得地址資訊 */

  herror("gethostbyname");

  exit(1);

  }

  printf("Host name : %s\n", h->h_name);

  printf("IP Address : %s\n",inet_ntoa(*((struct in_addr *)h->h_addr)));

return 0;

}

在使用 gethostbyname() 的時候,你不能用 perror() 列印錯誤資訊 (因為 errno 沒有使用),你應該呼叫 herror()

相當簡單,你只是傳遞一個儲存機器名的字串(例如 “whitehouse.gov”) 給 gethostbyname(),然後從返回的資料結構 struct hostent 中獲取資訊。

唯一也許讓人不解的是輸出 IP 地址資訊。h->h_addr 是一個 char *, 但是 inet_ntoa() 需要的是 struct in_addr。因此,我轉換 h->h_addr 成 struct in_addr*,然後得到資料。

18.客戶-伺服器背景知識

這裡是個客戶–伺服器的世界。在網路上的所有東西都是在處理客戶進 程和伺服器程序的交談。舉個telnet 的例子。當你用 telnet (客戶)通過23 號埠登陸到主機,主機上執行的一個程式(一般叫 telnetd,伺服器)啟用。它處理這個連線,顯示登陸介面等等。

注意,客戶–伺服器之間可以使用SOCK_STREAM、SOCK_DGRAM 或者其它(只要它們採用相同的)。一些很好的客戶–伺服器的例子有 telnet/telnetd、 ftp/ftpd 和 bootp/bootpd。每次你使用 ftp 的時候,在遠 端都有一個 ftpd 為你服務。

一般,在服務端只有一個伺服器,它採用 fork() 來處理多個客戶的連 接。基本的程式是:伺服器等待一個連線,接受 (accept()) 連線,然後 fork() 一個子程序處理它。這是下一章我們的例子中會講到的。

19.簡單的伺服器

這個伺服器所做的全部工作是在流式連線上傳送字串 “Hello, World!\n”。你要測試這個程式的話,可以在一臺機器上執行該程式,然後 在另外一機器上登陸:

$ telnet remotehostname 3490

remotehostname 是該程式執行的機器的名字。

伺服器程式碼:

#include <stdio.h>

#include <stdlib.h>

#include <errno.h>

#include <string.h>

#include <sys/types.h>

#include <netinet/in.h>

#include <sys/socket.h>

#include <sys/wait.h>

#define MYPORT 3490 /*定義使用者連線埠*/

#define BACKLOG 10 /*多少等待連線控制*/

main()

{

  int sockfd, new_fd; /* listen on sock_fd, new connection on new_fd */

  struct sockaddr_in my_addr; /* my address information */

  struct sockaddr_in their_addr; /* connector's address information */

  int sin_size;

  if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

  perror("socket");

  exit(1);

  }

  my_addr.sin_family = AF_INET; /* host byte order */

  my_addr.sin_port = htons(MYPORT); /* short, network byte order */

  my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */

  bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */



  if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1) {

  perror("bind");

  exit(1);

  }

  if (listen(sockfd, BACKLOG) == -1) {

  perror("listen");

  exit(1);

  }



  while(1) { /* main accept() loop */

  sin_size = sizeof(struct sockaddr_in);

  if ((new_fd = accept(sockfd, (struct sockaddr *)&their_addr, &sin_size)) == -1) {

  perror("accept");

  continue;

  }

  printf("server: got connection from %s\n", \

  inet_ntoa(their_addr.sin_addr));

  if (!fork()) { /* this is the child process */

  if (send(new_fd, "Hello, world!\n", 14, 0) == -1)

  perror("send");

  close(new_fd);

  exit(0);

  }

  close(new_fd); /* parent doesn't need this */

  while(waitpid(-1,NULL,WNOHANG) > 0); /* clean up child processes */

}

}

如果你很挑剔的話,一定不滿意我所有的程式碼都在一個很大的main() 函式中。如果你不喜歡,可以劃分得更細點。

你也可以用我們下一章中的程式得到伺服器端傳送的字串。

20.簡單的客戶端程式

這個程式比伺服器還簡單。這個程式的所有工作是通過 3490 埠連線到命令列中指定的主機,然後得到伺服器傳送的字串。

客戶端程式碼:

#include <stdio.h>

#include <stdlib.h>

#include <errno.h>

#include <string.h>

#include <sys/types.h>

#include <netinet/in.h>

#include <sys/socket.h>

#include <sys/wait.h>

#define PORT 3490 /* 客戶機連線遠端主機的埠 */

#define MAXDATASIZE 100 /* 每次可以接收的最大位元組 */

int main(int argc, char *argv[])

{

int sockfd, numbytes;

char buf[MAXDATASIZE];

struct hostent *he;

struct sockaddr_in their_addr; /* connector's address information */

if (argc != 2) {

fprintf(stderr,"usage: client hostname\n");

exit(1);

}

if ((he=gethostbyname(argv[1])) == NULL) { /* get the host info */

herror("gethostbyname");

exit(1);

}

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

perror("socket");

exit(1);

}

their_addr.sin_family = AF_INET; /* host byte order */

their_addr.sin_port = htons(PORT); /* short, network byte order */

their_addr.sin_addr = *((struct in_addr *)he->h_addr);

bzero(&(their_addr.sin_zero),; /* zero the rest of the struct */

if(connect(sockfd,(struct sockaddr *)&their_addr,sizeof(struct sockaddr)) == -1) {

perror("connect");

exit(1);

}

if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0)) == -1) {

perror("recv");

exit(1);

}

buf[numbytes] = '\0';

printf("Received: %s",buf);

close(sockfd);

return 0;

}

注意,如果你在執行伺服器之前執行客戶程式,connect() 將返回 “Connection refused” 資訊,這非常有用。

21.資料包 Sockets

我不想講更多了,所以我給出程式碼 talker.c 和 listener.c。

listener 在機器上等待在埠 4590 來的資料包。talker 傳送資料包到 一定的機器,它包含使用者在命令列輸入的內容。

這裡就是 listener.c:

#include <stdio.h>

#include <stdlib.h>

#include <errno.h>

#include <string.h>

#include <sys/types.h>

#include <netinet/in.h>

#include <sys/socket.h>

#include <sys/wait.h>

#define MYPORT 4950 /* the port users will be sending to */

#define MAXBUFLEN 100

main()

{

int sockfd;

struct sockaddr_in my_addr; /* my address information */

struct sockaddr_in their_addr; /* connector's address information */

int addr_len, numbytes;

char buf[MAXBUFLEN];

if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) == -1) {

perror("socket");

exit(1);

}

my_addr.sin_family = AF_INET; /* host byte order */

my_addr.sin_port = htons(MYPORT); /* short, network byte order */

my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */

bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */

if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {

perror("bind");

exit(1);

}

addr_len = sizeof(struct sockaddr);

if ((numbytes=recvfrom(sockfd, buf, MAXBUFLEN, 0,     \

(struct sockaddr *)&their_addr, &addr_len)) == -1) {

perror("recvfrom");

exit(1);

}

printf("got packet from %s\n",inet_ntoa(their_addr.sin_addr));

printf("packet is %d bytes long\n",numbytes);

buf[numbytes] = '\0';

printf("packet contains \"%s\"\n",buf);

close(sockfd);

}

注意在我們的呼叫 socket(),我們最後使用了 SOCK_DGRAM。同時, 沒有必要去使用 listen() 或者 accept()。我們在使用無連線的資料報套接字!

下面是 talker.c:

#include <stdio.h>

#include <stdlib.h>

#include <errno.h>

#include <string.h>

#include <sys/types.h>

#include <netinet/in.h>

#include <sys/socket.h>

#include <sys/wait.h>

#define MYPORT 4950 /* the port users will be sending to */

int main(int argc, c