C++中Socket程式設計入門
C++中Socket程式設計入門
轉載 :http://www.cnblogs.com/L-hq815/archive/2012/07/09/2583043.html
該作者也是轉載,為國外網站翻譯之作
本人在學習Socket程式設計時,在其他地方看到了不錯Socket入門文件,通俗易懂,特此轉載;
注:文中套接字即指socket
目錄
- C++中Socket程式設計入門
- 目錄
- 介紹
- 讀者物件
- 平臺和編譯器
- 正文
- 1.什麼是套接字?
- 2.Internet 套接字的兩種型別
- 3.網路理論
- 4.結構體
- 5.本機轉換
- 6.IP 地址和如何處理它們
- 7.socket()函式
- 8.bind()函式
- 9.connect()程式
- 10.listen()函式
- 11.accept()函式
- 12.send() 和 recv()函式
- 13.sendto() 和 recvfrom()函式
- 14.close()和shutdown()函式
- 15.getpeername()函式
- 16.gethostname()函式
- 17.域名服務(DNS)
- 18.客戶-伺服器背景知識
- 19.簡單的伺服器
- 20.簡單的客戶端程式
- 21.資料包 Sockets
- 22.阻塞
- 23.select()–多路同步 I/O
介紹
Socket程式設計讓你沮喪嗎?從man pages中很難得到有用的資訊嗎?你想跟上時代去編Internet相關的程式,但是為你在呼叫 connect() 前的bind() 的結構而不知所措?等等…
好在我已經將這些事完成了,我將和所有人共享我的知識了。如果你瞭解 C 語言並想穿過網路程式設計的沼澤,那麼你來對地方了。
讀者物件
這個文件是一個指南,而不是參考書。如果你剛開始 socket 程式設計並想找一本入門書,那麼你是我的讀者。但這不是一本完全的 socket 程式設計書。
平臺和編譯器
這篇文件中的大多數程式碼都在 Linux 平臺PC 上用 GNU 的 gcc 成功編譯過。而且它們在 HPUX平臺 上用 gcc 也成功編譯過。但是注意,並不是每個程式碼片段都獨立測試過。
正文
1.什麼是套接字?
你經常聽到人們談論著 “socket”,或許你還不知道它的確切含義。現在讓我告訴你:它是使用標準Unix 檔案描述符 (file descriptor) 和其它程式通訊的方式。 什麼? 你也許聽到一些Unix高手(hacker)這樣說過:“呀,Unix中的一切就是檔案!”那個傢伙也許正在說到一個事實:Unix 程式在執行任何形式的 I/O 的時候,程式是在讀或者寫一個檔案描述符。一個檔案描述符只是一個和開啟的檔案相關聯的整數。但是(注意後面的話),這個檔案可能是一個網路連線,FIFO,管道,終端,磁碟上的檔案或者什麼其它的東西。Unix 中所有的東西就是檔案!所以,你想和Internet上別的程式通訊的時候,你將要使用到檔案描述符。你必須理解剛才的話。現在你腦海中或許冒出這樣的念頭:“那麼我從哪裡得到網路通訊的檔案描述符呢?”,這個問題無論如何我都要回答:你利用系統呼叫 socket(),它返回套接字描述符 (socket descriptor),然後你再通過它來進行send() 和 recv()呼叫。
“但是…”,你可能有很大的疑惑,“如果它是個檔案描述符,那麼為什 麼不用一般呼叫read()和write()來進行套接字通訊?”簡單的答案是:“你可以使用!”。詳細的答案是:“你可以,但是使用send()和recv()讓你更好的控制資料傳輸。”
存在這樣一個情況:在我們的世界上,有很多種套接字。有DARPA Internet 地址 (Internet 套接字),本地節點的路徑名 (Unix套接字),CCITT X.25地址 (你可以將X.25 套接字完全忽略)。也許在你的Unix 機器上還有其它的。我們在這裡只講第一種:Internet 套接字。
2.Internet 套接字的兩種型別
什麼意思?有兩種型別的Internet 套接字?是的。不,我在撒謊。其實還有很多,但是我可不想嚇著你。我們這裡只講兩種。除了這些, 我打算另外介紹的 “Raw Sockets” 也是非常強大的,很值得查閱。
那麼這兩種型別是什麼呢?一種是”Stream Sockets”(流格式),另外一種是”Datagram Sockets”(資料包格式)。我們以後談到它們的時候也會用到 “SOCK_STREAM” 和 “SOCK_DGRAM”。資料報套接字有時也叫“無連線套接字”(如果你確實要連線的時候可以用connect()。) 流式套接字是可靠的雙向通訊的資料流。如果你向套接字按順序輸出“1,2”,那麼它們將按順序“1,2”到達另一邊。它們是無錯誤的傳遞的,有自己的錯誤控制,在此不討論。
有什麼在使用流式套接字?你可能聽說過 telnet,不是嗎?它就使用流式套接字。你需要你所輸入的字元按順序到達,不是嗎?同樣,WWW瀏覽器使用的 HTTP 協議也使用它們來下載頁面。實際上,當你通過埠80 telnet 到一個 WWW 站點,然後輸入 “GET pagename” 的時候,你也可以得到 HTML 的內容。為什麼流式套接字可以達到高質量的資料傳輸?這是因為它使用了“傳輸控制協議 (The Transmission Control Protocol)”,也叫 “TCP” (請參考 RFC-793 獲得詳細資料。)TCP 控制你的資料按順序到達並且沒有錯誤。你也許聽到 “TCP” 是因為聽到過 “TCP/IP”。這裡的 IP 是指“Internet 協議”(請參考 RFC-791。) IP只是處理 Internet 路由而已。
那麼資料報套接字呢?為什麼它叫無連線呢?為什麼它是不可靠的呢?有這樣的一些事實:如果你傳送一個數據報,它可能會到達,它可能次序顛倒了。如果它到達,那麼在這個包的內部是無錯誤的。資料報也使用 IP 作路由,但是它不使用 TCP。它使用“使用者資料報協議 (User Datagram Protocol)”,也叫 “UDP” (請參考 RFC-768。)
為什麼它們是無連線的呢?主要是因為它並不象流式套接字那樣維持一個連線。你只要建立一個包,構造一個有目標資訊的IP 頭,然後發出去。無需連線。它們通常使用於傳輸包-包資訊。簡單的應用程式有:tftp, bootp等等。
你也許會想:“假如資料丟失了這些程式如何正常工作?”我的朋友,每個程式在 UDP 上有自己的協議。例如,tftp 協議每發出的一個被接受到包,收到者必須發回一個包來說“我收到了!” (一個“命令正確應答”也叫“ACK” 包)。如果在一定時間內(例如5秒),傳送方沒有收到應答,它將重新發送,直到得到 ACK。這一ACK過程在實現 SOCK_DGRAM 應用程式的時候非常重要。
3.網路理論
既然我剛才提到了協議層,那麼現在是討論網路究竟如何工作和一些 關於 SOCK_DGRAM 包是如何建立的例子。當然,你也可以跳過這一段, 如果你認為已經熟悉的話。
現在是學習資料封裝 (Data Encapsulation) 的時候了!它非常非常重要。它重要性重要到你在網路課程學習中無論如何也得也得掌握它。主要 的內容是:一個包,先是被第一個協議(在這裡是TFTP )在它的報頭(也許 是報尾)包裝(“封裝”),然後,整個資料(包括 TFTP 頭)被另外一個協議 (在這裡是 UDP )封裝,然後下一個( IP ),一直重複下去,直到硬體(物理) 層( 這裡是乙太網 )。
當另外一臺機器接收到包,硬體先剝去乙太網頭,核心剝去IP和UDP 頭,TFTP程式再剝去TFTP頭,最後得到資料。
現在我們終於講到聲名狼藉的網路分層模型 (Layered Network Model)。這種網路模型在描述網路系統上相對其它模型有很多優點。例如, 你可以寫一個套接字程式而不用關心資料的物理傳輸(序列口,乙太網,連 接單元介面 (AUI) 還是其它介質),因為底層的程式會為你處理它們。實際 的網路硬體和拓撲對於程式設計師來說是透明的。
不說其它廢話了,我現在列出整個層次模型。如果你要參加網路考試, 可一定要記住:
應用層 (Application)
表示層 (Presentation)
會話層 (Session)
傳輸層(Transport)
網路層(Network)
資料鏈路層(Data Link)
物理層(Physical)
物理層是硬體(串列埠,乙太網等等)。應用層是和硬體層相隔最遠的–它 是使用者和網路互動的地方。 這個模型如此通用,如果你想,你可以把它作為修車指南。把它對應 到 Unix,結果是:
應用層(Application Layer) (telnet, ftp,等等)
傳輸層(Host-to-Host Transport Layer) (TCP, UDP)
Internet層(Internet Layer) (IP和路由)
網路訪問層 (Network Access Layer) (網路層,資料鏈路層和物理層)
現在,你可能看到這些層次如何協調來封裝原始的資料了。
看看建立一個簡單的資料包有多少工作?哎呀,你將不得不使用 “cat” 來建立資料包頭!這僅僅是個玩笑。對於流式套接字你要作的是 send() 發 送資料。對於資料報式套接字,你按照你選擇的方式封裝資料然後使用 sendto()。核心將為你建立傳輸層和 Internet 層,硬體完成網路訪問層。 這就是現代科技。 現在結束我們的網路理論速成班。哦,忘記告訴你關於路由的事情了。 但是我不準備談它,如果你真的關心,那麼參考 IP RFC。
4.結構體
終於談到程式設計了。在這章,我將談到被套接字用到的各種資料型別。 因為它們中的一些內容很重要了。
首先是簡單的一個:socket描述符。它是下面的型別:
int
僅僅是一個常見的 int。
從現在起,事情變得不可思議了,而你所需做的就是繼續看下去。注 意這樣的事實:有兩種位元組排列順序:重要的位元組 (有時叫 “octet”,即八 位位組) 在前面,或者不重要的位元組在前面。前一種叫“網路位元組順序 (Network Byte Order)”。有些機器在內部是按照這個順序儲存資料,而另外 一些則不然。當我說某資料必須按照 NBO 順序,那麼你要呼叫函式(例如 htons() )來將它從本機位元組順序 (Host Byte Order) 轉換過來。如果我沒有 提到 NBO, 那麼就讓它保持本機位元組順序。
我的第一個結構(在這個技術手冊TM中)–struct sockaddr.。這個結構 為許多型別的套接字儲存套接字地址資訊:
struct sockaddr {
unsigned short sa_family; /* 地址家族, AF_xxx */
char sa_data[14]; /*14位元組協議地址*/
};
sa_family 能夠是各種各樣的型別,但是在這篇文章中都是 “AF_INET”。 sa_data包含套接字中的目標地址和埠資訊。這好像有點 不明智。
為了處理struct sockaddr,程式設計師創造了一個並列的結構: struct sockaddr_in (“in” 代表 “Internet”。)
struct sockaddr_in {
short int sin_family; /* 通訊型別 */
unsigned short int sin_port; /* 埠 */
struct in_addr sin_addr; /* Internet 地址 */
unsigned char sin_zero[8]; /* 與sockaddr結構的長度相同*/
};
用這個資料結構可以輕鬆處理套接字地址的基本元素。注意 sin_zero (它被加入到這個結構,並且長度和 struct sockaddr 一樣) 應該使用函式 bzero() 或 memset() 來全部置零。 同時,這一重要的位元組,一個指向 sockaddr_in結構體的指標也可以被指向結構體sockaddr並且代替它。這樣的話即使 socket() 想要的是 struct sockaddr *,你仍然可以使用 struct sockaddr_in,並且在最後轉換。同時,注意 sin_family 和 struct sockaddr 中的 sa_family 一致並能夠設定為 “AF_INET”。最後,sin_port和 sin_addr 必須是網路位元組順序 (Network Byte Order)!
你也許會反對道:”但是,怎麼讓整個資料結構 struct in_addr sin_addr 按照網路位元組順序呢?” 要知道這個問題的答案,我們就要仔細的看一看這 個數據結構: struct in_addr, 有這樣一個聯合 (unions):
/* Internet 地址 (一個與歷史有關的結構) */
struct in_addr {
unsigned long s_addr;
};
它曾經是個最壞的聯合,但是現在那些日子過去了。如果你宣告 “ina” 是資料結構 struct sockaddr_in 的例項,那麼 “ina.sin_addr.s_addr” 就儲 存4位元組的 IP 地址(使用網路位元組順序)。如果你不幸的系統使用的還是恐 怖的聯合 struct in_addr ,你還是可以放心4位元組的 IP 地址並且和上面 我說的一樣(這是因為使用了“#define”。)
5.本機轉換
我們現在到了新的章節。我們曾經講了很多網路到本機位元組順序的轉 換,現在可以實踐了! 你能夠轉換兩種型別: short (兩個位元組)和 long (四個位元組)。這個函 數對於變數型別 unsigned 也適用。假設你想將 short 從本機位元組順序轉 換為網路位元組順序。用 “h” 表示 “本機 (host)”,接著是 “to”,然後用 “n” 表 示 “網路 (network)”,最後用 “s” 表示 “short”: h-to-n-s, 或者 htons() (“Host to Network Short”)。
太簡單了… ,如果不是太傻的話,你一定想到了由”n”,”h”,”s”,和 “l”形成的正確 組合,例如這裡肯定沒有stolh() (“Short to Long Host”) 函式,不僅在這裡 沒有,所有場合都沒有。但是這裡有:
htons()–“Host to Network Short”
htonl()–“Host to Network Long”
ntohs()–“Network to Host Short”
ntohl()–“Network to Host Long”
現在,你可能想你已經知道它們了。你也可能想:“如果我想改變 char 的順序要怎麼辦呢?” 但是你也許馬上就想到,“用不著考慮的”。你也許 會想到:我的 68000 機器已經使用了網路位元組順序,我沒有必要去呼叫 htonl() 轉換 IP 地址。你可能是對的,但是當你移植你的程式到別的機器 上的時候,你的程式將失敗。可移植性!這裡是 Unix 世界!記住:在你 將資料放到網路上的時候,確信它們是網路位元組順序的。
最後一點:為什麼在資料結構 struct sockaddr_in 中, sin_addr 和 sin_port 需要轉換為網路位元組順序,而sin_family 需不需要呢? 答案是: sin_addr 和 sin_port 分別封裝在包的 IP 和 UDP 層。因此,它們必須要 是網路位元組順序。但是 sin_family 域只是被核心 (kernel) 使用來決定在數 據結構中包含什麼型別的地址,所以它必須是本機位元組順序。同時, sin_family 沒有傳送到網路上,它們可以是本機位元組順序。
6.IP 地址和如何處理它們
現在我們很幸運,因為我們有很多的函式來方便地操作 IP 地址。沒有 必要用手工計算它們,也沒有必要用”<<”操作來儲存成長整字型。 首先,假設你已經有了一個sockaddr_in結構體ina,你有一個IP地 址”132.241.5.10”要儲存在其中,你就要用到函式inet_addr(),將IP地址從 點數格式轉換成無符號長整型。使用方法如下:
ina.sin_addr.s_addr = inet_addr("132.241.5.10");
注意,inet_addr()返回的地址已經是網路位元組格式,所以你無需再呼叫 函式htonl()。 我們現在發現上面的程式碼片斷不是十分完整的,因為它沒有錯誤檢查。 顯而易見,當inet_addr()發生錯誤時返回-1。記住這些二進位制數字?(無符 號數)-1僅僅和IP地址255.255.255.255相符合!這可是廣播地址!大錯特 錯!記住要先進行錯誤檢查。
好了,現在你可以將IP地址轉換成長整型了。有沒有其相反的方法呢? 它可以將一個in_addr結構體輸出成點數格式?這樣的話,你就要用到函式 inet_ntoa()(“ntoa”的含義是”network to ascii”),就像這樣:
printf("%s",inet_ntoa(ina.sin_addr));
它將輸出IP地址。需要注意的是inet_ntoa()將結構體in-addr作為一個引數,不是長整形。同樣需要注意的是它返回的是一個指向一個字元的 指標。它是一個由inet_ntoa()控制的靜態的固定的指標,所以每次呼叫 inet_ntoa(),它就將覆蓋上次呼叫時所得的IP地址。例如:
char *a1, *a2;
……
a1 = inet_ntoa(ina1.sin_addr); /* 這是198.92.129.1 */
a2 = inet_ntoa(ina2.sin_addr); /* 這是132.241.5.10 */
printf("address 1: %s\n",a1);
printf("address 2: %s\n",a2);
輸出如下:
address 1: 132.241.5.10
address 2: 132.241.5.10
假如你需要儲存這個IP地址,使用strcopy()函式來指向你自己的字元指標。
上面就是關於這個主題的介紹。稍後,你將學習將一個類似”wintehouse.gov”的字串轉換成它所對應的IP地址(查閱域名服務)。
7.socket()函式
我想我不能再不提這個了-下面我將討論一下socket()系統呼叫。
下面是詳細介紹:
#include <sys/types.h>
#include <sys/socket.h>
int socket(int domain, int type, int protocol);
但是它們的引數是什麼? 首先,domain 應該設定成 “AF_INET”,就 象上面的資料結構struct sockaddr_in 中一樣。然後,引數 type 告訴核心 是 SOCK_STREAM 型別還是 SOCK_DGRAM 型別。最後,把 protocol 設定為 “0”。(注意:有很多種 domain、type,我不可能一一列出了,請看 socket() 的 man幫助。當然,還有一個”更好”的方式去得到 protocol,同 時請查閱 getprotobyname() 的 man 幫助。) socket() 只是返回你以後在系統呼叫種可能用到的 socket 描述符,或 者在錯誤的時候返回-1。全域性變數 errno 中將儲存返回的錯誤值。(請參考 perror() 的 man 幫助。)
8.bind()函式
一旦你有一個套接字,你可能要將套接字和機器上的一定的埠關聯 起來。(如果你想用listen()來偵聽一定埠的資料,這是必要一步–MUD 告 訴你說用命令 “telnet x.y.z 6969”。)如果你只想用 connect(),那麼這個步 驟沒有必要。但是無論如何,請繼續讀下去。
這裡是系統呼叫 bind() 的大概:
#include <sys/types.h>
#include <sys/socket.h>
int bind(int sockfd, struct sockaddr *my_addr, int addrlen);
sockfd 是呼叫 socket 返回的檔案描述符。my_addr 是指向資料結構 struct sockaddr 的指標,它儲存你的地址(即埠和 IP 地址) 資訊。 addrlen 設定為 sizeof(struct sockaddr)。 簡單得很不是嗎? 再看看例子:
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#define MYPORT 3490
main()
{
int sockfd;
struct sockaddr_in my_addr;
sockfd = socket(AF_INET, SOCK_STREAM, 0); /*需要錯誤檢查 */
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = inet_addr("132.241.5.10");
bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */
/* don't forget your error checking for bind(): */
bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));
……
}
這裡也有要注意的幾件事情。my_addr.sin_port 是網路位元組順序, my_addr.sin_addr.s_addr 也是的。另外要注意到的事情是因系統的不同, 包含的標頭檔案也不盡相同,請查閱本地的 man 幫助檔案。 在 bind() 主題中最後要說的話是,在處理自己的 IP 地址和/或埠的 時候,有些工作是可以自動處理的。
my_addr.sin_port = 0; /* 隨機選擇一個沒有使用的埠 */
my_addr.sin_addr.s_addr = INADDR_ANY; /* 使用自己的IP地址 */
通過將0賦給 my_addr.sin_port,你告訴 bind() 自己選擇合適的端 口。同樣,將 my_addr.sin_addr.s_addr 設定為 INADDR_ANY,你告訴 它自動填上它所執行的機器的 IP 地址。
如果你一向小心謹慎,那麼你可能注意到我沒有將 INADDR_ANY 轉 換為網路位元組順序!這是因為我知道內部的東西:INADDR_ANY 實際上就 是 0!即使你改變位元組的順序,0依然是0。但是完美主義者說應該處處一 致,INADDR_ANY或許是12呢?你的程式碼就不能工作了,那麼就看下面 的程式碼:
my_addr.sin_port = htons(0); /* 隨機選擇一個沒有使用的埠 */
my_addr.sin_addr.s_addr = htonl(INADDR_ANY);/* 使用自己的IP地址 */
你或許不相信,上面的程式碼將可以隨便移植。我只是想指出,既然你 所遇到的程式不會都執行使用htonl的INADDR_ANY。
bind() 在錯誤的時候依然是返回-1,並且設定全域性錯誤變數errno。
在你呼叫 bind() 的時候,你要小心的另一件事情是:不要採用小於 1024的埠號。所有小於1024的埠號都被系統保留!你可以選擇從1024 到65535的埠(如果它們沒有被別的程式使用的話)。
你要注意的另外一件小事是:有時候你根本不需要呼叫它。如果你使 用 connect() 來和遠端機器進行通訊,你不需要關心你的本地埠號(就象 你在使用 telnet 的時候),你只要簡單的呼叫 connect() 就可以了,它會檢 查套接字是否繫結埠,如果沒有,它會自己繫結一個沒有使用的本地端 口。
9.connect()程式
現在我們假設你是個 telnet 程式。你的使用者命令你得到套接字的檔案 描述符。你聽從命令呼叫了socket()。下一步,你的使用者告訴你通過埠 23(標準 telnet 埠)連線到”132.241.5.10”。你該怎麼做呢? 幸運的是,你正在閱讀 connect()–如何連線到遠端主機這一章。你可 不想讓你的使用者失望。
connect() 系統呼叫是這樣的:
#include <sys/types.h>
#include <sys/socket.h>
int connect(int sockfd, struct sockaddr *serv_addr, int addrlen);
sockfd 是系統呼叫 socket() 返回的套接字檔案描述符。serv_addr 是 儲存著目的地埠和 IP 地址的資料結構 struct sockaddr。addrlen 設定 為 sizeof(struct sockaddr)。 想知道得更多嗎?讓我們來看個例子:
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#define DEST_IP "132.241.5.10"
#define DEST_PORT 23
main()
{
int sockfd;
struct sockaddr_in dest_addr; /* 目的地址*/
sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 錯誤檢查 */
dest_addr.sin_family = AF_INET; /* host byte order */
dest_addr.sin_port = htons(DEST_PORT); /* short, network byte order */
dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);
bzero(&(dest_addr.sin_zero),; /* zero the rest of the struct */
/* don't forget to error check the connect()! */
connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));
……
}
再一次,你應該檢查 connect() 的返回值–它在錯誤的時候返回-1,並 設定全域性錯誤變數 errno。 同時,你可能看到,我沒有呼叫 bind()。因為我不在乎本地的埠號。 我只關心我要去哪。核心將為我選擇一個合適的埠號,而我們所連線的 地方也自動地獲得這些資訊。一切都不用擔心。
10.listen()函式
是換換內容的時候了。假如你不希望與遠端的一個地址相連,或者說, 僅僅是將它踢開,那你就需要等待接入請求並且用各種方法處理它們。處理過程分兩步:首先,你聽–listen(),然後,你接受–accept() (請看下面的內容)。
除了要一點解釋外,系統呼叫 listen 也相當簡單。
int listen(int sockfd, int backlog);
sockfd 是呼叫 socket() 返回的套接字檔案描述符。backlog 是在進入 佇列中允許的連線數目。什麼意思呢? 進入的連線是在佇列中一直等待直 到你接受 (accept() 請看下面的文章)連線。它們的數目限制於佇列的允許。 大多數系統的允許數目是20,你也可以設定為5到10。
和別的函式一樣,在發生錯誤的時候返回-1,並設定全域性錯誤變數 errno。
你可能想象到了,在你呼叫 listen() 前你或者要呼叫 bind() 或者讓內 核隨便選擇一個埠。如果你想偵聽進入的連線,那麼系統呼叫的順序可 能是這樣的:
socket();
bind();
listen();
/* accept() 應該在這 */
因為它相當的明瞭,我將在這裡不給出例子了。(在 accept() 那一章的 程式碼將更加完全。)真正麻煩的部分在 accept()。
11.accept()函式
準備好了,系統呼叫 accept() 會有點古怪的地方的!你可以想象發生 這樣的事情:有人從很遠的地方通過一個你在偵聽 (listen()) 的埠連線 (connect()) 到你的機器。它的連線將加入到等待接受 (accept()) 的佇列 中。你呼叫 accept() 告訴它你有空閒的連線。它將返回一個新的套接字文 件描述符!這樣你就有兩個套接字了,原來的一個還在偵聽你的那個埠, 新的在準備傳送 (send()) 和接收 ( recv()) 資料。這就是這個過程!
函式是這樣定義的:
#include <sys/socket.h>
int accept(int sockfd, void *addr, int *addrlen);
sockfd 相當簡單,是和 listen() 中一樣的套接字描述符。addr 是個指 向區域性的資料結構 sockaddr_in 的指標。這是要求接入的資訊所要去的地 方(你可以測定那個地址在那個埠呼叫你)。在它的地址傳遞給 accept 之 前,addrlen 是個區域性的整形變數,設定為 sizeof(struct sockaddr_in)。 accept 將不會將多餘的位元組給 addr。如果你放入的少些,那麼它會通過改 變 addrlen 的值反映出來。
同樣,在錯誤時返回-1,並設定全域性錯誤變數 errno。
現在是你應該熟悉的程式碼片段。
#include <string.h>
#include <sys/socket.h>
#include <sys/types.h>
#define MYPORT 3490 /*使用者接入埠*/
#define BACKLOG 10 /* 多少等待連線控制*/
main()
{
int sockfd, new_fd; /* listen on sock_fd, new connection on new_fd */
struct sockaddr_in my_addr; /* 地址資訊 */
struct sockaddr_in their_addr; /* connector's address information */
int sin_size;
sockfd = socket(AF_INET, SOCK_STREAM, 0); /* 錯誤檢查*/
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */
bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */
/* don't forget your error checking for these calls: */
bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));
listen(sockfd, BACKLOG);
sin_size = sizeof(struct sockaddr_in);
new_fd = accept(sockfd, &their_addr, &sin_size);
……
}
注意,在系統呼叫 send() 和 recv() 中你應該使用新的套接字描述符 new_fd。如果你只想讓一個連線進來,那麼你可以使用 close() 去關閉原 來的檔案描述符 sockfd 來避免同一個埠更多的連線。
12.send() 和 recv()函式
這兩個函式用於流式套接字或者資料報套接字的通訊。如果你喜歡使用無連線的資料報套接字,你應該看一看下面關於sendto() 和 recvfrom() 的章節。
send() 是這樣的:
int send(int sockfd, const void *msg, int len, int flags);
sockfd 是你想傳送資料的套接字描述符(或者是呼叫 socket() 或者是 accept() 返回的。)msg 是指向你想傳送的資料的指標。len 是資料的長度。 把 flags 設定為 0 就可以了。(詳細的資料請看 send() 的 man page)。 這裡是一些可能的例子:
char *msg = "Beej was here!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg, len, 0);
……
send() 返回實際傳送的資料的位元組數–它可能小於你要求傳送的數 目! 注意,有時候你告訴它要傳送一堆資料可是它不能處理成功。它只是 傳送它可能傳送的資料,然後希望你能夠傳送其它的資料。記住,如果 send() 返回的資料和 len 不匹配,你就應該傳送其它的資料。但是這裡也 有個好訊息:如果你要傳送的包很小(小於大約 1K),它可能處理讓資料一 次傳送完。最後要說得就是,它在錯誤的時候返回-1,並設定 errno。
recv() 函式很相似:
int recv(int sockfd, void *buf, int len, unsigned int flags);
sockfd 是要讀的套接字描述符。buf 是要讀的資訊的緩衝。len 是緩 衝的最大長度。flags 可以設定為0。(請參考recv() 的 man page。) recv() 返回實際讀入緩衝的資料的位元組數。或者在錯誤的時候返回-1, 同時設定 errno。
很簡單,不是嗎? 你現在可以在流式套接字上傳送資料和接收資料了。 你現在是 Unix 網路程式設計師了!
13.sendto() 和 recvfrom()函式
“這很不錯啊”,你說,“但是你還沒有講無連線資料報套接字呢?” 沒問題,現在我們開始這個內容。 既然資料報套接字不是連線到遠端主機的,那麼在我們傳送一個包之 前需要什麼資訊呢? 不錯,是目標地址!看看下面的:
int sendto(int sockfd, const void *msg, int len, unsigned int flags,
const struct sockaddr *to, int tolen);
你已經看到了,除了另外的兩個資訊外,其餘的和函式 send() 是一樣 的。 to 是個指向資料結構 struct sockaddr 的指標,它包含了目的地的 IP 地址和埠資訊。tolen 可以簡單地設定為 sizeof(struct sockaddr)。 和函式 send() 類似,sendto() 返回實際傳送的位元組數(它也可能小於 你想要傳送的位元組數!),或者在錯誤的時候返回 -1。
相似的還有函式 recv() 和 recvfrom()。recvfrom() 的定義是這樣的:
int recvfrom(int sockfd, void *buf, int len, unsigned int flags,
struct sockaddr *from, int *fromlen);
又一次,除了兩個增加的引數外,這個函式和 recv() 也是一樣的。from 是一個指向區域性資料結構 struct sockaddr 的指標,它的內容是源機器的 IP 地址和埠資訊。fromlen 是個 int 型的區域性指標,它的初始值為 sizeof(struct sockaddr)。函式呼叫返回後,fromlen 儲存著實際儲存在 from 中的地址的長度。
recvfrom() 返回收到的位元組長度,或者在發生錯誤後返回 -1。
記住,如果你用 connect() 連線一個數據報套接字,你可以簡單的調 用 send() 和 recv() 來滿足你的要求。這個時候依然是資料報套接字,依然使用 UDP,系統套接字介面會為你自動加上了目標和源的資訊。
14.close()和shutdown()函式
你已經整天都在傳送 (send()) 和接收 (recv()) 資料了,現在你準備關閉你的套接字描述符了。這很簡單,你可以使用一般的 Unix 檔案描述符 的 close() 函式:
close(sockfd);
它將防止套接字上更多的資料的讀寫。任何在另一端讀寫套接字的企 圖都將返回錯誤資訊。如果你想在如何關閉套接字上有多一點的控制,你可以使用函式 shutdown()。它允許你將一定方向上的通訊或者雙向的通訊(就象close()一 樣)關閉,你可以使用:
int shutdown(int sockfd, int how);
sockfd 是你想要關閉的套接字檔案描述復。how 的值是下面的其中之 一:
0 – 不允許接受
1 – 不允許傳送
2 – 不允許傳送和接受(和 close() 一樣)
shutdown() 成功時返回 0,失敗時返回 -1(同時設定 errno。) 如果在無連線的資料報套接字中使用shutdown(),那麼只不過是讓 send() 和 recv() 不能使用(記住你在資料報套接字中使用了 connect 後 是可以使用它們的)。
15.getpeername()函式
這個函式太簡單了。它太簡單了,以至我都不想單列一章。但是我還是這樣做了。函式 getpeername() 告訴你在連線的流式套接字上誰在另外一邊。函式是這樣的:
#include <sys/socket.h>
int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);
sockfd 是連線的流式套接字的描述符。addr 是一個指向結構 struct sockaddr (或者是 struct sockaddr_in) 的指標,它儲存著連線的另一邊的 資訊。addrlen 是一個 int 型的指標,它初始化為 sizeof(struct sockaddr)。 函式在錯誤的時候返回 -1,設定相應的 errno。
一旦你獲得它們的地址,你可以使用 inet_ntoa() 或者 gethostbyaddr() 來列印或者獲得更多的資訊。但是你不能得到它的帳號。(如果它執行著愚蠢的守護程序,這是可能的,但是它的討論已經超出了本文的範圍,請參考 RFC-1413 以獲得更多的資訊。)
16.gethostname()函式
甚至比 getpeername() 還簡單的函式是 gethostname()。它返回你程 序所執行的機器的主機名字。然後你可以使用 gethostbyname() 以獲得你 的機器的 IP 地址。
下面是定義:
#include <unistd.h>
int gethostname(char *hostname, size_t size);
引數很簡單:hostname 是一個字元陣列指標,它將在函式返回時儲存 主機名。size是hostname 陣列的位元組長度。
函式呼叫成功時返回 0,失敗時返回 -1,並設定 errno。
17.域名服務(DNS)
如果你不知道 DNS 的意思,那麼我告訴你,它代表域名服務(Domain Name Service)。它主要的功能是:你給它一個容易記憶的某站點的地址, 它給你 IP 地址(然後你就可以使用 bind(), connect(), sendto() 或者其它 函式) 。當一個人輸入:
$ telnet whitehouse.gov
telnet 能知道它將連線 (connect()) 到 “198.137.240.100”。 但是這是如何工作的呢? 你可以呼叫函式 gethostbyname():
#include <netdb.h>
struct hostent *gethostbyname(const char *name);
很明白的是,它返回一個指向 struct hostent 的指標。這個資料結構是這樣的:
struct hostent {
char *h_name;
char **h_aliases;
int h_addrtype;
int h_length;
char **h_addr_list;
};
#define h_addr h_addr_list[0]
這裡是這個資料結構的詳細資料:
h_name – 地址的正式名稱。
h_aliases – 空位元組-地址的預備名稱的指標。
h_addrtype –地址型別; 通常是AF_INET。
h_length – 地址的位元長度。
h_addr_list – 零位元組-主機網路地址指標。網路位元組順序。
h_addr - h_addr_list中的第一地址。
gethostbyname() 成功時返回一個指向結構體 hostent 的指標,或者 是個空 (NULL) 指標。(但是和以前不同,不設定errno,h_errno 設定錯 誤資訊,請看下面的 herror()。) 但是如何使用呢? 有時候(我們可以從電腦手冊中發現),向讀者灌輸 資訊是不夠的。這個函式可不象它看上去那麼難用。
這裡是個例子:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <netdb.h>
#include <sys/types.h>
#include <netinet/in.h>
int main(int argc, char *argv[])
{
struct hostent *h;
if (argc != 2) { /* 檢查命令列 */
fprintf(stderr,"usage: getip address\n");
exit(1);
}
if ((h=gethostbyname(argv[1])) == NULL) { /* 取得地址資訊 */
herror("gethostbyname");
exit(1);
}
printf("Host name : %s\n", h->h_name);
printf("IP Address : %s\n",inet_ntoa(*((struct in_addr *)h->h_addr)));
return 0;
}
在使用 gethostbyname() 的時候,你不能用 perror() 列印錯誤資訊 (因為 errno 沒有使用),你應該呼叫 herror()。
相當簡單,你只是傳遞一個儲存機器名的字串(例如 “whitehouse.gov”) 給 gethostbyname(),然後從返回的資料結構 struct hostent 中獲取資訊。
唯一也許讓人不解的是輸出 IP 地址資訊。h->h_addr 是一個 char *, 但是 inet_ntoa() 需要的是 struct in_addr。因此,我轉換 h->h_addr 成 struct in_addr*,然後得到資料。
18.客戶-伺服器背景知識
這裡是個客戶–伺服器的世界。在網路上的所有東西都是在處理客戶進 程和伺服器程序的交談。舉個telnet 的例子。當你用 telnet (客戶)通過23 號埠登陸到主機,主機上執行的一個程式(一般叫 telnetd,伺服器)啟用。它處理這個連線,顯示登陸介面等等。
注意,客戶–伺服器之間可以使用SOCK_STREAM、SOCK_DGRAM 或者其它(只要它們採用相同的)。一些很好的客戶–伺服器的例子有 telnet/telnetd、 ftp/ftpd 和 bootp/bootpd。每次你使用 ftp 的時候,在遠 端都有一個 ftpd 為你服務。
一般,在服務端只有一個伺服器,它採用 fork() 來處理多個客戶的連 接。基本的程式是:伺服器等待一個連線,接受 (accept()) 連線,然後 fork() 一個子程序處理它。這是下一章我們的例子中會講到的。
19.簡單的伺服器
這個伺服器所做的全部工作是在流式連線上傳送字串 “Hello, World!\n”。你要測試這個程式的話,可以在一臺機器上執行該程式,然後 在另外一機器上登陸:
$ telnet remotehostname 3490
remotehostname 是該程式執行的機器的名字。
伺服器程式碼:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/wait.h>
#define MYPORT 3490 /*定義使用者連線埠*/
#define BACKLOG 10 /*多少等待連線控制*/
main()
{
int sockfd, new_fd; /* listen on sock_fd, new connection on new_fd */
struct sockaddr_in my_addr; /* my address information */
struct sockaddr_in their_addr; /* connector's address information */
int sin_size;
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
perror("socket");
exit(1);
}
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */
bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */
if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1) {
perror("bind");
exit(1);
}
if (listen(sockfd, BACKLOG) == -1) {
perror("listen");
exit(1);
}
while(1) { /* main accept() loop */
sin_size = sizeof(struct sockaddr_in);
if ((new_fd = accept(sockfd, (struct sockaddr *)&their_addr, &sin_size)) == -1) {
perror("accept");
continue;
}
printf("server: got connection from %s\n", \
inet_ntoa(their_addr.sin_addr));
if (!fork()) { /* this is the child process */
if (send(new_fd, "Hello, world!\n", 14, 0) == -1)
perror("send");
close(new_fd);
exit(0);
}
close(new_fd); /* parent doesn't need this */
while(waitpid(-1,NULL,WNOHANG) > 0); /* clean up child processes */
}
}
如果你很挑剔的話,一定不滿意我所有的程式碼都在一個很大的main() 函式中。如果你不喜歡,可以劃分得更細點。
你也可以用我們下一章中的程式得到伺服器端傳送的字串。
20.簡單的客戶端程式
這個程式比伺服器還簡單。這個程式的所有工作是通過 3490 埠連線到命令列中指定的主機,然後得到伺服器傳送的字串。
客戶端程式碼:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/wait.h>
#define PORT 3490 /* 客戶機連線遠端主機的埠 */
#define MAXDATASIZE 100 /* 每次可以接收的最大位元組 */
int main(int argc, char *argv[])
{
int sockfd, numbytes;
char buf[MAXDATASIZE];
struct hostent *he;
struct sockaddr_in their_addr; /* connector's address information */
if (argc != 2) {
fprintf(stderr,"usage: client hostname\n");
exit(1);
}
if ((he=gethostbyname(argv[1])) == NULL) { /* get the host info */
herror("gethostbyname");
exit(1);
}
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
perror("socket");
exit(1);
}
their_addr.sin_family = AF_INET; /* host byte order */
their_addr.sin_port = htons(PORT); /* short, network byte order */
their_addr.sin_addr = *((struct in_addr *)he->h_addr);
bzero(&(their_addr.sin_zero),; /* zero the rest of the struct */
if(connect(sockfd,(struct sockaddr *)&their_addr,sizeof(struct sockaddr)) == -1) {
perror("connect");
exit(1);
}
if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0)) == -1) {
perror("recv");
exit(1);
}
buf[numbytes] = '\0';
printf("Received: %s",buf);
close(sockfd);
return 0;
}
注意,如果你在執行伺服器之前執行客戶程式,connect() 將返回 “Connection refused” 資訊,這非常有用。
21.資料包 Sockets
我不想講更多了,所以我給出程式碼 talker.c 和 listener.c。
listener 在機器上等待在埠 4590 來的資料包。talker 傳送資料包到 一定的機器,它包含使用者在命令列輸入的內容。
這裡就是 listener.c:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/wait.h>
#define MYPORT 4950 /* the port users will be sending to */
#define MAXBUFLEN 100
main()
{
int sockfd;
struct sockaddr_in my_addr; /* my address information */
struct sockaddr_in their_addr; /* connector's address information */
int addr_len, numbytes;
char buf[MAXBUFLEN];
if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) == -1) {
perror("socket");
exit(1);
}
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */
bzero(&(my_addr.sin_zero),; /* zero the rest of the struct */
if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {
perror("bind");
exit(1);
}
addr_len = sizeof(struct sockaddr);
if ((numbytes=recvfrom(sockfd, buf, MAXBUFLEN, 0, \
(struct sockaddr *)&their_addr, &addr_len)) == -1) {
perror("recvfrom");
exit(1);
}
printf("got packet from %s\n",inet_ntoa(their_addr.sin_addr));
printf("packet is %d bytes long\n",numbytes);
buf[numbytes] = '\0';
printf("packet contains \"%s\"\n",buf);
close(sockfd);
}
注意在我們的呼叫 socket(),我們最後使用了 SOCK_DGRAM。同時, 沒有必要去使用 listen() 或者 accept()。我們在使用無連線的資料報套接字!
下面是 talker.c:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/wait.h>
#define MYPORT 4950 /* the port users will be sending to */
int main(int argc, c