1. 程式人生 > >Python之路(十五):網絡編程(上)

Python之路(十五):網絡編程(上)

核心 accept 廣泛 文件系統 類型 操作 兩種 學習 一起

socket編程

  本篇介紹socket是基於什麽來的,為什麽要知道互聯網底層實現通信的原理

一、客戶端/服務端架構

即C/S架構,包括

1.硬件C/S架構(打印機)

2.軟件C/S架構(web服務)

美好的願望:

最常用的軟件服務器是 Web 服務器。一臺機器裏放一些網頁或 Web 應用程序,然後啟動 服務。這樣的服務器的任務就是接受客戶的請求,把網頁發給客戶(如用戶計算機上的瀏覽器),然 後等待下一個客戶請求。這些服務啟動後的目標就是“永遠運行下去”。雖然它們不可能實現這樣的 目標,但只要沒有關機或硬件出錯等外力幹擾,它們就能運行非常長的一段時間。

生活中的C/S架構:

老男孩是S端,所有的學員是C端

飯店是S端,所有的食客是C端

互聯網中處處是C/S架構(黃色網站是服務端,你的瀏覽器是客戶端;騰訊作為服務端為你提供視頻,你得下個騰訊視頻客戶端才能看狗日的視頻)

C/S架構與socket的關系:

我們學習socket就是為了完成C/S架構的開發

二、osi七層

引子:

須知一個完整的計算機系統是由硬件、操作系統、應用軟件三者組成,具備了這三個條件,一臺計算機系統就可以自己跟自己玩了(打個單機遊戲,玩個掃雷啥的)

如果你要跟別人一起玩,那你就需要上網了(訪問個黃色網站,發個黃色微博啥的),互聯網的核心就是由一堆協議組成,協議就是標準,全世界人通信的標準是英語,如果把計算機比作人,互聯網協議就是計算機界的英語。所有的計算機都學會了互聯網協議,那所有的計算機都就可以按照統一的標準去收發信息從而完成通信了。人們按照分工不同把互聯網協議從邏輯上劃分了層級,詳見引自導師的一篇博客

網絡通信原理:http://www.cnblogs.com/linhaifeng/articles/5937962.html

為何學習socket一定要先學習互聯網協議:

1.首先:本節課程的目標就是教會你如何基於socket編程,來開發一款自己的C/S架構軟件

2.其次:C/S架構的軟件(軟件屬於應用層)是基於網絡進行通信的

3.然後:網絡的核心即一堆協議,協議即標準,你想開發一款基於網絡通信的軟件,就必須遵循這些標準。

4.最後:就讓我們從這些標準開始研究,開啟我們的socket編程之旅

技術分享圖片

三、socket層

在上圖中,我們沒有看到Socket的影子,那麽它到底在哪裏呢?還是用圖來說話,一目了然。

技術分享圖片

四、socket的定義

Socket是應用層與TCP/IP協議族通信的中間軟件抽象層,它是一組接口。在設計模式中,Socket其實就是一個門面模式,它把復雜的TCP/IP協議族隱藏在Socket接口後面,對用戶來說,一組簡單的接口就是全部,讓Socket去組織數據,以符合指定的協議。

所以,我們無需深入理解tcp/udp協議,socket已經為我們封裝好了,我們只需要遵循socket的規定去編程,寫出的程序自然就是遵循tcp/udp標準的。

也有人將socket說成ip+port,ip是用來標識互聯網中的一臺主機的位置,而port是用來標識這臺機器上的一個應用程序,ip地址是配置到網卡上的,而port是應用程序開啟的,ip與port的綁定就標識了互聯網中獨一無二的一個應用程序

而程序的pid是是同一臺機器上不同進程或者線程的標識

五、套接字的發展史以及分類

套接字起源於 20 世紀 70 年代加利福尼亞大學伯克利分校版本的 Unix,即人們所說的 BSD Unix。 因此,有時人們也把套接字稱為“伯克利套接字”或“BSD 套接字”。一開始,套接字被設計用在同 一臺主機上多個應用程序之間的通訊。這也被稱進程間通訊,或 IPC。套接字有兩種(或者稱為有兩個種族),分別是基於文件型的和基於網絡型的。

基於文件類型的套接字家族

套接字家族的名字:AF_UNIX

unix一切皆文件,基於文件的套接字調用的就是底層的文件系統來取數據,兩個套接字進程運行在同一機器,可以通過訪問同一個文件系統間接完成通信

基於網絡類型的套接字家族

套接字家族的名字:AF_INET

(還有AF_INET6被用於ipv6,還有一些其他的地址家族,不過,他們要麽是只用於某個平臺,要麽就是已經被廢棄,或者是很少被使用,或者是根本沒有實現,所有地址家族中,AF_INET是使用最廣泛的一個,python支持很多種地址家族,但是由於我們只關心網絡編程,所以大部分時候我們只使用AF_INET)

六、套接字的工作流程

一個生活中的場景。你要打電話給一個朋友,先撥號,朋友聽到電話鈴聲後提起電話,這時你和你的朋友就建立起了連接,就可以講話了。等交流結束,掛斷電話結束此次交談。 生活中的場景就解釋了這工作原理,也許TCP/IP協議族就是誕生於生活中,這也不一定。

技術分享圖片

先從服務器端說起。服務器端先初始化Socket,然後與端口綁定(bind),對端口進行監聽(listen),調用accept阻塞,等待客戶端連接。在這時如果有個客戶端初始化一個Socket,然後連接服務器(connect),如果連接成功,這時客戶端與服務器端的連接就建立了。客戶端發送數據請求,服務器端接收請求並處理請求,然後把回應數據發送給客戶端,客戶端讀取數據,最後關閉連接,一次交互結束

七、socket收發消息的原理

詳情看圖

技術分享圖片

闡釋:發送端可以是一K一K地發送數據,而接收端的應用程序可以兩K兩K地提走數據,當然也有可能一次提走3K或6K數據,或者一次只提走幾個字節的數據,也就是說,應用程序所看到的數據是一個整體,或說是一個流(stream),一條消息有多少字節對應用程序是不可見的,因此TCP協議是面向流的協議,這也是容易出現粘包問題的原因。而UDP是面向消息的協議,每個UDP段都是一條消息,應用程序必須以消息為單位提取數據,不能一次提取任意字節的數據,這一點和TCP是很不同的。怎樣定義消息呢?可以認為對方一次性write/send的數據為一個消息,需要明白的是當對方send一條信息的時候,無論底層怎樣分段分片,TCP協議層會把構成整條消息的數據段排序完成後才呈現在內核緩沖區。

八、小結

上述七點對socket進行了一些簡單的闡釋,對socket有了一些初步的認識,下篇會介紹socket如何運用。

Python之路(十五):網絡編程(上)