網絡編程之進程理論簡介
背景知識:
顧名思義,進程即一個軟件正在進行的過程。進程是對正在運行程序的一個抽象。
進程的概念起源於操作系統,是操作系統最核心的概念,也是操作系統提供的最古老的也是最重要的抽象概念之一。操作系統的其他所有內容都是圍繞進程的概念展開的。所以想要真正了解進程,必須先了解操作系統。詳見博客點擊進入。
須知的理論基礎:
#一 操作系統的作用: 1:隱藏醜陋復雜的硬件接口,提供良好的抽象接口 2:管理、調度進程,並且將多個進程對硬件的競爭變得有序 #二 多道技術: 1.產生背景:針對單核,實現並發 ps: 現在的主機一般是多核,那麽每個核都會利用多道技術,但是核與核之間沒有使用多道技術切換這麽一說; 有4個cpu,運行於cpu1的某個程序遇到io阻塞,會等到io結束再重新調度,會被調度到4個cpu中的任意一個,具體由操作系統調度算法決定。2.時間上的復用(復用一個cpu的時間片)+空間上的復用(如內存中同時有多道程序)
一、什麽是進程
進程:正在進行的一個過程或是一個任務。而負責執行任務的是CPU。
舉例:(單核+多道,實現多個進程的並發):
比如說你就是一個CPU,你下午有幾個活要幹,吃飯,洗衣服,上廁所等。但是就在那一下午要把所有的事幹完(而CPU同一時間只能幹一件事),那麽如何才能讓多個任務實現並發執行的效果呢?那麽,你應該這樣做,你可以先做飯,在等待飯熟的過程中你可以去洗個衣服,洗的差不多飯也就熟了,那麽你在去上個廁所也可以嘛。
二、進程與程序的區別
程序僅僅只是一堆代碼而已,而進程指的是程序的運行過程
需要強調的是:同一程序執行兩次,那也是進程,比如登錄QQ,雖然都是同一個軟件,但是一個可以視頻聊天,一個可以逛空間。
三、並發和並行
並發:單CPU,多進程並發
無論是並行還是並發,在用戶看來都是‘同時‘運行的,不管是進程還是線程,都只是一個任務而已,真實幹活的是cpu,cpu來做這些任務,而一個cpu同一時刻只能執行一個任務
一 並發:是偽並行,即看起來是同時運行。單個cpu+多道技術就可以實現並發,(並行也屬於並發)
1 你是一個cpu,你同時談了三個女朋友,每一個都可以是一個戀愛任務,你被這三個任務共享 2 要玩出並發戀愛的效果, 3 應該是你先跟女友1去看電影,看了一會說:不好,我要拉肚子,然後跑去跟第二個女友吃飯,吃了一會說:那啥,我 4 去趟洗手間,然後跑去跟女友3開了個房
並行:多CPU(同時運行,只有具有多個cpu才能實現並行)
單核下,可以利用多道技術,多個核,每個核也都可以利用多道技術(多道技術是針對單核而言的)
有四個核,六個任務,這樣同一時間有四個任務被執行,假設分別被分配給了cpu1,cpu2,cpu3,cpu4,
一旦任務1遇到I/O就被迫中斷執行,此時任務5就拿到cpu1的時間片去執行,這就是單核下的多道技術
而一旦任務1的I/O結束了,操作系統會重新調用它(需知進程的調度、分配給哪個cpu運行,由操作系統說了算),可能被分配給四個cpu中的任意一個去執行
所有現代計算機經常會在同一時間做很多件事,一個用戶的PC(無論是單cpu還是多cpu),都可以同時運行多個任務(一個任務可以理解為一個進程)。
多道技術:內存中同時存入多道(多個)程序,cpu從一個進程快速切換到另外一個,使每個進程各自運行幾十或幾百毫秒,這樣,雖然在某一個瞬間,一個cpu只能執行一個任務,但在1秒內,cpu卻可以運行多個進程,這就給人產生了並行的錯覺,即偽並發,以此來區分多處理器操作系統的真正硬件並行(多個cpu共享同一個物理內存)
四、同步和異步
同步執行:一個進程在執行某個任務時,另外一個進程必須等待其執行完畢,才能繼續執行
異步執行:一個進程在執行某個任務時,另外一個進程無需等待其執行完畢,就可以繼續執行,當有消息返回時,系統會通知後者進行處理,這樣可以提高執行效率
舉個例子,打電話時就是同步通信,發短息時就是異步通信。
五、進程的創建
但凡是硬件,都需要有操作系統去管理,只要有操作系統,就有進程的概念,就需要有創建進程的方式,一些操作系統只為一個應用程序設計,比如微波爐中的控制器,一旦啟動微波爐,所有的進程都已經存在。
而對於通用系統(跑很多應用程序),需要有系統運行過程中創建或撤銷進程的能力,主要分為4中形式創建新的進程
1. 系統初始化(查看進程linux中用ps命令,windows中用任務管理器,前臺進程負責與用戶交互,後臺運行的進程與用戶無關,運行在後臺並且只在需要時才喚醒的進程,稱為守護進程,如電子郵件、web頁面、新聞、打印)
2. 一個進程在運行過程中開啟了子進程(如nginx開啟多進程,os.fork,subprocess.Popen等)
3. 用戶的交互式請求,而創建一個新進程(如用戶雙擊暴風影音)
4. 一個批處理作業的初始化(只在大型機的批處理系統中應用)
無論哪一種,新進程的創建都是由一個已經存在的進程執行了一個用於創建進程的系統調用而創建的:
1. 在UNIX中該系統調用是:fork,fork會創建一個與父進程一模一樣的副本,二者有相同的存儲映像、同樣的環境字符串和同樣的打開文件(在shell解釋器進程中,執行一個命令就會創建一個子進程)
2. 在windows中該系統調用是:CreateProcess,CreateProcess既處理進程的創建,也負責把正確的程序裝入新進程。
關於創建的子進程,UNIX和windows
1.相同的是:進程創建後,父進程和子進程有各自不同的地址空間(多道技術要求物理層面實現進程之間內存的隔離),任何一個進程的在其地址空間中的修改都不會影響到另外一個進程。
2.不同的是:在UNIX中,子進程的初始地址空間是父進程的一個副本,提示:子進程和父進程是可以有只讀的共享內存區的。但是對於windows系統來說,從一開始父進程與子進程的地址空間就是不同的。
六、進程的終止
1. 正常退出(自願,如用戶點擊交互式頁面的叉號,或程序執行完畢調用發起系統調用正常退出,在linux中用exit,在windows中用ExitProcess)
2. 出錯退出(自願,python a.py中a.py不存在)
3. 嚴重錯誤(非自願,執行非法指令,如引用不存在的內存,1/0等,可以捕捉異常,try...except...)
4. 被其他進程殺死(非自願,如kill -9)
七、進程的層次結構
無論UNIX還是windows,進程只有一個父進程,不同的是:
1. 在UNIX中所有的進程,都是以init進程為根,組成樹形結構。父子進程共同組成一個進程組,這樣,當從鍵盤發出一個信號時,該信號被送給當前與鍵盤相關的進程組中的所有成員。
2. 在windows中,沒有進程層次的概念,所有的進程都是地位相同的,唯一類似於進程層次的暗示,是在創建進程時,父進程得到一個特別的令牌(稱為句柄),該句柄可以用來控制子進程,但是父進程有權把該句柄傳給其他子進程,這樣就沒有層次了。
八、進程的狀態
tail -f access.log |grep ‘404‘
執行程序tail,開啟一個子進程,執行程序grep,開啟另外一個子進程,兩個進程之間基於管道‘|‘通訊,將tail的結果作為grep的輸入。
進程grep在等待輸入(即I/O)時的狀態稱為阻塞,此時grep命令都無法運行
其實在兩種情況下會導致一個進程在邏輯上不能運行,
1. 進程掛起是自身原因,遇到I/O阻塞,便要讓出CPU讓其他進程去執行,這樣保證CPU一直在工作
2. 與進程無關,是操作系統層面,可能會因為一個進程占用時間過多,或者優先級等原因,而調用其他的進程去使用CPU。
因而一個進程由三種狀態
九、進程並發的現象
進程並發的實現在於,硬件中斷一個正在運行的進程,把此時進程運行的所有狀態保存下來,為此,操作系統維護一張表格,即進程表(process table),每個進程占用一個進程表項(這些表項也稱為進程控制塊)
什麽是進程
網絡編程之進程理論簡介