copy-on-write（寫時拷貝）

阿新 • • 發佈：2022-03-25

寫時拷貝（copy-on-write， COW）

　　就是等到修改資料時才真正分配記憶體空間，這是對程式效能的優化，可以延遲甚至是避免記憶體拷貝，當然目的就是避免不必要的記憶體拷貝。其實我們對寫時拷貝並不陌生，Linux fork和STL string是比較典型的寫時拷貝應用

Linux fork

　　傳統的fork()系統呼叫直接把所有的資源複製給新建立的程序。這種實現過於簡單並且效率低下，因為它拷貝的資料或許可以共享，Linux的fork()使用寫時拷貝(copy-on-write)頁實現。寫時拷貝是一種可以推遲甚至避免拷貝資料的技術。核心此時並不複製整個程序的地址空間，而是讓父子程序共享同一個地址空間。只用在需要寫入的時候才會複製地址空間，從而使各個進行擁有各自的地址空間。也就是說，資源的複製是在需要寫入的時候才會進行，在此之前，只有以只讀方式共享。這種技術使地址空間上的頁的拷貝被推遲到實際發生寫入的時候。
　　在Linux程式中，fork（）會產生一個和父程序完全相同的子程序，但子程序在此後多會exec系統呼叫，出於效率考慮，linux中引入了“寫時複製“技術，也就是隻有程序空間的各段的內容要發生變化時，才會將父程序的內容複製一份給子程序。那麼子程序的物理空間沒有程式碼，怎麼去取指令執行exec系統呼叫呢？
在fork之後exec之前兩個程序用的是相同的物理空間（記憶體區），子程序的程式碼段、資料段、堆疊都是指向父程序的物理空間，也就是說，兩者的虛擬空間不同，但其對應的物理空間是同一個。當父子程序中有更改相應段的行為發生時，再為子程序相應的段分配物理空間，如果不是因為exec，核心會給子程序的資料段、堆疊段分配相應的物理空間（至此兩者有各自的程序空間，互不影響），而程式碼段繼續共享父程序的物理空間（兩者的程式碼完全相同）。而如果是因為exec，由於兩者執行的程式碼不同，子程序的程式碼段也會分配單獨的物理空間。fork之後核心會通過將子程序放在佇列的前面，以讓子程序先執行，以免父程序執行導致寫時複製，而後子程序執行exec系統呼叫，因無意義的複製而造成效率的下降。
　　fork的另一個特性是所有由父程序開啟的描述符都被複制到子程序中。父、子程序中相同編號的檔案描述符在核心中指向同一個file結構體，也就是說，file結構體的引用計數要增加。
　　fork函式用於建立子程序，典型的呼叫一次，返回兩次的函式，其中返回子程序的PID和0，其中呼叫程序返回了子程序的PID，而子程序則返回了0，這是一個比較有意思的函式，但是兩個程序的執行順序是不定的。fork()函式呼叫完成以後父程序的虛擬儲存空間被拷貝給了子程序的虛擬儲存空間，因此也就實現了共享檔案等操作。但是虛擬的儲存空間對映到物理儲存空間的過程中採用了寫時拷貝技術（具體的操作大小是按著頁控制的），該技術主要是將多程序中同樣的物件（資料）在物理儲存其中只有一個物理儲存空間，而當其中的某一個程序試圖對該區域進行寫操作時，核心就會在物理儲存器中開闢一個新的物理頁面,將需要寫的區域內容複製到新的物理頁面中，然後對新的物理頁面進行寫操作。這時就是實現了對不同程序的操作而不會產生影響其他的程序，同時也節省了很多的物理儲存器

STL String

　　string類的實現必然有個char*成員變數，用以存放string的內容，寫時拷貝針對的物件就是這個char*成員變數。通過賦值或拷貝構造類操作，不管派生多少份string“副本”，每個“副本”的char*成員都是指向相同的地址，也就是共享同一塊記憶體，直到某個“副本”執行string寫操作時，才會觸發寫時拷貝，拷貝一份新的記憶體空間出來，然後在新空間上執行寫操作。顯然，那些只讀的“副本”節省了記憶體分配的時間和空間。

　　聽起來有點懵，對於沒了解過寫時拷貝的同學，會感覺完全顛覆平常對string的認知，下面我們來看一下實際例子。

寫時拷貝例子

如上程式碼所示，呼叫拷貝建構函式生成str2，呼叫賦值操作符生成str3，那麼str2與str3是否有分配記憶體空間來儲存內容“abc”呢？

　　執行結果告訴我們，str1、str2與str3是共享記憶體空間的（char*成員指向相同的地址）。那麼問題來了，對str1、str2或str3內容的修改是否會互相影響呢？答案是，只要遵守STL的約定來修改，是會觸發寫時拷貝的，不會互相影響(畢竟平時一直這樣用也沒有問題)。

可以看到，對str1重新複製，修改str3的值，都會觸發寫時拷貝，分配了新的空間。由於str1、str3都分配了新的空間，str2就可以繼續使用原來的空間了。

寫時拷貝原理

　　看了上面的例子，相信大家都已明白寫時拷貝的表象了。但我們不能滿足於現象，還要知道實現原理。應該很多同學都能猜到，string肯定是使用計數器來記錄引用數，當有新的string物件共享記憶體塊時，計數器+1，當有物件觸發寫時拷貝或析構時，計數器-1。

　　那麼計數器存放在哪裡呢？這是物件級別的計數器，由若干個物件共享，string類成員變數、靜態變數或全域性變數都不能滿足要求。最合適的就是在堆裡分配空間專門儲存這個計數器，由第一個建立的物件分配並初始化計數器，其他物件按照約定引用計數器。我們知道string的記憶體空間就在堆上，那麼直接在這塊區上多分配一個空間來儲存計數器是最方便的，所有共享這塊記憶體的string物件都能訪問計數器。事實上STL就是這麼實現的，在string記憶體空間的最前面分配了空間儲存計數器，如下圖所示（圖片摘自引文）：

　　string的所有賦值、拷貝構造操作，計數器都會+1；修改string資料時，先判斷計數器是否為0（0代表沒有其他物件共享記憶體空間），為0則可以直接使用記憶體空間（如例子中的str2），否則觸發寫時拷貝，計數器-1，拷貝一份資料出來修改，並且新的記憶體計數器置0；string物件析構時，如果計數器為0則釋放記憶體空間，否則計數器也要-1。

copy-on-write（寫時拷貝）

寫時拷貝（copy-on-write， COW）　　就是等到修改資料時才真正分配記憶體空間，這是對程式效能的優化，可以延遲甚至是避免記憶體拷貝，當然目的就是避免不必要的記憶體拷貝。其實我們對寫時拷貝並不陌生，Linux

Linux寫時拷貝技術(copy-on-write)

源於網上資料 COW技術初窺：在Linux程式中，fork（）會產生一個和父程序完全相同的子程序，但子程序在此後多會exec系統呼叫，出於效率考慮，linux中引入了“寫時複製“技術，也就是隻有程序空間的各段的

寫時複製(Copy-On-Write)思想在Java中的應用

前言寫時複製（Copy-on-write，簡稱COW）是一種計算機程式設計領域的優化策略。其核心思想是，如果有多個呼叫者同時請求相同資源（如記憶體或磁碟上的資料儲存），他們會共同獲取相同的指標指向相同的資源，直到某

Redis寫時拷貝（COW）總結

雖然我們經常將 Redis 看做一個純記憶體的鍵值儲存系統，但是我們也會用到它的持久化功能，RDB 和 AOF 就是 Redis 為我們提供的兩種持久化工具，其中 RDB 就是 Redis 的資料快照，我們在這篇文章想要分析 Redis 為什

C++寫時拷貝實現原理及例項解析

一、什麼是寫時拷貝寫入時複製是一種計算機程式設計領域的優化策略。其核心思想是，如果有多個呼叫者同時請求相同資源（如記憶體或磁碟上的資料儲存），他們會共同獲取相同的指標指向相同的資源，直到某個呼叫者試圖

MIT 6.S081 Lab5 Copy-On-Write Fork

前言最近絕大多數的空閒時間都拿來錘15-445了，很久沒動6.S081。前幾天回頭看了一下一個月前錘完的Lazy Allocation，自己寫的程式碼幾乎都不認識了.......看來總結之類的東西最好還是趁著熱乎的時候寫啊。

一篇文章教會你用Python爬取淘寶評論資料（寫在記事本）

【一、專案簡介】本文主要目標是採集淘寶的評價，找出客戶所需要的功能。統計客戶評價上面誇哪個功能多，比如防水，容量大，好看等等。

rust漫遊 - 寫時拷貝 Cow<'_, B>

rust漫遊 - 寫時拷貝 Cow<\'_, B> Cow 是一個寫時複製功能的智慧指標，在資料需要修改或者所有權發生變化時使用，多用於讀多寫少的場景。

# C++學習筆記------String寫時拷貝

c/c++中耗時最大的幾個操作：（1）檔案操作（2）記憶體的申請和釋放

Copy on Write實現

xv6中並沒有實現這個部分，我自己實現的COW程式碼沒有儲存，因此借用了別人的程式碼，主要是瞭解實現方法。

[ARC101C] Ribbons on Tree （容斥+DP）

AT4352 [ARC101C] Ribbons on Tree 妙題，如果按照套路子樹 DP 匹配子樹內外的點 \\(O(n^3)\\)

5. Lab: Copy-on-Write Fork for xv6

https://pdos.csail.mit.edu/6.S081/2021/labs/cow.html 1. 要求 Your task is to implement copy-on-write fork in the xv6 kernel. You are done if your modified kernel executes both the cowtest and usert

6.S081-2021-lab5 Copy-on-Write Fork

Copy-on-Write Fork 主要根據hins來一步一步修改。cow的思想是在fork的時候，子程序與父程序共享物理頁，當需要修改頁面內容的時候才會真正分配自己的頁表空間，也就是 lazy allocation

關於Copy-on-write的理解

關於Copy-on-write的理解定義寫入時複製（英語：Copy-on-write，簡稱COW）是一種計算機程式設計領域的優化策略。其核心思想是，如果有多個呼叫者（callers）同時請求相同資源（如記憶體或磁碟上的資料儲存），他們

php進階（二）—php寫時複製

　　在php的記憶體管理中有一個很重要的概念就是寫時複製（Copy on write），話不多說直接來程式碼

淺析Object.assign()基本用法（物件合併、同名屬性覆蓋、僅1個引數時直接返回、target不是物件會轉成物件、源物件位置為非物件時不同的處理規則-字串的特殊情況、拷貝的屬性限制）及需要注意的點（淺拷貝、同名屬性替換、陣列的處理-把索引當屬性替換、取值函式先取值再拷貝）和常見應用（給物件新增屬性、合併多個物件、給屬性設定預設值）

一、基本用法 1、Object.assign方法用於物件的合併，將源物件（source）的所有可列舉屬性，複製到目標物件（target）。

copy-on-write（寫時拷貝）

寫時拷貝（copy-on-write， COW）

Linux fork

STL String

寫時拷貝例子

寫時拷貝原理

copy-on-write（寫時拷貝）

Linux寫時拷貝技術(copy-on-write)

寫時複製(Copy-On-Write)思想在Java中的應用

Redis寫時拷貝（COW）總結

C++寫時拷貝實現原理及例項解析

MIT 6.S081 Lab5 Copy-On-Write Fork

一篇文章教會你用Python爬取淘寶評論資料（寫在記事本）

rust漫遊 - 寫時拷貝 Cow<'_, B>

# C++學習筆記------String寫時拷貝

Copy on Write實現

[ARC101C] Ribbons on Tree （容斥+DP）

5. Lab: Copy-on-Write Fork for xv6

6.S081-2021-lab5 Copy-on-Write Fork

關於Copy-on-write的理解

php進階（二）—php寫時複製

JS 從零手寫一個深拷貝（進階篇）

[譯] Python 的打包現狀（寫於 2019 年）

JS賦值、淺拷貝和深拷貝（陣列和物件的深淺拷貝）例項詳解

mooc機器學習第九天-手寫數字分類例項（MLP,K近鄰）

copy-on-write（寫時拷貝）

寫時拷貝（copy-on-write， COW）

Linux fork

STL String

寫時拷貝例子

寫時拷貝原理

相關推薦