Python-深拷貝-淺拷貝-時間消耗
1.深淺拷貝差別實驗
首先直接上結論:
—–我們尋常意義的複製就是深複製,即將被複制物件完全再複製一遍作為獨立的新個體單獨存在。所以改變原有被複制物件不會對已經複製出來的新物件產生影響。
—–而淺複製並不會產生一個獨立的物件單獨存在,他只是將原有的資料塊打上一個新標籤,所以當其中一個標籤被改變的時候,資料塊就會發生變化,另一個標籤也會隨之改變。這就和我們尋常意義上的複製有所不同了。
對於簡單的 object,用 shallow copy 和 deep copy 沒區別(這裡的簡單是指資料裡面不存在存在其他資料結構巢狀)
複雜的 object, 如 list 中套著 list 的情況,shallow copy 中的 子list,並未從原 object 真的「獨立」出來。也就是說,如果改變原 object 的子 list 中的一個元素,你的 copy 就會跟著一起變。這跟我們直覺上對「複製」的理解不同。
# -*-coding:utf-8 -*- import copy a = [1, 2, 3, 4, ['a', 'b']] #原始物件 b = a #賦值,傳物件的引用 c = copy.copy(a) #物件拷貝,淺拷貝 d = copy.deepcopy(a) #物件拷貝,深拷貝 a.append(5) #修改物件a a[4].append('c') #修改物件a中的['a', 'b']陣列物件 print 'a = ', a print 'b = ', b print 'c = ', c print 'd = ', d 輸出結果: a = [1, 2, 3, 4, ['a', 'b', 'c'], 5] b = [1, 2, 3, 4, ['a', 'b', 'c'], 5] c = [1, 2, 3, 4, ['a', 'b', 'c']] d = [1, 2, 3, 4, ['a', 'b']]
2. Python資料儲存
Python 儲存變數的方法跟其他 OOP 語言不同。它與其說是把值賦給變數,不如說是給變數建立了一個到具體值的 reference。
當在 Python 中 a = something 應該理解為給 something 貼上了一個標籤 a。當再賦值給 a 的時候,就好象把 a 這個標籤從原來的 something 上拿下來,貼到其他物件上,建立新的 reference。 這就解釋了一些 Python 中可能遇到的詭異情況。
其實這個現象用指標的淺拷貝和深拷貝理解最直觀,所謂的淺拷貝相當於多個指標指向同一個資源區,一旦資源區被改變,那麼所有指標指向的內容都會發生改變。更危險的是,如果我們釋放了其中一個指標,在進行其他指標的釋放時,就會造成嚴重的記憶體洩漏。
為了避免這種情況,我們自然想到單獨建立一塊記憶體空間,對內容進行完全的複製拷貝。
3. Python 為什麼比C++慢很多
其實,Python的跨平臺效能和執行速度一起來研究就更有意義了。
Python的原始碼首先要被翻譯成位元組碼m.pyc,然後現在Python的虛擬機器上執行生成可供CPU執行的機器碼。
而C++卻不一樣,C++編譯器是直接將原始碼翻譯成機器碼供給CPU執行,自然而言,C++的速度更快。
此外,python是一種動態型別,解釋型語言,它的值都是儲存在分散的物件中,而不是緊密的快取之中。這意味著編譯器在程式執行之前並不知道變數定義的型別。
4.參考資料
《Python從入門到精通》