1. 程式人生 > >python : 正確複製列表的方法

python : 正確複製列表的方法

Python老鳥都知道以上程式碼是什麼意思。它複製列表old到new。它對於新手來說是種困惑而且應該避免使用這種方法。不幸的是[:]標記法被廣泛使用,可能是Python程式設計師不知道更好的列表複製法吧。

首先我們需要了解Python是如何管理物件和變數。Python沒有C語言中的變數。在C語言中,變數不止是個名字,它是位元組集合並真實存在於記憶體某個位置上。而在Python中,變數僅僅是指向物件的標籤。

看看以下語句:

a = [1, 2, 3]

它表示我們建立了一個指引指向列表[1, 2, 3],但是a不是列表。如果:

b = a

我們並沒有複製a所指引的列表。我們只是建立了一個新的標籤b,然後將其指向a所指向的列表。

如果你修改a,那你就同時修改了b,因為它們指向同一個列表:

複製程式碼

>>> a = [1, 2, 3]
>>> b = a
>>> a.append(4)
>>> print a
[1, 2, 3, 4]
>>> print b
[1, 2, 3, 4]

複製程式碼

內建函式id()可以返回物件的唯一id。該id是物件的記憶體地址。

複製程式碼

>>> id(a)
3086056
>>> id(b)
3086056
>>> c = [] # Create a new list
>>> id(c)
2946712

複製程式碼

可以看出a和b都指向同一個記憶體地址。c指向一個新建的空列表,因此指向了不同的地址。

現在我們要複製a指引的列表。我們必須建立新的列表,然後使用b指引它。

這其實就是 new = old[:]。切片運算子[:]返回一個序列的切片。切片過程是切下列表的一部分,建立新的列表,將切下的部分複製到新列表。

複製程式碼

>>> a[1:3]
[2, 3]
>>> id(a)
3086056
>>> id(a[1:3])
3063400

複製程式碼

省略第一個索引值,切片從列表開始,省略第二個索引值,切片直到列表末端。

>>> a[:3]
[1, 2, 3]
>>> a[1:]
[2, 3, 4]

通過呼叫a[:],我們得到一個從列表首端開始到末端的切片,也就是a(指引的列表)的完整複製。但這不是複製列表的唯一方式。看看下面這個情況:

>>> b = list(a)
>>> id(a)
3086056
>>> id(b)
3086256

這個是不是看起來更好,少一些隱式,更加pythonic?a[:]看起來有點太像Perl。不同於切片標記法,不瞭解Python的人也會明白b是一個列表。

list()是列表建構函式。它會在傳入的數列基礎上新建一個列表。數列不一定是列表,它可以是任何型別的數列。

複製程式碼

>>> my_tuple = (1, 2, 3)
>>> my_list = list(my_tuple)
>>> print my_list
[1, 2, 3]
>>> id(my_tuple)
3084496
>>> id(my_list)
3086336

複製程式碼

而且它還接受生成器。切片筆記法不適用於生成器,因為生成器是不可更改。你不能generator[0],例如:

>>> generator = (x * 3 for x in range(4))
>>> list(generator)
[0, 3, 6, 9]

百分之九十的切片標記法都可以被list()代替。下次你看見[:]的時候試試使用list()替代,這樣可以讓你的程式碼更加可讀。記住,魔鬼藏在細節裡。

附:五種複製方法的比較

複製程式碼

>>> import copy
>>> a = [[10], 20]
>>> b = a[:]
>>> c = list(a)
>>> d = a * 1
>>> e = copy.copy(a)
>>> f = copy.deepcopy(a)
>>> a.append(21)
>>> a[0].append(11)
>>> print id(a), a
30553152 [[10, 11], 20, 21]
>>> print id(b), b
44969816 [[10, 11], 20]
>>> print id(c), c
44855664 [[10, 11], 20]
>>> print id(d), d
44971832 [[10, 11], 20]
>>> print id(e), e
44833088 [[10, 11], 20]
>>> print id(f), f
44834648 [[10], 20]

複製程式碼

從以上可以看出,使用 a[:], list(a), a*1, copy.copy(a)四種方式複製列表結果都可以得到一個新的列表,但是如果列表中含有列表,所有b, c, d, e四個新列表的子列表都是指引到同一個物件上。只有使用copy.deepcopy(a)方法得到的新列表f才是包括子列表在內的完全複製。