python中整數的快取機制
在python中,如下程式碼結果一定不會讓你吃驚:
Python 3.3.2 (v3.3.2:d047928ae3f6, May 16 2013, 00:06:53) [MSC v.1600 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> a=345
>>> b=a
>>> a is b
True
>>>
沒錯,在python一切皆是物件,而物件是通過引用傳遞的。在賦值時,不管這個物件是新建立的,還是一個已經存在的,都是將該物件的引用賦值給變數。故這裡a實際上和b是同一個物件,a is b為true!
當然稍為了解python的人我相信都會知道以上相關知識的。但是如下的程式碼結果,卻讓人不大好理解了:
>>> c=256
>>> d=256
>>> c is d
True
>>> e=257
>>> f=257
>>> e is f
False
>>>
我們將c賦值為了整型值256,d也為256,e為257,f為257。但是當把c與d,e與f進行is操作時,卻發現兩者的結果不同。
原因在哪?
——這個是由python中的整型物件的緩衝池機制,所決定的。
在python中幾乎所有的內建物件,都會有自己所特有的物件池機制。
1. 小整數物件——小整型物件池
在實際程式設計中,數值比較小的整數,比如1,2,29等,可能會非常頻繁的出現。而在python中,所有的物件都存在與系統堆上。想想?如果某個小整數出現的次數非常多,那麼python將會出現大量的malloc/free操作,這樣大大降低了執行效率,而且會造成大量的記憶體碎片,嚴重影響Python的整體效能。
在python2.5乃至3.3中,將小整數位於[-5,257)之間的數,快取在小整型物件池中。
這也就是為了c is d而e is not f的原因了。
2. 大整數物件——通用整數物件池
由以上知,python把小整型數完全的快取在了小物件快取池中了。而那些大整數物件就沒有那麼好的待遇了!python執行環境提供了一塊記憶體空間供大整數輪流使用。通常稱為通用整數物件池。這也就是說大整數其實也是有快取的。該物件池使用連結串列組織,雖然e和f有著相同的值,但是在連結串列中確是不同的節點。也就是說e和f根本不是一個物件。至於既然有快取,為什麼e和f還要組織為兩個節點,就不大明白了。
講講我的看法吧:我覺得從語義上來講e=257和f=257本身就是應當為兩個不同的物件(這點和物件賦值不同)。由於整數快取池的存在,讓大家覺得任何整數在緩衝池中都只能存在一個,不能重複。但將e和f在整數緩衝池中組織為一個節點或兩個節點沒有什麼本質區別吧(除了浪費了一點記憶體)。本人享有部落格文章的版權,轉載請標明出處http://blog.csdn.net/baidu20008