1. 程式人生 > 程式設計 >Python 字串池化的前提

Python 字串池化的前提

前言

在 Python 中經常通過記憶體池化技術來提高其效能,那麼問題來了,在什麼情況下會池化呢? 讓我們通過幾個例子進行一下理解一下.

預備知識

在檢視例子之前,首先要提 python 中的一個函式 id(),讓我們看一下函式說明:

id(obj,/)
  Return the identity of an object.

  This is guaranteed to be unique among simultaneously existing objects.
  (CPython uses the object \'s memory address.)

通過上述說明,可以得知 id() 將會返回對像的唯一標識,在 CPython 中將會返回記憶體地址,也就是說如果兩個物件 的 id 值一樣,可以說著兩個物件是相同的了.

例子

example 00

a = ""
b = ""
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = ""
>>> b = ""
>>> print(id(a),id(b))
2114853370544 2114853370544
>>> print(a is b)
True

example 01

a = "a"
b = "a"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "a"
>>> b = "a"

>>> print(id(a),id(b))
2114883022608 2114883022608
>>> print(a is b)
True

example 02

a = "magic_string"
b = "magic" + "_" + "string"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "magic_string"
>>> b = "magic" + "_" + "string"
>>> print(id(a),id(b))
2114887161136 2114887161136

>>> print(a is b)
True

example 03

a = "magic!"
b = "mgaic!"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "magic!"
>>> b = "mgaic!"
>>> print(id(a),id(b))
2114885855416 2114889455408
>>> print(a is b)
False

example 04

a,b = "magic!","magic!"
print(id(a),id(b))
print(a is b)

輸出結果:
>>> a,"magic!"
>>> print(id(a),id(b))
2114885691912 2114885691912
>>> print(a is b)
True

example 05

a = "!"
b = "!"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "!"
>>> b = "!"
>>> print(id(a),id(b))
140564571922024 140564571922024
>>> print(a is b)
True

example 06

print(a*20 is 'aaaaaaaaaaaaaaaaaaaa')
print(a*21 is 'aaaaaaaaaaaaaaaaaaaaa')

輸出結果:

>>> print(a*20 is 'aaaaaaaaaaaaaaaaaaaa')
False
>>> print(a*21 is 'aaaaaaaaaaaaaaaaaaaaa')
False

總結

通過上述 7 個例子,我們不難對 python 的字串池化有個大概的認識,我們這裡做個簡單的總結:

  1. 通過 example 00,01,05,我們可以得出對於長度為 0 或者 1 的字串會被池化
  2. 通過 example 02,03,我們可以得出字串中只包含字母數字以及下劃線的字串會被池化
  3. 通過 example 04,我們可以得出當在同一行對不同變數,賦值如果相同的話,它們將會指向同一個物件,注意這裡面的 “magic!” 並不符合池化的要求,這只是一種編譯器的優化
  4. example 06 所出現的現象在 python 中有一個專業的術語,講常量摺疊(constant folding),顧名思義,在編譯優化時,講能夠計算出的結果的變數直接替換為常量.但是這沒有限制嗎?顯然不是的,在我們的例子中已經發現,當長度超過20的時候,摺疊就會失效了,試想一下,如果沒有限制的話,初始化的字串過長,將會嚴重導致效能的下降以及記憶體的消耗

參考連結

The internals of Python string interning

exploring python code objects

Python string interning

Python String objects implementation

以上就是Python 字串池化的前提的詳細內容,更多關於Python 字串池化的資料請關注我們其它相關文章!