python3 整數型別PyLongObject 和PyObject原始碼分析
python3 整數型別PyLongObject 和PyObject原始碼分析
一 測試環境介紹和準備
測試環境:
作業系統:windows10
Python版本:3.7.0 下載地址
VS版本:vs2015社群版(免費) 下載地址
win10SDK(安裝vs2015是可以選擇,如果沒有安裝則需要獨立安裝)
http://ffmpeg.club/python
二 如何檢視原始碼
1 下載python原始碼
https://www.python.org/ftp/python/3.7.0/Python-3.7.0.tar.xz
http://www.ffmpeg.club/python
下載後解壓縮
使用vs2015或者vs2017開啟
Python-3.7.0\PCbuild\pcbuild.sln 解決方案檔案
開啟pythoncore專案可以找到\include\object.h檔案
三 原始碼分析
python原始碼版本 python3.7.0
在python中所有的型別都可以轉為PyObject型別,單python用的是c語言,並沒有繼承機制,我們可以通過原始碼看它試如何實現的,我們先看PyObject原始碼
1 PyObject 原始碼
typedef struct _object {
_PyObject_HEAD_EXTRA
Py_ssize_t ob_refcnt;
struct _typeobject *ob_type;
} PyObject;
1-1 _PyObject_HEAD_EXTRA 原始碼
我們先看第一個成員是一個巨集 _PyObject_HEAD_EXTRA,這個巨集是如下定義
#ifdef Py_TRACE_REFS
/ Define pointers to support a doubly-linked list of all live heap objects.
#define _PyObject_HEAD_EXTRA \
struct _object _ob_next; \
struct _object _ob_prev;
#define _PyObject_EXTRA_INIT 0, 0,
#else
#define _PyObject_HEAD_EXTRA
#define _PyObject_EXTRA_INIT
#endif
通過程式碼我們可以看出,它根據環境給_PyObject_HEAD_EXTRA設定的值有可能是空的,或者是一個雙向連結串列。通過編譯程式碼我們知道,他在debug版本的python中是用的雙向連結串列,而在release版本中是空。
1-2 Py_ssize_t ob_refcnt 引用計數
Py_ssize_t 型別在32位程式中就是int,在64位win程式中是__int64
引用計數的策略後面我們專門寫文章分析
1-3 struct _typeobject ob_type;
原始碼比較長,就不全部列出來,這個結構體中包含了一個PyObject物件的所有相關操作函式和屬性,比如物件建立和銷燬函式,print物件的序列化函式等,儲存方式都是通過函式指標。所以每種python型別都會對各類操作函式指標做賦值設定。
其中的PyObject_VAR_HEAD巨集內容如下
typedef struct {
PyObject ob_base;
Py_ssize_t ob_size; / Number of items in variable part */
} PyVarObject;
2 PyLongObject 整數物件
digit
struct _longobject {
PyObject_VAR_HEAD
digit ob_digit[1];
};
2-1 小數預處理
對於比較小的數(-5到257 )直接返回初始化好的值,所以說大量的小整數時,不會新增額外的空間
do if (-NSMALLNEGINTS <= ival && ival < NSMALLPOSINTS) { \
return get_small_int((sdigit)ival); \
} while(0)
2-2 按照數字的發小分配空間,以unsigned short為單位
數字少於16位也就是2個位元組的,用一個digit (unsigned short) 存放
數字少於32位也就是4個位元組的,用兩個個digit (unsigned short) 存放
2-3 大數處理
如果是超大數,就用多個位元組存放,由於變數就是一個 unsigned long,先看一下原始碼:
對於不同的系統,大數能表示的範圍不一致,因為數字採用的是unsigned long存放,在不同的系統大小不一致,可以見如下表
其中 windows 64位使用的是 LLP64所以 在window中python數字的最大值也就是4個位元組,如果用它來存放64位指標的地址,就會丟失資料。
在linux(ubuntu16.04 64)使用的是LP64,,所以數字最大值就是8個位元組。
相關視訊可以觀看
http://edu.51cto.com/course/15278.html