1. 程式人生 > >對比 C++ 和 Python,談談指標與引用

對比 C++ 和 Python,談談指標與引用

花下貓語:本文是學習群內 櫻雨樓 小姐姐的投稿。之前已釋出過她的一篇作品《當談論迭代器時,我談些什麼?》,大受好評。本文依然是對比 C++ 與 Python,來探討程式語言中極其重要的概念。祝大家讀有所獲,學有所成!

櫻雨樓 | 原創作者

豌豆花下貓 | 編輯潤色

本文原創並首發於公眾號【Python貓】,未經授權,請勿轉載。

原文地址:https://mp.weixin.qq.com/s/k0VNL6uyvBHT7PWdzEPROQ

0 引言

指標(Pointer)是 C、C++ 以及 Java、Go 等語言的一個非常核心且重要的概念,而引用(Reference)是在指標的基礎上構建出的一個同樣重要的概念。

指標對於任何一個程式語言而言都是必須且重要的,雖然 Python 對指標這一概念進行了刻意的模糊與限制,但指標對於 Python 而言依然是一個必須進行深入討論的話題。

本文基於 C++ 與 Python,討論了 Python 中與指標及引用相關的一些行為。

1 什麼是指標?為什麼需要指標?

指標有兩重含義:

(1)指代某種資料型別的指標型別,如整形指標型別、指標指標型別

(2)指代一類存放有記憶體地址的變數,即指標變數

指標的這兩重含義是緊密聯絡的:作為一種變數,通過指標可以獲取某個記憶體地址,從而為訪問此地址上的值做好了準備;作為一種型別,其決定了記憶體地址的正確偏移長度,其應等於當前型別的單位記憶體大小。

如果一個指標缺少指標型別,即 void *,則顯然,其雖然儲存了記憶體地址,但這僅僅是一個起點地址,指標會因為無法獲知從起點向後進行的偏移量,從而拒絕解指標操作;而如果一個指標缺少地址,即 nullptr,則其根本無法讀取特定位置的記憶體。

指標存在的意義主要有以下幾點:

  • 承載通過 malloc、new、allocator 等獲取的動態記憶體
  • 使得 pass-by-pointer 成為可能

pass-by-pointer 的好處包括但不限於:

  • 避免對實參無意義的值拷貝,大幅提高效率
  • 使得對某個變數的修改能力不侷限於變數自身的作用域
  • 使得 swap、移動建構函式、移動賦值運算等操作可以僅針對資料結構內部的指標進行操作,從而避免了對臨時物件、移後源等物件的整體記憶體操作

由此可見,與指標相關的各操作對於程式設計而言都是必須的或十分重要的。

2 C++中的引用

在 C++ 中,引用具有與指標相似的性質,但更加隱形與嚴格。C++ 的引用分為以下兩種:

2.1 左值引用

左值引用於其初始化階段繫結到左值,且不存在重新繫結。

左值引用具有與被繫結左值幾乎一樣的性質,其唯一的區別在於 decltype 宣告:

int numA = 0, &lrefA = numA;  // Binding an lvalue
cout << ++lrefA << endl;      // Use the lvalue reference as lvalue & rvalue
decltype(lrefA) numB = 1;     // Error!

左值引用常用於 pass-by-reference:

void swap(int &numA, int &numB)
{
    int tmpNum = numA;
    numA = numB;
    numB = tmpNum;
}

int main()
{
    int numA = 1, numB = 2;
    swap(numA, numB);
    cout << numA << endl << numB << endl;  // 2 1
}

2.2 右值引用

右值引用於其初始化階段繫結到右值,其常用於移動建構函式和移動賦值操作。在這些場合中,移動建構函式和移動賦值操作通過右值引用接管被移動物件。

右值引用與本文內容無關,故這裡不再詳述。

3 Python中的引用

3.1 Python不存在引用

由上文討論可知,雖然“引用”對於 Python 而言是一個非常常用的術語,但這顯然是不準確的——由於 Python 不存在對左/右值的繫結操作,故不存在左值引用,更不存在右值引用。

3.2 Python的指標操作

不難發現,雖然 Python 沒有引用,但其變數的行為和指標的行為具有高度的相似性,這主要體現在以下方面:

  • 在任何情況下(包括賦值、實參傳遞等)均不存在顯式值拷貝,當此種情況發生時,只增加了一次引用計數
  • 變數可以進行重繫結(對應於一個不含頂層 const(top-level const)的指標)
  • 在某些情況下(下文將對此問題進行詳細討論),可通過函式實參修改原值

由此可見,Python 變數更類似於(某種殘缺的)指標變數,而不是引用變數。

3.2.1 建構函式返回指標

對於 Python 的描述,有一句非常常見的話:“一切皆物件”。

但在這句話中,有一個很重要的事實常常被人們忽略:物件是一個值,不是一個指標或引用。

所以,這句話的準確描述應該更正為:“一切皆(某種殘缺的)指標”。雖然修改後的描述很抽象,但這是更準確的。

而由於物件從建構函式而來,至此我們可知:Python 的建構函式將構造匿名物件,且返回此物件的一個指標。

這是 Python 與指標的第一個重要聯絡。

用程式碼描述,對於Python程式碼:

sampleNum = 0

其不類似於 C++ 程式碼:

int sampleNum = 0;

而更類似於:

int __tmpNum = 0, *sampleNum = &__tmpNum;

// 或者:
shared_ptr<int> sampleNum(new int(0));

3.2.2 __setitems__操作將隱式解指標

Python 與指標的另一個重要聯絡在於 Python 的隱式解指標行為。

雖然 Python 不存在顯式解指標操作,但(有且僅有)__setitems__操作將進行隱式解指標,通過此方法對變數進行修改等同於通過解指標操作修改變數原值。

此種性質意味著:

  1. 任何不涉及__setitems__的操作都將成為指標重繫結。

對於Python程式碼:

numList = [None] * 10

# Rebinding
numList = [None] * 5

其相當於:

int *numList = new int[10];

// Rebinding
delete[] numList;
numList = new int[5];
delete[] numList;

由此可見,對 numList 的非__setitems__操作,導致 numList 被繫結到了一個新指標上。

  1. 任何涉及__setitems__的操作都將成為解指標操作。

由於 Python 對雜湊表的高度依賴,“涉及__setitems__的操作”在 Python 中實際上是一個非常廣泛的行為,這主要包括:

  • 對陣列的索引操作
  • 對雜湊表的查詢操作
  • 涉及__setattr__的操作(由於 Python 將 attribute 儲存在雜湊表中,所以__setattr__操作最終將是某種__setitems__操作)

我們用一個稍複雜的例子說明這一點:

對於以下Python程式碼:

class Complex(object):
    def __init__(self, real = 0., imag = 0.):
        self.real = real
        self.imag = imag

    def __repr__(self):
        return '(%.2f, %.2f)' % (self.real, self.imag)

def main():
    complexObj = Complex(1., 2.)
    complexObj.real += 1
    complexObj.imag += 1
    # (2.00, 3.00)
    print(complexObj)

if __name__ == '__main__':
    main()

其相當於:

class Complex
{
public:
    double real, imag;
    Complex(double _real = 0., double _imag = 0.): real(_real), imag(_imag) {}
};

ostream &operator<<(ostream &os, const Complex &complexObj)
{
    return os << "(" << complexObj.real << ", " << complexObj.imag << ")";
}

int main()
{
    Complex *complexObj = new Complex(1., 2.);
    complexObj->real++;
    complexObj->imag++;
    cout << *complexObj << endl;
    delete complexObj;
    return 0;
}

由此可見,無論是 int、float 這種簡單的 Python 型別,還是我們自定義的類,其構造行為都類似使用 new 構造物件並返回指標。

且在 Python 中任何涉及“.”和“[]”的操作,都類似於對指標的“->”或“*”解指標操作。

4 後記

本文探討了 Python 變數與指標、引用兩大概念之間的關係,主要論證了“Python 不存在引用 ”以及“Python 變數的行為類似於某種殘缺的指標 ”兩個論點。

所有論點均系作者個人觀點,如有錯誤,恭迎指正。

公眾號【Python貓】, 本號連載優質的系列文章,有喵星哲學貓系列、Python進階系列、好書推薦系列、技術寫作、優質英文推薦與翻譯等等,歡迎關注哦