1. 程式人生 > 實用技巧 >Python爬蟲技術--基礎篇--面向物件高階程式設計(上)

Python爬蟲技術--基礎篇--面向物件高階程式設計(上)

1.使用__slots__

正常情況下,當我們定義了一個class,建立了一個class的例項後,我們可以給該例項繫結任何屬性和方法,這就是動態語言的靈活性。先定義class:

class Student(object):
    pass

然後,嘗試給例項繫結一個屬性:

>>> s = Student()
>>> s.name = 'Michael' # 動態給例項繫結一個屬性
>>> print(s.name)
Michael

還可以嘗試給例項繫結一個方法:

>>> def set_age(self, age): # 定義一個函式作為例項方法
...     self.age = age
...
>>> from types import MethodType
>>> s.set_age = MethodType(set_age, s) # 給例項繫結一個方法
>>> s.set_age(25) # 呼叫例項方法
>>> s.age # 測試結果
25

但是,給一個例項繫結的方法,對另一個例項是不起作用的:

>>> s2 = Student() # 建立新的例項
>>> s2.set_age(25) # 嘗試呼叫方法
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'Student' object has no attribute 'set_age'

為了給所有例項都繫結方法,可以給class繫結方法:

>>> def set_score(self, score):
...     self.score = score
...
>>> Student.set_score = set_score

給class繫結方法後,所有例項均可呼叫:

>>> s.set_score(100)
>>> s.score
100
>>> s2.set_score(99)
>>> s2.score
99

通常情況下,上面的set_score方法可以直接定義在class中,但動態繫結允許我們在程式執行的過程中動態給class加上功能,這在靜態語言中很難實現。

使用__slots__

但是,如果我們想要限制例項的屬性怎麼辦?比如,只允許對Student例項新增nameage屬性。

為了達到限制的目的,Python允許在定義class的時候,定義一個特殊的__slots__

變數,來限制該class例項能新增的屬性:

class Student(object):
    __slots__ = ('name', 'age') # 用tuple定義允許繫結的屬性名稱

然後,我們試試:

>>> s = Student() # 建立新的例項
>>> s.name = 'Michael' # 繫結屬性'name'
>>> s.age = 25 # 繫結屬性'age'
>>> s.score = 99 # 繫結屬性'score'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'Student' object has no attribute 'score'

由於'score'沒有被放到__slots__中,所以不能繫結score屬性,試圖繫結score將得到AttributeError的錯誤。

使用__slots__要注意,__slots__定義的屬性僅對當前類例項起作用,對繼承的子類是不起作用的

>>> class GraduateStudent(Student):
...     pass
...
>>> g = GraduateStudent()
>>> g.score = 9999

除非在子類中也定義__slots__,這樣,子類例項允許定義的屬性就是自身的__slots__加上父類的__slots__

2.使用@property

在繫結屬性時,如果我們直接把屬性暴露出去,雖然寫起來很簡單,但是,沒辦法檢查引數,導致可以把成績隨便改:

s = Student()
s.score = 9999

這顯然不合邏輯。為了限制score的範圍,可以通過一個set_score()方法來設定成績,再通過一個get_score()來獲取成績,這樣,在set_score()方法裡,就可以檢查引數:

class Student(object):

    def get_score(self):
         return self._score

    def set_score(self, value):
        if not isinstance(value, int):
            raise ValueError('score must be an integer!')
        if value < 0 or value > 100:
            raise ValueError('score must between 0 ~ 100!')
        self._score = value

現在,對任意的Student例項進行操作,就不能隨心所欲地設定score了:

>>> s = Student()
>>> s.set_score(60) # ok!
>>> s.get_score()
60
>>> s.set_score(9999)
Traceback (most recent call last):
  ...
ValueError: score must between 0 ~ 100!

但是,上面的呼叫方法又略顯複雜,沒有直接用屬性這麼直接簡單。

有沒有既能檢查引數,又可以用類似屬性這樣簡單的方式來訪問類的變數呢?對於追求完美的Python程式設計師來說,這是必須要做到的!

還記得裝飾器(decorator)可以給函式動態加上功能嗎?對於類的方法,裝飾器一樣起作用。Python內建的@property裝飾器就是負責把一個方法變成屬性呼叫的

class Student(object):

    @property
    def score(self):
        return self._score

    @score.setter
    def score(self, value):
        if not isinstance(value, int):
            raise ValueError('score must be an integer!')
        if value < 0 or value > 100:
            raise ValueError('score must between 0 ~ 100!')
        self._score = value

@property的實現比較複雜,我們先考察如何使用。把一個getter方法變成屬性,只需要加上@property就可以了,此時,@property本身又建立了另一個裝飾器@score.setter,負責把一個setter方法變成屬性賦值,於是,我們就擁有一個可控的屬性操作:

>>> s = Student()
>>> s.score = 60 # OK,實際轉化為s.set_score(60)
>>> s.score # OK,實際轉化為s.get_score()
60
>>> s.score = 9999
Traceback (most recent call last):
  ...
ValueError: score must between 0 ~ 100!

注意到這個神奇的@property,我們在對例項屬性操作的時候,就知道該屬性很可能不是直接暴露的,而是通過getter和setter方法來實現的。

還可以定義只讀屬性,只定義getter方法,不定義setter方法就是一個只讀屬性:

class Student(object):

    @property
    def birth(self):
        return self._birth

    @birth.setter
    def birth(self, value):
        self._birth = value

    @property
    def age(self):
        return 2015 - self._birth

上面的birth是可讀寫屬性,而age就是一個只讀屬性,因為age可以根據birth和當前時間計算出來。

小結

@property廣泛應用在類的定義中,可以讓呼叫者寫出簡短的程式碼,同時保證對引數進行必要的檢查,這樣,程式執行時就減少了出錯的可能性