[6]面向對象編程
[6]面向對象編程
面向對象編程——Object Oriented Programming,簡稱OOP,是一種程序設計思想。OOP把對象作為程序的基本單元,一個對象包含了數據和操作數據的函數。
面向過程的程序設計把計算機程序視為一系列的命令集合,即一組函數的順序執行。為了簡化程序設計,面向過程把函數繼續切分為子函數,即把大塊函數通過切割成小塊函數來降低系統的復雜度。
而面向對象的程序設計把計算機程序視為一組對象的集合,而每個對象都可以接收其他對象發過來的消息,並處理這些消息,計算機程序的執行就是一系列消息在各個對象之間傳遞。
在Python中,所有數據類型都可以視為對象,當然也可以自定義對象。自定義的對象數據類型就是面向對象中的類(Class)的概念。
我們以一個例子來說明面向過程和面向對象在程序流程上的不同之處。
假設我們要處理學生的成績表,為了表示一個學生的成績,面向過程的程序可以用一個dict表示:
std1 = { ‘name‘: ‘Michael‘, ‘score‘: 98 } std2 = { ‘name‘: ‘Bob‘, ‘score‘: 81 }
而處理學生成績可以通過函數實現,比如打印學生的成績:
def print_score(std): print ‘%s: %s‘ % (std[‘name‘], std[‘score‘])
如果采用面向對象的程序設計思想,我們首選思考的不是程序的執行流程,而是Student
name
和score
這兩個屬性(Property)。如果要打印一個學生的成績,首先必須創建出這個學生對應的對象,然後,給對象發一個print_score
消息,讓對象自己把自己的數據打印出來。
class Student(object): def __init__(self, name, score): self.name = name self.score = score def print_score(self): print ‘%s: %s‘ % (self.name, self.score)
給對象發消息實際上就是調用對象對應的關聯函數,我們稱之為對象的方法(Method)。面向對象的程序寫出來就像這樣:
bart = Student(‘Bart Simpson‘, 59) lisa = Student(‘Lisa Simpson‘, 87) bart.print_score() lisa.print_score()
面向對象的設計思想是從自然界中來的,因為在自然界中,類(Class)和實例(Instance)的概念是很自然的。Class是一種抽象概念,比如我們定義的Class——Student,是指學生這個概念,而實例(Instance)則是一個個具體的Student,比如,Bart Simpson和Lisa Simpson是兩個具體的Student:
所以,面向對象的設計思想是抽象出Class,根據Class創建Instance。
面向對象的抽象程度又比函數要高,因為一個Class既包含數據,又包含操作數據的方法。
類和實例
面向對象最重要的概念就是類(Class)和實例(Instance),必須牢記類是抽象的模板,比如Student類,而實例是根據類創建出來的一個個具體的“對象”,每個對象都擁有相同的方法,但各自的數據可能不同。
仍以Student類為例,在Python中,定義類是通過class
關鍵字:
class Student(object): pass
class
後面緊接著是類名,即Student
,類名通常是大寫開頭的單詞,緊接著是(object)
,表示該類是從哪個類繼承下來的,繼承的概念我們後面再講,通常,如果沒有合適的繼承類,就使用object
類,這是所有類最終都會繼承的類。
定義好了Student
類,就可以根據Student
類創建出Student
的實例,創建實例是通過類名+()實現的:
>>> bart = Student() >>> bart <__main__.Student object at 0x10a67a590> >>> Student <class ‘__main__.Student‘>
可以看到,變量bart
指向的就是一個Student的object,後面的0x10a67a590
是內存地址,每個object的地址都不一樣,而Student
本身則是一個類。
可以自由地給一個實例變量綁定屬性,比如,給實例bart
綁定一個name
屬性:
>>> bart.name = ‘Bart Simpson‘ >>> bart.name ‘Bart Simpson‘
由於類可以起到模板的作用,因此,可以在創建實例的時候,把一些我們認為必須綁定的屬性強制填寫進去。通過定義一個特殊的__init__
方法,在創建實例的時候,就把name
,score
等屬性綁上去:
class Student(object): def __init__(self, name, score): self.name = name self.score = score
註意到__init__
方法的第一個參數永遠是self
,表示創建的實例本身,因此,在__init__
方法內部,就可以把各種屬性綁定到self
,因為self
就指向創建的實例本身。
有了__init__
方法,在創建實例的時候,就不能傳入空的參數了,必須傳入與__init__
方法匹配的參數,但self
不需要傳,Python解釋器自己會把實例變量傳進去:
>>> bart = Student(‘Bart Simpson‘, 59) >>> bart.name ‘Bart Simpson‘ >>> bart.score 59
和普通的函數相比,在類中定義的函數只有一點不同,就是第一個參數永遠是實例變量self
,並且,調用時,不用傳遞該參數。除此之外,類的方法和普通函數沒有什麽區別,所以,你仍然可以用默認參數、可變參數和關鍵字參數。
數據封裝
面向對象編程的一個重要特點就是數據封裝。在上面的Student
類中,每個實例就擁有各自的name
和score
這些數據。我們可以通過函數來訪問這些數據,比如打印一個學生的成績:
>>> def print_score(std): ... print ‘%s: %s‘ % (std.name, std.score) ... >>> print_score(bart) Bart Simpson: 59
但是,既然Student
實例本身就擁有這些數據,要訪問這些數據,就沒有必要從外面的函數去訪問,可以直接在Student
類的內部定義訪問數據的函數,這樣,就把“數據”給封裝起來了。這些封裝數據的函數是和Student
類本身是關聯起來的,我們稱之為類的方法:
class Student(object): def __init__(self, name, score): self.name = name self.score = score def print_score(self): print ‘%s: %s‘ % (self.name, self.score)
要定義一個方法,除了第一個參數是self
外,其他和普通函數一樣。要調用一個方法,只需要在實例變量上直接調用,除了self
不用傳遞,其他參數正常傳入:
>>> bart.print_score()
Bart Simpson: 59
這樣一來,我們從外部看Student
類,就只需要知道,創建實例需要給出name
和score
,而如何打印,都是在Student
類的內部定義的,這些數據和邏輯被“封裝”起來了,調用很容易,但卻不用知道內部實現的細節。
封裝的另一個好處是可以給Student
類增加新的方法,比如get_grade
:
class Student(object): ... def get_grade(self): if self.score >= 90: return ‘A‘ elif self.score >= 60: return ‘B‘ else: return ‘C‘
同樣的,get_grade
方法可以直接在實例變量上調用,不需要知道內部實現細節:
>>> bart.get_grade() ‘C‘
類是創建實例的模板,而實例則是一個一個具體的對象,各個實例擁有的數據都互相獨立,互不影響;
方法就是與實例綁定的函數,和普通函數不同,方法可以直接訪問實例的數據;
通過在實例上調用方法,我們就直接操作了對象內部的數據,但無需知道方法內部的實現細節。
和靜態語言不同,Python允許對實例變量綁定任何數據,也就是說,對於兩個實例變量,雖然它們都是同一個類的不同實例,但擁有的變量名稱都可能不同:
>>> bart = Student(‘Bart Simpson‘, 59) >>> lisa = Student(‘Lisa Simpson‘, 87) >>> bart.age = 8 >>> bart.age 8 >>> lisa.age Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: ‘Student‘ object has no attribute ‘age‘
訪問限制
在Class內部,可以有屬性和方法,而外部代碼可以通過直接調用實例變量的方法來操作數據,這樣,就隱藏了內部的復雜邏輯。
但是,從前面Student類的定義來看,外部代碼還是可以自由地修改一個實例的name
、score
屬性:
>>> bart = Student(‘Bart Simpson‘, 98) >>> bart.score 98 >>> bart.score = 59 >>> bart.score 59
如果要讓內部屬性不被外部訪問,可以把屬性的名稱前加上兩個下劃線__
,在Python中,實例的變量名如果以__
開頭,就變成了一個私有變量(private),只有內部可以訪問,外部不能訪問,所以,我們把Student類改一改:
class Student(object): def __init__(self, name, score): self.__name = name self.__score = score def print_score(self): print ‘%s: %s‘ % (self.__name, self.__score)
改完後,對於外部代碼來說,沒什麽變動,但是已經無法從外部訪問實例變量.__name
和實例變量.__score
了:
>>> bart = Student(‘Bart Simpson‘, 98) >>> bart.__name Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: ‘Student‘ object has no attribute ‘__name‘
這樣就確保了外部代碼不能隨意修改對象內部的狀態,這樣通過訪問限制的保護,代碼更加健壯。
但是如果外部代碼要獲取name和score怎麽辦?可以給Student類增加get_name
和get_score
這樣的方法:
class Student(object): ... def get_name(self): return self.__name def get_score(self): return self.__score
如果又要允許外部代碼修改score怎麽辦?可以給Student類增加set_score
方法:
class Student(object): ... def set_score(self, score): self.__score = score
你也許會問,原先那種直接通過bart.score = 59
也可以修改啊,為什麽要定義一個方法大費周折?因為在方法中,可以對參數做檢查,避免傳入無效的參數:
class Student(object): ... def set_score(self, score): if 0 <= score <= 100: self.__score = score else: raise ValueError(‘bad score‘)
需要註意的是,在Python中,變量名類似__xxx__
的,也就是以雙下劃線開頭,並且以雙下劃線結尾的,是特殊變量,特殊變量是可以直接訪問的,不是private變量,所以,不能用__name__
、__score__
這樣的變量名。
有些時候,你會看到以一個下劃線開頭的實例變量名,比如_name
,這樣的實例變量外部是可以訪問的,但是,按照約定俗成的規定,當你看到這樣的變量時,意思就是,“雖然我可以被訪問,但是,請把我視為私有變量,不要隨意訪問”。
繼承和多態
在OOP程序設計中,當我們定義一個class的時候,可以從某個現有的class繼承,新的class稱為子類(Subclass),而被繼承的class稱為基類、父類或超類(Base class、Super class)。
比如,我們已經編寫了一個名為Animal
的class,有一個run()
方法可以直接打印:
class Animal(object): def run(self): print ‘Animal is running...‘
當我們需要編寫Dog和Cat類時,就可以直接從Animal類繼承:
class Dog(Animal): pass class Cat(Animal): pass
對於Dog來說,Animal就是它的父類,對於Animal來說,Dog就是它的子類。Cat和Dog類似。
繼承有什麽好處?最大的好處是子類獲得了父類的全部功能。由於Animial實現了run()
方法,因此,Dog和Cat作為它的子類,什麽事也沒幹,就自動擁有了run()
方法:
dog = Dog() dog.run() cat = Cat() cat.run()
運行結果如下:
Animal is running... Animal is running...
當然,也可以對子類增加一些方法,比如Dog類:
class Dog(Animal): def run(self): print ‘Dog is running...‘ def eat(self): print ‘Eating meat...‘
繼承的第二個好處需要我們對代碼做一點改進。你看到了,無論是Dog還是Cat,它們run()
的時候,顯示的都是Animal is running...
,符合邏輯的做法是分別顯示Dog is running...
和Cat is running...
,因此,對Dog和Cat類改進如下:
class Dog(Animal): def run(self): print ‘Dog is running...‘ class Cat(Animal): def run(self): print ‘Cat is running...‘
再次運行,結果如下:
Dog is running... Cat is running...
當子類和父類都存在相同的run()
方法時,我們說,子類的run()
覆蓋了父類的run()
,在代碼運行的時候,總是會調用子類的run()
。這樣,我們就獲得了繼承的另一個好處:多態。
要理解什麽是多態,我們首先要對數據類型再作一點說明。當我們定義一個class的時候,我們實際上就定義了一種數據類型。我們定義的數據類型和Python自帶的數據類型,比如str、list、dict沒什麽兩樣:
a = list() # a是list類型 b = Animal() # b是Animal類型 c = Dog() # c是Dog類型
判斷一個變量是否是某個類型可以用isinstance()
判斷:
>>> isinstance(a, list) True >>> isinstance(b, Animal) True >>> isinstance(c, Dog) True
看來a、b、c確實對應著list、Animal、Dog這3種類型。
但是等等,試試:
>>> isinstance(c, Animal)
True
看來c不僅僅是Dog,c還是Animal!
不過仔細想想,這是有道理的,因為Dog是從Animal繼承下來的,當我們創建了一個Dog的實例c
時,我們認為c
的數據類型是Dog沒錯,但c
同時也是Animal也沒錯,Dog本來就是Animal的一種!
所以,在繼承關系中,如果一個實例的數據類型是某個子類,那它的數據類型也可以被看做是父類。但是,反過來就不行:
>>> b = Animal() >>> isinstance(b, Dog) False
Dog可以看成Animal,但Animal不可以看成Dog。
要理解多態的好處,我們還需要再編寫一個函數,這個函數接受一個Animal類型的變量:
def run_twice(animal): animal.run() animal.run()
當我們傳入Animal的實例時,run_twice()
就打印出:
>>> run_twice(Animal()) Animal is running... Animal is running...
當我們傳入Dog的實例時,run_twice()就打印出: >>> run_twice(Dog()) Dog is running... Dog is running... 當我們傳入Cat的實例時,run_twice()就打印出: >>> run_twice(Cat()) Cat is running... Cat is running...
看上去沒啥意思,但是仔細想想,現在,如果我們再定義一個Tortoise類型,也從Animal派生:
class Tortoise(Animal): def run(self): print ‘Tortoise is running slowly...‘
當我們調用run_twice()時,傳入Tortoise的實例:
>>> run_twice(Tortoise()) Tortoise is running slowly... Tortoise is running slowly...
你會發現,新增一個Animal的子類,不必對run_twice()做任何修改,實際上,任何依賴Animal作為參數的函數或者方法都可以不加修改地正常運行,原因就在於多態。
多態的好處就是,當我們需要傳入Dog、Cat、Tortoise……時,我們只需要接收Animal類型就可以了,因為Dog、Cat、Tortoise……都是Animal類型,然後,按照Animal類型進行操作即可。由於Animal類型有run()
方法,因此,傳入的任意類型,只要是Animal類或者子類,就會自動調用實際類型的run()
方法,這就是多態的意思:
對於一個變量,我們只需要知道它是Animal類型,無需確切地知道它的子類型,就可以放心地調用run()
方法,而具體調用的run()
方法是作用在Animal、Dog、Cat還是Tortoise對象上,由運行時該對象的確切類型決定,這就是多態真正的威力:調用方只管調用,不管細節,而當我們新增一種Animal的子類時,只要確保run()
方法編寫正確,不用管原來的代碼是如何調用的。這就是著名的“開閉”原則:
對擴展開放:允許新增Animal子類;
對修改封閉:不需要修改依賴Animal類型的run_twice()
等函數。
繼承還可以一級一級地繼承下來,就好比從爺爺到爸爸、再到兒子這樣的關系。而任何類,最終都可以追溯到根類object,這些繼承關系看上去就像一顆倒著的樹。比如如下的繼承樹:
繼承可以把父類的所有功能都直接拿過來,這樣就不必重零做起,子類只需要新增自己特有的方法,也可以把父類不適合的方法覆蓋重寫;
有了繼承,才能有多態。在調用類實例方法的時候,盡量把變量視作父類類型,這樣,所有子類類型都可以正常被接收;
獲取對象信息
當我們拿到一個對象的引用時,如何知道這個對象是什麽類型、有哪些方法呢?
使用type()
首先,我們來判斷對象類型,使用type()
函數:
基本類型都可以用type()
判斷:
>>> type(123) <type ‘int‘> >>> type(‘str‘) <type ‘str‘> >>> type(None) <type ‘NoneType‘>
如果一個變量指向函數或者類,也可以用type()
判斷:
>>> type(abs) <type ‘builtin_function_or_method‘> >>> type(a) <class ‘__main__.Animal‘>
但是type()
函數返回的是什麽類型呢?它返回type類型。如果我們要在if
語句中判斷,就需要比較兩個變量的type類型是否相同:
>>> type(123)==type(456) True >>> type(‘abc‘)==type(‘123‘) True >>> type(‘abc‘)==type(123) False
但是這種寫法太麻煩,Python把每種type類型都定義好了常量,放在types
模塊裏,使用之前,需要先導入:
>>> import types >>> type(‘abc‘)==types.StringType True >>> type(u‘abc‘)==types.UnicodeType True >>> type([])==types.ListType True >>> type(str)==types.TypeType True
最後註意到有一種類型就叫TypeType
,所有類型本身的類型就是TypeType
,比如:
>>> type(int)==type(str)==types.TypeType
True
使用isinstance()
對於class的繼承關系來說,使用type()就很不方便。我們要判斷class的類型,可以使用isinstance()
函數。
我們回顧上次的例子,如果繼承關系是:
object -> Animal -> Dog -> Husky
那麽,isinstance()
就可以告訴我們,一個對象是否是某種類型。先創建3種類型的對象:
>>> a = Animal() >>> d = Dog() >>> h = Husky()
然後,判斷:
>>> isinstance(h, Husky)
True
沒有問題,因為h
變量指向的就是Husky對象。
再判斷:
>>> isinstance(h, Dog)
True
h
雖然自身是Husky類型,但由於Husky是從Dog繼承下來的,所以,h
也還是Dog類型。換句話說,isinstance()
判斷的是一個對象是否是該類型本身,或者位於該類型的父繼承鏈上。
因此,我們可以確信,h
還是Animal類型:
>>> isinstance(h, Animal)
True
同理,實際類型是Dog的d
也是Animal類型:
>>> isinstance(d, Dog) and isinstance(d, Animal) True
但是,d
不是Husky類型:
>>> isinstance(d, Husky)
False
能用type()
判斷的基本類型也可以用isinstance()
判斷:
>>> isinstance(‘a‘, str) True >>> isinstance(u‘a‘, unicode) True >>> isinstance(‘a‘, unicode) False
並且還可以判斷一個變量是否是某些類型中的一種,比如下面的代碼就可以判斷是否是str或者unicode:
>>> isinstance(‘a‘, (str, unicode)) True >>> isinstance(u‘a‘, (str, unicode)) True
由於str
和unicode
都是從basestring
繼承下來的,所以,還可以把上面的代碼簡化為:
>>> isinstance(u‘a‘, basestring) True
使用dir()
>>> dir(‘ABC‘) [‘__add__‘, ‘__class__‘, ‘__contains__‘, ‘__delattr__‘, ‘__doc__‘, ‘__eq__‘, ‘__format__‘, ‘__ge__‘, ‘__getattribute__‘, ‘__getitem__‘, ‘__getnewargs__‘, ‘__getslice__‘, ‘__gt__‘, ‘__hash__‘, ‘__init__‘, ‘__le__‘, ‘__len__‘, ‘__lt__‘, ‘__mod__‘, ‘__mul__‘, ‘__ne__‘, ‘__new__‘, ‘__reduce__‘, ‘__reduce_ex__‘, ‘__repr__‘, ‘__rmod__‘, ‘__rmul__‘, ‘__setattr__‘, ‘__sizeof__‘, ‘__str__‘, ‘__subclasshook__‘, ‘_formatter_field_name_split‘, ‘_formatter_parser‘, ‘capitalize‘, ‘center‘, ‘count‘, ‘decode‘, ‘encode‘, ‘endswith‘, ‘expandtabs‘, ‘find‘, ‘format‘, ‘index‘, ‘isalnum‘, ‘isalpha‘, ‘isdigit‘, ‘islower‘, ‘isspace‘, ‘istitle‘, ‘isupper‘, ‘join‘, ‘ljust‘, ‘lower‘, ‘lstrip‘, ‘partition‘, ‘replace‘, ‘rfind‘, ‘rindex‘, ‘rjust‘, ‘rpartition‘, ‘rsplit‘, ‘rstrip‘, ‘split‘, ‘splitlines‘, ‘startswith‘, ‘strip‘, ‘swapcase‘, ‘title‘, ‘translate‘, ‘upper‘, ‘zfill‘]
類似__xxx__
的屬性和方法在Python中都是有特殊用途的,比如__len__
方法返回長度。在Python中,如果你調用len()
函數試圖獲取一個對象的長度,實際上,在len()
函數內部,它自動去調用該對象的__len__()
方法,所以,下面的代碼是等價的:
>>> len(‘ABC‘) 3 >>> ‘ABC‘.__len__() 3
我們自己寫的類,如果也想用len(myObj)
的話,就自己寫一個__len__()
方法:
>>> class MyObject(object): ... def __len__(self): ... return 100 ... >>> obj = MyObject() >>> len(obj) 100
剩下的都是普通屬性或方法,比如lower()
返回小寫的字符串:
>>> ‘ABC‘.lower() ‘abc‘
僅僅把屬性和方法列出來是不夠的,配合getattr()
、setattr()
以及hasattr()
,我們可以直接操作一個對象的狀態:
>>> class MyObject(object): ... def __init__(self): ... self.x = 9 ... def power(self): ... return self.x * self.x ... >>> obj = MyObject()
緊接著,可以測試該對象的屬性:
>>> hasattr(obj, ‘x‘) # 有屬性‘x‘嗎? True >>> obj.x 9 >>> hasattr(obj, ‘y‘) # 有屬性‘y‘嗎? False >>> setattr(obj, ‘y‘, 19) # 設置一個屬性‘y‘ >>> hasattr(obj, ‘y‘) # 有屬性‘y‘嗎? True >>> getattr(obj, ‘y‘) # 獲取屬性‘y‘ 19 >>> obj.y # 獲取屬性‘y‘ 19
如果試圖獲取不存在的屬性,會拋出AttributeError的錯誤:
>>> getattr(obj, ‘z‘) # 獲取屬性‘z‘ Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: ‘MyObject‘ object has no attribute ‘z‘
可以傳入一個default參數,如果屬性不存在,就返回默認值:
>>> getattr(obj, ‘z‘, 404) # 獲取屬性‘z‘,如果不存在,返回默認值404
404
也可以獲得對象的方法:
>>> hasattr(obj, ‘power‘) # 有屬性‘power‘嗎?
True
>>> getattr(obj, ‘power‘) # 獲取屬性‘power‘
<bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0>>
>>> fn = getattr(obj, ‘power‘) # 獲取屬性‘power‘並賦值到變量fn
>>> fn # fn指向obj.power
<bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0>>
>>> fn() # 調用fn()與調用obj.power()是一樣的
81
[6]面向對象編程