1. 程式人生 > 實用技巧 >Python開發的入門教程(一)-資料型別、變數等

Python開發的入門教程(一)-資料型別、變數等

介紹

Python第一門課程,是Python開發的入門教程,將介紹Python語言的特點和適用範圍,Python基本的資料型別,條件判斷和迴圈,函式,以及Python特有的切片和列表生成式。

Python的資料型別

計算機顧名思義就是可以做數學計算的機器,因此,計算機程式理所當然地可以處理各種數值。但是,計算機能處理的遠不止數值,還可以處理文字、圖形、音訊、視訊、網頁等各種各樣的資料,不同的資料,需要定義不同的資料型別。在Python中,能夠直接處理的資料型別有以下幾種:

  • 整數

Python可以處理任意大小的整數,當然包括負整數,在Python程式中,整數的表示方法和數學上的寫法一模一樣,例如:1,100,-8080,0,等等。
計算機由於使用二進位制,所以,有時候用十六進位制表示整數比較方便,十六進位制用0x字首和0-9,a-f表示,例如:0xff00,0xa5b4c3d2,等等。

  • 浮點數

浮點數也就是小數,之所以稱為浮點數,是因為按照科學記數法表示時,一個浮點數的小數點位置是可變的,比如,1.23x109和12.3x108是相等的。浮點數可以用數學寫法,如1.23,3.14,-9.01,等等。但是對於很大或很小的浮點數,就必須用科學計數法表示,把10用e替代,1.23x10^9就是1.23e9,或者12.3e8,0.000012可以寫成1.2e-5,等等。

整數和浮點數在計算機內部儲存的方式是不同的,整數運算永遠是精確的(除法難道也是精確的?是的!),而浮點數運算則可能會有四捨五入的誤差。

  • 字串

字串是以''或""括起來的任意文字,比如'abc',"xyz"等等。請注意,''或""本身只是一種表示方式,不是字串的一部分,因此,字串'abc'只有a,b,c這3個字元。

  • 布林值

布林值和布林代數的表示完全一致,一個布林值只有True、False兩種值,要麼是True,要麼是False,在Python中,可以直接用True、False表示布林值(請注意大小寫),也可以通過布林運算計算出來。

布林值可以用and、or和not運算。

and運算是與運算,只有所有都為 True,and運算結果才是 True。

or運算是或運算,只要其中有一個為 True,or 運算結果就是 True。

not運算是非運算,它是一個單目運算子,把 True 變成 False,False 變成 True。

  • 空值

空值是Python裡一個特殊的值,用None表示。None不能理解為0,因為0是有意義的,而None是一個特殊的空值。

此外,Python還提供了列表、字典等多種資料型別,還允許建立自定義資料型別,我們後面會繼續講到

Python的註釋

任何時候,我們都可以給程式加上註釋。註釋是用來說明程式碼的,給自己或別人看,而程式執行的時候,Python直譯器會直接忽略掉註釋,所以,有沒有註釋不影響程式的執行結果,但是影響到別人能不能看懂你的程式碼。

Python的註釋以 # 開頭,後面的文字直到行尾都算註釋

# 這一行全部都是註釋...
print 'hello' # 這也是註釋

Python的變數

在Python中,變數的概念基本上和初中代數的方程變數是一致的。
例如,對於方程式 y=xx ,x就是變數。當x=2時,計算結果是4,當x=5時,計算結果是25。
只是在計算機程式中,變數不僅可以是數字,還可以是任意資料型別。在Python程式中,變數是用一個變數名錶示,
變數名必須是大小寫英文、數字和下劃線(_)的組合,且不能用數字開頭*,比如:
a = 1
變數a是一個整數。
t_007 = 'T007'
變數t_007是一個字串。
在Python中,等號=是賦值語句,可以把任意資料型別賦值給變數,同一個變數可以反覆賦值,而且可以是不同型別的變數,例如:

a = 123    # a是整數
print a
a = 'imooc'   # a變為字串
print a

這種變數本身型別不固定的語言稱之為動態語言,與之對應的是靜態語言。
靜態語言在定義變數時必須指定變數型別,如果賦值的時候型別不匹配,就會報錯。例如Java是靜態語言,賦值語句如下(// 表示註釋):

int a = 123; // a是整數型別變數
a = "mooc"; // 錯誤:不能把字串賦給整型變數

和靜態語言相比,動態語言更靈活,就是這個原因。
請不要把賦值語句的等號等同於數學的等號。比如下面的程式碼:

x = 10
x = x + 2

如果從數學上理解x = x+2那無論如何是不成立的,在程式中,賦值語句先計算右側的表示式x + 2,得到結果12,再賦給變數x。由於x之前的值是10,重新賦值後,x的值變成12。
最後,理解變數在計算機記憶體中的表示也非常重要。當我們寫:a = 'ABC'時,Python直譯器幹了兩件事情:

  1. 在記憶體中建立了一個'ABC'的字串;
  2. 在記憶體中建立了一個名為a的變數,並把它指向'ABC'

Python中定義字串

前面我們講解了什麼是字串。字串可以用''或者""括起來表示。
如果字串本身包含'怎麼辦?比如我們要表示字串 I'm OK ,這時,可以用" "括起來表示:

"I'm OK"

類似的,如果字串包含",我們就可以用' '括起來表示:

'Learn "Python" in imooc'

如果字串既包含'又包含"怎麼辦?
這個時候,就需要對字串的某些特殊字元進行“轉義”,Python字串用\進行轉義。
要表示字串 Bob said "I'm OK".
由於 ' 和 " 會引起歧義,因此,我們在它前面插入一個\表示這是一個普通字元,不代表字串的起始,因此,這個字串又可以表示為

'Bob said \"I\'m OK\".'

注意:轉義字元 \ 不計入字串的內容中。
常用的轉義字元還有:

\n 表示換行
\t 表示一個製表符
\\ 表示 \ 字元本身

Python中raw字串與多行字串

如果一個字串包含很多需要轉義的字元,對每一個字元都進行轉義會很麻煩。為了避免這種情況,我們可以在字串前面加個字首 r ,表示這是一個 raw 字串,裡面的字元就不需要轉義了。例如:

r'\(~_~)/ \(~_~)/'

但是r'...'表示法不能表示多行字串,也不能表示包含'和 "的字串(為什麼?)

如果要表示多行字串,可以用'''...'''表示:

'''Line 1
Line 2
Line 3'''

上面這個字串的表示方法和下面的是完全一樣的:

'Line 1\nLine 2\nLine 3'

還可以在多行字串前面新增 r ,把這個多行字串也變成一個raw字串:

r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''

Python中Unicode字串

字串還有一個編碼問題。
因為計算機只能處理數字,如果要處理文字,就必須先把文字轉換為數字才能處理。最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),0 - 255被用來表示大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼,比如大寫字母 A 的編碼是65,小寫字母 z 的編碼是122。
如果要表示中文,顯然一個位元組是不夠的,至少需要兩個位元組,而且還不能和ASCII編碼衝突,所以,中國製定了GB2312編碼,用來把中文編進去。
類似的,日文和韓文等其他語言也有這個問題。為了統一所有文字的編碼,Unicode應運而生。Unicode把所有語言都統一到一套編碼裡,這樣就不會再有亂碼問題了。
Unicode通常用兩個位元組表示一個字元,原有的英文編碼從單位元組變成雙位元組,只需要把高位元組全部填為0就可以。
因為Python的誕生比Unicode標準釋出的時間還要早,所以最早的Python只支援ASCII編碼,普通的字串'ABC'在Python內部都是ASCII編碼的。
Python在後來添加了對Unicode的支援,以Unicode表示的字串用u'...'表示,比如:

print u'中文'
中文

注意: 不加 u ,中文就不能正常顯示。
Unicode字串除了多了一個 u 之外,與普通字串沒啥區別,轉義字元和多行表示法仍然有效:

轉義:

u'中文\n日文\n韓文'

多行:

u'''第一行
第二行'''

raw+多行:

ur'''Python的Unicode字串支援"中文",
"日文",
"韓文"等多種語言'''

如果中文字串在Python環境下遇到 UnicodeDecodeError,這是因為.py檔案儲存的格式有問題。可以在第一行添加註釋

# -*- coding: utf-8 -*-

目的是告訴Python直譯器,用UTF-8編碼讀取原始碼。然後用Notepad++ 另存為... 並選擇UTF-8格式儲存。

Python中整數和浮點數

Python支援對整數和浮點數直接進行四則混合運算,運算規則和數學上的四則運算規則完全一致。

基本的運算:

1 + 2 + 3   # ==> 6
4 * 5 - 6   # ==> 14
7.5 / 8 + 2.1   # ==> 3.0375

使用括號可以提升優先順序,這和數學運算完全一致,注意只能使用小括號,但是括號可以巢狀很多層:

(1 + 2) * 3    # ==> 9
(2.2 + 3.3) / (1.5 * (9 - 0.3))    # ==> 0.42145593869731807

和數學運算不同的地方是,Python的整數運算結果仍然是整數,浮點數運算結果仍然是浮點數:

1 + 2    # ==> 整數 3
1.0 + 2.0    # ==> 浮點數 3.0

但是整數和浮點數混合運算的結果就變成浮點數了:

1 + 2.0    # ==> 浮點數 3.0

為什麼要區分整數運算和浮點數運算呢?這是因為整數運算的結果永遠是精確的,而浮點數運算的結果不一定精確,因為計算機記憶體再大,也無法精確表示出無限迴圈小數,比如 0.1 換成二進位制表示就是無限迴圈小數。
那整數的除法運算遇到除不盡的時候,結果難道不是浮點數嗎?我們來試一下:

11 / 4    # ==> 2

令很多初學者驚訝的是,Python的整數除法,即使除不盡,結果仍然是整數,餘數直接被扔掉。不過,Python提供了一個求餘的運算 % 可以計算餘數:

11 % 4    # ==> 3

如果我們要計算 11 / 4 的精確結果,按照“整數和浮點數混合運算的結果是浮點數”的法則,把兩個數中的一個變成浮點數再運算就沒問題了:

11.0 / 4    # ==> 2.75

Python中布林型別

我們已經瞭解了Python支援布林型別的資料,布林型別只有TrueFalse兩種值,但是布林型別有以下幾種運算:
與運算:只有兩個布林值都為 True 時,計算結果才為 True。

True and True   # ==> True
True and False   # ==> False
False and True   # ==> False
False and False   # ==> False

或運算:只要有一個布林值為 True,計算結果就是 True。

True or True   # ==> True
True or False   # ==> True
False or True   # ==> True
False or False   # ==> False

非運算:把True變為False,或者把False變為True:

not True   # ==> False
not False   # ==> True

布林運算在計算機中用來做條件判斷,根據計算結果為True或者False,計算機可以自動執行不同的後續程式碼。
在Python中,布林型別還可以與其他資料型別做 and、or和not運算,請看下面的程式碼:

a = True
print a and 'a=T' or 'a=F'

計算結果不是布林型別,而是字串 'a=T',這是為什麼呢?
因為Python把0、空字串''和None看成 False,其他數值和非空字串都看成 True,所以:
True and 'a=T' 計算結果是 'a=T'
繼續計算 'a=T' or 'a=F' 計算結果還是 'a=T'
要解釋上述結果,又涉及到 and 和 or 運算的一條重要法則:短路計算。

  1. 在計算 a and b 時,如果 a 是 False,則根據與運演算法則,整個結果必定為 False,因此返回 a;如果 a 是 True,則整個計算結果必定取決與 b,因此返回 b。
  2. 在計算 a or b 時,如果 a 是 True,則根據或運演算法則,整個計算結果必定為 True,因此返回 a;如果 a 是 False,則整個計算結果必定取決於 b,因此返回 b。
    所以Python直譯器在做布林運算時,只要能提前確定計算結果,它就不會往後算了,直接返回結果。