python開發總結
最近在接觸python,感覺python之所以開發效率高,可能有三個因素:
1、語言表達能力強悍。
2、支援很多高階的語言特性。
3、第三方開源庫非常的豐富。
兩本不錯的書:
《Python參考手冊》:對Python各個標準模組,特性介紹的比較詳細。
《Python核心程式設計》:介紹的比較深入,關鍵是,對Python很多高階特性都有介紹。
一個開原始碼:openstack,關於雲端計算的,用Python寫的,可以重點學習一下。
套接字程式設計:
1、 函式的功能基本和c類似,唯一不同的地方在於當發生錯誤時,它不是通過返回值來告知的,而是通過觸發異常,所以udp中的bind, recvfrom, sendto必須要進行捕捉異常。
2、 套接字在垃圾收集的時候也會關閉。
3、 獲取網絡卡的IP:
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
return socket.inet_ntoa(fcntl.ioctl(s.fileno(), 0X8915, struct.pack('256s', ethname[:15]))[20:24])
字串的使用:
1、 字串中刪除一個字串。沒有直接提供這個方法,但是replace可以實現:
"abcdef".replace(" ", "")
同樣的功能還有一個方法:translate。它的原有作用是將字串中的某個字元替換為另外一個字元,注意,不是字串。它的第一個引數是一個轉換表。第二個引數是要刪除的字串。我們可以利用第二個引數del,實現這個功能。同時,第一個引數設定為None。
translate可能更高效一點。另外,它的第二個引數可以使一個字串,含有多個字元,這樣就會刪除多個。
注意:translate方法不會對這個字串操作,而是返回一個新的字串。
2、 strip方法:去除字串兩側的空格,返回新的字串。這個功能非常有用。
3、 str中有一個函式,format,非常強大,有時間一定要看一下。
4、 endswitch:檢查字串是否已某字串結尾。startswith:檢查是否已某字串開頭。
5、 partition:它將字串按指定的字串分為三個部分,返回一個元組。第一個是指定字串前面內容,第二個是指定字串,第三個是指定字串後面的內容。用於字串解析非常好用。
6、 split:將字串按照某指定字串分割成多個子字串,返回一個分割後的列表。
7、 join:將一個字串列表中的各個字串連線起來,中間插入指定的字串。
8、 find的返回值不是false和true,所以不可以直接用於if判斷。需要判斷if s.find(‘’) >= 0:
內建函式:
string.capitalize() |
把字串的第一個字元大寫 |
string.center(width) |
返回一個原字串居中,並使用空格填充至長度 width 的新串 |
string.count(str, beg=0, end=len(string)) |
返回 str 在 string 裡面出現的次數,如果 beg 或者 end 指返回指定範圍內 str 出現的次數 |
string.decode(encoding='UTF-8', errors='strict') |
以 encoding 指定的編碼格式解碼 string,如果出錯預設報ValueError 的異常,除非 errors 指定的是'ignore'或'replace' |
string.encode(encoding='UTF-8', errors='strict') |
以 encoding 指定的編碼格式編碼 string,如果出錯預設報ValueError的異常, 除非errors指定的是'ignore'或者'repl |
string.endswith(obj, beg=0, end=len(string)) |
檢查字串是否以 obj 結束,如果 beg 或者 end 指定則檢定的範圍內是否以 obj 結束, 如果是, 返回True,否則返回Fa |
string.expandtabs(tabsize=8) |
把字串 string 中的 tab 符號轉為空格, 預設格數 tabsize 是 8. |
string.find(str, beg=0, end=len(string)) |
檢測 str 是否包含在 string 中,如果 beg 和 end 指定範則檢查是否包含在指定範圍內,如果是返回開始的索引值,返回-1 |
string.index(str, beg=0, end=len(string)) |
跟find()方法一樣, 只不過如果str不在string中會報一個異 |
string.isalnum() |
a, b, c R如果string至少有一個字元並且所有字元都是字母或數字回 True,否則返回 False |
string.isalpha() |
a, b, c 如果string至少有一個字元並且所有字元都是字母則返回T否則返回 False |
string.isdecimal() |
b, c, d 如果 string 只包含十進位制數字則返回 True 否則返回 False. |
string.isdigit() |
b, c 如果 string 只包含數字則返回 True 否則返回 False. |
string.islower() |
b, c 如果 string 中包含至少一個區分大小寫的字元,並且所有這些(大小寫的)字元都是小寫,則返回 True,否則返回 False |
string.isnumeric() |
b, c, d 如果 string 中只包含數字字元,則返回 True,否則返回 False |
string.isspace() |
b, c 如果 string 中只包含空格,則返回 True,否則返回 False. |
string.istitle() |
b, c 如果 string 是標題化的(見 title())則返回 True,否則返回 False |
string.isupper() |
b, c 如果 string 中包含至少一個區分大小寫的字元, 並且所有這些(區分大小寫的)字元都是大寫,則返回 True,否則返回 False |
string.join(seq) |
Merges (concatenates)以 string 作為分隔符,將 seq 中所有的元素(的字串表示)合併為一個新的字串 |
string.ljust(width) |
返回一個原字串左對齊,並使用空格填充至長度 width 的新字串 |
string.lower() |
轉換 string 中所有大寫字元為小寫. |
string.lstrip() |
截掉 string 左邊的空格 |
string.partition(str) |
e 有點像 find()和 split()的結合體,從 str 出現的第一個位置起,把 字 符 串 string 分 成 一 個 3 元 素 的 元 組 (string_pre_str,str,string_post_str),如果 string 中不包含str 則 string_pre_str == string. |
string.replace(str1, str2, num=string.count(str1)) |
把 string 中的 str1 替換成 str2,如果 num 指定, 則替換不超過 num 次. |
string.rfind(str, beg=0,end=len(string)) |
類似於 find()函式,不過是從右邊開始查詢. |
string.rindex( str, beg=0,end=len(string)) |
類似於 index(), 不過是從右邊開始. |
string.rjust(width) |
返回一個原字串右對齊,並使用空格填充至長度 width 的新字串 |
string.rpartition(str) |
e 類似於 partition()函式,不過是從右邊開始查詢. |
string.rstrip() |
刪除 string 字串末尾的空格. |
string.split(str="", num=string.count(str)) |
以 str 為分隔符切片 string,如果 num有指定值,則僅分隔 num 個子字串 |
string.splitlines(num=string.count('\n')) |
b, c按照行分隔, 返回一個包含各行作為元素的列表, 如果 num 指定則僅切片 num 個行. |
string.startswith(obj, beg=0,end=len(string)) |
b, e檢查字串是否是以 obj 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定範圍內檢查. |
string.strip([obj]) |
在 string 上執行 lstrip()和 rstrip() |
string.swapcase() |
翻轉 string 中的大小寫 |
string.title() |
b, c 返回"標題化"的 string,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle()) |
string.translate(str, del="") |
根據str給出的表(包含256個字元)轉換string的字元,要過濾掉的字元放到 del 引數中 |
string.upper() |
轉換 string 中的小寫字母為大寫 |
string.zfill(width) |
返回長度為 width 的字串,原字串 string 右對齊,前面填充0 |
函式的使用:
1、 函式的作用域:函式中定義一個變數,如果和全域性變數重名,則全域性變數名稱就會被覆蓋,也就是,這裡對這個變數的更改,不會更改全域性變數。但是,如果直接使用的話,是會使用全域性變數的。同時,如果想要修改全域性變數,需要制定是全域性變數:global a
2、 xrange用法和range一樣,不過更為高效,因為他不會在記憶體中建立列表。所以,它只能用於迴圈。
3、 如果函式沒有return語句,則他的返回值為None。
4、 關於函式的入參判斷:如果如此為空,可能會發生異常。當異常發生後,可能會出現一種情況,一個事情做到了一半,就沒有在進行下去,可能會造成記憶體洩露。這個問題如何解決?按照C的方式,每個入參都做判斷是可以解決的,但是這樣太麻煩了。而且看很多開原始碼頁沒有這樣來做。是不是有更好的方法?換一種思路,在呼叫之前確保不為空。在看看開源的程式碼是怎麼做的。特別是openstack。
閉包的使用:
1、 將組成函式的語句和語句的執行環境打包在一起形成的物件,成為閉包。
2、 2.7之前的閉包不支援關鍵字nonlocal。3.0之後才支援。所以2.7前的閉包不可以使用nonlocal。
3、 這樣他就不可以對執行環境中的變數進行更改。
字典的使用:
1、 字典的刪除:直接使用del dict[k]可能會引發異常;首先判斷k是否存在則效率有些低;使用異常使程式結構看起來不好。一個好的方法是pop(k, default v)。這個刪除一個k項,並且返回。如果不存在返回預設的v。如果不加預設值,則會引發異常。
2、 直接使用字典下標獲取字典的值可能會引發一場。使用get方法則不會,如果不存在會返回none。另外,還可以設定不存在的預設值。
3、 通過字典格式化字串:print “value is %(key)s” % kvdict
4、 item方法返回一個列表,列表中的元素是一個元組,第一個是key,第二個是value。比較好用的方法。
5、 iteritem:返回的是一個迭代器。如果想要迭代這個字典,iteritem會比item更高效一點。
6、 iterkeys則返回的是key的迭代器。keys返回的是key的list。
7、 values返回值的列表,itervalues返回的是vlaue的迭代器
8、 popitem會隨機彈出(同時刪除)一個項,則對於想要處理所有的元素,並且刪除所有的元素是有幫助的。但是,如果沒用元素的話,會丟擲異常。
9、 viewitems,viewkeys,viewvalues:這三個函式返回的是一個view物件。這個類似於檢視。分別表示(key, value)pair的列表,key的列表,value的列表。一個優點是,如果字典發生變化,view會同步發生變化。在迭代過程中,字典不允許改變,否則會報異常。
10、
列表的使用:
1、 列表的刪除:不可以在遍歷的過程中刪除連結串列,這樣會得到不可預知的後果。可以使用列表的過濾,來獲得新的列表。
2、 列表的過濾:
def filterFun(node):#這個函式做了兩個事情哎。
node.cycleCount = node.cycleCount -1
return node.cycleCount < 0
timeoutList = filter(filterFun, timerList)
對timerList中的每個節點執行函式filterFun,根據filterFun返回的結果,為真的項組成一個新的列表。
3、 map: kvlist = map(lambda x:x.strip(), kvlist)。同時,map可以接受多個列表,這個時候,函式也會接受多個引數,分別表示列表的每一個元素:
kvlist = map(lambda x,y:x+y, [1,2,3], [4,5,6])
如果函式為None,則相當於函式zip:
zip([1,2,3],[4,5,6])
[(1,4),(2,5),(3,6)]
4、 生成器表示式:l = [node for node in xrange(5) if node - 3 < 0]:這個的這個方法一定程度上可以替代過濾器和map。
生成器表示式定義:
[expr foriter_var in iterable if cond_expr]
l = [2 for x inxrange(5)]#結果是生成一個含有5個2的列表
5、 print(reduce(lambda x,y: x*y, [2 for x in xrange(38)]))
上面的這個語句是計算2的38次方的值。它用到的是二元函式reduce。它第一次呼叫是將第一個和第二個元素做入參,後面用他們的結果做x,新的元素做y,最後返回值。
另外,在獲取一個38個2的列表也可以使用:[2] * 38。這可能更可讀一點。
6、 enumerate:對列表處理,返回的是列表的索引以及節點。
for index, node in enumerate(timerList):
if timerId == node.timerId and timerEvent ==node.timerEvent:
del timerList[index]
7、 列表的分片:[1,2,3,4],l[1:-1]表示從索引從1到倒數第一個,不包含倒數第一個。如果要從某位置到最後,則應該:[1:]
8、 l[i:j:k]:表示切片,從i到j,步長為k。
迭代的使用:
1、 迭代比直接使用列表遍歷效率根據高。比如字典的keys函式返回的列表,以及iterkeys返回的迭代器。
2、 reversed() 內建函式將返回一個反序訪問的迭代器.引數必須為序列。
3、 enumerate:返回一個迭代器:有索引值。
4、 for eachLine in myFile 替換 for eachLine in myFile.readlines() :
5、 注意:在迭代的過程中不可以更改序列,否則會引發問題,導致迭代出錯。
6、 可以自己定義一個類,可以迭代使用。不過需要定義方法:__iter__,next。
7、
生成器的使用:
1、 yield關鍵字可以阻塞住函式的執行,並且儲存當前的執行環境,整個包被稱為生成器。
2、 生成器可以通過呼叫生成器函式來建立。生成器函式是指包含關鍵字yield的函式。
3、 生成器可以通過.next()來執行。每呼叫一次,就執行程式碼,直到遇到yield關鍵字停止,並且返回yield關鍵字後面的表示式的值。
4、 可以通過呼叫send()函式來發送訊息到生成器中。a = yield l:表示將send的入參賦值給a。
5、 throw:允許客戶端傳入要丟擲的任何異常。
6、 和throw相同,只不過是要丟擲一個特定的異常:GeneratorExit。
協程的使用:
1、 協程(coroutine)是一個可以掛起,回覆,並且有多個進入點的函式。
2、
XML的使用:
1、 處理xml訊息包比較好用的模組是xml.etree.ElementTree。
2、 Element執行xml的根節點。
3、 elem.find(path):查詢根節點下面路徑為path的子節點。
4、 elem.findall(path):同樣的子節點可能有多個,這裡會返回一個列表。
5、 elem.findtext(path):獲取指定路徑子節點的內容,這個我們會經常使用。
6、 elem.get(key);獲取屬性的值。
7、 上面如果沒用,則返回none
8、 elem.append:新增自節點。
9、 elem.tag:返回tag值,也就是name。
10、 elem.text:返回內容。
11、 elem.attrib:返回屬性的字典。
12、 SubElement:生成一個節點,自動新增為父節點的子節點。
13、 tostring:轉化為xml文字字串。但是不包括xml頭。如果編碼方式為UTF-8或者GB2312,gb2312都會產生xml頭;如果是utf-8,則不會產生xml頭
14、 fromstring:從字串轉化為ElementTree物件。和XML同樣的功能。
15、 elem.set();設定屬性值
time的使用:
1、 time.sleep()函式函式具有c下sleep函式功能,單位為秒,但是可以接受浮點數。這樣可以表示毫秒。
2、 ti = datetime.datetime.now()可以顯示當前的時間,包括當前的微秒也可以顯示出來。兩個的差值可以表示時間的間隔:microsecondLong = timeLong.seconds *1000000 + timeLong.microseconds。差值的成員是seconds和microseconds
3、
OO的使用:
1、 如果不想讓成員變數或者方法被外部使用(也就是private特性),可以以__雙下劃線開通。
2、 Python也可以實現抽象基類,也就是介面:
3、 __str__屬性可以將物件轉換為字串,也就是呼叫print(object)是會列印的字串。
4、 __call__(魔法方法)可以將物件作為函式來呼叫。給它一個入參就可以。:
def __call__(self, protoVer):
return api.protoModules[protoVer].TimeTicks(
(time.time()-self.birthday)*100
)
5、 物件例項是否可以刪除?
6、 Python參考手冊要好好看一下。
7、 python的static方法使用的是裝飾器語法:@staticmethod.
模組的使用:
1、 如果不想將模組的某些函式和變數被別的模組使用,可以以單下劃線開頭。這樣import *是沒有的,但是使用importmode,然後mode._fun仍然可以呼叫。在class中是以雙下劃線開頭的。
2、
日誌的使用:
1、 日誌的標準模組logging基本可以滿足我的工作。
2、 設定log的初始化工作:
logging.basicConfig(
filename = "test.log",
format = "[%(asctime)s-%(levelname)s] %(message)s[%(filename)s,%(lineno)d]",
level = logging.INFO,
datefmt = "%F %T")
3、 除此之外,一個比較強大的功能就是過濾功能:可以針對級別,檔案,行號等等很多的東西進行過濾。
4、
自省的使用:
1、 type()可以檢視物件的型別。這就是自省。也就是可以看看自己是什麼型別。這個功能在動態語言中非常有用。
2、 getattr函式:這是個非常有用的函式,它可以根據字串,從模組,類,物件例項中獲取屬性和方法的應用並且呼叫。這個功能非常類似於c語言的函式指標,以及c++中的成員函式的指標。
1)從模組中獲取函式和成員
import testfun
tf = getattr(testfun, 'test')
tstr = getattr(testfun, 'str')
2)從類中獲取屬性和方法
class test():
tst = 2
def __init__(self):
self.abc = 1
def method(self):
print('in test.method', self)
def __test(self):
print('in test')
tm = getattr(test, 'method’)#獲取類方法method函式指標。因為沒有例項,所以呼叫必須用下面的方法:
t =test()
tm(t)#申請一個例項,並且作為第一個引數傳進去。
tm = getattr(test, '__test’)#這裡會報錯,也就是無法獲取私有方法。
tabc = getattr(test, 'abc’)#這是錯誤的。無法獲取。
ttst = getattr(test, 'tst’)#這是可以的。。
3)從物件例項中獲取屬性和方法
t =test()
tm = getattr(t, 'method')
tm()#可以這樣呼叫,而不用傳入t例項。
tabc = getattr(test, 'abc’)#可以獲取例項的屬性。
3、 callable:函式表示某個物件是否可以呼叫。它和getattr結合起來,可以獲取一個物件中的所有的method列表:
methods = [methodfor method in dir[object] if callable(getattr(object, method))]
4、 自省也叫放射。
5、 exec(‘code’):可以執行程式碼
配置檔案讀取的使用:
1、 使用模組ConfigParser。例項如下:
conf = ConfigParser()
conf.read("snmp_agent.ini")
print(conf.get("main", "log_level"))
print(conf.getint("main", "ne_agent_port"))
print(conf.get("main", "ne_agent_qip"))
異常的使用:
1、 儘量少用。它會使程式難以理解,而且還會發生不可預知的情況,比如異常的發生使程式的狀態變為一個未知狀態。
2、 可以尋找替代方案。
3、 程式非常重要,不可以停止,可以在主迴圈包裝在異常處理中執行。
4、 打印出異常的資訊,供後面的定位:log.error(traceback.format_exc())
型別系統
1、 型別也是物件。比如:inttype = int,然後,n = inttype(‘256’),這樣可以把字串轉化為int值。
2、 另外,是否可以把字串轉化為關鍵字,或者物件?比如,一個變數,abc,是否可以通過’abc’來引用?
檔案的使用
1、 開啟使用函式open,模式和linux c類似。有一個不同的地方時,可以選擇,直接操作磁碟還是操作記憶體。
2、 readline可以讀取一個檔案的一行。
3、 readlines:返回每一個列的列表。對應writelines。
4、 檔案迭代器:
f = open(‘fliename’)
for line in f:
process(line)
f.close()
或者更簡潔的:
forline in open(filename):
process(line)
資料庫的使用
1、 資料庫中的欄位使用的utf8格式編碼,但是讀取出來卻是問號。這個問題的解決可以通過在查詢的時候指定編碼方式來解決,只要執行sql語句:Query_Execsql(pdb,"SET NAMES 'utf8'");
注意,這個需要在連線後馬上進行。並且,在其他的操作中,會一直使用這種編碼。除非再次更改。
2、
位元組的使用
1、 ord:可以見字元轉化為int型別的值。
2、 chr:ord的方向操作。可以見int型別值轉換為字元。
字元編碼的使用
1、 encode是將Unicode轉化為str,decode是將字串轉化為Unicode。所以,一個字串要轉化為另一種格式可以:
s = ‘中文’
s.decode(fromcodec).encode(tocodec)
也可以直接使用:s.encode(tocodec)。這個時候,相當於預設呼叫了decode,並且使用的是預設的編碼方式。
其他:
1、 指令碼語言的程序名稱顯示為:python ,如果一個伺服器上有多個程序,那麼將不易發現那個程序是哪個程式。可以使用第三方開源的庫來解決這個問題:setproctitle.
from setproctitle import setproctitle,getproctitle
print('當前的程序名:%s' % getproctitle())
setproctitle('proctitle')
print('設定後的的程序名:%s' % getproctitle())
2、 with語法:with open(‘file’, ‘r’) as f:
code
可以是try的另一種形式。
可以執行with操作的型別:
file
decimal.Context
thread.LockType
threading.Lock
threading.RLock
threading.Condition
threading.Semaphore
threading.BoundedSemaphore
3、 產生隨機數:random.randint(100000, 999999)
4、 回撥函式的使用:設定回撥函式的時候,