9.27
阿新 • • 發佈:2018-09-27
替換 def b- cond clas 去除 位置 txt 方式
(1)
fo = open(‘girl.txt‘,‘r‘,encoding = ‘utf-8‘) #導入文件 girl = fo.read().lower() # 設定全部小寫 fo.close() #關閉文件 print(girl) x = ‘,.:?!_-;‘ #把出現的符號定義成一個字符串 for y in x : girl.replace(y,‘ ‘) #用空格替換字符串中的標點符號以及特殊符號 print(y) stra = girl.split() #split以空格為界限拆分成字符串 print(len(stra),stra) #len(stra) 求列表元素總個數 strb=set(stra) #去掉重復元素變成集合 m = {‘a‘,‘the‘,‘and‘,‘i‘,‘you‘,‘in‘,‘no‘} #定義一個集合,集合內容為虛詞等 strb=strb-m #利用集合特性,去除集合 strb 中的虛詞等詞性的單詞 print(len(strb),strb) strd = {} for word in strb: #進行遍歷,把集合 strb 中的元素放到名為 strd 的空字典中 strd[word] = stra.count(word) print(len(strd),strd) wcList= list(strd.items()) # list 把字典變成元素以元祖形式出現的列表 wcList.sort() #按照默認方式進行排序:英文字母順序 print(wcList)
(2)
a = [‘Tatr‘,‘Bofgj‘,‘Tatr‘,‘李三‘,‘Tatr‘] print(a) a.sort() print(a) b = [85,60,31,76,87] c = dict(zip(a,b)) #連接a,b變為字典 print(c) cList = list(c.items()) # list 把字典變成元素以元祖形式出現的列表 print(cList) def takeSecond(elem): #按照第二位置 x = elem[1] return x cList.sort(key=takeSecond,reverse=True) #進行降序排列 print(cList)
(3)
fo = open(‘zhuzi.txt‘,‘r‘,encoding = ‘utf-8‘) #導入文件 zhuzi = fo.read().lower() # 設定全部小寫 fo.close() #關閉文件 print(zhuzi) import jieba print(list(jieba.cut(zhuzi))) print(list(jieba.cut(zhuzi,cut_all=True))) print(list(jieba.cut_for_search(zhuzi)))
9.27