完整的英文詞頻統計

阿新 • • 發佈：2018-09-27

code 空格存儲 for src res inf 分享圖片次數

1.準備utf-8編碼的文本文件file

2.通過文件讀取字符串 str

3.對文本進行預處理

4.分解提取單詞 list

5.單詞計數字典 set , dict

6.按詞頻排序 list.sort(key=)

7.排除語法型詞匯，代詞、冠詞、連詞等無語義詞

8.輸出TOP(20)

代碼：

#讀取fire文本文件
f = open(‘fire.txt‘,‘r‘,encoding=‘utf-8‘)
fire = f.read()
f.close()
print(fire)
#預處理
print(fire.lower())  #全部字母小寫
a = ",.;:‘`"   #特殊符號歸集為字符串
for 
 b in a:
    fire.replace(b,‘ ‘)   #利用for循環語句把特殊符號替換成空格
    print(fire)

#分別從空格提取單詞
firelist = fire.split()
print(firelist)

#統計每個單詞出現的次數
fireset = set(firelist)  #把列表firelist轉換成集合，使得單詞不會重復出現
#排除語法型詞匯，代詞、冠詞、連詞等無語義詞
se = {‘a‘,‘the‘,‘and‘,‘we‘,‘you‘,‘of‘}
fireset =fireset-se
firedict = {}  #創建一個空字典，用於存儲 

# #遍歷fireset集合，放入單詞為鍵，統計的次數為值的strdict字典
for word in fireset:
    firedict[word] = firelist.count(word)
print(len(firedict),firedict)
wordlist = list(firedict.items())
#按單詞的頻數排序
wordlist.sort(key=lambda x:x[1],reverse=True)
print(wordlist)
#輸出TOP(20)
for i in range(20):
    print(wordlist[i])

運行結果：

技術分享圖片

完整的英文詞頻統計

文件方式實現完整的英文詞頻統計實例

() item .com div lambda 英文 [1] 完整 set fo=open(‘123.txt‘,‘r‘) a=fo.read() a=a.lower() #小寫 for i in ‘,.‘: a=a.replace(i,‘ ‘) #替換標點符

完整的英文詞頻統計

code 空格存儲 for src res inf 分享圖片次數 1.準備utf-8編碼的文本文件file 2.通過文件讀取字符串 str 3.對文本進行預處理 4.分解提取單詞 list 5.單詞計數字典 set , dict 6.按詞頻排序 list.sort(ke

組合數據類型練習，英文詞頻統計實例

news forever .com 分隔 ima hat http war nis 實例：由字符串創建一個作業評分列表，做增刪改查詢統計遍歷操作。例如，查詢第一個3分的下標統計1分的同學有多少個，3分的同學有多少個 >>> ap=list("02

英文詞頻統計預備，組合數據類型練習

life ril 對象 1-1 com please moment ppi hat 1.實例: 下載一首英文的歌詞或文章，將所有,.？！等替換為空格，將所有大寫轉換為小寫，統計某幾個單詞出現的次數，分隔出一個一個的單詞。 lyrics=‘‘‘Waking up I see

組合數據類型和英文詞頻統計實例

think laughing clas self why rms day index oom 1.列表實例：由字符串創建一個作業評分列表，做增刪改查詢統計遍歷操作。例如，查詢第一個3分的下標，統計1分的同學有多少個，3分的同學有多少個等。 >>> ls

組合數據類型練習，英文詞頻統計實例上

元組 one lam 主鍵必須分析字符串 logs with spa 1/字典實例：建立學生學號成績字典，做增刪改查遍歷操作。 d={‘10‘:80,‘11‘:87,‘13‘:76,‘13‘:50,‘14‘:89,‘15‘:96,‘16‘:89,‘17‘:100}

英文詞頻統計

top 自己的 phi rust dom 分享 operation color reason str=‘‘‘In his speech at the closing session of this year‘s National People‘s Congress, Ch

綜合練習：英文詞頻統計

ldr one Go 處理 AC 空格 sorted 意義 spl 詞頻統計預處理下載一首英文的歌詞或文章將所有,.？！’:等分隔符全部替換為空格將所有大寫轉換為小寫生成單詞列表生成詞頻統計排序排除語法型詞匯，代詞、冠詞、連詞輸出詞頻最大TOP10 s

組合數據類型，英文詞頻統計

for meet cap pro 字典適合操作技術分享 capital 列表，元組，字典，集合的聯系與區別：1，列表的增刪改查的時間消耗隨著元素的增加而增加，當元素大的時候比較浪費時間3、元組只能查，不能增刪改，可以保證數據的安全性，因為可操作性較低，資源占用

python實現讀取檔案英文詞頻統計並寫入到檔案

# _*_ coding: utf-8 _*_ # 作者：dcjmessi import os from collections import Counter # 假設要讀取檔名為read，位於當前路徑 filename = 'read.txt' # 當前程

字符串操作，英文詞頻統計預處理

contex row 惠州市新興 odi ESS 性別南山區 ddr str="""440000 廣東省 440100 　　廣州市440103 　　荔灣區440104 　　越秀區440105 　　海珠區440106 　　天河區440111 　　白雲區4401

字符串、文件操作，英文詞頻統計預處理

ima post 本體預處理 eight 固定密鑰圖片行政區 1.字符串操作：解析身份證號：生日、性別、出生地等。　地址碼：表示編碼對象常住戶口所在縣(市、旗、區)的行政區劃代碼。　　出生日期碼：表示編碼對象出生的年、月、日，年、月、

Python——字符串、文件操作，英文詞頻統計預處理

string 加密和解密 com 模塊 put 圖片查詢 url 偏移一.字符串操作：解析身份證號：生日、性別、出生地等。凱撒密碼編碼與解碼網址觀察與批量生成 2.凱撒密碼編碼與解碼　　凱撒加密法的替換方法

字符串操作、文件操作，英文詞頻統計預處理

ews 行政區劃 format bcd ignore hat 密碼 clas 串操作 1.字符串操作：解析身份證號：生日、性別、出生地等。凱撒密碼編碼與解碼網址觀察與批量生成（1）解析身份證號： ID = input(‘請輸入十八位身份證號碼

復合數據類型，英文詞頻統計

odin move 不能 list not mov sar mil clear 1.列表，元組，字典，集合分別如何增刪改查及遍歷。列表增：list是一個可變的有序表，所以，可以往list中追加元素到末尾：classmates.append(‘Adam‘)刪：要刪除l

1.英文詞頻統2.中文詞頻統計

diff earch port pboc [1] ould ret framework poi 1.英文詞頻統 news=‘‘‘ Guo Shuqing, head of the newly established China banking and insurance

階段作業1：完整的中英文詞頻統計

ini str clas rms encoding nic app 英文 around strBig =‘‘‘Big Big World Emilia I‘m a big big girl In a big big world It‘s not a big

完整的中英文詞頻統計

import word 完整 txt sep open read list span #讀取字符串str f = open(‘zz.txt‘,‘r‘,encoding=‘utf-8‘) strbig= f.read() f.close() sep =‘‘‘.,;:?!-

階段作業1：完整的中英文詞頻統計+補交上次作業

#補交作業 cc = ('''Counting stars Lately I've been, I've been losing sleep 　　 Dreaming 'bout the things that we could be 　　 But baby I've been, I've been p

完整的英文詞頻統計

相關推薦