1. 程式人生 > >"Hard To Get"歌詞分析

"Hard To Get"歌詞分析

join ng2 with open 字符 pla ever wid oge +=

#導入歌詞文件,把換行符替換成空格
sing=""
with open ("D:\python_fx\HardToGet.txt","r") as f:
    for line in f.readlines():
        sing += line.replace("\n"," ")

  發現歌詞中有一句中文

技術分享圖片

#先把所有英文字符變小,在根據asll編碼把中文去掉,由上圖發現歌詞最後有一個空格
sing1 = sing.lower()
sing2 = "".join(i for i in sing1 if ord(i) < 256)
result = result.strip()

  處理後歌詞如下

技術分享圖片

#進行詞頻分析,進行降序排列
dic = {}
for i in set(music):
    dic[i] = music.count(i)
sorted(dic,key= lambda d:d[1],reverse=True)

  發現歌詞最多的五個單詞為“you”,“i”,“to”,“play”,“get”,一共有288個英文詞匯

技術分享圖片

"Hard To Get"歌詞分析