1. 程式人生 > 其它 >女朋友說異性相吸,所以產生真愛!我覺得得用python驗證一下

女朋友說異性相吸,所以產生真愛!我覺得得用python驗證一下

這次不是因為電影,是因為電視劇《鬼吹燈》!不得不說拍得還是很不錯的,選角合適,特效逼真,畫面精美,連刷9集!
女朋友看完以後竟然說“胡八一和Shirley妥妥的真愛!”,因為異性相吸,必然是真愛!
不得不說男女之間還是有差異的,關注點完全不同呀!
Shirley才出來幾分鐘呀?滿打滿算也就5分鐘吧,怎麼就看出來“妥妥的真愛”?
鬼吹燈的8本書裡,明顯胡八一的“真愛”明明應該是王胖子才對呀!陪伴才是真呀!

看來只有繼續用資料說話,讓她在資料面前顫抖吧!
“真愛”:真愛是一個漢語詞語,拼音是zhēn ài,指純粹真誠的情感。之所以叫“真”,即真誠和真實,其是它最基本的基礎。它絕不建立在欺騙和幻想之上。真愛,或許每個人都有自己的看法。廣義的真愛,與性別無關,與民族無關,與國家無關,與宗教無關,與種族無關。
——來源:百度百科“真愛”詞條

Python程式碼如下:

"""
當然在學習Python的道路上肯定會困難,沒有好的學習資料,怎麼去學習呢? 
學習Python中有不明白推薦加入交流Q群號:928946953 
群裡有志同道合的小夥伴,互幫互助, 群裡有不錯的視訊學習教程和PDF!
還有大牛解答!
"""
import jieba    #匯入jieba庫,以便於使用分詞
txt = open("鬼吹燈.txt","r",encoding='utf-8').readlines()    #使用open函式開啟檔案,把文字資訊傳遞給變數txt
txt = "".join(txt)    #將變數txt由列表list型別轉換為jieba庫分詞時需要使用的字串str型別
words = jieba.lcut(txt) #利用jieba庫中的lcut()函式來將變數txt中文字進行分詞操作,然後將結果傳遞給變數words print(words) counts = {} #定義一個空的字典給變數counts,以用來接收資料進行統計 stop_txt = open("停用詞.txt","r",encoding='utf-8').readlines() #使用open函式開啟停用詞檔案,把文字資訊傳遞給變數stop_txt stop_txt = "".join(stop_txt) #將停用詞轉變為str格式 stop_words = jieba.lcut(stop_txt) #
停用詞進行分詞處理 #stopwords = [line.strip() for line in open("停用詞.txt").readlines()] print(stop_words) for word in words: #利用for語句來依次迴圈獲得列表words中的值,並用word來接收 if word not in stop_words: #如果這個詞word沒有在停用詞裡面的話,進行下面的語句: if len(word) == 1: #如果,這個詞出現的次數是1次,那麼執行下邊的語句: continue #continue語句,跳過迴圈體中剩餘的語句併到迴圈末尾而強行執行下一次迴圈 else: #如果,這個詞出現的次數不是1,那麼執行下邊的語句: counts[word] = counts.get(word,0) + 1 #將程式碼進行合併,減少程式碼量,在字典中查詢鍵值word中儲存的詞,沒有的話自動建立這個詞為鍵值,並賦予其對應的值為0,之後再無作用,然後將查詢到的詞對應的數字+1 counts_items = counts.items() #將字典dict型別變為字典列表dict_items型別,字典中的鍵值和對應的值變為字典列表中的資料,並將資料傳遞給變數counts_items counts_list = list(counts_items) #將變數counts_items由dict_items型別轉變為list型別,並用變數counts_list來接收 counts_list.sort(key=lambda x:x[1],reverse=True) #對變數counts_list列表進行排序,key= lambda x:x[1]代表以物件中第二維資料的值進行排序,(lambda用於匿名函式,可以免去命名函式的麻煩),reverse=True代表降序排列,若為False則代表升序排列 for i in range(10):#展示排名前10的詞 word,count = counts_list[i] print("{0:<10}{1:>5}".format(word,count)) #冒號是引導符,後面跟的是格式控制方法。<表示左對齊,>表示右對齊,數字表示寬度。<10表示左對齊,並佔10個位置,>5表示右對齊,佔5個位置。

詞頻排序前十執行結果:
我們 4448
胖子 4421
什麼 3446
Shirley 2416
沒有 2414
一個 2067
就是 1920
咱們 1788
已經 1737
東西 1615
胖子出場次數4421次,Shirley出場次數2416次!
差不多能有2倍了,所以我覺得胡八一的“真愛”應該是王胖子,畢竟陪伴才是真愛啊!
沒事多陪陪自己的女朋友吧,少敲點Python程式碼吧!