python 學習 紅樓夢字頻統計 DAY17
import jieba txt = open(r"C:\Users\lenovo\Desktop\redbuilding.txt","r",encoding="utf-8").read() words = jieba.lcut(txt) excludes = ["什麼","一個","我們","你們","如今","說道","知道","出來","那裡","起來"] counts = {} for word in words: if len(word) == 1: continue else: counts[word] = counts.get(word,0) + 1 for word in excludes: del(counts[word]) items = list(counts.items()) items.sort(key = lambda x:x[1] ,reverse = True) for i in range(20): word,count = items[i] print("{0:<10} {1:>5}".format(word,count))
相關推薦
python 學習 紅樓夢字頻統計 DAY17
import jieba txt = open(r"C:\Users\lenovo\Desktop\redbuilding.txt","r",encoding="utf-8").read() words = jieba.lcut(txt) excludes = ["什麼","
python學習筆記2詞頻統計
對英文文字中的英文單詞進行詞頻統計: 程式碼如下: # -*- coding: utf-8 -*- """ Created on Thu Apr 5 20:07:09 2018 @author: Administrator """ import turtle count=5
用Python繪制紅樓夢詞雲圖,竟然發現了這個!
微信 mce dataframe 文言文 中文分詞 import 雲圖 標點符號 data Python在數據分析中越來越受歡迎,已經達到了統計學家對R的喜愛程度,Python的擁護者們當然不會落後於R,開發了一個個好玩的數據分析工具,下面我們來看看如何使用Python,
用深度學習模型Word2Vec探索《紅樓夢》人物關系
繼續 comment block for lse r+ not 百度 構建 先來看一看結果,發現: 1.賈寶玉和襲人的關系最近。 2.薛寶釵和自己的媽媽關系最近。 3.賈寶玉和林黛玉逼格比較統一,薛寶釵屬於獨樹一幟的逼格調性。 4.大觀園中可以看到邢岫煙經常出沒... 還有
python學習day17 遞迴函式
遞迴函式 http://www.cnblogs.com/Eva-J/articles/7205734.html def age(n): if n == 4: return 40 elif n >0 and n < 4:
《貝葉斯思維:統計建模的Python學習法》高清中文版PDF+高清英文版PDF+原始碼
下載:https://pan.baidu.com/s/1axiPTi3PkYcZhdkQAQidEg 更多資料分享:http://blog.51cto.com/3215120 《貝葉斯思維:統計建模的Python學習法》高清中文版PDF+高清英文版PDF+原始碼 高清中文版PDF,帶目錄和書籤,文字能夠
分享《貝葉斯思維:統計建模的Python學習法》高清中文版PDF+高清英文版PDF+源代碼
復制 ges 源代碼 term alt log vpd ces 英文 下載:https://pan.baidu.com/s/1axiPTi3PkYcZhdkQAQidEg 更多資料分享:http://blog.51cto.com/3215120 《貝葉斯思維:統計建模的Py
分享《貝葉斯思維:統計建模的Python學習法》+PDF+源碼+Allen B.Downey+許楊毅
ext img 中文版 下載 ESS size alt sha 分享圖片 下載:https://pan.baidu.com/s/130Wf-CymOIW4ELlh9ihVlg 更多資料分享:http://blog.51cto.com/14087171 《貝葉斯思維:統計建模
Python學習--day17
day17 一、logging模組 1、日誌中的級別: import logging # logging.debug("debug") #日誌等級10級 # logging.info("info") #日誌等級20級 # logging.warning("警
python學習之路 day17
re模組和hashlib模組 1.re模組(正則表示式): 一:什麼是正則? 正則就是用一些具有特殊含義的負號組合到一起(稱為正則表示式)來描述字元或者字串的方法。或者說:正則就是用來描述一類事物的規則。() 正則表示式就是利用一些特殊字元為規則匹配字串的方法,目的是為了找
貝葉斯思維.統計建模的Python學習法(高清版)PDF
貝葉斯思維.統計建模的Python學習法(高清版)PDF百度網盤連結:https://pan.baidu.com/s/1gueMg4HDSzyflwdr3zPZCA 提取碼:m0fk 複製這段內容後開啟百度網盤手機App,操作更方便哦內容簡介 · · · · · · 這本書幫助那些希望用數學工具解決實際問題的
181115 Python學習日記——詞頻統計
主要使用第三方庫:jieba import jieba f = open('三國演義.txt','r').read() word_count = {} for word in f: if word in ',。:;”“‘’—!——': w
Python語言程式設計(MOOC崇天)第六章組合資料型別學習筆記(基本統計值計算+文字詞頻統計)
複習: 今日內容:組合資料型別 集合型別及操作: 集合型別的定義: 非可變的資料型別:整數、浮點、元組、負數、字串型別 可變的資料型別:列表list和字典dict。所以看不到集合中有列表、{[ ]} 就算是set([1
面向過程給出《貝葉斯思維:統計建模的Python學習法》——二維綵球問題學習程式碼
背景 給出讀《艾伯特貝葉斯思維:統計建模的Python學習法.pdf》的時候,寫的程式碼,以面向過程的方式給出。 本章彩彈問題,求似然度的時候,假設已知隱藏點時,射手等概率從各個角度射擊。 程式碼 匯入
python 學習 迴文數 、 田字格 、猜數遊戲、統計不同字元個數DAY15
迴文數 getnum = input("請輸入一個自然數:") if getnum == getnum[::-1]: print("{0}是迴文數".format(getnum)) else: print("該數不是迴文數") 田字格1 for i i
Python學習--統計字串中單詞的數目
Python在這些年異常的火爆,這也得益於其功能的龐大效率的高效以及第三方庫的。最近也來追一下“潮流”哈。統計單詞出現的次數可以做搜尋,也可做關聯。Python實現起來也非常方便。(只支援英文)
貝葉斯思維 統計建模的Python學習法pdf
貝葉斯方法正在變得越來越常見與重要,但是卻沒有太多可以借鑑的資料來幫助初學者。基於Allen Downey在大學講授的本科課程,本書的計算方法能幫助你獲得一個良好的開端。 使用已有的程式設計技巧學習和理解貝葉斯統計 處理估計、預測、決策分析、假設的證據、假設檢驗等問題 從簡單的例子開始,包括硬幣問題
Spark學習筆記:四、WordCount字頻統計入門程式(基於IntelliJ IDEA使用Scala+SBT)
一、環境準備: Ubuntu16.04 IDEA Ultimate(破解版、教育版) Java JDK 1.8 Hadoop2.7 (偽單機模式) Spark 2.1.0 Hadoop與Spark的安裝過程本文省略 二、IDEA + SBT
python基於共現的《紅樓夢》人物關係圖
作為中國古典四大名著,《紅樓夢》的影響深遠,至今家喻戶曉。歷來紅學家們都在研究《紅樓夢》。最近受python自然語言處理的影響,突然想用機器學習來實現紅樓夢人物關係的大致情況。對於我這個從沒讀過《紅樓夢》的人來說省去了很多時間,因為太長,真的讀不來啊!那麼,用python如何
python學習之路(四)
[1] size class dex epc uri msu 語句 這就是 繼續昨天的學習,學到了數組。 首先有兩個數組,name1和name2.我們可以將兩個數組合並 name1=[1,2,3,4] name2=[5,6,7,8] names=name1.extend(