如何統計英文文字中詞彙的出現次數
def getText(): txt = open('hamlet.txt', 'r').read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>[email protected][\\]^_{|}~': txt = txt.replace(ch, ' ') return txt txt = getText() words = txt.split() counts = {} for word in words: counts[word] = counts.get(word,0) + 1 items = list(counts.items()) items.sort(key=lambda x:x[1], reverse=True) for i in range(10): word, count = items[i] print('{0:<10}{1:>5}'.format(word, count))
我統計的英文文字是哈姆雷特,只需要把你想要統計的文字拷貝到專案的根目錄,然後進行相應的修改即可。
相關推薦
如何統計英文文字中詞彙的出現次數
def getText(): txt = open('hamlet.txt', 'r').read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>[email protected][\\]^_
[Trie樹] 統計英文文字中單詞出現的個數 - C語言實現 - 考慮數字、英文
【英文文字】 However, after reaching the shore there are plenty of challenges waiting for him."The biggest challenge now is learning to walk agai
linux統計txt檔案中單詞出現次數並排序
檔案:a.txt 任務:統計該檔案中每一個單詞出現的次數,並按照出現頻率從大到小排序 sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr 解析: sed替換 sed 's/被替換的字串/新字串/[替換選項]' fil
TOP K演算法(微軟筆試題 統計英文電子書中出現次數最多的k個單詞)
在v_JULY_v的文章中找到了這個問題的解法後用C++實現了一下,發現C++的程式碼非常的簡潔。 主要用到了標準庫中的hash_map,優先順序佇列priority_queue。
IOS菜鳥的所感所思(十一)——統計文字中單詞出現的次數並按照次數高低排序
//確認我放英文檔案的目錄下又該檔案, - (NSString *)getFileData{ //這是放在其沙盒路徑下 // NSString *docDirPath = [NSSearchPathForDirectoriesInDomains(NSCachesDirectory, NS
統計字串中字元出現次數以及排序
題目是這樣的,對字串“sdfgzxcvasdfxcvdf”每個字元出現次數並對其排序 public static void main(String[] args) { //統計字串中英文字元的出現次數
js統計html中標籤出現次數最多的標籤
思路:要統計標籤出現的次數,首先肯定要獲取html中的標籤,然後再統計各個標籤出現的次數。因為不能一下子獲得所有的標籤,所以只能先獲得根元素,然後通過獲取它的子元素來進行統計。 很久沒有用原生js了,所以誤以為childNodes是獲得當前元素的所有子節點,後
統計一個字串中字母出現的次數
function numInString(str){ var str1=''; while(str!=''){ var count=0; var str2 = str.split('');
統計資料庫表中關鍵詞出現的次數,按次數大小降序排序
在做搜尋時遇到一個搜尋提示的問題,我就想著記錄使用者輸入的關鍵詞,然後按出現次數最多的來推薦到搜尋列表展示給使用者。 SELECT COUNT(keyword),keyword FROM `desto
Java 檔案統計:編寫程式,統計英文文字檔案中的字元數目和單詞數目。程式執行時,輸入要統計的檔案的名稱,程式處理後輸出字元數目和單詞數目
package text6; import java.util.*; import java.io.File; import java.io.FileReader; import javax.sw
vim中字串出現次數的統計及字元創替換
vim中字串出現次數的查詢: 在所有行中查詢 字串 出現的次數 :%s/字串/&/gn 在m和n行之間查詢 字串 出現的次數 :m,ns/字串/&/gn vim中字串的替換: vi/vim 中可以使用 :s 命令來替換字串。以前只會使用一
已知一個字符串S 以及長度為n的字符數組a,編寫一個函數,統計a中每個字符在字符串中的出現次數
lin sta imp scanner col div created rip void import java.util.Scanner; /** * @author:(LiberHome) * @date:Created in 2019/3/6 21:
求一個字符串中連續出現次數最多的子串
article 規律 生成 clu 一次 strong tor first sub 題目:求一個字符串中連續出現的次數最多的子串。 例如,字符串“abababc”,最多連續出現的為ab,連續出現三次。 思路: 例如字符串“abababc”,最多連續出現的為ab,連續出現
hdu3065 病毒侵襲持續中 AC自動機入門題 N(N <= 1000)個長度不大於50的模式串(保證所有的模式串都不相同), 一個長度不大於2000000的待匹配串,求模式串在待匹配串中的出現次數。
sizeof archive 模式 emp tomat .... truct print sca /** 題目:hdu3065 病毒侵襲持續中 鏈接:http://acm.hdu.edu.cn/showproblem.php?pid=3065 題意:N(N <= 1
在一個數組中找出現次數超過一半的數字
數組中出現次數超過一半的數字package Suanfa; /** * @author jixiang * 在一個數組中找到次數超過一半的數字 */ public class MoreThanHalfNum { public static void main(String[] args) {
java中使用Map集合判斷字串中字元出現次數
import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.Map; import java.util.Scanner; import java.util.S
(劍指offer)從1到n整數中1出現次數
時間限制:1秒 空間限制:32768K 熱度指數:133857 題目描述 求出113的整數中1出現的次數,並算出1001300的整數中1出現的次數?為此他特別數了一下1~13中包含1的數字有1、10、11、12、13因此共出現6次,但是對於後面問題他就沒轍了。ACMer希望你們幫幫他
陣列中尋找出現次數最多的一個數
//第一種方法 #include #include<stdlib.h> using namespace std; //以空間換取時間 //時間複雜度分析2n1+2n2 //空間複雜度為n2 int search(int* a, int len) {
統計檔案內每個字元出現次數
package com.zyq.test; import java.io.*; import java.util.Set; import java.util.TreeMap; public class TsetCountCharacters { public st
統計1-n 中1 的次數
package offer; /** * @Package Name : ${PACKAG_NAME} * @Creation Date : 2018年12月27日上午7:19 * @Function : todo */ public class calculate_1_count {