統計文字中每個單詞的個數

阿新 • • 發佈：2019-01-19

/**
	 * 統計文字每個單詞的個數
	 * 
	 * @param text
	 *            文字
	 * @param ignoreCase
	 *            是否忽略大小寫
	 * @return
	 */
	public static Map<String, Integer> countEachWorld(String text,
			boolean ignoreCase) {
		Matcher m = Pattern.compile("\\w+").matcher(text);
		String matcheStr = null;
		Map<String, Integer> map = new LinkedHashMap<>();
		Integer count = 0;
		while (m.find()) {
			matcheStr = m.group();
			matcheStr = ignoreCase ? matcheStr.toLowerCase() : matcheStr;
			count = map.get(matcheStr);
			map.put(matcheStr, count != null ? count + 1 : 1);
		}
		return map;
	}

匹配的文字：

Java provides the java.util.regex package for pattern matching with regular expressions. Java regular expressions are very similar to the Perl programming language and very easy to learn.

A regular expression is a special sequence of characters that helps you match or find other strings or sets of strings, using a specialized syntax held in a pattern. They can be used to search, edit, or manipulate text and data.

結果：

1、忽略大小寫

countEachWorld(text, true);

{java=3, provides=1, the=2, util=1, regex=1, package=1, for=1, pattern=2, matching=1, with=1, regular=3, expressions=2, are=1, very=2, similar=1, to=3, perl=1, programming=1, language=1, and=2, easy=1, learn=1, a=4, expression=1, is=1, special=1, sequence=1, of=2, characters=1, that=1, helps=1, you=1, match=1, or=3, find=1, other=1, strings=2, sets=1, using=1, specialized=1, syntax=1, held=1, in=1, they=1, can=1, be=1, used=1, search=1, edit=1, manipulate=1, text=1, data=1}

2、對大小寫敏感

countEachWorld(text, false);

{Java=2, provides=1, the=2, java=1, util=1, regex=1, package=1, for=1, pattern=2, matching=1, with=1, regular=3, expressions=2, are=1, very=2, similar=1, to=3, Perl=1, programming=1, language=1, and=2, easy=1, learn=1, A=1, expression=1, is=1, a=3, special=1, sequence=1, of=2, characters=1, that=1, helps=1, you=1, match=1, or=3, find=1, other=1, strings=2, sets=1, using=1, specialized=1, syntax=1, held=1, in=1, They=1, can=1, be=1, used=1, search=1, edit=1, manipulate=1, text=1, data=1}

統計文字中每個單詞的個數

/** * 統計文字每個單詞的個數 * * @param text * 文字 * @param ignoreCase * 是否忽略

jmu-Java&Python-統計一段文字中的單詞個數並按單詞的字母順序排序後輸出

現需要統計若干段文字(英文)中的不同單詞數量。如果不同的單詞數量不超過10個，則將所有單詞輸出(按字母順序)，否則輸出前10個單詞。注1：單詞之間以空格(1個或多個空格)為間隔。注2：忽略空行或者空格行。注3：單詞大小寫敏感，即'word'與'WORD'是兩個不同的單詞。輸入說明

統計字串中每個單詞出現的次數 for C++

void CountWords(char str[])//實現字串中每個單詞出現的次數統計 { char S[20][10];//用於儲存每個單詞 int Count[20];//用於統計每個單詞出現的次數 int i=0,j=0,k=0; int Num;//表示單詞的個數

統計句子中的單詞個數

from collections import Counter def bag_of_words(text): # TODO: Implement bag of words retur

統計一行文字的單詞個數（15 分）本題目要求編寫程式統計一行字元中單詞的個數。所謂“單詞”是指連續不含空格的字串，各單詞之間用空格分隔，空格數可以是多個。輸入格式: 輸入給出一行字元。輸出格式: 在一行中輸出單詞個數。輸入樣例: Let's go to room 209. 輸出樣例

MD,一開始就想著怎麼用空格和結尾前判斷字母來計算寫的頭的爆了，反過來判斷空格後面是否有 =‘ ’就尼瑪容易多了 #include<stdio.h> #include<stdlib.h> #include<string.h> int

C語言K&R習題系列——統計文件中每個單詞所包含的字母個數，以直方圖形式輸出

原題： Write a program to print a histogram of the lengths of words in its input. It is easy to draw

需求說明:從鍵盤輸入一個字串，統計字串中每個字元的個數。如輸入“adbda”，結果為a=2，d=2，b=1。

思路：使用Scanner接收鍵盤輸入的字串。使用HashMap統計每個字元的個數，其中key儲存字元，value用來記錄字元的數量。原始碼： public static void main(String[] args) { //人性化提示資訊。 System

演算法--統計文字中出現次數最多的單詞（字典樹）

統計一個文字中，出現次數最多的單詞：單詞全部小寫，單詞與單詞之間以空格間隔 1.利用字典 key為單詞 value為單詞出現的次數 def mostString(): dict = {} fr = open('preprocessing.txt')

Python每日一題：第3題：統計一個檔案中每個單詞出現的次數

題目：統計一個檔案中每個單詞出現的次數，列出出現頻率最多的5個單詞。前言：這道題在實際應用場景中使用比較廣泛，比如統計歷年來四六級考試中出現的高頻詞彙，記得李笑來就利用他的程式設計技能出版過一本背單詞的暢銷書，就是根據詞頻來記單詞，深受學生喜歡。這就是一個把程式設計技能用來解決實際問

Java 統計一個字串中每個單詞,或者字母出現的次數

package cn.itcast.demo24; import java.util.HashMap; /* * 用程式碼實現以下需求(1)有如下字串"If you want to change your fate I think you must come to the

Java實現統計一篇文章中每個單詞出現的次數

import java.io.File; import java.io.FileReader; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; import jav

IOS菜鳥的所感所思(十一)——統計文字中單詞出現的次數並按照次數高低排序

//確認我放英文檔案的目錄下又該檔案， - (NSString *)getFileData{ //這是放在其沙盒路徑下 // NSString *docDirPath = [NSSearchPathForDirectoriesInDomains(NSCachesDirectory, NS

C++經典題目二：統計一篇英文文章中的單詞個數

要求：統計處一篇英文文章中的不同的單詞，並得到單詞個數。用一個單向連結串列儲存所出現的單詞，注意幾點：1）檔案輸入輸出；2）字串處理；3）連結串列資料結構再看程式碼——演算法實現如下： //========================================

【C語言程序】讓用戶輸入一句話，輸出這句話中每個單詞含有多少個字母

get mage 一句話 printf png es2017 urn bsp can #include <stdio.h>#define N 100 //宏定義，用N表示100 int main(int argc, char *argv[]) { int i

Python3基礎 str 循環輸出list中每個單詞及其長度

clas str 簡單 dev 方法 .cn uid 語言 art ? python : 3.7.0 OS : Ubuntu 18.04.1 LTS

【LeetCode 簡單題】96-字串中的單詞個數

宣告：今天是第96道題。統計字串中的單詞個數，這裡的單詞指的是連續的不是空格的字元。以下所有程式碼經過樓主驗證都能在LeetCode上執行成功，程式碼也是借鑑別人的，在文末會附上參考的部落格連結，如果侵犯了博主的相關權益，請聯絡我刪除（手動比心ღ( ´･ᴗ･` )）正文題目：

案例2-mapreduce統計每年中每個月氣溫排行

如圖所示我們要計算每年中每個月氣溫倒序排行，在這個例子中我們輸入檔案中的年份只有3個，所以例子中的reduceTask個數是3個。如果不確定年份的個數，就不能使用年份維度作為reduceTask個數。

Hadoop 統計檔案中某個單詞出現的次數

轉自：https://www.xuebuyuan.com/1270346.html 2013年10月24日 ⁄ 綜合 ⁄ 共 2628字 ⁄ 字號小中大 ⁄ 評論關閉如檔案wor

統計字串中的字元個數 python程式設計

問題描述：題目內容：定義函式countchar()按字母表順序統計字串中所有出現的字母的個數（允許輸入大寫字元，並且計數時不區分大小寫）。形如： def countchar(string): ... ... return a list

Spark -- RDD簡單操作【統計文字中單行最大單詞數】

一、什麼是RDD ？ RDD在Spark【Scala語言】中，是一種資料結構【基於記憶體，可持久化】，就好比Java的ArrayList一樣，可以進行各種的Action操作，比如Java中的List集合，可以進行get【獲取元素】、add【增加元

統計文字中每個單詞的個數

相關推薦