Scala集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡

阿新 • • 發佈：2022-03-06

集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡

集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡
- 1、統計單詞的數量
- 2、計算每一個班級學生的平均年齡

1、統計單詞的數量

使用Java的方式

object Demo23WordCount {
  def main(args: Array[String]): Unit = {
	
    val hashMap = new util.HashMap[String, Integer]()

    val bufferedReader = new BufferedReader(new FileReader("data/words.txt"))

    var line: String = bufferedReader.readLine()
    while (line != null) {
      val split: Array[String] = line.split(",")
      for (word <- split) {
        //判斷map集合中是否存在這個單詞
        if (hashMap.containsKey(word)) {
          //取出之前的統計結果
          val count: Integer = hashMap.get(word)
          //在之前的基礎上加一
          hashMap.put(word, count + 1)
        } else {
          //如果單詞在hashMap中不存在存一個一進去
          hashMap.put(word, 1)
        }
      }
      line = bufferedReader.readLine()
    }

    println(hashMap)//{hive=6, java=12, spark=12, hadoop=6}
  }
}

使用Scala的普通方式

object Demo23WordCount {
  def main(args: Array[String]): Unit = {
	//1、讀取檔案
    val lines: List[String] = Source.fromFile("data/words.txt").getLines().toList

    //2、將每一行中的多個單詞拆分出來，每隔單詞一行
    val words: List[String] = lines.flatMap(line => line.split(","))

    //3、按照單詞分組，將同一個單詞分到同一個組內，返回一個Map集合（k,v）格式
    val groupBy: Map[String, List[String]] = words.groupBy((word: String) => word)
    groupBy.foreach(println)
    /*
      (hadoop,List(hadoop, hadoop, hadoop, hadoop, hadoop, hadoop))
      (spark,List(spark, spark, spark, spark, spark, spark, spark, spark, spark, spark, spark, spark))
      (java,List(java, java, java, java, java, java, java, java, java, java, java, java))
      (hive,List(hive, hive, hive, hive, hive, hive))
     */

    //4、統計單詞的數量，使用map函式，返回一個Map集合
    val wordCount: Map[String, Int] = groupBy.map(kv => {
      //第一個元素，作為新Map集合的key
      val word: String = kv._1

      //組內所有的單詞，作為新Map集合的value
      val values: List[String] = kv._2

      //計算單詞的數量
      val count: Int = values.length

      //返回結果
      (word, count)
    })

    wordCount.foreach(println)
      /*
        (hadoop,6)
        (spark,12)
        (java,12)
        (hive,6)
       */
  }
}

Scala方式的鏈式呼叫（這種方式就是spark程式碼）

object Demo23WordCount {
  def main(args: Array[String]): Unit = {
  
  Source.fromFile("data/words.txt")
      .getLines()
      .toList
      .flatMap(_.split(",")) //將一行轉換成多行
      .groupBy(w => w) //按照單詞分組
      .map(kv => (kv._1, kv._2.length)) //統計單詞的數量
      .foreach(println)
      }
   }

2、計算每一個班級學生的平均年齡

package com.shujia.scala

import scala.io.Source

object Demo24Student {
  def main(args: Array[String]): Unit = {

    //1、讀取檔案
    val students: List[String] = Source.fromFile("data/students.txt").getLines().toList


    //2、取出班級和年齡
    val clazzAndAge: List[(String, Double)] = students.map(student => {
      //取出班級和年齡
      val split: Array[String] = student.split(",")
      val age: Double = split(2).toDouble
      val clazz: String = split(4)

      (clazz, age)
    })

    //3、按照班級分組
    val groupBy: Map[String, List[(String, Double)]] = clazzAndAge.groupBy(kv => kv._1)


    //4、統計平均年齡
    val clazzAvgAge: Map[String, Double] = groupBy.map(kv => {
      //班級
      val clazz: String = kv._1

      //一個班級所有的資料
      val values: List[(String, Double)] = kv._2

      //取出年齡
      val ages: List[Double] = values.map(ca => ca._2)

      //九三平均值
      val avgAge: Double = ages.sum / ages.length

      (clazz, avgAge)
    })

    clazzAvgAge.foreach(println)
  }
}

    執行結果：
            (理科六班,22.48913043478261)
            (理科一班,22.333333333333332)
            (理科二班,22.556962025316455)
            (理科五班,22.642857142857142)
            (文科一班,22.416666666666668)
            (文科六班,22.60576923076923)
            (理科三班,22.676470588235293)
            (文科四班,22.506172839506174)
            (理科四班,22.63736263736264)
            (文科二班,22.379310344827587)
            (文科五班,22.30952380952381)
            (文科三班,22.680851063829788)

Scala集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡

集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡目錄集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡1、統計單詞的數量2、計算每一個班級學生的平均年齡

Flink流處理---WordCount：統計單詞數量

Flink流處理---WordCount：統計單詞數量注意：導包的時候需要手動修改一下修改為import org.apache.flink.streaming.api.scala._

go語言之給定英語文章統計單詞數量(go語言小練習)

給定一篇英語文章，要求統計出所有單詞的個數，並按一定次序輸出。思路是利用go語言的map型別，以每個單詞作為關鍵字儲存數量資訊，程式碼實現如下：

003:程式設計填空：統計動物數量

程式碼填空，使得程式能夠自動統計當前各種動物的數量樣例輸入輸出就不放了

C語言實現計算句子中的單詞數量的計算

用c語言實現判斷句子單子數量編寫程式，輸出一行字串中，所有純英文單詞的數目。純英文單詞指的是該單詞的所有字元皆為英文字母(例如:I am a student of 23，需要輸出5)

多名 NBA 球隊老闆成立區塊鏈應用委員會：蔡崇信、馬克 · 庫班在內

3 月 8 日訊息，據國外媒體報道，美國籃球聯盟 (NBA)中一些最富有、最有權力的球隊老闆組成了一個委員會，探索區塊鏈在 NBA 的使用情況。

Python 3.11 (Alpha) 上架微軟 Win11/Win10 應用商店：支援執行時、直譯器

10 月 11 日訊息近期，Python 軟體基金會已經在 Windows 10 和 Windows 11 微軟商店上架了 Python 3.11 執行時和直譯器。Python 是一種易於學習、功能強大的程式語言。它具有高效的高層資料結構和簡單而有效的面向

B 站 CEO 陳睿：5G 時代到來後，每一個網際網路使用者都是視訊使用者

9 月 28 日訊息在 2020 中國網路媒體論壇產業論壇上，嗶哩嗶哩董事長兼 CEO 陳睿稱，5G 時代到來了以後，每一個網際網路使用者都是視訊的使用者，因為視訊是一種最自然的傳播手段，它也是對使用者最友好的一種表達

英特爾新 CEO 帕特 · 基辛格上任發言：要在所競爭的每一個業務領域都成為引領者 - IT之家

2月18日訊息今日晚間，英特爾新任 CEO 帕特 · 基辛格今日釋出內部信表示，英特爾要在所競爭的每一個業務領域都成為引領者。基辛格指出，英特爾是唯一一家在智慧晶片、平臺、軟體、架構、設計、製造和規模化方面，均

部分谷歌 Pixel 6/Pro 出現螢幕問題：閃爍綠屏、多出一個挖孔

10 月 29 日訊息，目前首批谷歌 Pixel 6/Pro 已經陸續交到了消費者手中，但就和前幾代 Pixel 會出現一些奇怪的問題一樣，這一代也不例外。在拿到新手機後，就有使用者反饋他們的手機螢幕出現了一些異常。首先是 Red

Stream常見用法：集合建立時間最小的元素、集合中最大的建立時間、集合分組並統計數量、集合按指定屬性分組

記錄Stream對集合常見的幾個用法：測試物件 Order @Data @AllArgsConstructor @ToString public class Order {

python統計單詞平均長度_統計學的Python實現-014：幾何平均數(衡量樣本集中趨勢)...

技術標籤：python統計單詞平均長度統計學解釋幾何平均數：幾何平均數(geometric mean)是衡量樣本集中趨勢的統計量，其值為該組資料所有n個變數值的乘積的n次方根。其計算公式如下：

Android 12 對話小部件亮相：支援多應用，可顯示通知數量

6 月 10 日消息穀歌將於今年釋出 Android 12 正式版，今日谷歌向 Pixel 使用者推送了 Android 12 Beta 2 版本系統更新。根據外媒 Androidpolice 訊息，這一版本的系統帶來了全新的對話小部件應用，在桌面上可以顯示

qiankun常見問題集合：主子應用間路由跳轉、微應用如何設定跨域訪問、各生命週期鉤子如何執行

一、qiankun框架中微應用之間如何跳轉　　qiankun框架提供兩種跳轉方式： 1、通過history.pushState()方式進行跳轉

舉例：在C語言使用結構體和聯合體，設計應用全域性變數

/*舉例：在C語言使用結構體和聯合體，設計應用全域性變數*/ #include \"stm32f1xx_hal.h\"

Scala併發程式設計實戰：Monitor與synchronized

Java併發程式設計最常用和易用的技術莫過於synchronized關鍵字，而Scala的併發程式設計之旅也可以從synchronized開始。而synchronized的背後其實是monitor技術。

Scala併發程式設計實戰：Executor執行緒池

建立執行緒是一個重量級操作，因為需要呼叫作業系統核心的API，所以最好不要頻繁的建立和銷燬執行緒，為了能夠複用建立的執行緒，常用的辦法的就是建立執行緒池。

matlab中imadjust函式的作用及應用舉例

imadjust簡介 imadjust是一個計算機函式，該函式用於調節灰度影象的亮度或彩色影象的顏色矩陣。在matlab的命令視窗中鍵入： doc imadjust或者help imadjust即可獲得該函式的幫助資訊，鍵入type imadjust可以檢視函式

Scala函數語言程式設計專題--scala集合和函式

前情提要： Scala函數語言程式設計指南（一）函式式思想介紹 scala函數語言程式設計（二） scala基礎語法介紹

如何巧用HashMap一行程式碼統計單詞出現次數詳解

前言 JDK是在一直在迭代更新的，很多我們熟悉的類也悄悄的添加了一些新的方法特性。比如我們最常用的HashMap。

Scala集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡

集合的應用舉例：統計單詞的數量、計算每一個班級學生的平均年齡

1、統計單詞的數量

2、計算每一個班級學生的平均年齡

相關推薦