使用SparkSQL2.x的SQL方式實現WordCount

阿新 • • 發佈：2018-11-10

程式碼裡面有很詳細的說明

程式碼實現：

package cn.ysjh0014.SparkSql

import org.apache.spark.sql.{DataFrame, Dataset, SparkSession}

object SparkSQLWordCount {

  def main(args: Array[String]): Unit = {

    //建立SparkSession
    val session: SparkSession = SparkSession.builder().appName("SQLWordCount").master("local[4]").getOrCreate()

    //讀資料，是lazy

    //Dataset也是一個分散式資料集，是對RDD的進一步分裝
    //Dataset只有一列，預設這列叫value
    val lines: Dataset[String] = session.read.textFile(args(0))

    //匯入隱式轉換
    import  session.implicits._
    val word: Dataset[String] = lines.flatMap(_.split(","))

    //登錄檔
    word.createTempView("test")

    //執行SQL
    val result: DataFrame = session.sql("SELECT value,COUNT(*) counts FROM test GROUP BY value ORDER BY counts DESC")

    result.show()

    session.stop()


  }
}

執行後你會發現他的速度會變慢，這是因為他會生成執行計劃，然後再執行計算

使用SparkSQL2.x的SQL方式實現WordCount

程式碼裡面有很詳細的說明程式碼實現： package cn.ysjh0014.SparkSql import org.apache.spark.sql.{DataFrame, Dataset, SparkSession} object SparkSQLWordCount { de

kafka的receive方式實現WordCount,使用updateStateByKey函式，累加所有批次的wordCount

Spark Streaming的updateStateByKey可以把DStream中的資料按key做reduce操作，然後對各個批次的資料進行累加。注意 wordDstream.updateStateByKey[Int]每次傳遞給updateFunc函式兩個引數，其中， 1、第一個引數是某

【iOS開發-79】利用Modal方式實現控制器之間的跳轉

article 運用 mis cli 控制 present 沒有 dismiss 導航控制器利用Modal方法。事實上就是以下兩個方法的運用。Modal方式的切換效果是從底部呈現。 -(void)clickModal{ WPViewController *wp

java加載properties文件的六中基本方式實現

alt user 通過 put main import port pac 技術 java加載properties文件的方式主要分為兩大類：一種是通過import java.util.Properties類中的load(InputStream in)方法加載；另一種是通過

使用Spring的註解方式實現AOP入門

單元測試 comment cast override src ioc ans 文件返回首先在Eclipse中新建一個普通的Java Project，名稱為springAOP。為了使用Spring的註解方式進行面向切面編程，需要在springAOP項目中加入與AOP相關的

AspectJ的註解方式實現AOP

private nts 代理 wan .com 進制 text 修改表達式 1.引入spring基礎包2.引入aspectJ的jar包：　　com.springsource.org.aopalliance-*.jar 　　com.springsource.org.asp

Ajax異步方式實現登錄與參數的校驗

hasclass prim ann idcard lock stc item code repl 登錄代碼這個是使用Bootstrap3的組件功能實現的 <div class="login_con_R"> <

CentOS6.5源碼搭建LAMP--基於module方式實現php（單臺機器）

centos6.5 源碼搭建lamp 基於module方式實現php 單臺機器源碼搭建LAMP軟件包下載源：搜狐鏡像源：http://mirrors.sohu.com/apache下載網：http://mirror.bit.edu.cn/apache/pcre官網：http://www.pcre.org/a

Spring(十二)使用Spring的xml文件配置方式實現AOP

註解 asp odi ns2 package hit 實現 object space 配置文件與註解方式的有非常大不同，多了非常多配置項。 beans2.xml <?xml version="1.0" encoding="UT

@WebListener 註解方式實現監聽

sun listener etc 修改 tom imp exti .get xsd 1.創建 Dynamic Web Project ,Dynamic Web module version選擇3.0 2.在自動生成的web.xml配置，增加 metadata-com

使用釘釘自定義應用的方式實現zabbix報警

zabbix 釘釘自定義應用先給大家展示一下完成後的效果圖下面我們就按照下面的步驟來實現我們想要的效果首先去釘釘後臺管理添加自定義應用,關於如何創建自定義應用可以咨詢釘釘客服或者查看釘釘相關文檔，創建好應用後我們需要獲取三個信息：AgentID：創建好應用後再點擊應用進去就可以查看CorpId

Hive 實現 wordcount

style nbsp logs 執行 txt hive ble text bsp 創建表： create table hive_wordcount(context string); load data local inpath ‘/home/hadoop/files/

文件方式實現完整的英文詞頻統計實例

() item .com div lambda 英文 [1] 完整 set fo=open(‘123.txt‘,‘r‘) a=fo.read() a=a.lower() #小寫 for i in ‘,.‘: a=a.replace(i,‘ ‘) #替換標點符

兩種方式實現sticky footer絕對底部

gin 實現 add charset 什麽是主體 ica min direction 一、什麽是sticky footer 如果頁面內容不夠長的時候，頁腳塊粘貼在視窗底部；如果內容足夠長時，頁腳塊會被內容向下推送，我們看到的效果就如下面兩張圖這樣。這種效果基本

PHP使用header方式實現文件下載

transfer ati off server 動畫 shee http nginx app php文件下載可以使用http的請求頭加上php的IO可以實現，很久之前寫過這麽一個功能，後來代碼沒了，今天記錄一下 1、先看一下一個正常的http請求 HTTP/1.1

php用ajax方式實現四級聯動

tle 空數組 str 簡單的 oca align 調用 select ble 使用ajax方式實現了下簡單的四級聯動，　數據庫：　　　以下為前臺代碼： 1 <!DOCTYPE html> 2 <html> 3 &l

Android註解方式實現表單校驗

view print tde try success lte ise rdb emp 在開發中總會遇到輸入框的輸入規則限制比如電話輸入框電話號碼的校驗，密碼規則的校驗等，我們通常做法是提交操作時對每個輸入框的輸入內容進行校驗，很多的if else ，代碼看起來很亂，

puppet（單機模式）-基於模塊方式實現redis主從

puppet redis主從模塊說明：puppet模塊存放位置有固定要求，不過為了實驗方便，先建一個臨時目錄來存放，當配置完成後移動到指定目錄。實現步驟：1、實現如下目錄結構[root@manifests modules]# tree ~/modules~/modules└── redis

2.2、Hibernate用註解方式實現一對多、多對多關系

tab 技術部 employee join incr 無法運行 hset strategy urn 一、一對多關系　　1、在上一篇日誌中用.xml配置文件項目基礎上，再往lib目錄先添加一個包-hibernate-jpa-2.0-api-1.0.0.Final.jar 　

mybatis之註解方式實現

nsa pub oct cto fault map bsp val neu * 使用mybatis舉例，使用註解方式實現* 不需要針對UserMapperI接口去編寫具體的實現類代碼，這個具體的實現類由MyBatis幫我們動態構建出來，我們只需要直接拿來使用即可。* 1、導

使用SparkSQL2.x的SQL方式實現WordCount

相關推薦