sparksql 2.x demo I

阿新 • • 發佈：2018-12-13

package com.ws.sparksql
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.types._
import org.apache.spark.sql._
import org.apache.spark.{SparkConf, SparkContext}

/**
  * spark sql版本 2.x
  */
object SparkSql2Demo {

  def main(args: Array[String]): Unit = {
    //spark 2.X sql建立執行過程
    val session = SparkSession.builder().appName("SparkSql2Demo").master("local[*]").getOrCreate()

    val dataRdd: RDD[String] = session.sparkContext.textFile("hdfs://hadoop-01:9000/student")

    val studentRowRdd: RDD[Row] = dataRdd.map(line => {
      val fieldArr: Array[String] = line.split(",")
      val id = fieldArr(0).toLong
      val name = fieldArr(1)
      val age = fieldArr(2).toInt
      val score = fieldArr(3).toInt
      Row(id, name, age, score)
    })

    //建立結構化表
    val schema: StructType = StructType(List(
      StructField("id", LongType, true),
      StructField("name", StringType, true),
      StructField("age", IntegerType, true),
      StructField("score", IntegerType, true)
    ))

    val dataFrame: DataFrame = session.createDataFrame(studentRowRdd, schema)

    import session.implicits._
    val result: Dataset[Row] = dataFrame.where($"score" > 100).orderBy($"score" desc, $"age" asc)

    result.show()

    session.stop()
  }
}

結果：

+---+----+---+-----+
| id|name|age|score|
+---+----+---+-----+
|  1|  張三| 18|  150|
|  2|  李四| 19|  150|
+---+----+---+-----+

sparksql 2.x demo I

package com.ws.sparksql import org.apache.spark.rdd.RDD import org.apache.spark.sql.types._ import org.apache.spark.sql._ import or

sparkstreaming結合sparksql-2.x實時向hive中寫資料

今天主要來介紹一下SparkSql,2.x新版本操作hive的一個寫法. Spark SQL 的功能之一是執行 SQL 查詢.Spark SQL 也能夠被用於從已存在的 Hive 環境中讀取資料廢話不多說,直接上程式碼: package spark import j

[python 2.x] xml.etree.ElementTree module

print creat imp system bool .py mark ati mit XML 文件：xmlparse.xml <?xml version="1.0" encoding="UTF-8" standalone="no"?> <!DOCTY

Codeforces Round #406 (Div. 2) E. Till I Collapse(主席樹)

esp type 個數 gif lan upd roo node .com 題目鏈接：Codeforces Round #406 (Div. 2) E. Till I Collapse 題意：給你n個數，對於每一個k(1<=k<=n)，劃分區間，每個區間只能有

CentOS 7.x下部署和配置zabbix 3.2.x監控工具

centos zabbix 監控一.安裝zabbix服務端1.下載官方yum源：rpm -ivh http://repo.zabbix.com/zabbix/3.2/rhel/7/x86_64/zabbix-release-3.2-1.el7.noarch.rpm2.安裝zabbix服務端（會自動安裝http

Android 仿窗簾效果和登錄界面拖動效果（Scroller類的應用）附 2個DEMO及源代碼

@override 宋體 off down != 過程事件學習 border 在android學習中，動作交互是軟件中重要的一部分。當中的Scroller就是提供了拖動效果的類，在網上。比方說一些Launcher實現滑屏都能夠通過這個類去實現。以下要說的

Hadoop 2.x常用端口及查看方法

hadoop常用端口一、常用端口組件節點默認端口配置用途說明HDFSDataNode50010dfs.datanode.addressdatanode服務端口，用於數據傳輸HDFSDataNode50075dfs.datanode.http.addresshttp服務的端口HDFSDataNode50475d

[3140] Sublime Text 2.x, 3.x 通用註冊碼、密鑰集合

cbc 所有包括 mmu pre 2.x cad 字符串 lar [3140] Sublime Text 2.x, 3.x Universal License Keys collection for Win, Mac & Lin 所有這些許可證密鑰都被測

Fw: EPM 11.1.2.x – Planning/PBCS Best Practices for BSO Business Rule Optimisation

trigge rec oval sage depend opera manage 1.2 group 1. Introduction This document is intended to provide best practices for Business Rule

記錄：Ubuntu下升級Python從2.x到3.x

終端 http 方法 ubun 可能 var png 解鎖建立一、安裝Python3 在Ubuntu中的終端輸入：sudo apt-get install python3 提示資源被鎖住，可能有另外一個程序在占用此資源。解決方法：輸入以下指令解鎖資源 sudo rm

Hadoop 2.x簡介

計算框架擴展性 namenode 背景在線目錄其它內存 alt Hadoop 2.0產生背景 Hadoop1.0中HDFS和MapReduce在高可用、擴展性等方面存在問題 HDFS存在的問題 NameNode單點故障，難以應用於在線場景 NameNode壓力

Hadoop 2.x 之 HA 簡介

算法另一個實現 con nal 數據塊網絡內部使用加載 HA結構圖 HA是用來解決單點故障問題 DN: DataNode，啟動時會往所有的NameNode匯報 NN: NameNode(主 Active(一個) 備 Standby(可以有多個)) Jo

CentOS 6.x 下安裝Zabbix Agent 3.2.x 操作指引

zabbix agent linuxCentOS 6.x 下安裝Zabbix Agent 3.2.x 操作指引=====第一步：安裝rpm包rpm -ivh http://http://repo.zabbix.com/zabbix/3.2/rhel/6/x86_64/zabbix-agent-3.2.0-1.

Vue.js（2.x）之計算屬性

眼睛猜想官網文檔 data ctype 小結 isp def 直接昨天看完大神的文章後，深感慚愧，硬著頭皮繼續看官網文檔，然而這真的沒是沒辦法，介紹的實在有些敷衍： 1）、計算屬性:也不說下computed是計算屬性關鍵詞，vm實例是可以像代理data一樣代理comp

springmvc4.2.X fastjson 替換引用配置

ati gis htm bsp color conf cati date mvc4 1 <mvc:annotation-driven> 2 <mvc:message-converters register-defaults="true

Cobbler 2.x安裝與配置

centos7 ejs config sync uic mil 自動安裝腳本 file loading 軟件環境 Centos7.3 Cobbler 2.8.1 1、下載、編譯和安裝創建自動安裝腳本cobbler-install.sh #!/bin/bash # Fi

CodeIgniter 2.x和3.x修改默認控制器問題解答

控制器修改 brush 並不會有時 logs test home fig 首先明確一點，CodeIgniter框架的2.x和3.x版本中修改默認控制器是有一點區別的但相同的操作都是修改application/config/routes.php $route[‘def

HDU 1395 2^x mod n = 1 （歐拉函數）

ear val clu pro ava http align 歐拉 similar 2^x mod n = 1 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Other

UWP 使用OneDrive雲存儲2.x api（二）【全網首發】

back existing ace -s -c file school sync sqlite 接上一篇 http://www.cnblogs.com/hupo376787/p/8032146.html 上一篇提到為了給用戶打造一個完全無縫銜接的最佳體驗，UWP開發者最好也

UWP 使用OneDrive雲存儲2.x api（一）【全網首發】

既然現在 rest 方式 exist 開源體驗 clas 下載地址最近開發人臉識別UWP【微識別 / WeRecognition】用到了OneDrive開發，下面把來龍去脈講一下。下載地址 https://www.microsoft.com/store/produc

sparksql 2.x demo I

相關推薦