dataframe的進行json數據的壓平、增加一列的id自增列

阿新 • • 發佈：2019-03-27

swe name 元素 each apache justin 自增 cit sql

{"name":"Michael", "age":25,"myScore":[{"score1":19,"score2":23},{"score1":58,"score2":50}]}
{"name":"Andy", "age":30,"myScore":[{"score1":29,"score2":33},{"score1":38,"score2":52},{"score1":88,"score2":71}]}
{"name":"Justin", "age":19,"myScore":[{"score1":39,"score2":43},{"score1":28,"score2":53}]}
{"name":"Michael", "age":25,"myScore":[{"score1":19,"score2":23},{"score1":58,"score2":50}]}

object explodeTest {
  def main(args: Array[String]): Unit = {

    val sparks = SparkSession.builder.master("local[4]").appName("test1").getOrCreate
    val sc = sparks.sparkContext

    val df=  sparks.read.json("file:///C:\\Users\\imp\\Desktop\\bo-kong\\data\\josn")

    df.show()
    //spark  讀取json 數據
    /**+---+--------------------+-------+
|age|             myScore|   name|
+---+--------------------+-------+
| 25|  [[19,23], [58,50]]|Michael|
| 30|[[29,33], [38,52]...|   Andy|
| 19|  [[39,43], [28,53]]| Justin|
| 25|  [[19,23], [58,50]]|Michael|
| 30|[[29,33], [38,52]...|   Andy|
| 19|  [[39,43], [28,53]]| Justin|
| 25|  [[19,23], [58,50]]|Michael|
| 30|[[29,33], [38,52]...|   Andy|
| 19|  [[39,43], [28,53]]| Justin|
+---+--------------------+-------+
      *
      *
      *
      */

    //使用spark.sql.functions._ explode函數進行壓平操作  行轉列
    import org.apache.spark.sql.functions._
    val dfScore = df.select(df("name"),explode(df("myScore"))).toDF("name","myScore")
    val dfMyScore = dfScore.select("name","myScore.score1", "myScore.score2")
    dfScore.show()
   df.createOrReplaceTempView("df")
    //u.answer, ‘‘
    /**
      *
      *
      *
      * +-------+-------+
      * |   name|myScore|
      * +-------+-------+
      * |Michael|[19,23]|
      * |Michael|[58,50]|
      * |   Andy|[29,33]|
      * |   Andy|[38,52]|
      * |   Andy|[88,71]|
      * | Justin|[39,43]|
      * | Justin|[28,53]|
      * |Michael|[19,23]|
      * |Michael|[58,50]|
      * |   Andy|[29,33]|
      * |   Andy|[38,52]|
      * |   Andy|[88,71]|
      * | Justin|[39,43]|
      * | Justin|[28,53]|
      * |Michael|[19,23]|
      * |Michael|[58,50]|
      * |   Andy|[29,33]|
      * |   Andy|[38,52]|
      * |   Andy|[88,71]|
      * | Justin|[39,43]|
      * +-------+-------+
      * only showing top 20 rows
      */



  }
}

數據
aa
bb
cc
dd
ee
ff

dataframe增加index主鍵列

 case  class Log(map:scala.collection.mutable.Map[String,String],ID: Long)
    import sparks.implicits._
  val data2 =  sc.parallelize(Seq((Map("uuid"->"sxexx","ip"->"192.168")),Map("uuid"->"man","ip"->"192.168.10.1"))).zipWithIndex()
    .map(i 
=>(i._1,i._2))
    data2.collect().foreach(print(_))
    /**
      * 先創造一個Rdd[map] 使用zipWithIndex 看看效果  第二個元素為id主鍵
      * 
      * 
      * (Map(uuid -> sxexx, ip -> 192.168),0)
      * (Map(uuid -> man, ip -> 192.168.10.1),1)
      */




val data=  sc.textFile("file:///C:\\Users\\imp\\Desktop\\bo-kong\\data\\data")
      .zipWithIndex().toDF("id","value")
    data.show()

    /**
      * 使用上面的數據的得出結果
      * +---+-----+
      * | id|value|
      * +---+-----+
      * | aa|    0|
      * | bb|    1|
      * | cc|    2|
      * | dd|    3|
      * | ee|    4|
      * | ff|    5|
      * +---+-----+
      */

dataframe的進行json數據的壓平、增加一列的id自增列

swe name 元素 each apache justin 自增 cit sql {"name":"Michael", "age":25,"myScore":[{"score1":19,"score2":23},{"score1":58,"score2":50}]}

oracle數據庫創建表且主鍵自增

創建 trigger contest 觸發器 create header 建表 div nextval Oracle數據庫中，設置ID自增並不像MySQL中那麽簡單，Oracle中需要設置一個序列。現在給出方式，具體如下：第一步：建立一個表 create tab

利用Gson將JSON數據進行格式化(pretty print)

div pretty string類型 overflow jsonp creat () one ons 我們可以利用Gson包將String類型的JSON數據進行格式化。 Gson gson = new GsonBuilder().setPrettyPrinting().

Jquery form.js文件上傳返回JSON數據,在IE下提示下載文件的解決辦法,並對返回數據進行正確的解析

設置解析轉換解決 pla esp 下載 ring 上傳 Jquery from.js插件上傳文件非常方便，但是在ie10以下的版本會彈出下載文件對話框解決方法: 1、在服務端設置response.setContentType("text/plain"); 2、對返回

SpringMVC返回JSON數據以及文件上傳、過濾靜態資源

SpringMVC 文件上傳返回JSON數據過濾靜態資源返回JSON數據在如今前後端分離的趨勢下，後端基本不需要再去關心前端頁面的事情，只需要把數據處理好並通過相應的接口返回數據給前端即可。在SpringMVC中，我們可以通過@ResponseBody註解來返回JSON數據或者是XML

大數據采集、清洗、處理：使用MapReduce進行離線數據分析完整案例

大數據 Hadoop MapReduce 數據清洗離線數據分析 [TOC] 1 大數據處理的常用方法大數據處理目前比較流行的是兩種方法，一種是離線處理，一種是在線處理，基本處理架構如下：在互聯網應用中，不管是哪一種處理方式，其基本的數據來源都是日誌數據，例如對於web應用來說，則

【量化小講堂- Python、pandas技巧系列】如何快速上手使用Python進行金融數據分析

exc 規律專業了解全能快速想法 pac 之前如何快速上手使用Python進行金融數據分析引言:本系列帖子“量化小講堂”，通過實際案例教初學者使用python、pandas進行金融數據處理，希望能對大家有幫助。【必讀文章】:《10年400倍策略分享-附視頻逐行講

32、Flask實戰第32天：優化json數據的返回

新建地方必須密碼錯誤 login form image 返回定義接著上節，我們通過jsonify返回json數據非常方便 ... return jsonify({"code": 400, "message": message}) 返回什麽數據則是公

ETL工具kettle怎麽進行增量數據抽取：一、通過標誌位

text term ESS log 繼續需要 roc 默認值 RoCE 在平時的操作過程中可能大家需要經常進行增量的數據抽取，方法有很多種，接下來幾天講給大家介紹幾種我本人經常使用的幾種方式；首先給大家介紹我最喜歡的一種，就是通過標誌位；操縱方法如下，在源表中增加一個標識

php中使用ajax進行前後端json數據交互

前端 array char 取數方式註冊界面 test 傳輸 created (最近在學習ajax，所以想自己總結一下在PHP中如何使用ajax技術！) 一、ajax註意點：　　1、原理圖：（來自韓順平ajax視頻）　　　　　　　　2、ajax返回數據類型

Ajax（form表單文件上傳、請求頭之contentType、Ajax傳遞json數據）

ati 沒有服務端內容 click 寫入 ESS mit 上傳 form表單文件上傳上菜 file_put.html <form action="" method="post" enctype="multipart/form-data"> {#

利用Python進行數據分析_Pandas_數據加載、存儲與文件格式

數據加載 1.2 格式 span div 逗號 names pytho spa 申明：本系列文章是自己在學習《利用Python進行數據分析》這本書的過程中，為了方便後期自己鞏固知識而整理。 1 pandas讀取文件的解析函數 read_csv 讀取帶分隔符的數據，默認分隔符

當Json數據中的key為Java關鍵字時，在定義實體類的時候不能對該字段進行聲明，所以需要對字段進行特殊處理

數據 prop str abstract prope 需要 jackson string 解析使用Gson解析在與Java關鍵字沖突的字段加上@SerializedName註解 @SerializedName("abstract") private Strin

一次國際化記錄以及平鋪JSON數據

inside new 其他 tolower 總結方便 scrip 再看 rev ? 寫這個方法的原因是因為我們需要改版國際化，因為相同的項目有其他分支做過國際化，但是主版本沒有進行過國際化，目前需要修改主版本的國際化，但是因為國際化的方式做了結構上的調整所以寫了這個工具

Pandas：DataFrame數據的更改、插入新增的列和行

core 參數 tro 語法 columns ont 對象需要 mage 一、更改DataFrame的某些值 1、更改DataFrame中的數據，原理是將這部分數據提取出來，重新賦值為新的數據。 2、需要註意的是，數據更改直接針對DataFrame原數據更改，操作無法

Android 實現Json數據解析，並進行應用

二維 message contex title 開發 blog asmx ear 身份證從網站上獲取數據然後再客戶端進行解析是常見的數據交互。下面是常用的一些接口網址： webservice工廠接口 http://www.36wu.com 快遞查詢接口http://

Pandas中DataFrame數據合並、連接（concat、merge、join）之concat

多個 name mage 參數技術 key 數據合並 bubuko axis 一、concat：沿著一條軸，將多個對象堆疊到一起 concat(objs, axis=0, join=‘outer‘, join_axes=None, ignore_index=False,

使用angularJS接收json數據並進行數據的顯示

findall targe rip 控制 -o fir fin 控制器 resp 1.引入JS <script type="text/javascript" src="../plugins/angularjs/angular.min.js"></sc

使用pandas、sklearn等外部庫進行iris數據的分類和繪圖，並計算正確率

tin closed mode frame 內容 plt -a predict none from sklearn.model_selection import train_test_split from sklearn.datasets import load_

淺析ajax請求json數據並用js解析 [轉]

set gif .ajax -1 pen 技術分享 hide asc spa <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-

dataframe的進行json數據的壓平、增加一列的id自增列

相關推薦