Spark-SQL 讀寫Parquet檔案

阿新 • • 發佈：2021-01-05

技術標籤：Spark spark

讀Parquet格式wenjian

import org.apache.spark.sql.{DataFrame, SparkSession}

object CreateDataFrameFromParquet {
  def main(args: Array[String]): Unit = {

    //建立SparkSession(是對SparkContext的包裝和增強)
    val spark: SparkSession = SparkSession.builder()
      .appName(this.getClass.getSimpleName)
      .master("local[*]")
      .getOrCreate()
    
    val df: DataFrame = spark.read.parquet("src/main/scala/data/user.parquet")

    df.show(2)

    df.printSchema()
    
    spark.stop()
  }
}

寫入到Parquet格式檔案中

import org.apache.spark.SparkContext
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{DataFrame, Row, SparkSession}
import org.apache.spark.sql.types.{DoubleType, IntegerType, StringType, StructField, StructType}

object WriteToParquet {
  def main(args: Array[String]): Unit = {
    //建立SparkSession
    val spark: SparkSession = SparkSession.builder()
      .appName(this.getClass.getSimpleName)
      .master("local[*]")
      .getOrCreate()

    val sc: SparkContext = spark.sparkContext

    val lines: RDD[String] = sc.textFile("src/main/scala/data/user.txt")
    //row的欄位沒有名字 沒有型別
    val rdd1: RDD[Row] = lines.map(e => {
      val split = e.split(",")
      Row(split(0), split(1).toInt, split(2).toDouble)
    })

    //關聯schema(欄位名稱、欄位型別、是否可以為空)
    val schema: StructType = StructType(
      Array(
        StructField("name", StringType),
        StructField("age", IntegerType),
        StructField("fv", DoubleType)
      )
    )
    //將RowRDD與StructType中的schema關聯
    val df1: DataFrame = spark.createDataFrame(rdd1, schema)

    df1.write.parquet("src/main/scala/data/outpar")

    sc.stop()
    spark.stop()
  }
}

Spark-SQL 讀寫Parquet檔案

技術標籤：Sparkspark 讀Parquet格式wenjian import org.apache.spark.sql.{DataFrame, SparkSession}

Spark-SQL 讀寫csv檔案

技術標籤：Sparkspark name,age,fv_value libai,18,9999.99 xuance,30,99.99 diaochan,28,99.99 libai,18,9999.99

Spark-SQL 讀寫jdbc

技術標籤：Sparkspark 讀jdbc中的資訊 import java.util.Properties import org.apache.spark.sql.{DataFrame, SparkSession}

Spark sql 讀寫資料庫

技術標籤：資料庫scalasparkjdbc 用JDBC連線MySql 啟動MySQL 輸入下面的語句完成資料庫和表的建立

sql server 讀寫txt檔案

技術標籤：資料庫sql server文字檔案檔案讀寫txt 測試環境： sql server 的登入使用者為sa

Spark-SQL讀不到Hive資料庫的新坑指北

背景本文講的是spark-sql這個命令列工具讀取hive資料的情況： Spark是2.3.1，HDP發行版

Python3讀寫Excel檔案(使用xlrd,xlsxwriter,openpyxl3種方式讀寫例項與優劣)

Python中幾種常用包比較 2、用xlrd包讀取Excel檔案引用包 import xlrd 開啟檔案 xlrd.open_workbook(r\'/root/excel/chat.xls\')

python使用docx模組讀寫docx檔案的方法與docx模組常用方法詳解

一，docx模組 Python可以利用python-docx模組處理word文件，處理方式是面向物件的。也就是說python-docx模組會把word文件，文件中的段落、文字、字型等都看做物件，對物件進行處理就是對word文件的內容處理。

Python3中configparser模組讀寫ini檔案並解析配置的用法詳解

Python3中configparser模組簡介 configparser 是 Pyhton 標準庫中用來解析配置檔案的模組，並且內建方法和字典非常接近。Python2.x 中名為 ConfigParser，3.x 已更名小寫，並加入了一些新功能。

C# 讀寫XML檔案例項程式碼

C#史上最簡單讀寫xml檔案方式，建立控制檯應用程式賦值程式碼，就可以執行，需要改動，請自行調整

Python3操作讀寫CSV檔案使用包過程解析

CSV(Comma-Separated Values)即逗號分隔值，一種以逗號分隔按行儲存的文字檔案，所有的值都表現為字串型別（注意：數字為字串型別）。

WPF 讀寫XML檔案

程式集整體框架如下：其中XmlReader類如下： using System; using System.Collections.Generic;

C#讀寫文字檔案原始碼片段

下邊內容段是關於C#讀寫文字檔案片段的內容，應該是對碼農們也有用。 using System; using System.IO; public class TestReadFile {public static void Main(String[] args){FileStream fs = new FileStream(@c:temp

nodejs讀寫json檔案

讀json檔案 \'use strict\'; const fs = require(\'fs\'); let rawdata = fs.readFileSync(\'student.json\');

讀/寫xlsx檔案

安裝 pip install openpyxl 1．建立Excel電子表格建立新文件需要呼叫Workbook物件的save方法，一個Workbook物件代表一個Excel工作簿，該方法的引數是儲存的檔名。

如何讀寫excel檔案？

需求： Microsoft Excel是目前辦公中使用最頻繁的軟體，其資料格式為xls,xlsx,一種非常常用的電子表格，小學某班成績，記錄在excel檔案中：

C# 使用Newtonsoft.Json讀寫Json檔案

json： { \"Information\": [ { \"LocationName\": \"通道1\", \"Points\": [ [ 1, 2, 3, 4 ], [ 5, 6, 7, 8 ] ] },

java讀寫磁碟檔案

參考： https://blog.csdn.net/qq_30141957/article/details/80049128 https://blog.csdn.net/liuhenghui5201/article/details/8279557

Python讀寫壓縮檔案的方法

問題你想讀寫一個gzip或bz2格式的壓縮檔案。解決方案 gzip 和 bz2 模組可以很容易的處理這些檔案。兩個模組都為 open() 函式提供了另外的實現來解決這個問題。比如，為了以文字形式讀取壓縮檔案，可以這樣做：

Python如何讀寫CSV檔案

CSV檔案是一種純文字檔案，它使用特定的結構來排列表格資料。 CSV檔案內容看起來應該是下面這樣的：

Spark-SQL 讀寫Parquet檔案

讀Parquet格式wenjian

寫入到Parquet格式檔案中

相關推薦