Spark sql 讀寫資料庫

阿新 • • 發佈：2021-01-11

用JDBC連線MySql

啟動MySQL
輸入下面的語句完成資料庫和表的建立

create database spark;
use spark;
create table student(id int(4),name char(20),gender char(4),age int(4));
insert into student values(1,'Xueqian','F',23);
insert into student values(2,'Weiliang','M',24);
select * from student;

在這裡插入圖片描述

啟動spark-shell

指定MySql連線驅動jar包

 val jdbcDF=spark.read.format("jdbc").
      option("url","jdbc:mysql://master:3306/spark").
      option("driver","com.mysql.jdbc.Driver").
      option("dbtable","student").
      option("user","root" 
).
      option("passjdword","01bk").
      load()
     jdbcDF: org.apache.spark.sql.DataFrame = [id: int, name: string ... 2 more fields]

在這裡插入圖片描述

向MySQL中寫入資料

import java.util.Properties
import org.apache.spark.sql.types._
import org.apache.spark.sql.Row

//兩個學生資訊
val studentRDD=spark.sparkContext
. 
parallelize(Array("3 Rongcheng M 26","4 Guanhua M 27"))
.map((_.split(""))
//設定模式資訊，得到表頭
val schema = StructType(List(
    StructField("id",IntegerType,true),
    StructField("name", StringType, true),
    StructField("gender", IntegerType, true),
    StructField("age", IntegerType, true)
  ))
  //建立Row物件，每個Row物件都是rowRDD中的一行
  val rowRDD: RDD[Row] = StudentRDD
    .map(x => Row(x(0).toInt, x(1).trim,x(2).trim,x(3).toInt))
  //建立Row和模式間的對應關係
  val studentDF = spark.createDataFrame(rowRDD,schema)  


//下面建立一個prop變數用來儲存JDBC連線引數
val prop = new Properties()
prop.put("user", "root")//表示使用者名稱是root
prop.put("password"，"01bk")//表示密碼是hadoop
prop.put("driver","com.mysql.jdbc.Driver")//表示驅動程式是com.mysql.jdbc.Driver
Pro.put(“驅動程式”，“com.mysql.jdbc.Driver”)//表示驅動程式是com.mysql.jdbc.Driver
//下面就就可以連線資料庫，採用append模式，表示追加記錄到資料庫spark的student表
studentDF.write.mode("append").
jdbc("jdbc:mysql://master:3306/spark","spark.student",prop)

Spark sql 讀寫資料庫

技術標籤：資料庫scalasparkjdbc 用JDBC連線MySql 啟動MySQL 輸入下面的語句完成資料庫和表的建立

Spark-SQL 讀寫Parquet檔案

技術標籤：Sparkspark 讀Parquet格式wenjian import org.apache.spark.sql.{DataFrame, SparkSession}

Spark-SQL 讀寫jdbc

技術標籤：Sparkspark 讀jdbc中的資訊 import java.util.Properties import org.apache.spark.sql.{DataFrame, SparkSession}

Spark-SQL 讀寫csv檔案

技術標籤：Sparkspark name,age,fv_value libai,18,9999.99 xuance,30,99.99 diaochan,28,99.99 libai,18,9999.99

Spark-SQL讀不到Hive資料庫的新坑指北

背景本文講的是spark-sql這個命令列工具讀取hive資料的情況： Spark是2.3.1，HDP發行版

【spark】elasticsearch自簽證書，spark進行讀寫

頒發自簽證書　　1) 列出keystore中的證書 keytool -list 　　預設情況下，它會在你的 $HOME 目錄下產生一個空的 .keystore 檔案。如要指定 Java 正在用的 keystore 檔案，使用以下引數

初識spark 之讀寫MySql資料

需求 1、使用spark讀取MySql庫資料； 2、使用spark讀取MySql庫資料，並寫入另一張表。

AOP實現mysql的主從資料庫：讀寫分離

1.問題首先，為什麼會碰到這樣的問題？昨天寫的一個業務上線了，但是在dev環境和test環境都能跑，但是到了線上環境發生資料不能插入的問題。

Mycat分散式資料庫架構解決方案--Mycat實現讀寫分離

echo編輯整理，歡迎轉載，轉載請宣告文章來源。歡迎新增echo微信(微訊號：t2421499075)交流學習。百戰不敗，依不自稱常勝，百敗不頹，依能奮力前行。——這才是真正的堪稱強大！！！

基於ShardingJDBC進行資料庫讀寫分離

1、引入依賴專案pom.xml檔案中，引入sharding-jdbc的依賴： <dependency> <groupId>org.apache.shardingsphere</groupId>

springboot+mybatis實現資料庫的讀寫分離

介紹隨著業務的發展，除了拆分業務模組外，資料庫的讀寫分離也是常見的優化手段。

Python使用Pandas庫實現MySQL資料庫的讀寫

本次分享將介紹如何在Python中使用Pandas庫實現MySQL資料庫的讀寫。首先我們需要了解點ORM方面的知識

詳解如何利用amoeba(變形蟲)實現mysql資料庫讀寫分離

關於mysql的讀寫分離架構有很多，百度的話幾乎都是用mysql_proxy實現的。由於proxy是基於lua指令碼語言實現的，所以網上不少網友表示proxy效率不高，也不穩定，不建議在生產環境使用；

利用MySQL主從配置實現讀寫分離減輕資料庫壓力

大型網站為了軟解大量的併發訪問，除了在網站實現分散式負載均衡，遠遠不夠。到了資料業務層、資料訪問層，如果還是傳統的資料結構，或者只是單單靠一臺伺服器扛，如此多的資料庫連線操作，資料庫必然會崩潰，資料丟

分析Mysql表讀寫、索引等操作的sql語句效率優化問題

上次我們說到mysql的一些sql查詢方面的優化，包括檢視explain執行計劃，分析索引等等。今天我們分享一些分析mysql表讀寫、索引等等操作的sql語句。

Python讀寫及備份oracle資料庫操作示例

本文例項講述了Python讀寫及備份oracle資料庫操作。分享給大家供大家參考，具體如下：

利用mycat實現mysql資料庫讀寫分離的示例

什麼是MyCAT 一個徹底開源的，面向企業應用開發的大資料庫叢集支援事務、ACID、可以替代MySQL的加強版資料庫

Redis如何實現資料庫讀寫分離詳解

前言 Redis是一種NoSQL的文件資料庫，通過key-value的結構儲存在記憶體中，Redis讀的速度是110000次/s，寫的速度是81000次/s，效能很高，使用範圍也很廣。Redis是一個key-value儲存系統。和Memcached類似，為了保證效

MySQL資料庫的主從同步配置與讀寫分離

使用mysql主從複製的好處有： 1、採用主從伺服器這種架構，穩定性得以提升。如果主伺服器發生故障，我們可以使用從伺服器來提供服務。

SQL Server AlwaysOn讀寫分離配置圖文教程

概述 Alwayson相對於資料庫映象最大的優勢就是可讀副本，帶來可讀副本的同時還添加了一個新的功能就是配置只讀路由實現讀寫分離；當然這裡的讀寫分離稍微誇張了一點，只能稱之為半讀寫分離吧！看接下來的文章就知道為

Spark sql 讀寫資料庫

用JDBC連線MySql

相關推薦