pyspark讀取csv文字儲存至MySQL案例

阿新 • • 發佈：2020-12-25

pyspark讀取csv文字儲存至MySQL案例

我們在使用spark處理完資料時，經常要將處理好的結果資料儲存的如mysql等關係型資料庫中，下面我們通過一個示例說明如何將spark處理好的資料儲存到mysql中

csv檔案如下

檔案student.csv

id,name,age
1,張三,23
2,李四,24

程式碼如下

from pyspark.sql.session import SparkSession as spark

sc = spark.builder.master('local[*]').appName('pysparktest').getOrCreate()

stuDF = sc.read.csv('C:\\Users\Administrator\Desktop\student.csv',header=True)

stuDF.show()
prop = {}
prop['user'] = 'root'
prop['password'] = 'root'
prop['driver'] = 'com.mysql.jdbc.Driver'

stuDF.write.jdbc('jdbc:mysql://localhost:3306/pyspark?characterEncoding=UTF-8','student','append',prop)
    
sc.stop()

問題及坑：

1、報錯找不到mysql驅動

該解決方案是基於windows環境配置的pyspark
解決方案：

首先找到pyspark的安裝路徑，如果使用的是pip的安裝的一般在C盤下。
如果找不到可通過全盤檢索工具 Everythin搜尋 pyspark找到spypark.cmd所在的資料夾的上一層就是pyspark的安裝路徑
如我的安裝目錄就在下面
然後將mysql的驅動拷貝到pyspark安裝路徑下的jars資料夾中
然後在系統環境變數中配置SPARK_CLASSPATH環境變數

上面的步驟操作完後，愉快的執行程式碼，發現成功了！！！

pyspark讀取csv文字儲存至MySQL案例

pyspark讀取csv文字儲存至MySQL案例我們在使用spark處理完資料時，經常要將處理好的結果資料儲存的如mysql等關係型資料庫中，下面我們通過一個示例說明如何將spark處理好的資料儲存到mysql中

使用python的pandas庫讀取csv檔案儲存至mysql資料庫

第一：pandas.read_csv讀取本地csv檔案為資料框形式 data=pd.read_csv(\'G:\\data_operation\\python_book\\chapter5\\\\sales.csv\')

隨機生成八位優惠碼並儲存至Mysql資料庫

目前很多商家通過優惠碼做活動，現在我們簡單的實現八位的優惠碼，並儲存在資料庫中。

spark將hive表結果儲存至mysql表中BigDecimal精度問題解決。

技術標籤：Spark 問題描述： hive表結果dataFrame 將row轉case時精度轉換時報錯： Cannot up cast xxx from decimal(29,2) to decimal(38,18) as it may truncate

Pandas讀取或儲存資料至Mysql

兩種連結方式用DBAPI構建資料庫連結 import pymysql import pandas as pd con = pymysql.connect(host=\"127.0.0.1\",user=\"root\",password=\"password\",db=\"world\")

MySQL儲存結構用法案例分析

本文例項講述了MySQL儲存結構用法。分享給大家供大家參考，具體如下：前言

Pytorch提取模型特徵向量儲存至csv的例子

Pytorch提取模型特徵向量 # -*- coding: utf-8 -*- \"\"\" dj \"\"\" import torch import torch.nn as nn

DataX案例：讀取MongoDB的資料匯入MySQL

讀取MongoDB的資料匯入MySQL 1）在MySQL中建立表 mysql> create table jason(name varchar(20),url varchar(20));

Python讀取CSV檔案寫入Mysql資料庫

環境 win10 python3.7 mysql5.7 方法 pymysql pip install pymysql xxx.py # -*- coding:utf-8 -*- import pandas as pd

pyspark 讀取本地csv_tidyfst vs pandas（1）：csv檔案讀寫

技術標籤：pyspark 讀取本地csv 作者：黃天元，復旦大學博士在讀，熱愛資料科學與開源工具（R），致力於利用資料科學迅速積累行業經驗優勢和科學知識發現，涉獵內容包括但不限於資訊計量、機器學習、資料視覺化

Zipkin實現儲存追蹤資料至MySQL

目錄前言 1、資料庫指令碼 3、部署Zipkin服務端 4、測試前言 Zipkin Server預設儲存追蹤資料至記憶體中，這種方式並不適合生產環境，一旦server關閉重啟或者服務崩潰，就會導致歷史資料消失。Zi

Zipkin實現基於RabbitMQ儲存鏈路資訊至MySQL

目錄摘要 1、啟動rabbitmq伺服器 2、部署Zipkin服務端 3、檢視佇列 4、客戶端新增依賴

python將類似json的資料儲存到MySQL中的例項

由於之前對於爬取下來的資料都是存入MongoDB中，想起來還沒有嘗試存入MySQL，於是將一篇簡單的文章爬取下來，存入MySQL試試

python讀取word文件,插入mysql資料庫的示例程式碼

表格內容如下： 1、實現批量匯入word文件，取文件標題中的數字作為編號 2、除取上面打鉤的內容需要匹配出來入庫入庫，其他內容全部直接入庫mysql

python3爬取資料至mysql的方法

本文例項為大家分享了python3爬取資料至mysql的具體程式碼，供大家參考，具體內容如下

python 從csv讀資料到mysql的例項

如下所示： import csv import sys,os import MySQLdb def read_csv(filename): with open(filename) as f: f_csv = csv.reader(f)

利用scrapy將爬到的資料儲存到mysql（防止重複）

前言本文主要給大家介紹了關於scrapy爬到的資料儲存到mysql（防止重複）的相關內容，分享出來供大家參考學習，下面話不多說了，來一起看看詳細的介紹吧。

Python讀取csv檔案例項解析

這篇文章主要介紹了Python讀取csv檔案例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python CSV檔案模組的使用案例分析

本文例項講述了Python CSV檔案模組的使用。分享給大家供大家參考，具體如下：

python 中Arduino串列埠傳輸資料到電腦並儲存至excel表格

起因：學校運河杯報了個專案，製作一個天氣預測的裝置。我用arduino跑了BME280模組，用藍芽模組實現兩塊arduino主從機透傳。但是為了分析，還需要提取出資料。因此我用python寫了個上位機程式，用pyserial模組實現ar

pyspark讀取csv文字儲存至MySQL案例

pyspark讀取csv文字儲存至MySQL案例

相關推薦