spark將hive表結果儲存至mysql表中BigDecimal精度問題解決。

阿新 • • 發佈：2021-02-10

技術標籤：Spark

問題描述：

hive表結果dataFrame 將row轉case時精度轉換時報錯：
Cannot up cast xxx from decimal(29,2) to decimal(38,18) as it may truncate

Exception in thread "main" org.apache.spark.sql.AnalysisException: Cannot up cast `zskpje` from decimal(29,2) to decimal(38,18) as it may truncate
The type path of the target object is:
- field ( 
class: "scala.math.BigDecimal", name: "zskpje")
- root class: "com.xxx.bean.Inovice_Monthly"
You can either add an explicit cast to the input data or choose a higher precision type of the field in the target object;
	at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveUpCast 
$.org$apache$spark$sql$catalyst$analysis$Analyzer$ResolveUpCast$$fail(Analyzer.scala:2292)
	at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveUpCast$$anonfun$apply$37$$anonfun$applyOrElse$15.applyOrElse(Analyzer.scala:2308)
	at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveUpCast$$anonfun 
$apply$37$$anonfun$applyOrElse$15.applyOrElse(Analyzer.scala:2303)
	at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$2.apply(TreeNode.scala:267)
	at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$2.apply(TreeNode.scala:267)
	at org.apache.spark.sql.catalyst.trees.CurrentOrigin$.withOrigin(TreeNode.scala:70)

錯誤原因：

 val result = DwdDataDao.getmonthlyStatisticsData(sparkSession: SparkSession).as[Inovice_Monthly]

查詢hive結果想將row轉成case儲存生成DataSet
輸出結果dataframe schema

root
 |-- NSR_SBH: string (nullable = true)
 |-- INVOICE_TYPE: decimal(10,0) (nullable = true)
 |-- TAX_RATE: decimal(18,2) (nullable = true)
 |-- zskpje: decimal(29,2) (nullable = true)
	......

而我們建立的case類（Inovice_Monthly）為BigDecimal 預設為（38，18）
想讓 DecimalType(10,0)->DecimalType(38,18) 或DecimalType(29,2)->DecimalType(38,18)顯然都是不可行的

case class Inovice_Monthly(
                              NSR_SBH: String,
                              INVOICE_TYPE: BigDecimal,
                              TAX_RATE: BigDecimal,
                              zskpje: BigDecimal,
								......
                            )

Spark case class開發人員認為從scala推斷模式很方便，他們選擇不支援允許程式設計師為Decimal或中的BigDecimal型別指定精度和小數位數case class 請參閱https://issues.apache.org/jira/browse/SPARK-18484

解決方法：

本人是將case類中BigDecimal型別改為Double 然後將結果集每列對應修改型別。

 result.withColumn("INVOICE_TYPE", result("INVOICE_TYPE").cast(DoubleType))
      .withColumn("TAX_RATE", result("TAX_RATE").cast(DoubleType))
      .withColumn("zskpje", result("zskpje").cast(DoubleType))
		......
      .as[Inovice_Monthly]

row轉成case無報錯
在這裡插入圖片描述

spark將hive表結果儲存至mysql表中BigDecimal精度問題解決。

技術標籤：Spark 問題描述： hive表結果dataFrame 將row轉case時精度轉換時報錯： Cannot up cast xxx from decimal(29,2) to decimal(38,18) as it may truncate

python結果儲存至列表x中_Python 基礎入門（四）從列表到元組學習小結

技術標籤：python結果儲存至列表x中本系列第四章一. 學習路線概述學習地址：

使用python的pandas庫讀取csv檔案儲存至mysql資料庫

第一：pandas.read_csv讀取本地csv檔案為資料框形式 data=pd.read_csv(\'G:\\data_operation\\python_book\\chapter5\\\\sales.csv\')

隨機生成八位優惠碼並儲存至Mysql資料庫

目前很多商家通過優惠碼做活動，現在我們簡單的實現八位的優惠碼，並儲存在資料庫中。

基於jsbarcode 生成條形碼並將生成的條碼儲存至本地+原始碼

引言 JsBarcode是一個用JavaScript編寫的條形碼生成器。它支援多種條形碼格式，可在瀏覽器和Node.js中使用。如果你在專案中使用了jquery也可以使用jquery，但它不是依賴項。

有如下值集合[11,22,33,44,55,66,77,88,99,90], 將所有大於66的值儲存至字典的第一個key中，將小於66值儲存至第二個key的值

技術標籤：pythonpython 1.有如下值集合[11,22,33,44,55,66,77,88,99,90], 將所有大於66的值儲存至字典的第一個key中，將小於66值儲存至第二個key的值

pyspark讀取csv文字儲存至MySQL案例

pyspark讀取csv文字儲存至MySQL案例我們在使用spark處理完資料時，經常要將處理好的結果資料儲存的如mysql等關係型資料庫中，下面我們通過一個示例說明如何將spark處理好的資料儲存到mysql中

【jmeter系列】Jmeter將響應資料結果儲存到csv檔案的兩種方式（Bean Shell）

背景日常介面測試，需要將介面返回值對應的欄位資料儲存下來示例介面： post請求：

Hive基礎（十九）：面試題:如何用sqoop將hive中分割槽表的分割槽欄位匯入到MySQL中

問題分析： hive中分割槽表其底層就是HDFS中的多個目錄下的單個檔案，hive匯出資料本質是將HDFS中的檔案匯出

mysql臨時表用法分析【查詢結果可存在臨時表中】

本文例項講述了mysql臨時表用法。分享給大家供大家參考，具體如下：一、建立臨時表可以將查詢結果寄存。報表製作的查詢sql中可以用到。

python將類似json的資料儲存到MySQL中的例項

由於之前對於爬取下來的資料都是存入MongoDB中，想起來還沒有嘗試存入MySQL，於是將一篇簡單的文章爬取下來，存入MySQL試試

mysql儲存過程基礎之遍歷多表記錄後插入第三方表中詳解

前言自從學過儲存過程後，就再也沒有碰過儲存過程，這是畢業後寫的第一個儲存過程。

利用scrapy將爬到的資料儲存到mysql（防止重複）

前言本文主要給大家介紹了關於scrapy爬到的資料儲存到mysql（防止重複）的相關內容，分享出來供大家參考學習，下面話不多說了，來一起看看詳細的介紹吧。

Hive元資料資訊對應MySQL資料庫表

一、VERSION（儲存Hive版本的元資料表）如果該表出現問題，根本進入不了Hive-Cli。

android實現搜尋功能並將搜尋結果儲存到SQLite中(例項程式碼)

執行結果：涉及要點： ListView+EditText+ScrollView實現搜尋效果顯示監聽軟鍵盤迴車執行搜尋

Pandas讀取或儲存資料至Mysql

兩種連結方式用DBAPI構建資料庫連結 import pymysql import pandas as pd con = pymysql.connect(host=\"127.0.0.1\",user=\"root\",password=\"password\",db=\"world\")

MySQL教程33-修改資料表的儲存引擎

在前面提到，MySQL的核心就是儲存引擎。MySQL 儲存引擎主要有 InnoDB、MyISAM、Memory、BDB、Merge、Archive、Federated、CSV、BLACKHOLE 等。

hive（1）——用mysql進行元資料儲存

Hive可以將結構化的資料對映為一張資料表而預設hive進行儲存的資料庫是derby 啟動我們的hadoop服務當我們安裝好hive後，要將mysql-connector-java-xx.jar的檔案包放到hive目錄下的lib資料夾下：這時候我們

高效能MySQL（七）：轉換表的儲存引擎

介紹三種方式將表的儲存引擎轉換成另一種儲存引擎： 1、ALTER TABLE 最簡單的方式就是使用修改表ALTER TABLE語句：

mysql innodb儲存引擎的表空間

InnoDB儲存引擎的表空間 1.共享表空間（ibdata1） 1）儲存的內容 1.系統資料 2.臨時表