pandas和spark dataframe互相轉換例項詳解

阿新 • • 發佈：2020-02-18

這篇文章主要介紹了pandas和spark dataframe互相轉換例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

from pyspark.sql import SparkSession
# 初始化spark會話
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe轉pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由於pandas的方式是單機版的，即toPandas()的方式是單機版的，所以參考breeze_lsw改成分散式版本：

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df,n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

pandas和spark dataframe互相轉換例項詳解

這篇文章主要介紹了pandas和spark dataframe互相轉換例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Spring IOC和aop的原理及例項詳解

這篇文章主要介紹了Spring IOC和aop的原理及例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python資料型別強制轉換例項詳解

1.字元強轉一切　如果是字串進行強制轉換,僅僅就是在原資料型別的兩邊套上引號

python中Pandas 庫函式DataFrame的基本屬性詳解

技術標籤：Python import pandas as pd DataFrame是一個結構體 class DataFrame(data=None, index: Optional[Axes]=None, columns: Optional[Axes]=None, dtype: Optional[Dtype]=None, copy: bool=False)

java利用JAXB實現物件和xml互相轉換方法與例項詳解

1、JAXB應用場景在使用WebService實現資料上傳下載，資料查詢時，可以利用JAXB實現java實體類和xml互相轉換

Java抽象類和抽象方法定義與用法例項詳解

本文例項講述了Java抽象類和抽象方法定義與用法。分享給大家供大家參考，具體如下：

Spring Bean的初始化和銷燬例項詳解

本文例項講述了Spring Bean的初始化和銷燬。分享給大家供大家參考，具體如下：

mysql檢視之建立檢視（CREATE VIEW）和使用限制例項詳解

本文例項講述了mysql檢視之建立檢視（CREATE VIEW）和使用限制。分享給大家供大家參考，具體如下：

python和mysql互動操作例項詳解【基於pymysql庫】

本文例項講述了python和mysql互動操作。分享給大家供大家參考，具體如下： python要和mysql互動，我們利用pymysql這個庫。

MongoDB分片鍵的選擇和案例例項詳解

前言分片鍵選擇不好，應用程式就無法利用分片叢集所提供的諸多優勢。在這種情況下，插入和查詢的效能都會顯著下降。下決定時一定要嚴肅，一旦選擇了分片鍵，就必須堅持選擇，分片鍵是不可以修改的。要讓分片鍵提供好

django框架cookie和session用法例項詳解

本文例項講述了django框架cookie和session用法。分享給大家供大家參考，具體如下：

Python pandas RFM模型應用例項詳解

本文例項講述了Python pandas RFM模型應用。分享給大家供大家參考，具體如下：

Python資料分析pandas模組用法例項詳解

本文例項講述了Python資料分析pandas模組用法。分享給大家供大家參考，具體如下：

python元組和字典的內建函式例項詳解

本文例項講述了python元祖和字典的內建函式。分享給大家供大家參考，具體如下：

Python3 pandas 操作列表例項詳解

1.首先需要安裝pandas，安裝的時候可能由依賴的包需要安裝，根據執行時候的提示，缺少哪個庫，就pip 安裝哪個庫。

Python讀寫檔案模式和檔案物件方法例項詳解

本文例項講述了Python讀寫檔案模式和檔案物件方法。分享給大家供大家參考，具體如下：

Python變數、資料型別、資料型別轉換相關函式用法例項詳解

本文例項講述了Python變數、資料型別、資料型別轉換相關函式用法。分享給大家供大家參考，具體如下：

laravel框架模型和資料庫基礎操作例項詳解

本文例項講述了laravel框架模型和資料庫基礎操作。分享給大家供大家參考，具體如下：

JS原型和原型鏈原理與用法例項詳解

本文例項講述了JS原型和原型鏈原理與用法。分享給大家供大家參考，具體如下：

Java整數和字串相互轉化例項詳解

這篇文章主要介紹了Java整數和字串相互轉化例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下