關於spark執行FP-growth演算法報錯com.esotericsoftware.kryo.KryoException

阿新 • • 發佈：2019-01-30

Spark執行FP-growth異常報錯

在spark1.4版上嘗試執行頻繁子項挖掘演算法是，照搬官方提供的python案例原始碼時，爆出該錯誤com.esotericsoftware.kryo.KryoException (java.lang.IllegalArgumentException: Can not set final scala.collection.mutable.ListBuffer field org.apache.spark.mllib.fpm.FPTree$Summary.nodes to scala.collection.mutable.ArrayBuffer

解決辦法

在第二篇中有個指出了這是序列輸出可能引起的錯誤，spark採用的kryo序列化方式比JavaSerializer方式更快，但是在1.4版本的spark上會產生錯誤，故解決方案是，要麼在spark-defaults.conf中替換，要麼只執行中直接替換，現提供執行指令碼testfp.py：

from pyspark import SparkContext, SparkConf
from pyspark.mllib.fpm import FPGrowth

if __name__ == "__main__":
        conf = SparkConf().setAppName("pythonFP" 
).set("spark.serializer", "org.apache.spark.serializer.JavaSerializer")
        sc = SparkContext(conf=conf)
        data = sc.textFile("data/mllib/sample_fpgrowth.txt")
        transactions = data.map(lambda line: line.strip().split(' '))
        model = FPGrowth.train(transactions, minSupport=0.5, numPartitions=10 
)
        result = model.freqItemsets().collect()
        for fi in result:
                 print(fi)
        sc.stop()

關鍵指出在於重新* *定義conf環境中的序列化類，然後利用spark提供的指令碼執行命令即可正常執行(PS:採用最新版的spark也可解決此問題)：

spark-submit –master=spark://namenode1-sit..com:7077,namenode2-sit..com:7077 testfp.py

關於spark執行FP-growth演算法報錯com.esotericsoftware.kryo.KryoException

關於spark執行FP-growth演算法報錯com.esotericsoftware.kryo.KryoException

執行Class.forName 報錯 com.mysql.jdbc.Driverjava.lang.NullPointerException

使用spark讀取es中的資料並進行資料清洗，使用fp-growth演算法進行加工

最新cenos執行service httpd restart 報錯Failed to restart httpd.service: Unit not found.

執行SDK的aapt報錯./aapt: /lib64/libc.so.6: version `GLIBC_2.14' not found (required by ./aapt)

CentOS 7在執行yum操作時報錯

Linux執行source /etc/profile報錯“：command not found”

關於Android Studio 3.0 報錯 com.android.tools.aapt2.Aapt2Exception: AAPT2 error: check logs for details

資料庫報錯com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column 'ua' at row 1

解決Spark Arrays.toString(Dataset.collect())報錯

pymysql多執行緒訪問資料庫報錯：Packet sequence number wrong - got 7 expected 2

連線rabbitmq 報錯 com.rabbitmq.client.ShutdownSignalException: connection error

Linux下Java執行.class檔案，報錯找不到或無法載入主類

轉：彙總Tensorflow1.0執行之前版本程式碼報錯問題

關於node.js執行Microsoft sript host 報錯解決方法

機器學習之Apriori演算法和FP-growth演算法

安裝 mongoDB ==執行命令 ===>./mongod 報錯

執行儲存過程，報錯提示找不到儲存過程

生效admin環境變數後執行cinder service-list報錯ERROR: Unable to establish connection to http://controller:35357/

執行perl xttdriver.pl報錯Can't locate Getopt/Long.pm in @INC

關於spark執行FP-growth演算法報錯com.esotericsoftware.kryo.KryoException

相關推薦