pyspark連hbase報org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter

阿新 • • 發佈：2018-12-31

ERROR python.Converter: Failed to load converter: org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/var/lib/spark/cspark/python/pyspark/context.py", line 678, in newAPIHadoopRDD
    jconf, batchSize)
  File "/var/lib/spark/cspark/python/lib/py4j-0.10.4-src.zip/py4j/java_gateway.py", line 1133, in __call__
  File "/var/lib/spark/cspark/python/pyspark/sql/utils.py", line 63, in deco
    return f(*a, **kw)
  File "/var/lib/spark/cspark/python/lib/py4j-0.10.4-src.zip/py4j/protocol.py", line 319, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.newAPIHadoopRDD.
: java.lang.ClassNotFoundException: org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter
	at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	at java.lang.Class.forName0(Native Method)
	at java.lang.Class.forName(Class.java:348)
	at org.apache.spark.util.Utils$.classForName(Utils.scala:229)
	at org.apache.spark.api.python.Converter$$anonfun$getInstance$1$$anonfun$1.apply(PythonHadoopUtil.scala:46)
	at org.apache.spark.api.python.Converter$$anonfun$getInstance$1$$anonfun$1.apply(PythonHadoopUtil.scala:45)
	at scala.util.Try$.apply(Try.scala:192)
	at org.apache.spark.api.python.Converter$$anonfun$getInstance$1.apply(PythonHadoopUtil.scala:45)
	at org.apache.spark.api.python.Converter$$anonfun$getInstance$1.apply(PythonHadoopUtil.scala:44)
	at scala.Option.map(Option.scala:146)
	at org.apache.spark.api.python.Converter$.getInstance(PythonHadoopUtil.scala:44)
	at org.apache.spark.api.python.PythonRDD$.getKeyValueConverters(PythonRDD.scala:743)
	at org.apache.spark.api.python.PythonRDD$.convertRDD(PythonRDD.scala:756)
	at org.apache.spark.api.python.PythonRDD$.newAPIHadoopRDD(PythonRDD.scala:580)
	at org.apache.spark.api.python.PythonRDD.newAPIHadoopRDD(PythonRDD.scala)
	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
	at java.lang.reflect.Method.invoke(Method.java:498)
	at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
	at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
	at py4j.Gateway.invoke(Gateway.java:280)
	at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
	at py4j.commands.CallCommand.execute(CallCommand.java:79)
	at py4j.GatewayConnection.run(GatewayConnection.java:214)
	at java.lang.Thread.run(Thread.java:745)

解決辦法:

在Spark 2.0版本上缺少相關把hbase的資料轉換python可讀取的jar包，需要我們另行下載。

下載jar包spark-examples_2.11-1.6.0-typesafe-001.jar(https://mvnrepository.com/artifact/org.apache.spark/spark-examples_2.11/1.6.0-typesafe-001),然後在你的spark安裝目錄下建立目錄存放這個jar

執行如下命令

1: mkdir /var/lib/spark/jars/hbase/

2:rz命令上傳剛才下載的jar包(現在最新版本是spark-examples_2.11-1.6.0-typesafe-001.jar)

3:進入spark的conf目錄下修改spark-env.sh新增:

export SPARK_DIST_CLASSPATH=$(/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin/hadoop classpath):$(/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin/hbase classpath):/var/lib/spark/jars/hbase/*

/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin/hadoop:改成自己的hadoop安裝目錄

/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin/hbase:改成自己的hbase安裝目錄

最後重啟下hbase,ok了

pyspark連hbase報org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter

ERROR python.Converter: Failed to load converter: org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter Trace

org.apache.spark.examples.SparkPi

Warning: Local jar /usr/local/spark/ does not exist, skipping. java.lang.ClassNotFoundException: org.apache.spark.examples.SparkPi at java.net.U

IDEA中如果報org.apache.spark.sparkException: A master URL must be set in your configuration

local 本地單執行緒local[K] 本地多執行緒（指定K個核心）local[*] 本地多執行緒（指定所有可用核心）spark://HOST:PORT 連線到指定的 Spark stand

關於在使用sparksql寫程序是報錯以及解決方案：org.apache.spark.sql.AnalysisException: Duplicate column(s): "name" found, cannot save to file.

文件加載 mod 但是路徑 win 錯誤寫入技術分享 over 說明：　　spark --version : 2.2.0 　　我有兩個json文件，分別是emp和dept： emp內容如下： {"name": "zhangsan", "age": 26, "dep

idae執行spark程式碼報錯ERROR MetricsSystem: Sink class org.apache.spark.metrics.sink.MetricsServlet cannot b

1.問題描述在idea中編寫，streaming處理伺服器socket傳遞的資料，結果報錯： "C:\Program Files\Java\jdk1.8.0_91\bin\java" -Didea.launcher.port=7534 "-Didea.launcher.bin.path=C

org.apache.spark.SparkException: Exception thrown in awaitResult （Spark報錯）

WARN StandaloneAppClient$ClientEndpoint: Failed to connect to master node1:7077 org.apache.spark.SparkException: Exception thrown i

spark submit提交任務報錯Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/stream

1.問題描述提交spark任務： bin/spark-submit --master local[2] \ --class _0924MoocProject.ImoocStatStreamingApp_product \ /opt/datas/project/scala

Spark升級到2.0後測試stream-kafka測試報java.lang.NoClassDefFoundError: org/apache/spark/Logging錯誤

- 最近從Spark 1.5.2升級到2.0之後，執行測試程式碼spark-stream-kafka報以下錯誤： java.lang.NoClassDefFoundError: org/apache/spark/Logging at java.lang.ClassLo

Spark-shell啟動的時候報Error while instantiating ‘org.apache.spark.sql.hive.HiveSessionStateBuilder’錯誤

call(Client.java:1475) at org.apache.hadoop.ipc.Client.call(Client.java:1408) at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngi

Hbase 出現 org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 錯誤

hadoop nbsp mode sta oop proto 出現 method cep ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet

Driver stacktrace: at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGSchedul

depend trace pan ssi ram rac .org driver 過大在寫Spark程序是遇到問題 Driver stacktrace: at org.apache.spark.scheduler.DAGScheduler.orgapachea

if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...

names apach true 行數 cin name else color isnull 運行spark程序一直報錯: 1 if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) nu

eclipse 提交代碼到SVN服務器失敗，報org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit failed (details follow)

tex sub version str window app svn服務器 cli color 報錯：org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit fail

Caused by: java.io.NotSerializableException: org.apache.spark.unsafe.types.UTF8String$IntWrapper

菜雞一隻！如果有什麼說錯的還請大家指出批評，堅決改正！！遇到了一個挺詭異的報錯把，反正比較無語，發現國內網站完全搜不到這個報錯的解決方法，因此在這裡記錄下！！ 1、環境：這是一個spark的Task not serializable問題，因此只需要關注spark的版本就好了，我的版本是

eclipse 提交程式碼到SVN伺服器失敗，報org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit failed (details follow)

報錯：org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit failed (details follow) 解決方案： 1、進入C:\Users\Administrator\AppData\Roami

pyspark連hbase報org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter

pyspark連hbase報org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter

org.apache.spark.examples.SparkPi

IDEA中如果報org.apache.spark.sparkException: A master URL must be set in your configuration

關於在使用sparksql寫程序是報錯以及解決方案：org.apache.spark.sql.AnalysisException: Duplicate column(s): "name" found, cannot save to file.

idae執行spark程式碼報錯ERROR MetricsSystem: Sink class org.apache.spark.metrics.sink.MetricsServlet cannot b

org.apache.spark.SparkException: Exception thrown in awaitResult （Spark報錯）

spark submit提交任務報錯Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/stream

Spark升級到2.0後測試stream-kafka測試報java.lang.NoClassDefFoundError: org/apache/spark/Logging錯誤

Spark-shell啟動的時候報Error while instantiating ‘org.apache.spark.sql.hive.HiveSessionStateBuilder’錯誤

Hbase 出現 org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 錯誤

Driver stacktrace: at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGSchedul

if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...

eclipse 提交代碼到SVN服務器失敗，報org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit failed (details follow)

Caused by: java.io.NotSerializableException: org.apache.spark.unsafe.types.UTF8String$IntWrapper

eclipse 提交程式碼到SVN伺服器失敗，報org.apache.subversion.javahl.ClientException: RA layer request failed svn: Commit failed (details follow)

Maven 匯入報 org.apache.maven.archiver.MavenArchiver.getManifest錯誤

Tomcat報org.apache.catalina.LifecycleException: Failed to start component [StandardEngine...

Spark提交任務到YARN cluster中，提示An error occurred while calling z:org.apache.spark.api.python.PythonRDD

failed to launch: nice -n 0 /usr/local/spark/bin/spark-class org.apache.spark.deploy.worker.Worker

eclipse裡報org.apache.ibatis.binding.BindingException: Invalid bound statement (not found)解決方法

pyspark連hbase報org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter

相關推薦