1. 程式人生 > >spark ML中的vector型別錯誤

spark ML中的vector型別錯誤

Exception in thread "main" java.lang.IllegalArgumentException: requirement failed: Column termWeights must be of type [email protected] but was actually ArrayType(DoubleType,false).
at scala.Predef$.require(Predef.scala:224)
at org.apache.spark.ml.util.SchemaUtils$.checkColumnType(SchemaUtils.scala:42)
at org.apache.spark.ml.clustering.KMeansParams$class.validateAndTransformSchema(KMeans.scala:92)
at org.apache.spark.ml.clustering.KMeans.validateAndTransformSchema(KMeans.scala:253)
at org.apache.spark.ml.clustering.KMeans.transformSchema(KMeans.scala:330)
at org.apache.spark.ml.PipelineStage.transformSchema(Pipeline.scala:74)
at org.apache.spark.ml.clustering.KMeans.fit(KMeans.scala:304)
at Scala.com.zj.hot_weibo.TF_IDF_LDAExample$.main(TF_IDF_LDAExample.scala:95)

at Scala.com.zj.hot_weibo.TF_IDF_LDAExample.main(TF_IDF_LDAExample.scala)

https://stackoverflow.com/questions/38664972/why-is-unable-to-find-encoder-for-type-stored-in-a-dataset-when-creating-a-dat

相關推薦

spark MLvector型別錯誤

Exception in thread "main" java.lang.IllegalArgumentException: requirement failed: Column termWeights must be of type [email protect

spark ML VectorIndexer, StringIndexer等用法

VectorIndexer 主要作用:提高決策樹或隨機森林等ML方法的分類效果。 VectorIndexer是對資料集特徵向量中的類別(離散值)特徵(index categorical features categorical features )進行編號。 它能夠自動

js常見的錯誤型別

SyntaxError  語法錯誤 ReferenceError  引用錯誤 要用的變數沒有找到 RangeError    範圍錯誤      引數超範圍 TypeError  

在外部應用執行oracle的sql語句時出現“不支援的列資料型別錯誤

如  SELECT OBJECTID,osmid,username,userid,versional,lat,lon,visible,changeset,timestamps,issimple,fc,dsg,code,gbcode,gbdes,tags,bz,names,n

C++輸入資料型別判斷,輸入型別錯誤後,提示使用者重新輸入直至其輸入正確

要求輸入number,但是使用者鍵入了字母A,仍然有結果,但是不正確,同時後面的程式碼自行運行了,沒有辦法去輸入string了。所以要改進,可以判斷輸入的是否為正確的資料型別 利用cin.good()和cin.fail()判斷: cin.good()為true時,輸入的資料型別與定

leetcode-645vector.size()的返回型別以及其應用死迴圈或者資料型別衝突的問題

leetcode–645 該題是一道分治問題,求陣列中最大數的下標,然後把該陣列分成左右兩個子區間 class Solution { public: int max(int i, int j,vector<int>&nums){ int m

spark執行模式的一些錯誤

錯誤一 Caused by: ERROR XJ040: Failed to start database 'metastore_db' with class loader org.apache.spark.sql.hive.client.IsolatedC

c++11模板:容器(map,set,list,vector)元素型別轉換

簡單的資料型別轉換很簡單,比如下面cast模板函式族: // 相同型別直接轉發 template<typename L> L cast(L left, typename std::de

spark執行的java.lang.OutOfMemoryError: Java heap space錯誤

問題描述:           我在執行我的spark程式碼過程中,出現瞭如標題所示的問題             以下為我執行的主要程式碼: ss=e_Task_test.engine()          diag_hos=l_patient.map(lambda x

淺析ListInteger型別比較的錯誤

相信很多人都會有想用List集合存int資料的時候(或許是用於後續遍歷),初始我的第一反應是下圖,經驗證會報錯,雖要將int存入,但初始化時需要初始為Integer型別。正確的初始化如下實際上是由於我的軟體構造實驗課lab1中一個困擾我近三個小時的程式bug,讓我想到了開這樣

Spark機器學習 自定義sql函式處理Vector型別

對於sparksql處理不了的型別,可以使用spark.udf.register自定義函式方法處理。 spark.udf.register("getPCA0", (s: Vector) => s(0)) spark.udf.register("getPCA1", (s

分析器錯誤 “/”應用程式的伺服器錯誤 請在型別名稱顯式指定程式集。

錯誤提示 “/”應用程式中的伺服器錯誤。 分析器錯誤 說明: 在分析向此請求提供服務所需資源時出錯。請檢查下列特定分析錯誤詳細資訊並適當地修改原始檔。 分析器錯誤訊息: 型別“Humanrace.WebAPIMain.WebApiApplication”不明確: 它可能

Spark DataFrame的join型別

Spark DataFrame中join與SQL很像,都有inner join, left join, right join, full join; 那麼join方法如何實現不同的join型別呢? 看其原型 def join(right : DataFra

在Apache Spark上跑Logistic Regression演算法及其的一些錯誤問題

本文旨在介紹使用機器學習演算法,來介紹Apache Spark資料處理引擎。我們一開始會先簡單介紹一下Spark,然後我們將開始實踐一個機器學習的例子。我們將使用Qualitative Bankruptcy資料集,來自UCI機器學習資料倉庫。雖然Spark支援同時Java,Scala,Python和R,在

spark開發一些錯誤

akka.actor.ActorNotFound: Actor not found for: ActorSelection[Anchor(akka.tcp://[email protected]:7070/), Path(/user/Master)] at akka.actor.Ac

spark讀取elasticsearch陣列型別的欄位

之前做的一個專案需要用sparksql讀取elasticsearch的資料,當讀取的型別中包含陣列時報錯. 讀取方式大概是 val options = Map("pushdown" -> "true", "strict" -> "false", "

Spark ML的幾種歸一化方法總結

org.apache.spark.ml.feature包中包含了4種不同的歸一化方法: Normalizer StandardScaler MinMaxScaler MaxAbsScaler 有時感覺會容易混淆,藉助官方文件和實際資料的變換,在這裡做一次

spark MLlib DataType ML的數據類型

all color ring tran 稀疏 tor true sna 1.0 package ML.DataType; import org.apache.spark.SparkConf; import org.apache.spark.api.java.

處理程序“ExtensionlessUrlHandler-Integrated-4.0”在其模塊列表有一個錯誤模塊“ManagedPipelineHandler”

images 打開 ext framework ros windows log asp gii IIS上部署MVC網站,打開後ExtensionlessUrlHandler-Integrated-4.0解決方法 IIS上部署MVC網站,打開後500錯誤:處理程序&ldqu

Cocos2d-xVector&lt;T&gt;容器以及實例介紹

top 宋體 hello 操作符 模板類 log ins bsp main Vector<T> 是Cocos2d-x 3.x推出的列表容器,因此它所能容納的是Ref及子類所創建的對象指針,其中的T是模板,表示能夠放入到容器中的類型,在Cocos2d-x 3.x