1. 程式人生 > >if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...

if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...

names apach true 行數 cin name else color isnull

運行spark程序一直報錯:

1 if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o

原因: 文件裏有一行數據為垃圾數據, 這行數據的列數和列名的個數不一致.

解決辦法: 過濾掉這樣的數據

1 .filter(_.length == infoSchema.fieldNames.length)

if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...