ALINK(九):載入資料集 (二)Text檔案讀入 (TextSourceBatchOp)
阿新 • • 發佈:2021-06-15
Java 類名:com.alibaba.alink.operator.batch.source.TextSourceBatchOp
Python 類名:TextSourceBatchOp
功能介紹
按行讀取檔案資料
引數說明
名稱 |
中文名稱 |
描述 |
型別 |
是否必須? |
預設值 |
filePath |
檔案路徑 |
檔案路徑 |
String |
✓ |
|
ignoreFirstLine |
是否忽略第一行資料 |
是否忽略第一行資料 |
Boolean |
false |
|
textCol |
文字列名稱 |
文字列名稱 |
String |
"text" |
程式碼示例
Python 程式碼
from pyalink.alink import * import pandas as pd useLocalEnv(1) URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv" data = TextSourceBatchOp().setFilePath(URL).setTextCol("text") data.print()
Java 程式碼
import com.alibaba.alink.operator.batch.BatchOperator; importcom.alibaba.alink.operator.batch.source.TextSourceBatchOp; import org.junit.Test; public class TextSourceBatchOpTest { @Test public void testTextSourceBatchOp() throws Exception { String URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv"; BatchOperator <?> data = newTextSourceBatchOp().setFilePath(URL).setTextCol("text"); data.print(); } }
執行結果
text |
6.5,2.8,4.6,1.5,Iris-versicolor |
6.1,3.0,4.9,1.8,Iris-virginica |
7.3,2.9,6.3,1.8,Iris-virginica |
5.7,2.8,4.5,1.3,Iris-versicolor |
6.4,2.8,5.6,2.1,Iris-virginica |
6.7,2.5,5.8,1.8,Iris-virginica |