1. 程式人生 > 其它 >ALINK(九):載入資料集 (二)Text檔案讀入 (TextSourceBatchOp)

ALINK(九):載入資料集 (二)Text檔案讀入 (TextSourceBatchOp)

Java 類名:com.alibaba.alink.operator.batch.source.TextSourceBatchOp

Python 類名:TextSourceBatchOp

功能介紹

按行讀取檔案資料

引數說明

名稱

中文名稱

描述

型別

是否必須?

預設值

filePath

檔案路徑

檔案路徑

String

ignoreFirstLine

是否忽略第一行資料

是否忽略第一行資料

Boolean

false

textCol

文字列名稱

文字列名稱

String

"text"

程式碼示例

Python 程式碼

from pyalink.alink import *
import pandas as pd
useLocalEnv(1)
URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv"
data = TextSourceBatchOp().setFilePath(URL).setTextCol("text")
data.print()

Java 程式碼

import com.alibaba.alink.operator.batch.BatchOperator;
import
com.alibaba.alink.operator.batch.source.TextSourceBatchOp; import org.junit.Test; public class TextSourceBatchOpTest { @Test public void testTextSourceBatchOp() throws Exception { String URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv"; BatchOperator <?> data = new
TextSourceBatchOp().setFilePath(URL).setTextCol("text"); data.print(); } }

執行結果

text

6.5,2.8,4.6,1.5,Iris-versicolor

6.1,3.0,4.9,1.8,Iris-virginica

7.3,2.9,6.3,1.8,Iris-virginica

5.7,2.8,4.5,1.3,Iris-versicolor

6.4,2.8,5.6,2.1,Iris-virginica

6.7,2.5,5.8,1.8,Iris-virginica