Spark MLLib從入門實戰小例子
阿新 • • 發佈:2019-02-05
本系列目錄如下:
- 資料型別
- 分類和迴歸
- 樸素貝葉斯
- 決策樹
- 組合樹
- 隨機森林
- 梯度提升樹
- 保序迴歸
- 聚類
- k-means||演算法
- GMM(高斯混合模型)
- PIC(快速迭代聚類)
- LDA(隱式狄利克雷分佈)
- 二分k-means演算法
- 流式k-means演算法
- 最優化演算法
- 梯度下降演算法
- L-BFGS(限制記憶體BFGS)
- NNLS(非負最小二乘)
- 降維
- EVD(特徵值分解)
- SVD(奇異值分解)
- PCA(主成分分析)
- 特徵抽取和轉換
- 特徵抽取
- TF-IDF
- Word2Vec
- CountVectorizer
- 特徵轉換
- Tokenizer
- StopWordsRemover
- n-gram
- Binarizer
- PolynomialExpansion
- Discrete Cosine Transform (DCT)
- StringIndexer
- IndexToString
- OneHotEncoder
- VectorIndexer
- Normalizer(規則化)
- StandardScaler(特徵縮放)
- MinMaxScaler
- MaxAbsScaler
- Bucketizer
- ElementwiseProduct(元素智慧乘積)
- SQLTransformer
- VectorAssembler
- QuantileDiscretizer
- 特徵選擇
- VectorSlicer
- RFormula
- ChiSqSelector(卡方選擇器)
- 特徵抽取
轉載地址:http://www.qqcourse.com/forum.php?mod=viewthread&tid=3291&_dsign=6c28f52b