1. 程式人生 > >Spark MLLib從入門實戰小例子

Spark MLLib從入門實戰小例子

本系列目錄如下:
  • 資料型別
  • 分類和迴歸
  • 聚類
    • k-means||演算法
    • GMM(高斯混合模型)
    • PIC(快速迭代聚類)
    • LDA(隱式狄利克雷分佈)
    • 二分k-means演算法
    • 流式k-means演算法
  • 最優化演算法
    • 梯度下降演算法
    • L-BFGS(限制記憶體BFGS)
    • NNLS(非負最小二乘)
  • 降維
    • EVD(特徵值分解)
    • SVD(奇異值分解)
    • PCA(主成分分析)
  • 特徵抽取和轉換
    • 特徵抽取
      • TF-IDF
      • Word2Vec
      • CountVectorizer
    • 特徵轉換
      • Tokenizer
      • StopWordsRemover
      • n-gram
      • Binarizer
      • PolynomialExpansion
      • Discrete Cosine Transform (DCT)
      • StringIndexer
      • IndexToString
      • OneHotEncoder
      • VectorIndexer
      • Normalizer(規則化)
      • StandardScaler(特徵縮放)
      • MinMaxScaler
      • MaxAbsScaler
      • Bucketizer
      • ElementwiseProduct(元素智慧乘積)
      • SQLTransformer
      • VectorAssembler
      • QuantileDiscretizer
    • 特徵選擇
      • VectorSlicer
      • RFormula
      • ChiSqSelector(卡方選擇器)

轉載地址:http://www.qqcourse.com/forum.php?mod=viewthread&tid=3291&_dsign=6c28f52b