8.7 Mahout與協同過濾

阿新 • • 發佈：2019-02-20

mahout是一個工具一個來自Apache的、開源的、JAVA的機器學習軟體庫當所處理的資料規模遠大於單機處理能力時成為一種可選的機器學習工具，建立在Apache的Hadoop分散式計算專案之上mahout安裝：1，上傳apache-mahout-distribution-0.12.2.tar.gz包到linux伺服器(hdfs叢集的一個節點安裝就行)2，解壓tar -zxvf apache-mahout-distribution-0.12.2.tar.gz3，上傳測試資料包synthetic_control.data到伺服器4，啟動hadoop叢集測試：1，檢視hdfs叢集上/user/root這個資料夾有沒有，沒有就建立 hadoop fs -mkdir /user/root

2，上傳本地的資料檔案到hdfs： hadoop fs -copyFromLocal /opt/local/synthetic_control.data testdata testdata 是相對路徑的意思，當前使用者目錄下，也就是hdfs的/user/root下的testdata3，進入apache-mahout-distribution-0.12.2目錄下執行測試jar：hadoop jar mahout-examples-0.12.2-job.jar org.apache.mahout.clustering.syntheticcontrol.canopy.Job4，程式分別運行了3個Job任務，最後把原始資料分為六類。在HDFS檔案系統中/user/root/output資料夾中可以看到輸出的檔案

5，把資料拷貝到linux本地：./bin/mahout clusterdump -i output/clusters-0-final -p output/clusteredPoints -o test.txt-i是輸入檔案路徑，即執行Canopy演算法產生的中心點檔案路徑(HDFS檔案系統)；-p是執行Canopy演算法後把原始資料分類後的資料檔案目錄(HDFS檔案系統)；-o是分類結果的所有文字檔案要生成的檔案路徑(本地檔案系統)。協同過濾是推薦系統中使用的技術簡單來說是利用某興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊協同過濾Mahout：基於使用者的協同過濾：簡單講就是，給使用者推薦和他興趣相似的其他使用者喜歡的物品1.收集使用者資料2.最近鄰搜尋找到相似使用者3.計算產生推薦結果(以使用者為基礎的協同推薦演算法隨著使用者數量的增多，計算的時間就會變長社交網路站點中，UserCF是一個不錯的選擇)基於物品的協同過濾:簡單講就是，給使用者推薦和他之前喜歡的物品相似的物品1.收集使用者資料2.針對物品的最近鄰搜尋找到相似物品3.計算產生推薦結果(是目前電子商務採用最廣泛的推薦演算法)Mahout協同過濾演算法(SIMILARITY_LOGLIKELIHOOD )

：1，進入apache-mahout-distribution-0.12.2目錄下2，上傳本地的資料檔案到hdfs： hadoop fs -copyFromLocal /opt/local/user.txt input/file 意思是檔案上傳到當期使用者目錄下的input/file目錄3，./bin/mahout recommenditembased -s SIMILARITY_LOGLIKELIHOOD -i input/file -o output/file --numRecommendations 25 讀取檔案按協同過濾演算法計算，結果輸出到當前使用者目錄下output/file4，檢視結果資料hadoop fs -cat /user/root/output/file/part-r-00000

8.7 Mahout與協同過濾

mahout是一個工具一個來自Apache的、開源的、JAVA的機器學習軟體庫當所處理的資料規模遠大於單機處理能力時成為一種可選的機器學習工具，建立在Apache的Hadoop分散式計算專案之上mahout安裝：1，上傳apache-mahout-distribution-

使用Mahout實現協同過濾 spark

Mahout使用了Taste來提高協同過濾演算法的實現，它是一個基於Java實現的可擴充套件的，高效的推薦引擎。Taste既實現了最基本的基於使用者的和基於內容的推薦演算法，同時也提供了擴充套件介面，使使用者可以方便的定義和實現自己的推薦演算法。同時，Taste不僅僅只適用於Java應用程式，它可以作為

吳恩達機器學習：異常檢測與協同過濾

這是吳恩達機器學習的最後一課，這次學習的內容是機器學習的常見應用，異常檢測與協同過濾。課程中介紹的異常檢測主要基於正態分佈，用於檢測出偏離正常值的資料。而協同過濾是推薦系統的一部分，利用已有使用者的評分來給你推薦商品、視訊等。點選課程視訊你就能不間

Mahout做協同過濾是的ID型別問題

mahout做推薦的輸入只能是long型別，但在某些網站中，儲存的資料不是long型別，是string型別。現在的手機APP，每個手機都有其device_id，也是string型別。如果能以string型別作為uid，即使使用者不註冊，不登入。只要採用dev

【Machine Learning】Mahout基於協同過濾(CF)的使用者推薦

一、Mahout推薦演算法簡介 Mahout演算法框架自帶的推薦器有下面這些： l GenericUserBasedRecommender：基於使用者的推薦器，使用者數量少時速度快； l GenericItemBasedRecommender：基於商品推薦器，商品數量

CentOS 7 下 PHP 7，MySQL 5.7 和 Nginx 1.8 的安裝與配置（實用）

下面將一步步在 CentOS 7 下 PHP 7，MySQL 5.7 和 Nginx 1.8 的安裝與配置。首先我的 CentOS 版本是7.0.1406 [[email protected] ~]# lsb_release -a LSB Version:

Neo4j 做推薦（8）—— 協同過濾（利用電影評級）

協同過濾：使用網路中其他使用者的首選項，評級和操作來查詢要推薦的專案。（買這個東西的使用者，還買了那個東西）使用者Misty Williams的所有評分 // Show all ratings by Misty Williams MATCH (u:User

deepin15.7安裝與解除安裝MySQL（解決不提示設定密碼問題）、修改預設編碼為utf-8以及查詢MySQL的一些命令

一、首先安裝MySQL 安裝前更新一下倉庫，輸入命令：sudo apt-get update [email protected]:~$ sudo apt-get autoremove --purge mysql-server-5.7 輸入命令：sudo

JDK1.7和1.8中HashMap與ConcurrentHashMap總結比較

談到HashMap和ConcurrentHashMap，必然會聯想到一些其他集合結構，比如HashTable，Vector等，先理一下他們的區別吧。其實HashTable和Vector已經被廢棄了，HashTable和Vector以及ConcurrentHashMap都是執行緒安全的同步結構，區別是

#學習筆記Python#7、列表字典（12下）&8、列表與字典（第12章掃尾）&9、函式（13）

7、列表字典（12下） 2017-08-09 19:14 查詢索引（為了找到一個元素位於列表中的什麼位置）暫時沒有找到方法。。。。。迴圈處理列表 letters=["a","b","d","e"] for letter in letters: pr

Spark MLlib協同過濾之交替最小二乘法ALS原理與實踐

請先閱讀leboop釋出的博文《Apache Mahout之協同過濾原理與實踐》。基於使用者和物品的協同過濾推薦都是建立在一個使用者-物品評分矩陣（user-item

整理不易，且整且珍惜 2.開發環境的搭建 3.Eclipse的相關配置 4.使用maven建立web專案 5.Spring+Mybatis+SpringMVC整合 6.mybatis自動生成程式碼 7.spring與mybatis整合中Junit的測試 8.maven專案的啟動 9.Restful

整理不易，且整且珍惜 2.開發環境的搭建 3.Eclipse的相關配置 4.使用maven建立web專案 5.Spring+Mybatis+SpringMVC整合 6.mybatis自動生成程式碼

8.7 Mahout與協同過濾

8.7 Mahout與協同過濾

使用Mahout實現協同過濾 spark

吳恩達機器學習：異常檢測與協同過濾

Mahout做協同過濾是的ID型別問題

【Machine Learning】Mahout基於協同過濾(CF)的使用者推薦

推薦系統-協同過濾原理與實現

CentOS 7 下 PHP 7，MySQL 5.7 和 Nginx 1.8 的安裝與配置（實用）

Neo4j 做推薦（8）—— 協同過濾（利用電影評級）

deepin15.7安裝與解除安裝MySQL（解決不提示設定密碼問題）、修改預設編碼為utf-8以及查詢MySQL的一些命令

JDK1.7和1.8中HashMap與ConcurrentHashMap總結比較

#學習筆記Python#7、列表字典（12下）&8、列表與字典（第12章掃尾）&9、函式（13）

Spark MLlib協同過濾之交替最小二乘法ALS原理與實踐

整理不易，且整且珍惜 2.開發環境的搭建 3.Eclipse的相關配置 4.使用maven建立web專案 5.Spring+Mybatis+SpringMVC整合 6.mybatis自動生成程式碼 7.spring與mybatis整合中Junit的測試 8.maven專案的啟動 9.Restful

協同過濾演算法概述與python 實現協同過濾演算法基於內容（usr-item,item-item）

mahout基於矩陣分解的協同過濾例項 ALS——WR

Mahout協同過濾演算法原始碼分析（3）--parallelALS

Mahout基於使用者的協同過濾演算法的例子

深入理解mahout基於hadoop的協同過濾流程

Mahout系列之推薦演算法-基於物品協同過濾實踐

Mahout系列之推薦演算法-基於使用者協同過濾

8.7 Mahout與協同過濾

相關推薦