1. 程式人生 > >關聯分析中的Groceries資料集

關聯分析中的Groceries資料集

  用Apriori、FP Growth、eclat演算法進行關聯分析時中,常常用到Groceries資料集,該資料集是某個雜貨店一個月真實的交易記錄,共有9835條消費記錄,169個商品。在開源軟體RGui的arules程式包裡含有Groceries資料集,儲存格式是.rda,如圖(1)所示:

這裡寫圖片描述
圖(1) Groceries資料集存放在: ..\R\R-2.15.3\library\arules\data

  下面,進行Grocerices資料集的匯出到Groceries.csv中,詳細步驟如下。
  1)開啟RGui,點選【檔案】–》新建程式指令碼 –》命名為:groceries.R ,程式碼如下:
  //groceries.R
##載入程式包
library(arules) library(Matrix) ##載入Groceries資料集 data(Groceries) ##Groceries資料集的型別 typeof(Groceries) ##將S4型別轉換為data.frame型別 cc <- as(Groceries,'data.frame') ##設定RGui的工作路徑 setwd("G:\\myProject\\RDoc\\Unit1") ##匯出Groceries資料集 write.csv(cc,"Groceries.csv")

  2)選中groceries.R中的全部程式碼,點選工具欄上的這裡寫圖片描述,如圖(2)所示:
  

這裡寫圖片描述
圖(2) 執行.R指令碼

  3)在G:\myProject\RDoc\Unit1目錄,就得到了Groceries.csv資料集,效果如下:
  
這裡寫圖片描述
圖(3) Groceries資料集裡的內容,有9835行,169列

  Groceries資料集下載地址:
  http://download.csdn.net/detail/sanqima/9301589