關聯分析中的Groceries資料集
阿新 • • 發佈:2019-02-01
用Apriori、FP Growth、eclat演算法進行關聯分析時中,常常用到Groceries資料集,該資料集是某個雜貨店一個月真實的交易記錄,共有9835條消費記錄,169個商品。在開源軟體RGui的arules程式包裡含有Groceries資料集,儲存格式是.rda,如圖(1)所示:
下面,進行Grocerices資料集的匯出到Groceries.csv中,詳細步驟如下。
1)開啟RGui,點選【檔案】–》新建程式指令碼 –》命名為:groceries.R ,程式碼如下:
//groceries.R
##載入程式包
library(arules)
library(Matrix)
##載入Groceries資料集
data(Groceries)
##Groceries資料集的型別
typeof(Groceries)
##將S4型別轉換為data.frame型別
cc <- as(Groceries,'data.frame')
##設定RGui的工作路徑
setwd("G:\\myProject\\RDoc\\Unit1")
##匯出Groceries資料集
write.csv(cc,"Groceries.csv")
2)選中groceries.R中的全部程式碼,點選工具欄上的,如圖(2)所示:
3)在G:\myProject\RDoc\Unit1目錄,就得到了Groceries.csv資料集,效果如下:
Groceries資料集下載地址:
http://download.csdn.net/detail/sanqima/9301589