R語言hdf5依賴h5 packge手動安裝
伺服器有網路限制,必須用離線方式去安裝
HDF指一種為儲存和處理大容量科學資料設計的檔案格式及相應庫檔案。HDF最早由NCSA開發,在氣象資料,高頻資料儲存方面應用較多。當前流行的版本是HDF5。 HDF5檔案資料結構包括Datagroup和DataSet。 DataGroup:類似資料夾,可以包含多個數據集或下級群組。DataSet:類似字典,儲存內容。
有什麼包
R有些包可以處理hdf5,有的已經從cran倉庫移除了。rhdf5可以線上安裝。離線安裝最後選擇cran倉庫的h5 package
Packages on CRAN and Bioconductor supporting the HDF5 fileformat.
Package Repository First Release Status
h5r CRAN 2011-10-23 Archived
ncdf4 CRAN 2010-02-24 Active
rgdal CRAN 2003-11-24 Active
hdf5(即h5) CRAN 2000-02-02 Archived
rhdf5 BioC > 10.5 Years Active
手動安裝
依賴Rcpp和libhdf5(≥1.8.12)
- install.pakages("Rcpp.tar.gz",repos=NULL)
或者直接用命令列裝 R CMD INSTALL Rcpp.tar.gz
2.安裝libhdf5
For CentOS
yum -y install hdf5-devel
The current version is (which will get installed) 1.8.12
For Ubuntu:
sudo apt-get install libhdf5-dev
檢視版本 h5cc -showconfig
3.手動安裝h5
遇到問題,libhdf5映象安裝的版本比較老,是1.8.5,所以選擇比較早的h5版本安裝,試下來h5_0.9.1是可以的
R CMD INSTALL h5_0.9.1.tar.gz —enable-cxx=yes
用法
網上資料已經沒有了,h5_0.9.1和線上文件用法有差異,用R命令檢視文件
?h5close
看到H5File建立和dataset的賦值方式與新版本相比略有差異。