使用 Rserve 實現 R 程式的複雜資料返回

阿新 • • 發佈：2018-11-30

在 RCaller 無法返回複雜資料的研究我們知道 RCaller 無法處理複雜資料的返回，那麼就看看其他工具吧，比如 Rserve。

使用下來的感覺是 Rserve 雖然能把值都給你，但是怎麼獲取卻是一個艱難的過程，比如和 RCaller 一樣，對矩陣值的讀取也是先列後行，定位到具體的值的變數上，API 顯然沒有與時俱進，不用泛型，使用古老的 Vector 型別，經常要強制轉型，要不是 debug, 我怎麼知道那個列是什麼資料型別啊。

private RList exeRMatchCode(PropensityMatchInput input, Map<String, List<String>> varResultMap,
			List<String> covairateNames) {
		logger.info("entering exeRMatchCode()");
		try {
			RConnection rc = new RConnection();
							
			for (String key : varResultMap.keySet()){
				logger.info("key is :: {}", key);
				List<String> varVals = varResultMap.get(key);
				String[] valStrs = new String[varVals.size()];
				int num = 0;
				for (String s : varVals){
					valStrs[num++] = s;
				}
				rc.assign(key, valStrs);
			}
			logger.info("各個變數值的陣列已經加入到了 R 的變數裡");
			
			StringBuffer sb = new StringBuffer();
			StringBuffer cbind = new StringBuffer();
			cbind.append("matrix <- cbind(").append(OUTCOME_VARIABLE).append(",")
				.append(StringUtils.join(covairateNames, ",")).append(")\n");
			sb.append(cbind.toString());
			
			sb.append("df <- as.data.frame(matrix)\n");			
			sb.append("library(MatchIt)\n");
			String replaceStr = input.isReplacement() ? "TRUE" : "FALSE";
			StringBuffer propensity = new StringBuffer();
			propensity.append("fm <- matchit(").append(OUTCOME_VARIABLE).append(" ~ ")
					.append(StringUtils.join(covairateNames, " + ")).append(", data = df, method = \"")
					.append(input.getAlgorithm().getValue()).append("\", caliper = ").append(input.getCaliper())
					.append(", replace = ").append(replaceStr).append(", ratio = ").append(input.getMatchRatio())
					.append(")\n");
			sb.append(propensity.toString());
			
			sb.append("result <- summary(fm)\n");				
			sb.append("sum <- result$sum.all\n");
			sb.append("mat <- result$sum.matched\n");
			sb.append("red <- result$reduction\n");
			sb.append("ss <- result$nn\n");
			sb.append("mData <- match.data(fm)[1]\n");
			sb.append("out <- list(sum, mat, red, ss, mData)\n");
			
			String code = sb.toString();
			logger.info("完整的 Match 演算法的 R 程式：： \n {}", code);
			
			REXP rexp = rc.eval(code);
			logger.info("完成 Propensity Score Match 匹配邏輯");
			
			return rexp.asList();
		} catch (Exception e) {
			logger.error(e.getMessage());
			throw new RuntimeException("執行 Propensity Score Match 匹配出錯了");
		}
	}

將變數值陣列傳入 Rserve 裡使用 assign 函式，對於獨立的語句比如 “library(MatchIt)” 也可以直接使用:

rc.eval("library(MatchIt)");

這裡我將多條語句放入快取池，然後一起 eval , 注意：需要在每一行末尾加上換行符，模擬命令列的執行。執行完，從 list 裡面取出各個物件：

logger.info("將 Map 物件裡的資料注入到 R 程式裡，同時執行 R 的匹配演算法");
RList result = exeRMatchCode(input, varResultMap, covairateNames);

logger.info("從 R 的匹配結果裡取出需要的資料，放入到 R 對應的 java 物件備用");
REXPGenericVector sumAllVector = (REXPGenericVector)result.elementAt(0);
REXPGenericVector matchedVector = (REXPGenericVector)result.elementAt(1);
REXPGenericVector balImproveVector = (REXPGenericVector)result.elementAt(2);
REXPDouble sampleSize = (REXPDouble)result.elementAt(3);
REXPGenericVector matchedPersonsVector = (REXPGenericVector)result.elementAt(4);

下面就挑其中一個來看看，怎麼獲取每個具體的值：

// 由於 R 對應的物件在取 R 矩陣的值，讀取是先列後行，所有資料處理比較特殊
private Collection<PropensitySum> extractMatchVectorData(REXPGenericVector vector,
		LinkedList<String> variableNamesR) {		
	LinkedHashMap<String, PropensitySum> map = new LinkedHashMap<>();			
	for (String name : variableNamesR){
		map.put(name, new PropensitySum());
	}
	
	RList t =  vector.asList();
	Vector names = t.names;
	for (int i = 0; i < names.size(); i++){
		String name = ((String)names.get(i)).trim();
		double[] vals = ((REXPDouble)t.elementAt(i)).asDoubles();
		
		if ("Means Treated".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).setMeansTreated(vals[j]);
			}
		} else if ("Means Control".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).setMeansControl(vals[j]);
			}
		} else if ("SD Control".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).setSdControl(vals[j]);
			}
		} else if (name.startsWith("Mean Diff")){ // 這個列名比較特殊， Bal Improve 矩陣這個列名後面有個點號
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).setMeanDiff(vals[j]);
			}
		} else if ("eQQ Med".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).seteQQMed(vals[j]);
			}
		} else if ("eQQ Mean".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).seteQQMean(vals[j]);
			}
		} else if ("eQQ Max".equalsIgnoreCase(name)){
			for (int j = 0; j < vals.length; j++){
				map.get(variableNamesR.get(j)).seteQQMax(vals[j]);
			}
		} 
	}
	return map.values();
}

可以看到，有強轉型，有陣列下標取值，就這兩個就覺得程式耦合性太高了。總之，感覺 API 不夠友好，沒有跟上潮流啊。

使用 Rserve 實現 R 程式的複雜資料返回

在 RCaller 無法返回複雜資料的研究我們知道 RCaller 無法處理複雜資料的返回，那麼就看看其他工具吧，比如 Rserve。使用下來的感覺是 Rserve 雖然能把值都給你，但是怎麼獲取卻是一個艱難的過程，比如和 RCaller 一樣，對矩陣值的讀取也是先列

Ubuntu環境R程式包安裝返回非零值的一個解決辦法

做迴歸分析的作業，需要用到car程式包，然而在Rstudio中一直沒能成功安裝，最後在StackOverFlow中看到一種解決方法，成功解決問題。原問題是安裝ncdf4程式包，將它換成相應的程式包即可。如果有其他解決方法，歡迎補充。 'ncdf4' require sy

SpringMVC複雜資料繫結——繫結陣列實現批量刪除

前幾天學習SSM開發框架遇到了批量刪除的資料繫結問題，就從網上學習了一下，參考別人的部落格又加了點自己的見解寫了這篇部落格。繫結陣列在實際開發時，可能會遇到前端請求需要傳遞到後臺多個input的Name屬性相同的資料的情況（如批量刪除），這個情況用SpringMVC的Controller

Java後臺返回複雜資料、大資料給前端解決辦法（返回json資料分類簡化前段操作）

背景分析：面對當前多種的業務需求和雜亂無章的資料堆放，Java後臺處理變得尤為重要。對於資訊系統開發而言，歸根到底是對資料的分類與處理。通過從伺服器獲取資料，客戶給出需求，形成怎樣的表格，多樣化的靜態圖和動態圖，各種各樣資原始檔，這些需求都不是簡單的從資料庫中取出來就可以直接使用的，往

Android ContentProvider實現兩個程式間資料共享demo

1、客戶端程式碼：先實現服務端 SQL建立： public class DBHelper extends SQLiteOpenHelper { // 資料庫名 private static final String DATABASE_NAME = "finch.db"

Hadoop實現MR程式模擬實現天氣資料獲取兩次最高溫度

資料 1949-10-01 14:21:02 34c 1949-10-01 19:21:02 38c 1949-10-02 14:01:02 36c 1950-01-01 11:21:02 32c 1950-10-01 12:21:02 37c 1951-12-01 12:21:02

小程式資料返回時重新整理當前頁面資料

首先判斷當前頁面載入的所有頁面的陣列，陣列中最後一個就是當前頁面，然後onload當前頁面。 if (getCurrentPages().length != 0) { //重新整理當前頁面的資料 getCurrentPages()[getCurrentPages().len

RCaller 無法返回複雜資料的研究以及解決方案

在 Java呼叫基於 R 的 One-Way ANOVA檢測文章裡，通過 cbind 我們可以返回多個數據，但是裡面的資料都是簡單型別，所有能正常工作，但是我在做 Propensity Score Match 的時候呼叫 MatchIt 函式，我需要將分析結果資料全部返回，

【資料結構與演算法-java實現】二複雜度分析（下）：最好、最壞、平均、均攤時間複雜度的概念

上一篇文章學習了：如何分析、統計演算法的執行效率和資源消耗？點選連結檢視上一篇文章：複雜度分析上今天的文章學習以下內容：最好情況時間複雜度最壞情況時間複雜度平均情況時間複雜度均攤時間複雜度 1、最好與最壞情況時間複雜度我們首先

卜若的程式碼筆記系列-微信小程式系列-第二章：微信小程式獲得srpingboot返回的json資料-4002

1.微信端向伺服器傳送上傳請求 wx.chooseImage({ success: function (res) { var tempFilePaths = res.tempFilePaths console.log(tempFi

用R語言實現對不平衡資料的四種處理方法

https://www.weixin765.com/doc/gmlxlfqf.html 在對不平衡的分類資料集進行建模時，機器學**演算法可能並不穩定，其預測結果甚至可能是有偏的，而預測精度此時也變得帶有誤導性那麼，這種結果是為何發生的呢？到底是什麼因素影響了這些演算法的表現？在不平衡的

資料結構用順序棧實現R進位制轉換

#include<stdio.h> #define MAXSIZE 500 typedef struct{ int *base; int *top; int stacksize; }Sqstack; int Initstack(Sqstack &S)

小程式——對後臺返回的資料新增新的欄位

如二維陣列，想要將每一條資料的末尾加新的一列。做法直接命名並賦值。 var type = "food"; for (i = 0; i < res.data.length; i++) { res.data[i].type = type; } 有試過報t

過濾器通過HttpServletResponseWrapper包裝HttpServletResponse實現獲取response中的返回資料，以及對資料進行gzip壓縮

前幾天我們專案總監給了我一個任務，就是將請求的介面資料進行壓縮，以達到節省流量的目的。對於實現該功能，有以下思路： 1.獲取到response中的值， 2.對資料進行gzip壓縮(因為要求前端不變，所以只能選在這個瀏覽器都支援的壓縮方式) 3.將資料寫

Gson搭配TypeToken實現複雜資料的解析

今天在開發過程中使用Gson解析遇到了一些問題，希望通過寫部落格的形式增強自己的記憶，以後儘量少走彎路，也希望通過寫部落格的形式加強自己對知識更為透徹的理解。關於Gson解析，用起來是非常的方便，在安裝了生成Javabean的GsonForma

R語言實現簡單的網頁資料抓取

在知乎遇到這樣一個問題。這是要爬取的內容的網頁： R語言的程式碼的實現方式如下： #安裝XML包 >install.packages("XML") #載入XML包 > l

09.1.VUE學習之watch監聽屬性變化實現類百度搜索欄功能ajax非同步請求資料,返回陣列

09.1html裡 <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

離散型與連續型資料決策樹構建及列印實現 R語言，ID3，C4.5演算法

本人的第一篇文章，趁著我們的資料探勘課設的時間，把實現的決策樹程式碼，拿出來分享下。有很多漏洞和缺陷，還有很多駭客思想的成分，但是總之，能實現，看網上的程式碼，能用的其實也沒幾個。廢話不多說，直接看程式碼特別鳴謝博主skyonefly的程式碼附上鍊接：R

GAM（廣義相加模型）概要及R程式實現

國內關於GAM方面的資料不是一般的少，基本上都要往國外找。我光顧了沒100都有50個網站，翻查了不少論文及資料，研究整理出下文，歡迎一同討論。 GAM 廣義相加模型Generalized additive model：概念迴歸模型中部分或全部的自變數採用平滑函式

資料結構之棧複雜資料應用實現（2）

#include<iostream> #include"MyStack.h" using namespace std; /* 棧要求： 1.定義Coordinate

使用 Rserve 實現 R 程式的複雜資料返回

相關推薦