Cloud Dataproc開始支援SparkR將突破限制

阿新 • • 發佈：2019-01-02

GCP宣佈在其Cloud Dataproc服務上釋出SparkR作業的測試版，供資料科學家在需要擴充套件分析規模的時候，利用託管的運算資源。使用者可以選擇使用雲端伺服器版的RStudio，以獲取備份與高效能執行的優點。R語言通常用建構資料分析工具和統計應用程式，而SparkR是一個輕量級的前端套件，供開發者在Apache Spark上開發R語言應用，而這整合讓R開發人員可以，使用類似dplyr的資料操作語法，操作儲存在雲端各種大小的資料集。SparkR還支援使用MLlib進行分散式機器學習，使用者可以用來處理大型雲端儲存資料及或是運算密集的工作。

而Cloud Dataproc是GCP的完全託管雲服務，使用者能以簡單且高效能的方式執行Apache Spark和Apache Hadoop叢集。 Cloud Dataproc工作API可以輕鬆的將SparkR工作分派到叢集中，無需開放防火牆才能利用網頁IDE或是SSH存取主結點，而且藉由工作API，可以自動重複在資料集上進行R統計。在GCP上使用R可以避免因為基礎設施所帶來分析上的限制，使用者可以自由建構大型模型，以分析過去需要高效能計算基礎架構才能運算的資料集。雖然SparkR工作API提供簡單的方式，執行SparkR程式程式碼並自動執行任務，但大多數R開發人員仍習慣使用RStudio進行探索性分析，而GCP上的R也提供開發人員熟悉的RStudio介面。而提供介面的RStudio伺服器可以在Cloud Dataproc主節點、網路大廠 Compute Engine虛擬機器，甚至是在GCP之外執行都可以。

開發者可以選擇在GCP上建立RStudio伺服器，並在不需要的時候關閉，開發者還可以選擇RStudio的商業發行版RStudio Pro。網路大廠表示，雖然從桌面連線到雲端是一種使用RStudio的方法，但大多數R開發人員仍喜歡使用雲端伺服器版的RStudio，從任何工作地點獲取桌面設定，在個人計算機之外備份工作，並將RStudio設定在與資料來源相同的網路中，利用網路大廠的高效能網路可以大幅提高R應用的效能。在Cloud Dataproc上執行RStudio的另一個優點，是開發者可以利用Cloud Dataproc自動擴充套件功能（Autoscaling），在開發SparkR邏輯時可以使用最小叢集規模，一旦工作需要大規模處理時，開發者不需要修改伺服器，只要將SparkR工作提交給RStudio，Dataproc叢集便會根據設定的區間，自動擴充套件以滿足工作需要。

GCP上的運算引擎能良好的擴充套件R的統計功能，透過BigQuery套件包，開發者能查詢BigQuery表格並檢索相關專案的元資料、資料集、表格和工作。在Cloud Dataproc上執行SparkR套件時，可以使用R來分析和建構儲存在雲端中的資料。一旦探索完畢，準備進入建模階段，開發者可以使用TensorFlow、Keras和Spark MLlib函式庫，TensorFlow存在R介面能夠利用進階Keras和Estimator API，而需要更多控制時，開發者也能擁有完全存取核心TensorFlow API的許可權。Dataproc上的SparkR工作允許開發者大規模訓練和評分Spark MLlib模型。另外，想要大規模訓練和託管TensorFlow和Keras模型時，也可以使用R介面存取雲端機器學習引擎，直接讓GCP代為管理資源。

Cloud Dataproc開始支援SparkR將突破限制

GCP宣佈在其Cloud Dataproc服務上釋出SparkR作業的測試版，供資料科學家在需要擴充套件分析規模的時候，利用託管的運算資源。使用者可以選擇使用雲端伺服器版的RStudio，以獲取備份與高效能執行的優點。R語言通常用建構資料分析工具和統計應用程式，而SparkR是一個輕量級的前端套

微服務架構下使用Spring Cloud Zuul作為網關將多個微服務整合到一個Swagger服務上

turn 接口文檔 vid 使用方法數據操作 prefix opera tor font 註意：　　如果你正在研究微服務，那必然少不了服務之間的相互調用，哪麽服務之間的接口以及api就必須生成系統的管理文檔了。如果你希望更好的管理你的API，你希望有一個工具能一站式地解

普華永道：2030年區塊鏈價值將突破30萬億

作者 | Sebastian Wurst 編譯 | Guoxi、kou 近日，據Gartner和普華永道預測，到2030年，區塊鏈業務將帶來3萬億美元的商業價值。而在當前熊市大環境下，網路中卻充斥著無數唱衰區塊鏈的聲音。

提示此計算機當前已將連線限制為xxx的解決辦法

netsh winsock reset命令，作用是重置 Winsock 目錄。如果一臺機器上的Winsock協議配置有問題的話將會導致網路連線等問題，就需要用netsh winsock reset命令來重置Winsock目錄藉以恢復網路。這個命令可以重新初始化網路環境，以解決由於軟體衝突、病毒原因造

Android什麼版本開始支援藍芽4.2？答案：Android 7.0

轉自：https://blog.csdn.net/h_o_w_e/article/details/79874162 根據Android 7.0的相容性文件（https://source.android.com/compatibility/7.0/android-7.0-cdd.pdf）裡面

流行的 C++ GUI 開發框架 Qt 開始支援 Python

Qt 5.12 在三大桌面平臺宣佈支援 Python 2.7 以及 3.5+，幷包含兩個封裝器模組，用來封裝 Qt API 以及自有的 C++ 函式庫。知名流行的 C++ 常用 GUI 開發框架 Qt 官方宣佈，開始在 5.12 版本中支援 Python ——&

bootstrap table裡th設定data-width="400px"後，發現url不能適應，th突破限制。

問題效果，導致後面操作按鈕排版變形：然後在css中td後面加上 word-break:break-all;換行成功。 .table-responsive .bootstrap-table .

safari 10 開始支援 webRTC

2015年 9月份， safari 10 終於開始支援 WebRTC 了，值得慶祝啊， H5 的一個重要功能終於獲得了 Apple 的支援，儘管遲了點，還是值得歡呼的！ http://webrtcbydralex.com/index.php/2015/

redis 叢集（3.0版本開始支援叢集功能）

叢集簡介 Redis 叢集是一個可以在多個 Redis 節點之間進行資料共享的設施（installation）。 Redis 叢集不支援那些需要同時處理多個鍵的 Redis 命令，因為執行這些命令需要在多個 Redis 節點之間移動資料，並且在高負載的情況下，這

Google Kubernetes引擎開始支援GPU_Kubernetes中文社群

去年Google旗下的公有云服務GCP就宣佈，Google Kubernetes引擎（GKE）也將開始支援GPU應用，而近日該功能終於進入Beta版階段，可在最新版的GKE使用該功能，目前GKE所支援的GPU，包含Tesla P100、K80，而未來也會支援V100s。在GKE支援GPU應用

基礎架構管理工具Terraform 開始支援Kubernetes_Kubernetes中文社群

HashiCorp Terraform是一款開源工具，可以讓使用者管理配置任何基礎架構，Terraform可以管理公有和私有云服務的基礎架構，也可以管理外部服務，如GitHub，Nomad。 HashiCorp近日也宣佈，其基礎架構管理工具Terraform可以支援Kubernetes。Ha

Sysdig開始支援AWS Kubernetes服務_Kubernetes中文社群

sysdig是sysdig cloud 出品的主要基於Lua語言開發一個超強的工具，就像其在站點首頁上所描述的“ Sysdig is open source, system-level exploration: capture system state and activity from a

Mesosphere不在死守Mesos？開始支援Kubernetes_Kubernetes中文社群

火紅幾年的容器技術，已經開始從開發、測試環境逐漸往企業正式環境中運作前進。Mesosphere表示，現在許多企業使用者已經開始匯入容器即服務（Container as a Service，CaaS），將它與既有基礎架構環境服務結合，讓開發工作變得更為順利。再者，也要跟上一日千里的資訊科技，像

Spark 2.3新版釋出，開始支援原生 Kubernetes_Kubernetes中文社群

開源社群越來越多人使用Kubernetes來進行資料處理、資料分析和處理機器學習計算，Kubernetes也增加了不少擴充功能，資源定製化、控制器定製化，以便對更深度整合這類專屬應用程式。現在熱門的大資料分析平臺Spark在2.3新版中，開始原生支援Kubernetes。可以直接在一個現成K

Intel釋出容器作業系統Clear Containers 3.0版，開始支援Kubernetes_Kubernetes中文社群

在去年DockerCon中，Intel釋出了自己的容器作業系統Clear Container 2.0版，超過一年後的近日，Intel釋出新的3.0版，現在它也符合OCI標準，同時也支援Kubernetes。 Intel表示，這一次推出新版容器作業系統的架構上有相當大的轉移，其中的關鍵就是用於構

地圖POI(興趣點)資料的爬蟲(突破限制)

當前很多網站都提供了POI的下載介面，但是一般都需要KEY來實現。然而每個KEY(正常是個人請求的)一般每天配額度也就1000條，這對於想要大量POI資料的需求獲取而言，簡直是杯水車薪。鑑於最近想分析一下POI資料，所以對POI的爬蟲也比較感興趣，剛好看了下，有些網站還

Firefox瀏覽器開始支援Windows 10原生通知特性

與任何其他Web瀏覽器一樣，Mozilla Firefox支援內建推送通知，不過今天這一通知系統變得非常特別，因為官方宣佈他們即將開始相容Windows 10的Action Center通知系統，我們很快就會看到通過Windows 10操作中心釋出Firefox通知。根據Mozilla的Bugzilla上

微軟ML.NET 0.5開始支援了TensorFlow人工智慧模型

微軟在5月釋出由微軟研究院開發、發展了十年的機器學習框架ML.NET，今釋出了ML.NET 0.5，最大的更新便是開始支援TensorFlow，開發者可以在ML.NET中直接使用已經訓練好的TensorFlow模型，進行評分（Scoring）。另外，微軟正在開發新的ML.NET API，屆時將會棄用現行的Le

安卓 9 先行，谷歌公共 DNS 開始支援 DNS-over-TLS

1月9日，Google 正式宣佈 Google Public DNS 開始支援 DNS-over-TLS（DOT），即日起 Android 9 使用者就能使用基於 DoT 的 Google Public DNS 服務。 DoT 是一種安全協議，通過傳輸層安全性

Effective Java 3rd 條目25 將原始檔限制在單個頂層類

雖然Java編譯器讓你在單個原始檔中定義多個頂層類，但是這麼做沒有任何益處。危險性來自這個事實：在單個原始檔中定義多個頂層類，使得為一個類提供多個定義變得可能。使用哪個定義，受傳遞到編譯器的原始檔順序的影響。為了使得這具體些，考慮如下原始檔，它僅僅包含了一個Main類，這個類引用另外兩