Spark2.0 一些新特性

阿新 • • 發佈：2018-12-26

一變化

① Spark Core& Spark SQL API

1、dataframe 與dataset統一，dataframe誕生於1.6，消亡於2.0…

dataframe只是dataset[Row]的類型別名
無論是typed方法（map、filter、groupByKey等）還是untyped方法（select、groupBy等），都通過Dataset來提供。而且Dataset API將成為Spark的新一代流式計算框架——structured streaming的底層計算引擎

2、SparkSession ：統一SQLContext 和HiveContext，新上下文入口
為SparkSession新的流式呼叫configuration api

3、accummulator 功能增強
4、dataset的增強聚合api

②Spark Core Spark SQL SQL

支援 sql 2003標準
支援ddl命令
支援ansi-sql和hive sql的sql parser
支援子查詢： in/not in 、exists/not exists

③ SparkCore & Spark SQL new Feature

支援csv檔案
支援快取和程式執行的堆外記憶體管理
3.看官網去吧。

Spark Core Spark SQL 效能？

1、通過whole-stage code generation 技術將spark sql和dataset 的效能提升 2~10倍
2、通過 vectorization 技術提升parquet檔案的掃描吞吐量
3、提升orc檔案讀寫效能

④ SparkStreaming

Structured Streaming

基於spark sql和catalyst引擎構建
支援使用dataframe風格的api進行流式計算

⑤依賴管理打包和操作

不需要在生產部署時打包fat jar（可以不打spark相關依賴jar包）,可以使用provided風格
完全移除了akka的依賴換 netty
支援kryo3.0版本
使用scala 2.11 替代了scala2.10
spark 1.x中標識為過期的所有api
hash-based shuffle manager

Spark2.0 一些新特性

一變化 ① Spark Core& Spark SQL API 1、dataframe 與dataset統一，dataframe誕生於1.6，消亡於2.0… dataframe只是dataset[Row]的類型別名無論是typed方法（map、filter、group

C# 6.0/7.0 的新特性

const con use 新特性小夥伴必須 switch 寫法相同轉眼C#語言都已經叠代到7.0版本了，很多小夥伴都已經把C# 7.0 的新特性應用到代碼中了，想想自己連6.0的新特性都還很少使用，今天特意搜集了一下6.0和7.0的一些新特性，記錄一下，方便查閱。

spring4.x的一些新特性

業務 spring 依賴註入例如 conf 解決基本配置基本自己一、spring的三階段 1、spring1.x中基本是使用xml文件配置bean的形式。 2、spring2.x中使用xml和註解混用形式，基本配置使用xml（例如數據庫配置），業務配置使用註解。

關於ES6的一些新特性的學習

實參使用當我 syn already 一個元素清空 math 一、關於變量 ES5 1.只有全局作用域變量和函數作用域變量 2.“變量提升”（當程序進入一個新的函數時，會將該函數中所有的變量的聲明放在函數開始的位置。僅僅會提升變量的聲明，不會提升變量的賦值） E

ES6中的一些新特性

得到好的代碼塊代碼重復就是 trac 聲明變量 {} 這兩個命令是ES6的新語法知識。這兩個新的特性解決了ES6中的一些小的“bug”問題。其中包含一些知識：塊級作用域、let命令、const命令、全局對象的屬性。Google V8引擎已經部署了ES6的部分特性。

【Oracle12C】部署服務建立用戶及建庫建表中遇到的問題以及12C的一些新特性

Oracle問題這是一篇oracle小白的不堪折磨，苦苦掙紮所作，所費心血頗深。 Oracle12C與11g版本的差異在創建用戶時遇到一個問題（我的發現都是根據遇到的問題來研究的）：問題描述：在創建服務所需用戶時提示ORA-65096：公用用戶名或角色無效。問題原因：根據Oracle官方文檔得知，12C版本

C#5.0語法新特性

n) 基於 work studio 4.5 AS for 特性 C# C# 5.0 .NET Framework 4.5 Visual Studio 2012 C#5.0新引進的語法基於.Net Framework 4.5。主要引進的語法：異步與等待，調用方信息其中最重要

前端(七)：ES6一些新特性

堆內存 btn The 自己一次至少 pytho 不同的 title 一、變量　　1.var關鍵字的弊端　　var關鍵字的弊端：1.可以重復聲明變量；2.無法限制變量修改；3.沒有會計作用域，只有函數作用域。 <html lang="en">

Vault 0.11 新特性搶鮮看: Valut Agent

inter exp pen erl nec case likely nta agent AUG 26 2018????ANDY MANOSKE The Vault team is quickly closing on the next major release of Va

關於jdk7和jdk8 一些新特性的總結

java7新特性 1. 自動資源管理只要資源實現AutoCloseable介面JVM可以幫我們自動關閉資源 jdk7的流實現了都該介面。 try（裡面寫要開啟的資源）{

認識 MongoDB 4.0 的新特性——事務（Transactions）

前言相信使用過主流的關係型資料庫的朋友對“事務（Transactions）”不會太陌生，它可以讓我們把對多張表的多次資料庫操作整合為一次原子操作，這在高併發場景下可以保證多個數據操作之間的互不干擾；並且一旦在這些操作過程任一環節中出現了錯誤，事務會中止並且讓資料回滾，這使得同時在多張表中修改資料的時候保證

來，看看MySQL 5.6, 5.7, 8.0的新特性

對於MySQL的歷史，相信很多人早已耳熟能詳，這裡就不要贅述。下面僅從產品特性的角度梳理其發展過程中的里程碑事件。 1995年，MySQL 1.0釋出，僅供內部使用。 1996年，MySQL 3.11.1釋出，直接跳過了MySQL 2.x版本。 1999年，MySQL AB公司成立。同年

MongoDB 3.6的一些新特性介紹

一、安全方面： 1、bind_ip 為了安全考慮，MongoDB 3.6中bind_ip的預設值為localhost，可通過啟動命令或者配置檔案繫結需訪問的ip地址 2、MO

CSS一些新特性的總結篇

本週學習了一些CSS3的新特性在此做出總結記錄。 1. background-clip 設定元素的背景（背景圖片或顏色）是否延伸到邊框下面一般設定背景只會存在於content和padding這條屬性可以將背景衍生至邊框。引數值 border-box：背景延伸到邊框外沿

hadoop2.0的新特性

Hadoop2.0 產生背景 1、Hadoop 1.0中HDFS和MapReduce在高可用、擴充套件性等方面存在問題 2、HDFS存在的問題 NameNode單點故障，難以應用於線上場景 NameNode壓力過大，且記憶體受限，影響系統擴充套件性 3、Map

Vue高版本中一些新特性的使用詳解

一、深度作用選擇器（ >>> ）嚴格來說，這個應該是vue-loader的功能。”vue-loader”: “^12.2.0” 在專案開發中，如果業務比較複雜，特別像中臺或B端功能頁面都不可避免的會用到第三方元件庫，產品有時會想對這些元件進行一些UI方面的定

Vue高版本中一些新特性的使用

主要包括以下幾點：深度作用選擇器（ >>> ）我在另一篇文章中也有提到這點Vue: scoped 樣式與 CSS Module 對比元件配置項inheritAttrs、元件例項屬性$attrs和$listeners 發生在父子元件之間

es6學習6:一些新特性的實例練習

for gen als text 對象產生 ont 代理模式 content asp // 先定義一個簡化輸出函數 window.print = function (oper, result) { result ? console.log(oper, ‘=>

jdk7和jdk8的一些新特性及區別

在jdk7的新特性方面主要有下面幾方面的增強： 1.jdk7語法上 1.1二進位制變數的表示,支援將整數型別用二進位制來表示，用0b開頭。 // 所有整數 int， short，long，byte都可以用二進位制表示 // An 8-bit 'byte'

《NETTY官方文件》4.0的新特性及注意點

原文連結譯者：裘卡此文件涵蓋了此次Netty大版本中值得關注的變更點及新特性，以幫助你將自己的應用順利移植到新版本。專案結構變更基於netty已經不再是JBoss.org的一部分，我們將包名從 org.jboss.netty 變更為 io.netty。二進位制jar包也被分割成了

Spark2.0 一些新特性

一 變化

① Spark Core& Spark SQL API

②Spark Core Spark SQL SQL

③ SparkCore & Spark SQL new Feature

Spark Core Spark SQL 效能？

④ SparkStreaming

⑤依賴管理 打包和操作

相關推薦

一變化

⑤依賴管理打包和操作