Spark 2.1.0整合CarbonData 1.1.0

阿新 • • 發佈：2018-12-12

1.新建專案

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.lcc</groupId>
    <artifactId>SomeTest</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <lombok.version>1.12.6</lombok.version>
        <dubhe.common.version>1.0.4</dubhe.common.version>
        <junit.version>4.12</junit.version>
    </properties>


    <dependencies>


        <dependency>
            <groupId>org.scala-lang</groupId>
            <artifactId>scala-library</artifactId>
            <scope>2.11.8</scope>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>2.1.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.11</artifactId>
            <version>2.1.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_2.11</artifactId>
            <version>2.1.0</version>
        </dependency>
        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>fastjson</artifactId>
            <version>1.2.28</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.7.2</version>
        </dependency>
       
        <!-- 注意：這裡一定要排除spark-sql_2.10，不然會導致錯誤 -->
        <dependency>
            <groupId>org.apache.carbondata</groupId>
            <artifactId>carbondata-core</artifactId>
            <version>1.1.0</version>
            <exclusions>
                <exclusion>
                    <artifactId>spark-sql_2.10</artifactId>
                    <groupId>org.apache.spark</groupId>
                </exclusion>
            </exclusions>
        </dependency>

        <!-- https://mvnrepository.com/artifact/org.apache.carbondata/carbondata-spark2 -->
        <dependency>
            <groupId>org.apache.carbondata</groupId>
            <artifactId>carbondata-spark2</artifactId>
            <version>1.1.0</version>
        </dependency>


    </dependencies>



    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>2.3.2</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
        </plugins>
    </build>

</project>

2.測試類

package com.dtwave.megrez


import java.util.Base64

import com.alibaba.fastjson.{JSONArray, JSONObject}
import org.apache.spark.sql.CarbonSession._
import org.apache.spark.sql.{DataFrame, SparkSession}
import org.apache.spark.{SparkConf, SparkContext}

import scala.io.Source

object MegrezApp {

  def main(args: Array[String]): Unit = {

    val Array(taskType, param) = args
    
    val conf = new SparkConf()
    conf.setAppName("lcc")
    conf.setMaster("local")
    val sc = new SparkContext(conf)

    val storePath = "hdfs://co1:9000/Opt/CarbonStore"
    //  這裡我們已經獲取到SparkSession了，可以像平常一樣操作spark
    val spark:SparkSession = SparkSession.builder().config(sc.getConf).getOrCreateCarbonSession(storePath)
	
	}
}

Spark 2.1.0整合CarbonData 1.1.0

1.新建專案 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http:

Spark Streaming 和kafka 整合指導（kafka 0.8.2.1 或以上版本）

本節介紹一下如何配置Spark Streaming 來接收kafka的資料。有兩個方法： 1、老的方法 -使用Receivers 和kafka的高階API 2、新的方法（ Spark 1.3 開始引入）-不適用Receivers。這兩個方式擁有不同的程式設計模型，效能特徵

springboot 2.0整合activiti（1）

springboot 2.0整合activiti（1）踩坑經歷增加Maven依賴生成activiti資料表踩坑經歷截止到現在activiti7只有beta版本，嘗試採用activiti6完成工作流任務。

SpringBoot2.1.1.RELEASE整合activiti 5.22.0

SpringBoot2.1.1.RELEASE整合activiti 5.22.0https://download.csdn.net/download/yebichao/10865094http://www.qchcloud.cn/system/article/show/78 http://localhost

Android Studio 3.0整合ButterKnife8.8.1版本出現問題以及解決方法

新安裝了Android Studio 3.0 ，做專案的時候需要整合ButterKnife，去githd上一看ButterKnife升級到了8.8.1，按著用法整合到了專案中，but 出現了下面的錯誤：Error:(2, 0) Android Gradle plu

springboot2.0整合工作流activiti6.0，以及與業務整合時的一些坑

1、首先，要在springboot工程的pom檔案中引入相關jar包 <dependency> <groupId>org.activiti</groupId> <artifactId>activiti-

Carbondata 1.4.0+Spark 2.2.1 On Yarn整合安裝

微信公眾號(SZBigdata-Club)：後續部落格的文件都會轉到微信公眾號中。 1、公眾號會持續給大家推送技術文件、學習視訊、技術書籍、資料集等。 2、接受大家投稿支援。 3、對於各公司hr招聘的，可以私下聯絡我，把招聘資訊發給我我會在公眾號中進行推送。技術

Spark 2.4.0 整合Hive 1.2.1

Spark 2.4.0 整合Hive 1.2.1 更多資源 github: https://github.com/opensourceteams/spark-scala-maven-2.4.0 apache-hive-1.2.1-bin 安裝: https://gith

spark(2.1.0) 操作hbase(1.0.2)

hadoop mon per bsp trac 事先 com maker scala 1、spark中引入外部jar包　　1）創建/usr/software/spark_jars目錄，放入spark操作hbase的jar包：hbase-annotations-1.0.2.

Spring4.0 整合Quartz2.2.1

mark apach ava class exp pack post 註入針對 1.版本說明 Spring 4.0.0 Quartz 2.2.1 SpringMvc 4.0.0 2.Quartz依賴的jar包 <dependency> <grou

spark-2.2.0-bin-2.6.0-cdh5.12.1.tgz 編譯方法總結！

菜雞一隻，如果有說錯的地方，還請見諒和指出批評！！事情是這樣的，想在自己本地部署一個hadoop2.6.0-cdh5.12.1，hive1.1.0-cdh5.12.1，spark-2.2.0-bin-2.6.0-cdh5.12.1的環境，前兩個還是很好找到哪裡下載和部署的！ c

Spark Streaming實時流處理筆記（1）——Spark-2.2.0原始碼編譯

1 下載原始碼 https://spark.apache.org/downloads.html 解壓 2 編譯原始碼參考 https://www.imooc.com/article/18419 https://spark.apache.org/docs/2.2.2/bu

IBM Cloud Private 2.1.0.2 和LDAP整合的問題

This security patch resolves the following issues in IBM Cloud Private Version 2.1.0.2: IBM Cloud Private cannot connect to a LDAP server if there are