Flink安裝、部署、KafkaSource、SinKToMysql

阿新 • • 發佈：2018-11-17

flink安裝、部署、測試

下載flink安裝包

flink下載地址

https://archive.apache.org/dist/flink/flink-1.5.0/

因為例子不需要hadoop，下載flink-1.5.0-bin-scala_2.11.tgz即可

上傳至機器的/opt目錄下

解壓

tar -zxf flink-1.5.0-bin-scala_2.11.tgz -C ../opt/

配置master節點

選擇一個 master節點(JobManager)然後在conf/flink-conf.yaml中設定jobmanager.rpc.address 配置項為該節點的IP 或者主機名。確保所有節點有有一樣的jobmanager.rpc.address 配置。

jobmanager.rpc.address: node1

(配置埠如果被佔用也要改如預設8080已經被spark佔用，改成了8088)

rest.port: 8088

本次安裝 master節點為node1，因為單機，slave節點也為node1

配置slaves

將所有的 worker 節點（TaskManager）的IP 或者主機名（一行一個）填入conf/slaves 檔案中。

啟動flink叢集

bin/start-cluster.sh

開啟 http://node1:8088 檢視web頁面

Task Managers代表當前的flink只有一個節點，每個task還有兩個slots

測試

依賴

    <groupId>com.rz.flinkdemo</groupId>
    <artifactId>Flink-programe</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <scala.binary.version>2.11</scala.binary.version>
        <flink.version>1.5.0</flink.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java_${scala.binary.version}</artifactId>
            <version>${flink.version}</version>
        </dependency>

        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-scala_${scala.binary.version}</artifactId>
            <version>${flink.version}</version>
        </dependency>
    </dependencies>

測試程式碼

public class SocketWindowWordCount {
    public static void main(String[] args) throws Exception {

        // the port to connect to
        final int port;
        final String hostName;
        try {
            final ParameterTool params = ParameterTool.fromArgs(args);
            port = params.getInt("port");
            hostName = params.get("hostname");
        } catch (Exception e) {
            System.err.println("No port or hostname specified. Please run 'SocketWindowWordCount --port <port> --hostname <hostname>'");
            return;
        }

        // get the execution environment
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // get input data by connecting to the socket
        DataStream<String> text = env.socketTextStream(hostName, port, "\n");

        // parse the data, group it, window it, and aggregate the counts
        DataStream<WordWithCount> windowCounts = text
                .flatMap(new FlatMapFunction<String, WordWithCount>() {
                    public void flatMap(String value, Collector<WordWithCount> out) {
                        for (String word : value.split("\\s")) {
                            out.collect(new WordWithCount(word, 1L));
                        }
                    }
                })
                .keyBy("word")
                .timeWindow(Time.seconds(5), Time.seconds(1))
                .reduce(new ReduceFunction<WordWithCount>() {
                    public WordWithCount reduce(WordWithCount a, WordWithCount b) {
                        return new WordWithCount(a.word, a.count + b.count);
                    }
                });

        // print the results with a single thread, rather than in parallel
        windowCounts.print().setParallelism(1);


        env.execute("Socket Window WordCount");
    }

    // Data type for words with count
    public static class WordWithCount {

        public String word;
        public long count;

        public WordWithCount() {}

        public WordWithCount(String word, long count) {
            this.word = word;
            this.count = count;
        }

        @Override
        public String toString() {
            return word + " : " + count;
        }
    }
}

打包mvn clean install (如果打包過程中報錯java.lang.OutOfMemoryError)

在命令列set MAVEN_OPTS= -Xms128m -Xmx512m

繼續執行mvn clean install

生成FlinkTest.jar

找到打成的jar，並upload，開始上傳

執行引數介紹

提交結束之後去overview介面看，可以看到，可用的slots變成了一個，因為我們的socket程式佔用了一個，正在running的job變成了一個

傳送資料

[[email protected] flink-1.5.0]# nc -l 8099
aaa bbb
aaa ccc
aaa bbb
bbb ccc

點開running的job，你可以看見接收的位元組數等資訊

到log目錄下可以清楚的看見輸出

[[email protected] log]# tail -f flink-root-taskexecutor-2-localhost.out
aaa : 1
ccc : 1
ccc : 1
bbb : 1
ccc : 1
bbb : 1
bbb : 1
ccc : 1
bbb : 1
ccc : 1

除了可以在介面提交，還可以將jar上傳的linux中進行提交任務

執行flink上傳的jar

bin/flink run -c com.rz.flinkdemo.SocketWindowWordCount jars/FlinkTest.jar --port 8099 --hostname node1

其他步驟一致。

使用kafka作為source

加上依賴

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-kafka-0.10_2.11</artifactId>
    <version>1.5.0</version>
</dependency>

public class KakfaSource010 {

    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        Properties properties = new Properties();
        properties.setProperty("bootstrap.servers","node1:9092");
        properties.setProperty("group.id","test");

        //DataStream<String> test = env.addSource(new FlinkKafkaConsumer010<String>("topic", new SimpleStringSchema(), properties));
        //可以通過正則表示式來匹配合適的topic
        FlinkKafkaConsumer010<String> kafkaSource = new FlinkKafkaConsumer010<>(java.util.regex.Pattern.compile("test-[0-9]"), new SimpleStringSchema(), properties);
        //配置從最新的地方開始消費
        kafkaSource.setStartFromLatest();

        //使用addsource，將kafka的輸入轉變為datastream
        DataStream<String> consume = env.addSource(kafkaSource);

        ...
        //process  and   sink

        env.execute("KakfaSource010");

    }
}

使用mysql作為sink

flink本身並沒有提供datastream輸出到mysql，需要我們自己去實現

首先，匯入依賴

<dependency>
    <groupId>mysql</groupId>
    <artifactId>mysql-connector-java</artifactId>
    <version>5.1.30</version>
</dependency>

自定義sink，首先想到的是extends SinkFunction，整合flink自帶的sinkfunction，再當中實現方法，實現如下

public class MysqlSink implements
        SinkFunction<Tuple2<String,String>> {

    private static final long serialVersionUID = 1L;
    private Connection connection;
    private PreparedStatement preparedStatement;
    String username = "mysql.user";
    String password = "mysql.password";
    String drivername = "mysql.driver";
    String dburl = "mysql.url";

    @Override
    public void invoke(Tuple2<String,String> value) throws Exception {
        Class.forName(drivername);
        connection = DriverManager.getConnection(dburl, username, password);
        String sql = "insert into table(name,nickname) values(?,?)";
        preparedStatement = connection.prepareStatement(sql);
        preparedStatement.setString(1, value.f0);
        preparedStatement.setString(2, value.f1);
        preparedStatement.executeUpdate();
        if (preparedStatement != null) {
            preparedStatement.close();
        }
        if (connection != null) {
            connection.close();
        }

    }

}

這樣實現有個問題，每一條資料，都要開啟mysql連線，再關閉，比較耗時，這個可以使用flink中比較好的Rich方式來實現，程式碼如下

public class MysqlSink extends RichSinkFunction<Tuple2<String,String>> {

    private Connection connection = null;
    private PreparedStatement preparedStatement = null;
    private String userName = null;
    private String password = null;
    private String driverName = null;
    private String DBUrl = null;

    public MysqlSink() {
        userName = "mysql.username";
        password = "mysql.password";
        driverName = "mysql.driverName";
        DBUrl = "mysql.DBUrl";
    }

    public void invoke(Tuple2<String,String> value) throws Exception {
        if(connection==null){
            Class.forName(driverName);
            connection = DriverManager.getConnection(DBUrl, userName, password);
        }
        String sql ="insert into table(name,nickname) values(?,?)";
        preparedStatement = connection.prepareStatement(sql);

        preparedStatement.setString(1,value.f0);
        preparedStatement.setString(2,value.f1);

        preparedStatement.executeUpdate();//返回成功的話就是一個，否則就是0
    }

    @Override
    public void open(Configuration parameters) throws Exception {
        Class.forName(driverName);
        connection = DriverManager.getConnection(DBUrl, userName, password);
    }

    @Override
    public void close() throws Exception {
        if(preparedStatement!=null){
            preparedStatement.close();
        }
        if(connection!=null){
            connection.close();
        }
    }
}

Rich方式的優點在於，有個open和close方法，在初始化的時候建立一次連線，之後一直使用這個連線即可，縮短建立和關閉連線的時間，也可以使用連線池實現，這裡只是提供這樣一種思路。

使用這個mysqlsink也非常簡單

//直接addsink，即可輸出到自定義的mysql中，也可以將mysql的欄位等寫成可配置的，更加方便和通用
proceDataStream.addSink(new MysqlSink());

總結

本次的筆記做了簡單的部署、測試、kafkademo，以及自定義實現mysqlsink的一些內容，其中比較重要的是Rich的使用，希望大家能有所收穫。

叢集基礎之04（部署ceph實驗環境、部署ceph叢集、建立Ceph塊儲存、塊儲存應用、掛載Ceph檔案系統、建立物件儲存伺服器）

目錄前言：前言： Ceph簡介 Ceph是一個統一的分散式儲存系統，設計初衷是提供較好的效能、可靠性和可擴充套件性。 Ceph專案最早起源於Sage就讀博士期間的工作（最早的成果於2004年

Flink安裝、部署、KafkaSource、SinKToMysql

flink安裝、部署、測試下載flink安裝包 flink下載地址 https://archive.apache.org/dist/flink/flink-1.5.0/ 因為例子不需要hadoop，下載flink-1.5.0-bin-scala_2.11.tgz即可上傳至機器

Flink環境安裝部署、詞頻統計例項、WordCount原始碼分析

./start-cluster.sh 瀏覽器輸入http://localhost:8081可以看到UI介面單詞統計例項： jar包所在位置(安裝包自帶) 依次輸入： ./flink run .

Golang學習-第一篇 Golang的簡單介紹及Windows環境下安裝、部署

需要簡單電腦 pan 生成文件多核 -- pear () 序言這是本人博客園第一篇文章，寫的不到位之處，希望各位看客們諒解。本人一直從事.NET的開發工作，最近在學習Golang，所以想著之前學習的過程中都沒怎麽好好的將學習過程記錄下來。深感惋惜！現在將Gola

FastDFS安裝、配置、部署（一）

springmvc mybatis shiro druid restful redis dubbo zookeeper fastdfs 摘要: FastDFS是一個開源的，高性能的的分布式文件系統，他主要的功能包括：文件存儲，同步和訪問，設計基於高可用和負載均衡，FastDFS非常適用於基於文

VMware vSAN超融合虛擬化存儲技術咨詢、故障排除、項目實施、安裝部署

vmware vsan 超整合項目實施安裝部署我們可以承接【VMware vSAN超融合虛擬化存儲技術咨詢、故障排除、項目實施遠程安裝部署】。我們是VMware授權合作夥伴代理商企業認證，專做VMware虛擬化項目，線上實施（技術咨詢、故障排除、項目實施）。項目收費標準：VMw

VMware Horizon view桌面虛擬化技術咨詢、故障排除、項目實施、安裝部署

虛擬桌面 horizon view vmware 虛擬化安裝部署我們可以承接【VMware Horizon view桌面虛擬化技術咨詢、故障排除、項目實施遠程安裝部署】。我們是VMware授權合作夥伴代理商企業認證，專做VMware虛擬化項目，線上實施（技術咨詢、故障排除、項目實施

VMware ESXi vCenter服務器虛擬化技術咨詢、故障排除、項目實施、安裝部署

vmware esxi vcenter 虛擬化虛擬機我們可以承接【VMware ESXi服務器虛擬化技術咨詢、故障排除、項目實施遠程安裝部署】。我們是VMware授權合作夥伴代理商企業認證，專做VMware虛擬化、虛擬機項目，線上實施（技術咨詢、故障排除、項目實施）。

【ASP.NET Core快速入門】（四）在CentOS上安裝.NET Core運行時、部署到CentOS

ati libunwind serve code api cal 之前 prompt conn 下載.NET Core SDK 下載地址：https://www.microsoft.com/net/download/windows 第一步：Add the dotne

ansible安裝部署和配置、常用模塊整理

自動化運維工具輸出信息 pat 秘鑰 img 系統命令 hair 作用環境今天心情不錯~~~~第25個生日了，又遇昨晚百年難得一見的藍月亮，所以昨晚連夜整理了文檔，會分為兩部分發出去，ansible批量化部署在工作中是非常實用，建議呢整理大量常用模塊去練習1.1.1

第二十二期 Linux安裝/刪除應用及快速部署http服務、FTP服務

雲計算 Linux 達內 1.安裝：基本用法格式：yum [-y] install 軟件名 .. ..eg：[root@ntd1711 ~]# yum list httpd //查看是否安裝http【這裏輸入服務名為httpd】[root@ntd1711 ~]# yum -y install ht

FastDFS安裝、配置、部署

spring springmvc fastdfs kafka dubbo 摘要: FastDFS是一個開源的，高性能的的分布式文件系統，他主要的功能包括：文件存儲，同步和訪問，設計基於高可用和負載均衡，FastDFS非常適用於基於文件服務的站點，例如圖片分享和視頻分享網站聲明：對於分布式

Redis的安裝及創建節點、部署群集

讀取 fff 補充 ring log cto all mkdir 目錄 Redis簡介 Redis是一個開源的使用ANSI C語言編寫、支持網絡、可基於內存亦可持久化的日誌型、Key-Value數據庫，並提供多種語言的API。 Redis有著更為復雜的數據結構並且提供對

kafka系列一、kafka安裝及部署

一、環境準備作業系統：Cent OS 7 Kafka版本：kafka_2.10 Kafka官網下載：請點選 JDK版本：1.8.0_171 zookeeper-3.4.10 二、kafka安裝配置 1、下載Kafka並解壓　　下載:

Docker安裝Nexus搭建Maven私服、部署引用jar包

docker run --restart="always" -d -p 8081:8081 --name nexus -v /opt/data/nexus-data:/nexus-data sonatype/nexus3 注意點：若出現許可權問題 chmod 777 nexus-

徹底明白Flink系統學習5：window、Linux本地安裝Flink

http://www.aboutyun.com/thread-26393-1-1.html 問題導讀 1.如何在window下安裝Flink? 2.Flink本地安裝啟動命令與原先版本有什麼區別? 3.window和Linux本地啟動命令有什麼區別？ 4.如何檢視Flink web ui? 關注最新經典文章

MongoDB的下載、安裝與部署

1、什麼是MongoDB？它是介於關係型資料庫和非關係型資料庫之間的一種NoSQL資料庫，用C++編寫，是一款集敏捷性、可伸縮性、擴充套件性於一身的高效能的面向文件的通用資料庫。 2、為什麼要用MongoDB？　　它具有以下幾個特

Golang的簡單介紹及Windows環境下安裝、部署

Golang安裝 Golang下載：https://golang.google.cn/dl/。作業系統包名 Windows go1.4.windows-amd64.msi Linux

jenkins持續整合安裝、配置、部署

jenkins介紹：它是一個自動化的週期性的整合測試過程，從檢出程式碼、編譯構建、執行測試、結果記錄、測試統計等都是自動完成的，無需人工干預，有利於減少重複過程以節省時間、費用和工作量；

windows下 zookeeper 叢集的安裝、配置、部署

前提：配置Java環境 zookeeper 單臺和叢集的區別在於配置檔案（conf/zoo.cfg）的配置不同，還有dataDir的目錄需要新建一個沒有檔案型別的檔案myid，並起myid裡面的值輸入對應配置中server.後面的數值。附上我配

Flink安裝、部署、KafkaSource、SinKToMysql

flink安裝、部署、測試

下載flink安裝包

解壓

配置master節點

配置slaves

啟動flink叢集

測試

依賴

測試程式碼

使用kafka作為source

使用mysql作為sink

總結

相關推薦