Flink流處理測試

阿新 • • 發佈：2022-03-20

Flink流處理測試

package com.shujia.flink.core

import org.apache.flink.streaming.api.scala._

object Demo1WordCount {
  def main(args: Array[String]): Unit = {
    /**
     * 1、建立flink的執行環境
     * 這是flink程式的入口
     */
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment

    /**
     * 2、讀取資料
     * DataStream相當於spark中的DStream
     */
    val linesDS: DataStream[String] = env.socketTextStream("master", 8888)

    /**
     * 3、開啟socket
     * 在虛擬機器中輸入  nc -lk 8888  回車
     */

    //先不做處理，直接列印處理
    //流處理不能使用foreach迴圈列印
    linesDS.print()

    /**
     * 4、啟動flink程式（執行該程式碼）
     */
    env.execute("wordcount")//給該程式起個名字
  }
}

步驟：

1、建立flink的執行環境
2、讀取資料
3、返回虛擬機器中，輸入nc -lk 8888 回車
4、編寫啟動flink程式的程式碼，然後執行整個程式碼

回到虛擬機器中，輸入一些資料，在IDEA中會對應生成；

因為我的電腦效能-邏輯處理器是4，所以在IDEA中的輸出結果並行度編號有4種

Flink處理WordCount時，想要列印日誌

(1)增加依賴

		<dependency>
      <groupId>org.apache.logging.log4j</groupId>
      <artifactId>log4j-slf4j-impl</artifactId>
      <version>${log4j.version}</version>
  </dependency>
  <dependency>
      <groupId>org.apache.logging.log4j</groupId>
      <artifactId>log4j-api</artifactId>
      <version>${log4j.version}</version>
  </dependency>
  <dependency>
      <groupId>org.apache.logging.log4j</groupId>
      <artifactId>log4j-core</artifactId>
      <version>${log4j.version}</version>
  </dependency>

(2)在IDEA的resources目錄中增加一個配置檔案log4j2.properties

(3)重新執行程式碼

預設並行度是計算機核心數（邏輯處理器）有關，我們通過程式碼可以自定義並行度

//在讀取資料之前設定並行度
env.setParallelism(2)

重新執行程式碼

Flink流處理測試

Flink流處理測試 package com.shujia.flink.core import org.apache.flink.streaming.api.scala._ object Demo1WordCount {

Flink基礎（五）：Flink 流處理 API

1 Environment 1.1 getExecutionEnvironment 　　建立一個執行環境，表示當前執行程式的上下文。如果程式是獨立呼叫的，則此方法返回本地執行環境；如果從命令列客戶端呼叫程式以提交到叢集，則此方法返回此叢集的

4、Flink流處理案例實現-Java

在Flink專案裡面建立一個包，同時新建一個wordcount類 package com.gong.stream; import org.apache.flink.api.common.functions.FlatMapFunction;

Flink流處理程式執行流程原始碼分析

首先，上程式碼，從最簡單的例子開始第一步：編寫流處理的小例子　　需求：接收來自Kafka中sensor-temperature主題下的溫度感測器資料，計算各感測器每天的5秒內的平均溫度

二.Flink 流處理API之Transform

轉換運算元 1.map DataStream<Integer> mapStram= dataStream.map(new MapFunction<String, Integer>() {public Integer map(String value) throws Exception {return value.length();}});

Flink筆記6：Flink流處理API之Environment與Source

技術標籤：Flinkflinkstream分散式kafkascala 1、 Environment 1.1 getExecutionEnvironment 建立一個執行環境，表示當前執行程式的上下文。如果程式是獨立呼叫的，則此方法返回本地執行環境；如果從命令列客

Flink 流處理api

技術標籤：Flink大資料flink 文章目錄 1.Environment1.1 getExecutionEnvironment1.2 createLocalEnvironment1.3 createRemoteEnvironment

Flink 流處理

Apache Flink可實現可擴充套件並行度的 ETL、資料分析以及事件驅動的流式應用程式。

Flink流處理-簡單案例-01

一、pom檔案 <?xml version=\"1.0\" encoding=\"UTF-8\"?> <project xmlns=\"http://maven.apache.org/POM/4.0.0\"

Flink流處理---WordCount：統計單詞數量

Flink流處理---WordCount：統計單詞數量注意：導包的時候需要手動修改一下修改為import org.apache.flink.streaming.api.scala._

Plink v0.1.0 釋出——基於Flink的流處理平臺

Plink是一個基於Flink的流處理平臺，旨在基於 [Apache Flink]封裝構建上層平臺。提供常見的作業管理功能。如作業的建立，刪除，編輯，更新，儲存，啟動，停止，重啟，管理，多作業模板配置等。

Flink基礎（十四）：Table API 和 Flink SQL（三）流處理中的特殊概念

　　Table API 和 SQL，本質上還是基於關係型表的操作方式；而關係型表、關係代數，以及SQL 本身，一般是有界的，更適合批處理的場景。這就導致在進行流處理的過程中，理解會

flink聯結器-流處理-讀寫redis

寫入redis resultStream.addSink(new RedisSink(FlinkUtils.getRedisSinkConfig(parameters),new MyRedisMapper()));

flink 流式處理中如何整合mybatis框架

flink 中自身雖然實現了大量的connectors，如下圖所示，也實現了jdbc的connector，可以通過jdbc 去操作資料庫，但是flink-jdbc包中對資料庫的操作是以ROW來操作並且對資料庫事務的控制比較死板，有時候操作關係型資料

流處理開源框架Flink原理簡介和使用

技術標籤：平凡人筆記 spark kafka stream 示例大資料處理工具Kafka、Zk、Spark 這篇文章描述了如何搭建kafka、zk和spark叢集環境

Flink批處理和流處理程式例子

技術標籤：# ---Flinkflink 批處理 import org.apache.flink.api.scala.{ExecutionEnvironment, createTypeInformation}

flink讀取不到檔案_Flink流處理API——Source

技術標籤：flink讀取不到檔案本文主要從以下幾個方面介紹Flink的流處理API——Source

Flink-Java版單詞計數(批處理&流處理)

技術標籤：flinkjavaflink 建立工程 pom.xml檔案依賴如下: <dependencies> <dependency>

Flink流式處理百萬資料量CSV檔案

技術標籤：平凡人筆記前言最近公司讓做一個\'沒有必要\'的需求需求針對的物件

flink core 流處理，批處理

流處理 package com.shujia.flink.core //匯入隱式轉換 import org.apache.flink.streaming.api.scala._

Flink流處理測試

Flink流處理測試

相關推薦