利用Avro實現Kakfa序列化和反序列化

阿新 • • 發佈：2018-11-19

1 在pom.xml中新增依賴，

1.1 在dependencies中配置：

<dependency>
      <groupId>org.apache.avro</groupId>
      <artifactId>avro</artifactId>
      <version>1.8.2</version>
    </dependency>
    <dependency>
      <groupId>org.apache.avro</groupId>
      <artifactId>avro-tools</artifactId>
      <version>1.8.2</version>
    </dependency>
    <dependency>
      <groupId>org.apache.avro</groupId>
      <artifactId>avro-maven-plugin</artifactId>
      <version>1.8.2</version>
    </dependency>
    <dependency>
      <groupId>org.apache.avro</groupId>
      <artifactId>avro-compiler</artifactId>
      <version>1.8.2</version>
    </dependency>

1.2 在<build>中配置，注意不要加<pluginManagement></pluginManagement>：

<build>
      <plugins>
        <plugin>
          <groupId>org.apache.avro</groupId>
          <artifactId>avro-maven-plugin</artifactId>
          <version>1.8.2</version>
          <executions>
            <execution>
              <phase>generate-sources</phase>
              <goals>
                <goal>schema</goal>
              </goals>
              <configuration>
                <sourceDirectory>${project.basedir}/src/main/avro/</sourceDirectory>
                <outputDirectory>${project.basedir}/src/main/java/</outputDirectory>
              </configuration>
            </execution>
          </executions>
        </plugin>
        <plugin>
          <groupId>org.apache.maven.plugins</groupId>
          <artifactId>maven-compiler-plugin</artifactId>
          <configuration>
            <source>1.8</source>
            <target>1.8</target>
          </configuration>
        </plugin>
      </plugins>
  </build>

2 定義avro的scheme

2.1 Avro scheme是通過JSON形式來定義的，一般以.avsc結尾（maven外掛會去指定目錄下獲取.avsc結尾的檔案並生成成java檔案）。

stock.avsc內容如下：

namespace —— 生成的java檔案的包

type —— record

name —— 生成類的名字

fields —— 欄位名和型別

{
  "namespace":"org.sunny.avroDAO",
  "type":"record",
  "name":"StockAvroBean",
  "fields":[
    {"name":"stockCode","type":"string"},
    {"name":"stockName","type":"string"},
    {"name":"tradeTime","type":"long"},
    {"name":"preclosePrice","type":"float"},
    {"name":"openPrice","type":"float"},
    {"name":"currentPrice","type":"float"}
  ]
}

2.2 利用*.avsc檔案生成.java檔案，IDEA->Tool Window->Maven Projects-> compile或者install都可以，在namespace的包下生成name.java檔案（StockAvroBean.java）。

StockAvroBean.java是org.apache.avro.specific.SpecificRecordBase的子類。

另外，avro提供了一個avro-tools包來生成java檔案，可以通過下面命令：

java -jar /path/to/avro-tools-1.8.0.jar compile schema <schema file> <destination>

這也是為什麼沒有avro/avro-tools-1.8.2.jar出現在avro資料夾中的原因。

3 實現序列化.class、反序列化.class，同時，為了方便起見，定義TopicEnum列舉類實現topic和value的class之間的對映。

3.1 序列化：

import org.apache.avro.io.BinaryEncoder;
import org.apache.avro.io.DatumWriter;
import org.apache.avro.io.EncoderFactory;
import org.apache.avro.specific.SpecificDatumWriter;
import org.apache.avro.specific.SpecificRecordBase;
import org.apache.kafka.common.serialization.Serializer;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.util.Map;

/**
 * 序列化
 * @param <T>
 */
public class AvroSerializer<T extends SpecificRecordBase> implements Serializer<T> {
    @Override
    public void configure(Map<String, ?> map, boolean b) {}

    @Override
    public byte[] serialize(String topic, T data) {
        if (data == null){
            return null;
        }
        DatumWriter<T> writer = new SpecificDatumWriter<>(data.getSchema());  //將data的schema裝進去
        ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
        BinaryEncoder encoder = EncoderFactory.get().directBinaryEncoder(outputStream,null); 
        try {
            writer.write(data,encoder);
        }catch (IOException e){
            e.printStackTrace();
        }
        return outputStream.toByteArray();
    }

    @Override
    public void close() {}
}

3.2 反序列化：

import org.apache.avro.io.*;
import org.apache.avro.specific.SpecificDatumReader;
import org.apache.avro.specific.SpecificRecordBase;
import org.apache.kafka.common.serialization.Deserializer;

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.util.Map;

/**
 * 反序列化
 */
public class AvorDeserializer<T extends SpecificRecordBase> implements Deserializer<T> {

    @Override
    public void configure(Map<String, ?> map, boolean b) {}

    @Override
    public T deserialize(String topic, byte[] data) {
        if (data == null){
            return null;
        }
        try {
            //得到主題對應的資料型別
            TopicEnum topicEnum = TopicEnum.getTopicEnum(topic);
            if (topicEnum == null){
                return null;
            }

            SpecificRecordBase record = topicEnum.getRecord();
            DatumReader<T> datumReader = new SpecificDatumReader<>(record.getSchema());
            ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(data);
            BinaryDecoder decoder = DecoderFactory.get().directBinaryDecoder(byteArrayInputStream,null);
            return  datumReader.read(null,decoder);

        }catch (IOException e){
            e.printStackTrace();
        }
        return null;
    }

    @Override
    public void close() {}
}

3.3 TopicEnum：將topic和value對應的class檔案進行關聯：

import org.apache.avro.specific.SpecificRecordBase;
import org.apache.commons.lang.StringUtils;

/**
 * 將topic和value對應的類對應起來
 */
public enum TopicEnum {
    STOCK_AVOR("avro-kafka",new StockAvroBean()); //例項

    private String topic;
    private SpecificRecordBase record;

    private TopicEnum(String topic,SpecificRecordBase record){
        this.topic = topic;
        this.record = record;
    }
    ...Getter and Setter...
    public static TopicEnum getTopicEnum(String topicName){
        if (topicName.isEmpty()){
            return null;
        }

        for (TopicEnum topicEnum : values()){
            if (StringUtils.equalsIgnoreCase(topicEnum.getTopic(),topicName)){
                return topicEnum;
            }
        }
        return null;
    }
}

4 在Producer和Consumer中配置屬性

消費者的配置部分：

public class AvroConsumer {
    private static final String BOOTSTRAP_SERVER = "LOCALHOST:9092";
  
    private Properties initConfig(){
        Properties config = new Properties();
        config.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,BOOTSTRAP_SERVER);
        config.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG,false);
        config.put(ConsumerConfig.GROUP_ID_CONFIG,"avro-group");
        config.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
        config.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, AvorDeserializer.class.getName());
        return config;
    }
}

生產者的配置部分：

public class AvroProducer {
    private static final String BROKER_LIST = "localhost:9092";
    
    public AvroProducer(String[] topics){
        this.topics = topics;
    }

    private static Properties initconfig(){
        Properties config = new Properties();
        config.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,BROKER_LIST);//broker_list
        config.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
        config.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, AvroSerializer.class.getName());
        config.put(ProducerConfig.PARTITIONER_CLASS_CONFIG,AvroPartition.class.getName()); //自定義的分割槽準則
        return config;
    }
}

題外話，上面自定義的分割槽準則，是通過繼承org.apache.kafka.client.producer.Partition實現的，下面提供一種實現方法：

import org.apache.kafka.clients.producer.Partitioner;
import org.apache.kafka.common.Cluster;
import java.util.Map;

/**
 * 實現自己的分割槽邏輯
 */
public class AvroPartition implements Partitioner {
    @Override
    public int partition(String topic, Object key, byte[] keybytes, Object value, byte[] valuebytes, Cluster cluster) {
        if (key==null){
            return 0;
        }
        String partitionKey = key.toString();
        try {
            //根據key的最後一位和partitions取模，設定分割槽
           int partitionID = Integer.valueOf(partitionKey.substring(partitionKey.length()-2)) % 6;
           System.out.println(partitionID);

           return partitionID;
        }catch (Exception e){
            e.printStackTrace();
        }
        return 0;
    }

    @Override
    public void close() {}

    @Override
    public void configure(Map<String, ?> map) {}
}

參考文章：

Avro序列化操作（1）：環境搭建和Schema處理

Apache Avro 1.8.1 入門指南（Java）

Apache Avro

Avro與Java

利用Avro實現Kakfa序列化和反序列化

1 在pom.xml中新增依賴， 1.1 在dependencies中配置： <dependency> <groupId>org.apache.avro</groupId> <ar

利用序列化和反序列化實現深拷貝

實現 turn one span format class pos 反序 isp 以下都是有缺陷的。 1 private static T BinDeepCopy<T>(T t) 2 { 3 using(va

C#中怎樣實現序列化和反序列化

image .com 合並小白 str mat get new ons 我們想要將數據進行持久化的操作的話，也就是將數據寫入到文件中，我們在C#中可以通過IO流來操作，同時也可以通過序列化來操作，本人是比較推薦使用序列化操作的因為我們如果想要將一個對象持久化到文件中

spring+redis 實現快取解決序列化和反序列化的問題

1.config.properties # Redis settings redis.host=127.0.0.1 redis.port=6379 #redis.pass=password redis.dbIndex=0 redis.expiration=3000 &

【修真院java小課堂】什麼是序列化和反序列化，在RMI中是否要實現 SERIALIZABLE 介面， SERIALVERSIONUID的用處是什麼？

8.更多討論 1、serialVersionUID實際作用假設本地資料庫中儲存了大量的user物件，後來由於需求，要修改User類中的屬性；如果不設定SerialVersionUID，根據屬性方法等自動生成，就會出現程式碼演示中的錯誤，造

《程式設計師程式碼面試指南》二叉樹的序列化和反序列化——java實現

二叉樹的序列化和反序列化題目描述：二叉樹被記錄成檔案的過程叫作二叉樹的序列化，通過檔案內容重建原來二叉樹的過程叫作二叉樹的反序列化。給定一棵二叉樹的頭節點head，並已知二叉樹節點值的型別為32位整型。請設計一種二叉樹序列化和反序列化的方案，並用程式碼實現

實現json的序列化和反序列化

之前一直用的是官網上的庫：http://www.json.org/java/index.html 個人體驗，這個庫的毛病挺多的，比如在將JSONObject轉換成String的過程中會產生大量的臨時性的String物件（因為沒用StringBuffer），更鬱悶的一個問題是，

javascript實現json的序列化和反序列化功能

json的序列化和反序列化是我們常用的功能序列化：序列化：反序列化：eval將字串反序列化成物件測試部分：完整示例：執行效果圖如下：序列化方法：JSON.stringfy() 反序列化：物件序列化是指將物件的狀態轉換為字串。序列

Java 物件序列化和反序列化（實現 Serializable 介面）

序列化和反序列化的概念把物件轉換為位元組序列的過程稱為物件的序列化。把位元組序列恢復為物件的過程稱為物件的反序列化。物件的序列化主要有兩種用途：把物件的位元組序列永久地儲存到硬碟上，通常存放在一個檔案中；在網路上傳送物件的位元組序列。 JDK

Json工具類--使用1.x版本Jackson實現json的序列化和反序列化

簡介：使用1.x版本(org.codehaus.jackson包下類)的Jackson實現了json的序列化和反序列化。 1.工具類程式碼： import com.fasterxml.jackson.annotation.JsonFormat; impor

JSON 序列化和反序列化——JavaScriptSerializer實現

json:{"ApplyName":"11","EmailNum":"[email protected]","PhoneNum":"13212121212","UnitName":"12","ActivityId":"4"} 通過Boutique_Activity

java 序列化和反序列化的實現原理

反序列化聽說 bsp 反序傳遞實體對象搜索狀態本地文件老是聽說序列化反序列化，就是不知道到底什麽是序列化，什麽是反序列化？今天就在網上搜索學習一下，這一搜不要緊，發現自己曾經用過，竟然不知道那就是JDK類庫中序列化和反序列化的API。 ----什麽是序列化

Android平臺實現點陣圖(Bitmap)的序列化和反序列化

android整個上層java開發框架可以分為四個方面：介面（activity和appwidget）、訊息（Intent和Message）、服務（Service）和資料（Sqllite、Content Provider）。1.新的序列化方式：android提供了一種新的型別

C# 實現Json 序列化和反序列化功能

1、新建一個 JSON 類，實現如下所示程式碼： /* * * 表示層的輔助類 * * 功能：JSON序列化和反序列化 * 作者：凌霜殘血 * */ public class JSON {

spring+redis 實現快取解決序列化和反序列化的問題

1.config.properties # Redis settings redis.host=127.0.0.1 redis.port=6379 #redis.pass=password redis.dbIndex=0 redis.expiration=3000

Jackson實現序列化和反序列化

簡介通俗的來說，Jackson是一個 Java 用來處理 JSON 格式資料的類庫，其效能非常好。Jackson具有比較高的序列化和反序列化效率，據測試，無論是哪種形式的轉換，Jackson > Gson > Json-lib，而且Jackson的處理能力甚至高出

Java 中的類為什麼要實現序列化呢 / JAVA中序列化和反序列化中的靜態成員問題

很多人覺得自己寫得 Java 程式碼中，新建的 pojo 物件要實現序列化是為了要儲存到硬碟上，其實呢，實現序列化和儲存到硬碟上沒有必然的關係。以下圖舉例：假設左邊的是你的電腦，也就是客戶端，右邊的是伺服器。之前你的客戶端和伺服器可能都在同一個電腦上，都是 Windows 下，那麼右邊的伺服器也可以放

c# 中利用 CookieContainer 對 Cookie 進行序列化和反序列化校驗

pre code ads domain sga pdb spa ner main private void Form1_Load(object sender, EventArgs e) { var cookieStr = @"

序列化和反序列化的底層實現原理是什麽？

rmi 自然接口 java對象本質傳遞對象 ultra tput out 前言序列化和反序列化作為Java裏一個較為基礎的知識點，大家心裏也有那麽幾句要說的，但我相信很多小夥伴掌握的也就是那麽幾句而已，如果再深究問一下Java如何實現序列化和反序列化的，就可能不知所

C# Json序列化和反序列化

ava script brush arp turn bject new c# 序列化 using System.Web.Script.Serialization; public class JsonHelper { public static string Ob

利用Avro實現Kakfa序列化和反序列化

2 定義avro的scheme

相關推薦