基於Heka+Flume+Kafka+ELK的日誌系統

阿新 • • 發佈：2019-02-15

前期準備

系統是centos6.6，64位機器。

所用軟體版本：

Logstash：2.3.3

JDK:1.8.0_25

Elasticsearch:2.3.4

Kibana:4.5.2

Heka:0.10.0

Flume:1.7.0

Zookeeper:3.4.8

Kafka:0.8.2.2

Nginx:1.7.6

Kafka-manager:1.3.1.6

整體架構圖

安裝步驟

零．安裝JDK

一．安裝Zookeeper叢集

二．安裝Kafka叢集

三．安裝Elasticsearch叢集

四．安裝Flume

五．業務機器安裝Heka

六．使用Logstash對接Kafka和Elasticsearch

叢集

七．安裝Kibana

八．安裝Nginx反向代理

九．安裝kafka-manager

零．安裝JDK

所有相關機器安裝JDK，配置PATH, CLASS_PATH, JAVA_HOME

一．安裝Zookeeper叢集

準備

Hostname和IP的對應關係

192.168.0.51 data1

192.168.0.49 data2

192.168.0.72 data3

同時需要配置/etc/hosts檔案，新增以上記錄

安裝

官網下載安裝包，解壓到/usr/local/public/，配置，啟動【其他服務類似，後續只做配置啟動說明】

cd /usr/local/public/

tar -zxvf zookeeper-3.4.8.tar.gz

ln -s zookeeper-3.4.8 zookeeper

配置檔案

cd conf/

cp zoo_samle.cfg zoo.cfg

zoo.cfg的內容

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/data/zookeeper

clientPort=2181

server.1=data1:2888:3888

server.2=data2:2888:3888

server.3=data3:2888:3888

建立叢集標誌檔案myid，內容為配置檔案中server.後面的數字。

echo “1” > /usr/local/public/zookeeper/data/myid

另外2臺機器的配置一模一樣，除了myid檔案的內容是2或者3以外。

啟動叢集

3臺伺服器依次執行：bin/zkServer.sh start

測試

bin/zkServer.sh status 檢視當前server屬於leader還是follower。

bin/zkCli.sh -server GZHL-192-168-0-51.boyaa.com:2181 連線某一臺Zookeeper Server。

二．安裝Kafka叢集

安裝

類似zookeeper，官網下載安裝包，解壓。

配置檔案config/server.properties

broker.id=1

log.dirs=/disk1/bigdata/kafka

zookeeper.connect=192.168.0.51:2181,192.168.0.49:2181,192.168.0.72:2181/kafka

另外2臺機器的配置一模一樣，除了broker.id檔案的值是2或者3以外。

啟動叢集

3臺伺服器依次執行:nohup bin/kafka-server-start.sh config/server.properties 2>&1 >> /dev/null &

測試

bin/kafka-topics.sh --create --zookeeper GZHL-192-168-0-51.boyaa.com:2181,GZHL-192-168-0-49.boyaa.com:2181,GZHL-192-168-2-147.boyaa.com:2181/kafka --topic test //建立一個topic

三．安裝ElasticSearch叢集

安裝

類似zookeeper，官網下載安裝包，解壓。

配置檔案config/elasticsearch.yml

cluster.name: dfqp-application

node.name: node-2

path.data: /disk1/es/,/disk2/es/,/disk3/es/,/disk4/es/,/disk5/es/,/disk6/es/,/disk7/es/,/disk8/es/,/disk9/es/,/disk10/es/,/disk11/es/,/disk12/es/

path.logs: /data/other/es/logs

network.host: 192.168.0.150

discovery.zen.ping.unicast.hosts: ["192.168.0.149", "192.168.0.150"]

2臺機器的配置一模一樣，除了node.name和network.host的值

啟動叢集

bin/elasticsearch -d

測試

返回以下資料表示ES叢集正常

{

"name" : "node-2",

"cluster_name" : "dfqp-application",

"version" : {

"number" : "2.3.4",

"build_hash" : "e455fd0c13dceca8dbbdbb1665d068ae55dabe3f",

"build_timestamp" : "2016-06-30T11:24:31Z",

"build_snapshot" : false,

"lucene_version" : "5.5.0"

"tagline" : "You Know, for Search"

}

四．安裝Flume

安裝

類似zookeeper，官網下載安裝包，解壓。

配置檔案conf/lremote.properties

agent_remote.sources = s1

agent_remote.sinks = k1

agent_remote.channels = c1

agent_remote.sources.s1.type = thrift

agent_remote.sources.s1.bind = 192.168.0.49

agent_remote.sources.s1.port = 6666

agent_remote.sources.s1.channels = c1

agent_remote.sources.s1.threads = 20

agent_remote.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink

agent_remote.sinks.k1.topic = dfqp_server_log_from_heka

agent_remote.sinks.k1.brokerList = 192.168.0.51:9092,192.168.0.49:9092,192.168.0.72:9092

agent_remote.sinks.k1.requiredAcks = 0

agent_remote.sinks.k1.batchSize = 2000

agent_remote.sinks.k1.channel = c1

agent_remote.sinks.k1.kafka.request.timeout.ms = 6000

agent_remote.sources.s1.interceptors = i2

agent_remote.sources.s1.interceptors.i2.type=org.apache.flume.sink.solr.morphline.UUIDInterceptor$Builder

agent_remote.sources.s1.interceptors.i2.headerName=key

agent_remote.sources.s1.interceptors.i2.preserveExisting=false

agent_remote.channels.c1.type = file

agent_remote.channels.c1.capacity = 100000000

agent_remote.channels.c1.dataDirs = /usr/local/public/flume/.flume_remote/c1/data_dir/

agent_remote.channels.c1.checkpointDir = /usr/local/public/flume/.flume_remote/c1/checkpoint_dir/

啟動flume

nohup bin/flume-ng agent -n agent_remote -c conf/ -f conf/remote.properties -Dflume.log.file=flume_remote.log &

五．業務機器安裝Heka

安裝

官網下載原始碼，編寫heka輸出外掛flume

配置檔案conf/log2flume.toml

[hekad]

maxprocs = 1

base_dir = "./base_dir"

log_info_filename = "logs/info.log"

log_error_filename = "logs/error.log"

log_file_max_size = 64

log_file_max_backups = 7

[LogstreamerInput]

log_directory = "/data/"

journal_directory = "./base_dir"

file_match = '(?P<dir1>[^/]*)/?(?P<dir2>[^/]*)/?(?P<dir3>[^/]*)/?(?P<dir4>[^/]*)/?(?P<dir5>[^/]*)/?(?P<dir6>[^/]*)/?(?P<dir7>[^/]*)/?(?P<file_name>.*)\.log\.?(?P<Seq>\d*)'

priority = ["^Seq"]

rescan_interval = "30s"

oldest_duration = "1h"

differentiator = ["dfqp-", "dir1", "-", "dir2", "-", "dir3", "-", "dir4", "-", "dir5", "-", "dir6", "-", "dir7", "-", "file_name", ".log"]

[paycenter_sqls_output]

type = "FlumeOutput"

message_matcher = "TRUE"

address = "192.168.0.49:6666"

encoder = "PayloadEncoder"

batch_size = 2000

use_buffering = false

[PayloadEncoder]

append_newlines = false

啟動hekad

./hekad -config conf/log2flume.toml

六．使用Logstash對接Kafka和Elasticsearch叢集

安裝

類似zookeeper，官網下載安裝包，解壓。

配置檔案etc/kafka_2_es.conf

input {

kafka {

topic_id => "my_kafka_topic"

group_id => "my_kafka_topic_group"

consumer_threads => 4

zk_connect => "data1:2181,data2:2181,data3:2181/kafka"

codec => "plain"

}

output {

elasticsearch {

index => "server-log-%{+YYYY.MM.dd}"

hosts => ["192.168.0.149", "192.168.0.150"]

}

2臺機器的配置一模一樣。

啟動Logstash

nohup bin/logstash -l logs/logstash${i}.log -f etc/kafka_2_es.conf > /dev/null &

其中${i}分別為1,2,3,4,5,6，也就是一臺機器啟動6個logstash程序。

七．安裝kibana

安裝

類似zookeeper，官網下載安裝包，解壓。

配置檔案config/kibana.yml

elasticsearch.url: "http://192.168.0.149:9200"

啟動Logstash

nohup ./bin/kibana > /dev/null &

八．安裝Nginx反向代理

配置檔案/usr/local/nginx-1.7.6/conf/vhosts/vhost.conf

server

{

listen 80;

server_name log.oa.com;

location / {

proxy_pass http://192.168.0.149:5601$request_uri;

proxy_set_header Host $host;

proxy_set_header X-Real-IP $remote_addr;

proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

}

location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|data|js|css|html|htm)$

{

expires 365d;

}

access_log /data/other/nginx_logs/${host}_${server_port}_access.log main;

}

九. 安裝kafka-manager

git clone https://github.com/yahoo/kafka-manager
cd kafka-manager
./sbt clean dist

會生成一個zip包，解壓後得到kafka-manager,開啟配置檔案conf/application.conf, 修改zk地址。

啟動：nohup bin/kafka-manager -Dconfig.file=conf/application.conf >/dev/null 2>&1 &

訪問：http://192.168.0.51:9000

基於Heka+Flume+Kafka+ELK的日誌系統

基於Heka+Flume+Kafka+ELK的日誌系統

基於flume+kafka+storm日誌收集系統搭建

SpringCloud整合ElasticSearch，Logstash，Kibana，ELK，Kafka分散式日誌系統（一）

日誌監控平臺搭建關於flume Kafka Elk

ELK日誌系統單體搭建，基於7.1.1版本

第二十三周微職位elk日誌系統

centos7 部署 ELK 日誌系統

ELK日誌系統：Elasticsearch+Logstash+Kibana搭建教程

基於.net core webapi的日誌系統——介面實現

創業公司做資料分析（四）ELK日誌系統

flume +kafka+SparkStreaming日誌監控平臺

elk日誌系統安裝部署

Flume+Kafka+Sparkstreaming日誌分析

ELK日誌系統開發（Logstash、Elasticsearch、Kibana安裝）（一）

ELK日誌系統淺析與部署

flume+es+kibana日誌系統

ELK日誌系統開發，Kibana建立圖表（四）

ElasticSearch實戰系列九: ELK日誌系統介紹和安裝

基於Flume+kafka打造實時日誌收集分析系統

基於 Flume+Kafka+Spark Streaming 實現實時監控輸出日誌的報警系統

基於Heka+Flume+Kafka+ELK的日誌系統

相關推薦