大資料專案之電信客服三

阿新 • • 發佈：2018-12-16

1.啟動Kafaka叢集

這裡的Kafka叢集搭建就不再說了，如果不會搭建可以看我之前的博文

首先啟動Zookeeper叢集，然後再啟動Kafka叢集

bin/zkServer.sh start
bin/kafka-server-start.sh config/server.properties

2.建立Kafka主題

bin/kafka-topics.sh --zookeeper cdh0:2181 --create --replication-factor 3 --partitions 3 --topic ctlog

3.檢視Kafka主題是否建立成功

bin/kafka-topics.sh --zookeeper cdh0:2181 --list

4.啟動一個Kafka的消費者，等待Flume的資訊的輸入

bin/kafka-console-consumer.sh --bootstrap-server cdh0:9092 --topic ctlog --from-beginning

5.配置Flume

建立ct_log.conf

# define
a1.sources = r1
a1.sinks = k1
a1.channels = c1
# source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F -c +0 /opt/package/log.csv
a1.sources.r1.shell = /bin/bash -c
# sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.brokerList = cdh0:9092,cdh1:9092,cdh2:9092
a1.sinks.k1.topic = ctlog
a1.sinks.k1.batchSize = 20
a1.sinks.k1.requiredAcks = 1
# channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
# bind
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

6.執行Flume

$ bin/flume-ng agent --conf conf/ --name a1 --conf-file testjob/ct_log.conf

到這裡基本就穩了，前面的生產資料程式碼在生產資料，Flume監控產生資料的檔案並將資料傳到Kafka，Kafka進行消費

這時候應該可以在Kafka的消費端看到資料的輸出

大資料專案之電信客服三

1.啟動Kafaka叢集這裡的Kafka叢集搭建就不再說了，如果不會搭建可以看我之前的博文首先啟動Zookeeper叢集，然後再啟動Kafka叢集 bin/zkServer.sh start bin/kafka-server-start.sh config/server.proper

大資料專案之電信客服二

1.資料生產在實際生產中，這個環節並不會讓你來做，更不會來模擬生產資料，但是這裡是為了專案執行，也是為了讓你連線每個環節 2.專案建立在IDEA中先建立一個Java專案ct，然後在該專案中建立各個Module模組進行編寫，這樣比較清晰，比如這裡的生產資料模組就可以建立一個ct_pro

大資料專案之電信客服一

1.專案需求對通話運營商的通話記錄資料進行離線的分析處理，通話記錄資訊包含通話的手機號碼，通話時間，通話時長，是否為主叫等資訊 2.專案架構這裡對整個專案架構進行簡單的說明首先通話資料是自己寫程式碼生產出來的，然後使用Flume，實時採集資料，將採集到的資料寫入Kafka，將K

大資料開發實戰系列之電信客服(1)

大資料實戰開發系列，以實戰為主，輔以一些基礎知識，關於電信客服，在網上也有很多的資料，這裡我自然會去參考網上的資料，程式的整體設計是在今天開始的，老夫儘量在本週末錢結束這個電信客服的程式編寫。因為我也是一個學習者，所以在程式編寫過程中難免會存在問題，有問題還請大家指出，有則改之，無則加勉。大家共同進步。本教程

大資料專案之通訊公司通話記錄改造

一、專案架構分析： 1、專案描述：將通話記錄資料由原來的oracle系統改造成使用大資料架構解決方案。主要使用hbase做通話資料的儲存方案。需要將原有oracle資料匯入到hbase中，以及新生成資料通過flume收集到kafka，再通過消費者儲存到hbase資料庫。 2、專案的目標： hadoo

大資料專案之dmp使用者畫像

一、網際網路廣告精準投放介紹（1）dsp的展示原理： ①　使用者瀏覽媒體網站，媒體網站通過新增的 SSP 程式碼向 AdExchange 發起廣告請求。②　AdExchange 將這次請求的關鍵資訊（如域名 URL、IP、Cookie 等）同時傳送給多家 DSP，我們把這個請求稱為 Bid Reques

13.大資料學習之旅——HBase第三天

LSM-TREE 概述眾所周知傳統磁碟I/O是比較耗效能的，優化系統性能往往需要和磁碟I/O打交道,而磁碟I/O產生的時延主要由下面3個因素決定: 1）尋道時間（將磁碟臂移動到適當的柱面上所需要的時間，尋道時移動到相鄰柱面移動所需時間1ms，而隨機移動所需時間位5~1

大資料專案之電商數倉一（使用者行為採集）

一、資料倉庫概念資料倉庫（Data Warehouse）　　是為企業所有決策制定過程，提供所有系統資料支援的戰略集合。二、專案需求及架構設計 2.1 專案需求分析　　1、專案需求　　　1）使用者行為資料採集平臺搭建　　　2）業務資料採集平臺搭建　　　3）資料倉庫維度建模　　 &n

大資料專案實戰之 --- 某App管理平臺的手機app日誌分析系統（三）

一、建立hive分割槽表 ---------------------------------------------------- 1.建立資料庫 $hive> create database applogsdb; 2.建立分割槽表編寫指令碼。

大資料實戰-電信客服-重點記錄

# 寫在前面的話最近不是一直在學習大資料框架和引用嘛（我是按照[尚矽谷](http://www.atguigu.com/)[B站](https://space.bilibili.com/302417610?spm_id_from=333.788.b_765f7570696e666f.1)視訊先學習過一遍路

大資料專案實戰之 --- 使用者畫像專案分析

一、使用者畫像專案分析 ------------------------------------------------------- 1.概念使用者畫像也叫使用者資訊標籤化、客戶資訊。根據使用者的資訊和行為動作，用一些標籤把使用者描繪出來，描繪的標籤就是使用者畫像。

大資料專案實戰之十三:13.Spark上下文構建以及模擬資料生成

import com.ibeifeng.sparkproject.conf.ConfigurationManager; import com.ibeifeng.sparkproject.constant.Constants; import com.ibeifeng.sparkpro

大資料專案實戰之十二:12.JSON資料格式講解以及fastjson介紹

什麼是JSON？就是一種資料格式；比如說，我們現在規定，有一個txt文字檔案，用來存放一個班級的成績；這個文字檔案裡的學生成績的格式，是第一行，就是一行列頭（姓名班級年級科目成績），接下來，每一行就是一個學生的成績。那麼，這個文字檔案內的這種資訊存放的格式，其實就是一種資料格式。

大資料專案實戰之十一:11.工廠模式講解以及DAOFactory開發

如果沒有工廠模式，可能會出現的問題： ITaskDAO介面和TaskDAOImpl實現類；實現類是可能會更換的；那麼，如果你就使用普通的方式來建立DAO，比如ITaskDAO taskDAO = new TaskDAOImpl()，那麼後續，如果你的TaskDAO的實現類變更了，那麼你就必須在你

大資料專案實戰之十:10.DAO模式講解以及TaskDAO開發

Data Access Object：資料訪問物件首先，你的應用程式，肯定會有業務邏輯的程式碼。在三層架構的web系統中，業務邏輯的程式碼，就是在你的Service元件裡面；在我們的spark作業中，業務邏輯程式碼就是在我們的spark作業裡面。如果說，你不用DAO模式的話，那麼所有的資

大資料專案實戰之九:9.JavaBean概念講解

JavaBean：類 JavaBean，雖然就是一個類，但是是有特殊條件的一個類，不是所有的類都可以叫做JavaBean的首先，它需要有一些field，這些field，都必須用private來修飾，表示所有的field，都是私有化的，不能隨意的獲取和設定其次，需要給所有的field，

大資料專案實戰之八:8.JDBC元件開發

/** * JDBC輔助元件 * 在正式的專案的程式碼編寫過程中，是完全嚴格按照大公司的coding標準來的 * 也就是說，在程式碼中，是不能出現任何hard code（硬編碼）的字元 * 比如“張三”、“com.mysql.jdbc.Driver”

大資料專案實戰之七:7.JDBC原理

1.Java程式/J2EE程式，當需要操作資料庫，通常就是對資料庫中某一個，或者某些表，進行增刪改查那麼就需要通過某些方式連線到資料庫，比如MySQL，執行各種SQL語句（insert、select、udpate） 2.JDBC，Java Database Connectivity，Jav

大資料專案實戰之六:6.工具類編寫和說明

日期時間工具類 import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date; /** * 日期時間工具類 * @author Administrator * */ public

大資料專案實戰之新聞話題統計分析

前言：本文是一個完整的大資料專案實戰，實時|離線統計分析使用者的搜尋話題，並用JavaEE工程前端介面展示出來。這些指標對網站的精準營銷、運營都有極大幫助。架構大致是按照企業標準來的，從日誌的採集、轉化處理、實時計算、JAVA後臺開發、WEB前端展示，一條完整流程線下來，甚至每個節點都用的高可用架構

大資料專案之電信客服三

相關推薦