大資料實戰（二十四）：電商數倉（十七）之使用者行為資料採集（十七）高可用mysql （HA mysql，ubuntu）

阿新 • • 發佈：2020-08-17

這裡只說一下離散化的簡單思路（還不會難的（T _ T））

離散化的就是將大範圍的縮小到小範圍來表示，這類問題一般是數的範圍很大，但是個數不多，

具體的思路是，將他們用一個數組來表示，查詢其原位置時用二分查詢即可。

一個模板題：區間和

假定有一個無限長的數軸，數軸上每個座標上的數都是0。

現在，我們首先進行 n 次操作，每次操作將某一位置x上的數加c。

接下來，進行 m 次詢問，每個詢問包含兩個整數l和r，你需要求出在區間[l, r]之間的所有數的和。

輸入格式

第一行包含兩個整數n和m。

接下來 n 行，每行包含兩個整數x和c。

再接下里 m 行，每行包含兩個整數l和r。

輸出格式

共m行，每行輸出一個詢問中所求的區間內數字和。

資料範圍

輸入樣例：

輸出樣例：

8
0
5
分析：數的範圍很大，但是個數卻不多，可以用一個數組來存。
程式碼如下：

 1 #include<cstdio>
 2 #include<algorithm>
 3 
 using namespace std;
 4 const int N=3e5+10;
 5 int n,m,q[N];
 6 struct node{
 7     int id,x;
 8 }s[N],e[N];
 9 bool cmp(node a,node b)
10 {
11     return a.id<b.id;
12 }
13 int er1(int x)//二分查左端點
14 {
15     int l=1,r=n+2*m,mid;
16     while(l<r)
17     {
18         mid=l+r>>1;
19         if 
(s[mid].id>=x)
20             r=mid;
21         else
22             l=mid+1;
23     }
24     return l;
25 }
26 int er2(int x)//二分查右端點
27 {
28     int l=1,r=n+2*m,mid;
29     while(l<r)
30     {
31         mid=l+r+1>>1;
32         if(s[mid].id<=x)
33             l=mid;
34         else
35             r=mid-1;
36     }
37     return l;
38 }
39 int main()
40 {
41     int k=0;
42     scanf("%d%d",&n,&m);
43     for(int i=1;i<=n;i++) scanf("%d%d",&s[i].id,&s[i].x);
44     for(int i=n+1;i<=n+2*m;i++)
45     {
46         int l,r;
47         scanf("%d%d",&l,&r);
48         s[i].id=l;s[i].x=0;
49         i++;
50         s[i].id=r;s[i].x=0;
51         e[k].id=l;e[k].x=r;
52         k++;
53     }
54     sort(s+1,s+n+2*m+1,cmp);
55     for(int i=1;i<=n+2*m;i++) q[i]=q[i-1]+s[i].x;
56     for(int i=0;i<k;i++)
57     {
58         //printf("%d %d\n",e[i].id,e[i].x);
59         int l=er1(e[i].id);
60         int r=er2(e[i].x);
61         //printf("%d %d\n",l,r);
62         printf("%d\n",q[r]-q[l-1]);
63     }
64     return 0;
65 }

大資料實戰（二十四）：電商數倉（十七）之使用者行為資料採集（十七）高可用mysql （HA mysql，ubuntu）

0 架構一安裝mysql 分別在hadoop102 與hadoop103 安裝mysql，安裝過程見：大資料實戰（二十三）：電商數倉（十六）之使用者行為資料採集（十六）Ubuntu mysql 安裝

大資料實戰（三十四）：電商數倉（二十七）之使用者行為資料倉庫（十三）使用者留存主題

1需求目標 1.1使用者留存概念 1.2需求描述使用者留存分析 2 DWS層 2.1DWS層（每日留存使用者明細表）

大資料實戰（四十一）：電商數倉（三十四）之使用者行為資料倉庫（二十）與top相關

1 各個商品點選次數top3的使用者 1.1 DWS層使用日誌資料使用者行為寬表作為DWS層表

大資料實戰（四十二）：電商數倉（三十五）之使用者行為資料倉庫（二十一）月活躍率

月活躍使用者與截止到該月累計的使用者總和之間的比例 1 DWS層使用DWS層月活表以及ADS新增使用者表作為DWS層

大資料實戰（五十九）：電商數倉（四十二）之系統業務資料倉庫（十五）商品每日銷量排行Top10

1 DWS層使用使用者購買商品明細寬表作為DWS資料 2 ADS層 2.1 建表語句 drop table if exists ads_goods_order_count_day;

大資料實戰（十二）：電商數倉（五）之使用者行為資料採集（五）元件安裝（一）之hadoop安裝

1）叢集規劃：伺服器hadoop102 伺服器hadoop103 伺服器hadoop104 HDFS NameNode DataNode DataNode

大資料實戰（十四）：電商數倉（七）之使用者行為資料採集（七）元件安裝（三）日誌生成

1日誌啟動 1）程式碼引數說明 // 引數一：控制傳送每條的延時時間，預設是0 Long delay = args.length > 0 ? Long.parseLong(args[0]) : 0L;

大資料實戰（十五）：電商數倉（八）之使用者行為資料採集（八）元件安裝（四）採集日誌Flume

0 簡介 Flume 採集 1日誌採集Flume安裝叢集規劃：伺服器hadoop102 伺服器hadoop103 伺服器hadoop104

大資料實戰（十九）：電商數倉（十二）之使用者行為資料採集（十二）元件安裝（八）kafka tools

Kafka 視覺化工具使用Kafka的小夥伴，有沒有為無法直觀地檢視 Kafka 的 Topic 裡的內容而發過愁呢？

大資料實戰（二十）：電商數倉（十三）之使用者行為資料採集（十三）元件安裝（九）資料採集通道

1 簡介 2 第一層資料採集通道 2.1 元件 1.第一層採集指令碼Source的選擇①Source:　　資料來源在日誌檔案中!　　　　讀取日誌中的資料，可以使用以下Source　　　　　　ExecSource:可以執行一個linux命令，例如t

大資料實戰（二十三）：電商數倉（十六）之使用者行為資料採集（十六）Ubuntu mysql 安裝

1. 先更新 apt 安裝中心： apt update 裡面會有預設最新的mysql 的包。 2.安裝msyql : sudo apt-get install mysql-server

大資料實戰（二十五）：電商數倉（十八）之使用者行為資料採集（十八）ODS層建立

0 簡介 1 建立資料庫 1）建立gmall資料庫 hive (default)> create database gmall; 說明：如果資料庫存在且有資料，需要強制刪除時執行：drop database gmall cascade;

大資料實戰（二十六）：電商數倉（十九）之使用者行為資料採集（十九）數倉搭建之DWD層（一）DWD層啟動表資料解析

0 簡介對ODS層資料進行清洗（去除空值，髒資料，超過極限範圍的資料，行式儲存改為列儲存，改壓縮格式）。

大資料實戰（三十六）：電商數倉（二十九）之使用者行為資料倉庫（十五）本週迴流使用者數

本週迴流=本週活躍-本週新增-上週活躍 1 DWS層使用日活明細表dws_uv_detail_day作為DWS層資料

大資料實戰（三十九）：電商數倉（三十二）之使用者行為資料倉庫（十八）每個使用者累計訪問次數

0 每個使用者累計訪問次數結果如下使用者日期小計總計 mid1 2019-12-14 10 10 mid1 2019-02-11 12 22

大資料實戰（四十）：電商數倉（三十三）之使用者行為資料倉庫（十九）新收藏使用者數

新收藏使用者：指的是在某天首次新增收藏的使用者 1 DWS層建立使用者日誌行為寬表

大資料實戰（五十二）：電商數倉（三十五）之系統業務資料倉庫（八）GMV成交總額

1 ADS層 1.1 什麼是GMV 1.2建表語句 hive (gmall)> drop table if exists ads_gmv_sum_day; create external table ads_gmv_sum_day(

大資料實戰（五十四）：電商數倉（三十七）之系統業務資料倉庫（十）品牌復購率

需求：以月為單位統計，購買2次以上商品的使用者 1 復購率計算分析 2 DWS層 2.1 使用者購買商品明細表（寬表）

大資料實戰（五十七）：電商數倉（四十）之系統業務資料倉庫（十三）付費使用者率

1 DWS層使用付費使用者數以及新增使用者表作為資料來源 2 ADS層 2.1 建表語句 drop table if exists ads_pay_user_ratio;

大資料實戰（五十六）：電商數倉（三十九）之系統業務資料倉庫（十二）新付費使用者數

1 DWS層 1.1 建表語句 drop table if exists dws_pay_user_detail; create external table dws_pay_user_detail(