對比分析

阿新 • • 發佈：2018-09-04

4.5 比較一個 ply nan pre har itl 隨著

‘‘‘
【課程1.3】  對比分析

對比分析 → 兩個互相聯系的指標進行比較

絕對數比較（相減） / 相對數比較（相除）
結構分析、比例分析、空間比較分析、動態對比分析

‘‘‘

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline

# 1、絕對數比較 → 相減
# 相互對比的指標在量級上不能差別過大
# （1）折線圖比較
# （2）多系列柱狀圖比較

data = pd.DataFrame(np.random.rand(30 
,2)*1000,
                   columns = [‘A_sale‘,‘B_sale‘],
                   index = pd.period_range(‘20170601‘,‘20170630‘))
print(data.head())
# 創建數據 → 30天內A/B產品的日銷售額

data.plot(kind=‘line‘,
       style = ‘--.‘,
       alpha = 0.8,
       figsize = (10,3),
       title = ‘AB產品銷量對比-折線圖‘)
# 折線圖比較

data.plot(kind  
= ‘bar‘,
          width = 0.8,
          alpha = 0.8,
          figsize = (10,3),
          title = ‘AB產品銷量對比-柱狀圖‘)
# 多系列柱狀圖比較

　　輸出：

                A_sale      B_sale
2017-06-01  334.812619  778.500279
2017-06-02  921.431743  970.734046
2017-06-03  785.444137  481.548456
2017-06-04  359.790330  259.824537 

2017-06-05  657.224681  332.818389

技術分享圖片

# 1、絕對數比較 → 相減
# （3）柱狀圖堆疊圖+差值折線圖比較

fig3 = plt.figure(figsize=(10,6))
plt.subplots_adjust(hspace=0.3)
# 創建子圖及間隔設置

ax1 = fig3.add_subplot(2,1,1)  
x = range(len(data))
y1 = data[‘A_sale‘]
y2 = -data[‘B_sale‘]
plt.bar(x,y1,width = 1,facecolor = ‘yellowgreen‘)
plt.bar(x,y2,width = 1,facecolor = ‘lightskyblue‘)
plt.title(‘AB產品銷量對比-堆疊圖‘)
plt.grid()
plt.xticks(range(0,30,6))
ax1.set_xticklabels(data.index[::6])
# 創建堆疊圖

ax2 = fig3.add_subplot(2,1,2)  
y3 = data[‘A_sale‘]-data[‘B_sale‘]
plt.plot(x,y3,‘--go‘)
plt.axhline(0,hold=None,color=‘r‘,linestyle="--",alpha=0.8)  # 添加y軸參考線
plt.grid()
plt.title(‘AB產品銷量對比-差值折線‘)
plt.xticks(range(0,30,6))
ax2.set_xticklabels(data.index[::6])
# 創建差值折線圖

　　輸出：

[<matplotlib.text.Text at 0x9faa9b0>,
 <matplotlib.text.Text at 0x9fa6e48>,
 <matplotlib.text.Text at 0x9fed0f0>,
 <matplotlib.text.Text at 0x9fedb38>,
 <matplotlib.text.Text at 0x9ff15c0>]

技術分享圖片

# 2、相對數比較 → 相除
# 有聯系的指標綜合計算後的對比，數值為相對數
# 結構分析、比例分析、空間比較分析、動態對比分析、計劃完成度分析
# （1）結構分析
# 在分組基礎上，各組總量指標與總體的總量指標對比，計算出各組數量在總量中所占比重
# 反映總體的內部結構

data = pd.DataFrame({‘A_sale‘:np.random.rand(30)*1000,
                    ‘B_sale‘:np.random.rand(30)*200},
                   index = pd.period_range(‘20170601‘,‘20170630‘))
print(data.head())
print(‘------‘)
# 創建數據 → 30天內A/B產品的日銷售額
# A/B產品銷售額量級不同

data[‘A_per‘] = data[‘A_sale‘] / data[‘A_sale‘].sum()
data[‘B_per‘] = data[‘B_sale‘] / data[‘B_sale‘].sum()
# 計算出每天的營收占比

data[‘A_per%‘] = data[‘A_per‘].apply(lambda x: ‘%.2f%%‘ % (x*100))
data[‘B_per%‘] = data[‘B_per‘].apply(lambda x: ‘%.2f%%‘ % (x*100))
# 轉換為百分數
print(data.head())

fig,axes = plt.subplots(2,1,figsize = (10,6),sharex=True)
data[[‘A_sale‘,‘B_sale‘]].plot(kind=‘line‘,style = ‘--.‘,alpha = 0.8,ax=axes[0])
axes[0].legend(loc = ‘upper right‘)
data[[‘A_per‘,‘B_per‘]].plot(kind=‘line‘,style = ‘--.‘,alpha = 0.8,ax=axes[1])
axes[1].legend(loc = ‘upper right‘)
# 絕對值對比較難看出結構性變化，通過看銷售額占比來看售賣情況的對比

# 同時可以反應“強度” → 兩個性質不同但有一定聯系的總量指標對比，用來說明“強度”、“密度”、“普遍程度”
# 例如：國內生產總值“元/人”，人口密度“人/平方公裏”

　　輸出：

                A_sale      B_sale
2017-06-01  688.134982    6.759655
2017-06-02  310.911156  141.978290
2017-06-03  227.496397  123.595400
2017-06-04  905.453084   64.534911
2017-06-05  374.572618  147.550005
------
                A_sale      B_sale     A_per     B_per A_per% B_per%
2017-06-01  688.134982    6.759655  0.045606  0.002227  4.56%  0.22%
2017-06-02  310.911156  141.978290  0.020606  0.046780  2.06%  4.68%
2017-06-03  227.496397  123.595400  0.015077  0.040723  1.51%  4.07%
2017-06-04  905.453084   64.534911  0.060009  0.021263  6.00%  2.13%
2017-06-05  374.572618  147.550005  0.024825  0.048616  2.48%  4.86%

　技術分享圖片

# 2、相對數比較 → 相除
# （2）比例分析
# 在分組的基礎上，將總體不同部分的指標數值進行對比，其相對指標一般稱為“比例相對數”
# 比例相對數 = 總體中某一部分數值 / 總體中另一部分數值 → “基本建設投資額中工業、農業、教育投資的比例”、“男女比例”...

data = pd.DataFrame({‘consumption‘:np.random.rand(12)*1000 + 2000,
                    ‘salary‘:np.random.rand(12)*500 + 5000},
                   index = pd.period_range(‘2017/1‘,‘2017/12‘,freq = ‘M‘))
print(data.head())
print(‘------‘)
# 創建數據 → 某人一年內的消費、工資薪水情況
# 消費按照2000-3000/月隨機，工資按照5000-5500/月隨機

data[‘c_s‘] = data[‘consumption‘] / data[‘salary‘]
print(data.head())
# 比例相對數 → 消費收入比

data[‘c_s‘].plot.area(color = ‘green‘,alpha = 0.5,ylim = [0.3,0.6],figsize=(8,3),grid=True)
# 創建面積圖表達

　　輸出：

         consumption       salary
2017-01  2300.613040  5349.939624
2017-02  2256.167470  5477.291974
2017-03  2356.130582  5366.495609
2017-04  2680.961342  5203.749452
2017-05  2612.676360  5395.189285
------
         consumption       salary       c_s
2017-01  2300.613040  5349.939624  0.430026
2017-02  2256.167470  5477.291974  0.411913
2017-03  2356.130582  5366.495609  0.439045
2017-04  2680.961342  5203.749452  0.515198
2017-05  2612.676360  5395.189285  0.484260

技術分享圖片

# 2、相對數比較 → 相除
# （3）空間比較分析（橫向對比分析）
# 同類現象在同一時間不同空間的指標數值進行對比，反應同類現象在不同空間上的差異程度和現象發展不平衡的狀況
# 空間比較相對數 = 甲空間某一現象的數值 / 乙空間同類現象的數值
# 一個很現實的例子 → 絕對數來看，我國多經濟總量世界第一，但從人均水平來看是另一回事

data = pd.DataFrame({‘A‘:np.random.rand(30)*5000,
                    ‘B‘:np.random.rand(30)*2000,
                    ‘C‘:np.random.rand(30)*10000,
                    ‘D‘:np.random.rand(30)*800},
                   index = pd.period_range(‘20170601‘,‘20170630‘))
print(data.head())
print(‘------‘)
# 創建數據 → 30天內A/B/C/D四個產品的銷售情況
# 不同產品的銷售量級不同

data.sum().plot(kind = ‘bar‘,color = [‘r‘,‘g‘,‘b‘,‘k‘], alpha = 0.8, grid = True)
for i,j in zip(range(4),data.sum()):
    plt.text(i-0.25,j+2000,‘%.2f‘ % j, color = ‘k‘)
# 通過柱狀圖做橫向比較 → 4個產品的銷售額總量

data[:10].plot(kind = ‘bar‘,color = [‘r‘,‘g‘,‘b‘,‘k‘], alpha = 0.8, grid = True, figsize = (12,4),width = 0.8)
# 多系列柱狀圖，橫向比較前十天4個產品的銷售額

# 關於同比與環比
# 同比 → 產品A在2015.3和2016.3的比較（相鄰時間段的同一時間點）
# 環比 → 產品A在2015.3和2015.4的比較（相鄰時間段的比較）
# 如何界定“相鄰時間段”與“時間點”，決定了是同比還是環比

　　輸出：

                     A            B            C           D
2017-06-01  2850.211921  1647.138351  5276.354493  529.747107
2017-06-02  3222.680792   768.466753  6941.803099  284.760211
2017-06-03   727.193796  1732.612257  3311.883561  332.427362
2017-06-04  2582.599603   444.224737  1829.401025  744.340597
2017-06-05  1756.352061  1731.221585  7583.832278  768.792895

技術分享圖片

# 2、相對數比較 → 相除
# （4）動態對比分析（縱向對比分析）
# 同一現象在不同時間上的指標數值進行對比，反應現象的數量隨著時間推移而發展變動的程度及趨勢
# 最基本方法，計算動態相對數 → 發展速度
# 動態相對數（發展速度） = 某一現象的報告期數值 / 同一現象的基期數值
# 基期：用來比較的基礎時期
# 報告期：所要研究的時期，又稱計算期

data = pd.DataFrame({‘A‘:np.random.rand(30)*2000+1000},
                   index = pd.period_range(‘20170601‘,‘20170630‘))
print(data.head())
print(‘------‘)
# 創建數據 → 30天內A產品的銷售情況

data[‘base‘] = 1000  # 假設基期銷售額為1000，後面每一天都為計算期
data[‘l_growth‘] = data[‘A‘] - data[‘base‘]  # 累計增長量 = 報告期水平 - 固定基期水平
data[‘z_growth‘] = data[‘A‘] - data.shift(1)[‘A‘]  # 逐期增長量 = 報告期水平 - 報告期前一期水平
data[data.isnull()] = 0  # 替換缺失值

data[[‘l_growth‘,‘z_growth‘]].plot(figsize = (10,4),style = ‘--.‘,alpha = 0.8)  
plt.axhline(0,hold=None,color=‘r‘,linestyle="--",alpha=0.8)  # 添加y軸參考線
plt.legend(loc = ‘lower left‘)
plt.grid()
# 通過折線圖查看增長量情況

data[‘lspeed‘] = data[‘l_growth‘] / data[‘base‘]  # 定基增長速度
data[‘zspeed‘] = data[‘z_growth‘] / data.shift(1)[‘A‘]  # 環比增長速度
data[[‘lspeed‘,‘zspeed‘]].plot(figsize = (10,4),style = ‘--.‘,alpha = 0.8)  
plt.axhline(0,hold=None,color=‘r‘,linestyle="--",alpha=0.8)  # 添加y軸參考線
plt.grid()
print(data.head())
print(‘------‘)
# 通過折線圖查看發展速度

　　輸出：

                     A
2017-06-01  2604.901536
2017-06-02  2387.955402
2017-06-03  1968.693059
2017-06-04  2313.807035
2017-06-05  1441.483332
------
                      A  base     l_growth    z_growth    lspeed    zspeed
2017-06-01  2604.901536  1000  1604.901536    0.000000  1.604902       NaN
2017-06-02  2387.955402  1000  1387.955402 -216.946134  1.387955 -0.083284
2017-06-03  1968.693059  1000   968.693059 -419.262343  0.968693 -0.175574
2017-06-04  2313.807035  1000  1313.807035  345.113976  1.313807  0.175301
2017-06-05  1441.483332  1000   441.483332 -872.323703  0.441483 -0.377008
------

技術分享圖片

對比分析

kubernetes中port、target port、node port的對比分析，以及kube-proxy代理

ans toc contain exp red lec adb service 接口轉：http://blog.csdn.net/xinghun_4/article/details/50492041 容器網絡實例服務中的3個端口設置這幾個port的概念很容易混淆，比

路由器與防火墻對比分析

路由器防火墻安全策略會話包過濾在目前中小網絡中越來越多的使用防火墻替代路由器作為網絡出口設備，這也導致了很多年輕的網工分不清路由器與防火墻到底有什麽區別，簡單的認為防火墻能防攻擊，特別是目前的防火墻集成了很多上網行為管理和IPS的功能，更容易掩蓋防火墻本身最核心的功能。下

MPLS VPN與IPSec VPN對比分析

端到端網絡 res 其它等價工作異步傳輸 prot 因特網轉：http://www.xzbu.com/8/view-7456625.htm 1 引言　　互聯網的快速發展大大促進了信息資源的交流，與此同時，人們對頻繁出現的安全保密問題也愈加關註。通過傳統的方式構建

iOS 11 vs 10: UI和交互全面對比分析

蘋果早在6月份的WWDC全球開發者大會中介紹了iOS 11系統，9月我們終於收到了正式版的更新推送。經歷了11代的大版本更叠的iOS依舊保持著活力與進步。跟手上用了一年的iOS 10相比，iOS 11在UI和交互上有什麽特別的改變呢？下面讓我們一起來看看。(左邊iOS 10，右邊為iOS 11）

StringBuffer與StringBuilder異同對比分析

ava 但是原因碎片內存碎片字符使用字符串指針 builder Java的字符類String、StringBuffer與StringBuilder異同對比分析　　　　Java String是一個“不可變常量字符串”對象，final屬性定義。之所以這麽說，是從St

互聯網十大數據分析方法-對比分析

ffffff water bdc 時間序列互聯網結果 .com tro 過程什麽是對比分析對比分析是數據分析中一種基礎分析方法。對於互聯網產品經常關註的轉化率指標，如果轉化率為5%，不能說明這個指標的好壞，如果該細分行業的行業平均轉化率為10%，通過對比其實指標還是有

Go/Python/Erlang編程語言對比分析及示例

情況 png 解耦多態有一種 blog fib 對比基準本文主要是介紹Go，從語言對比分析的角度切入。之所以選擇與Python、Erlang對比，是因為做為高級語言，它們語言特性上有較大的相似性，不過最主要的原因是這幾個我比較熟悉。 Go的很多語言特性借鑒與它的三個

MySQL查詢語句中的IN 和Exists 對比分析

In exists nested loop sql優化查詢效率背景介紹最近在寫SQL語句時，對選擇IN 還是Exists 猶豫不決，於是把兩種方法的SQL都寫出來對比一下執行效率，發現IN的查詢效率比Exists高了很多，於是想當然的認為IN的效率比Exists好，但本著尋根究底的原

GitHub & Bitbucket & GitLab & Coding 的對比分析

comm spa sch VC imp 遷移商業有一個 csdn 目前基於 Git 做版本控制的代碼托管平臺有很多種，比較流行的服務有 Github、Bitbucket、 GitLab、 Coding，他們各自有什麽特點，個人使用者和開發團隊又該如何選擇？在這篇文章

編程語言對比分析：Python與Java和JavaScript（圖）

最大 python 服務 dev 破壞 fff 對比分析可能分析編程語言對比分析：Python與Java和JavaScript（圖）：憑什麽說“Python 太慢，Java 太笨拙，我討厭 JavaScript”？[圖]編程語言生而為何？我們人類從原始社會就是用語言表

U8預測購貨數量和實際發貨數量對比分析

dha store 合並 bject select ted mco set begin USE [UFDATA_001_2017] GO /****** Object: StoredProcedure [dbo].[PROC_JDS_preorder] Scrip

Tower與DevCloud對比分析報告

original 測試管理 oom 定位設備 orm 覆蓋 androi con 1、產品介紹 Tower是彩程設計公司出品的遠程辦公和團隊協作工具，為小企業和小團隊提供簡單、靠譜的在線協作服務。 DevCloud 是集華為研發實踐、前沿研發理念、先進研發

JDK1.7&1.8源碼對比分析【集合】HashMap

rst www. sub com final 建議 views trie emp 前言在JDK1.8源碼分析【集合】HashMap文章中，我們分析了HashMap在JDK1.8中新增的特性（引進了紅黑樹數據結構），但是為什麽要進行這個優化呢？這篇文章我們通過對比JDK1.

JDK1.7&1.8源碼對比分析【集合】ConcurrentHashMap

ted html eat 重點內部 int bits ola ase 前言在JDK1.7&1.8源碼對比分析【集合】HashMap中我們對比分析了JDK1.7和1.8版本的HashMap源碼，趁熱打鐵，這篇文章就來看看JDK1.7和1.8版本的Concurren

LoRa和NB-IoT的應用場景對比分析

很多傳輸會有監管智能十分還需要問題生產 NB-IoT和LoRa兩種技術雖然有很多共同點，但是也有不同的技術和商業特性，所以在應用場景方面會有不同。今天我們就針對二者的區別來進行闡述，並且對各自適合的應用場景進行說明。　　LoRa的整個產業鏈相對已經較為成熟

九、順序表和單鏈表的對比分析

opera 基礎數據類型 insert 是我 public 位置參數 amp 一次 1、如何判斷某個數據元素是否存在於線性表中？ find()操作：可以為線性表List增加一個查找操作 int find(const T& e)const; 參數：待查找的數據

對比分析

4.5 比較一個 ply nan pre har itl 隨著 ‘‘‘ 【課程1.3】對比分析對比分析 → 兩個互相聯系的指標進行比較絕對數比較（相減） / 相對數比較（相除）結構分析、比例分析、空間比較分析、動態對比分析 ‘

測試工程師的福利！各遠程移動測試平臺對比分析

大公司 ssp 招聘做到蒲公英分發應用人工 com 蘋果收購歡迎大家前往騰訊雲+社區，獲取更多騰訊海量技術實踐幹貨哦~ 本文由騰訊移動品質中心TMQ發表於雲+社區專欄背景隨著移動設備和系統的碎片化程度越來越高以及復雜的移動網絡情況, 兼容性測試以及遠程真機

Apache 流框架 Flink，Spark Streaming，Storm對比分析（2）

此文已由作者嶽猛授權網易雲社群釋出。歡迎訪問網易雲社群，瞭解更多網易技術產品運營經驗。 2.Spark Streaming架構及特性分析 2.1 基本架構基於是spark core的spark streaming架構。 Spark Streaming是將流式計算分解成一系列短小的批處理作業。這裡的批處

機器學習演算法對比分析

各種機器學習的應用場景分別是什麼？例如，k近鄰,貝葉斯，決策樹，svm，邏輯斯蒂迴歸和最大熵模型。 k近鄰,貝葉斯，決策樹，svm，邏輯斯蒂迴歸和最大熵模型,隱馬爾科夫，條件隨機場，adaboost，em 這些在一般工作中，分別用到的頻率多大？一般用… 關於這個問題我今天正

對比分析

相關推薦