1. 程式人生 > >python貢獻度分析以及相關性分析小例子

python貢獻度分析以及相關性分析小例子

貢獻度又稱帕累託,80%的利潤來自20%的最暢銷的產品,而其他80%的產品只產生了20%的利潤。

#-*- coding: utf-8 -*-
#菜品盈利資料 帕累託圖
from __future__ import print_function
import pandas as pd

#初始化引數
dish_profit = 'E:/PythonMaterial/chapter3/chapter3/demo/data/catering_dish_profit.xls' #餐飲菜品盈利資料
data = pd.read_excel(dish_profit, index_col = u'菜品名')
data = data[u'盈利'
].copy()#把data的盈利這一列抓出來 data.sort(ascending = False)#降序排列 import matplotlib.pyplot as plt #匯入影象庫 plt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標籤 plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負號 plt.figure()#建立影象 #plot函式用來繪製線性二維圖,折線圖;kind用來指定作圖型別,bar指的是條形圖 data.plot(kind='bar') plt.ylabel(u'盈利(元)'
) #sum()是計算樣本的總和;cumsum()是依次給出前1,2,3.。。n個數的和 p = 1.0*data.cumsum()/data.sum() p.plot(color = 'r', secondary_y = True, style = '-o',linewidth = 2) plt.annotate(format(p[6], '.4%'), xy = (6, p[6]), xytext=(6*0.9, p[6]*0.9), arrowprops=dict(arrowstyle="->", connectionstyle="arc3,rad=.2")) #添加註釋,即85%處的標記。這裡包括了指定箭頭樣式。
plt.ylabel(u'盈利(比例)') plt.show()

這裡寫圖片描述

#-*- coding: utf-8 -*-
#餐飲銷量資料相關性分析
import pandas as pd

catering_sale = 'E:/PythonMaterial/chapter3/chapter3/demo/data/catering_sale_all.xls' #餐飲資料,含有其他屬性
data = pd.read_excel(catering_sale, index_col = u'日期') #讀取資料,指定“日期”列為索引列

d1=data.corr() #相關係數矩陣,即給出了任意兩款菜式之間的相關係數
print d1
print "\n"
d2=data.corr()[u'百合醬蒸鳳爪'] #只顯示“百合醬蒸鳳爪”與其他菜式的相關係數
print d2
print '\n'*3#列印換行單引號雙引號都行,*3表示列印3個空行
d3=data[u'百合醬蒸鳳爪'].corr(data[u'翡翠蒸香茜餃']) #計算“百合醬蒸鳳爪”與“翡翠蒸香茜餃”的相關係數
print d3
           百合醬蒸鳳爪    翡翠蒸香茜餃   金銀蒜汁蒸排骨     樂膳真味雞     蜜汁焗餐包      生炒菜心    鐵板酸菜豆腐  \
百合醬蒸鳳爪   1.000000  0.009206  0.016799  0.455638  0.098085  0.308496  0.204898   
翡翠蒸香茜餃   0.009206  1.000000  0.304434 -0.012279  0.058745 -0.180446 -0.026908   
金銀蒜汁蒸排骨  0.016799  0.304434  1.000000  0.035135  0.096218 -0.184290  0.187272   
樂膳真味雞    0.455638 -0.012279  0.035135  1.000000  0.016006  0.325462  0.297692   
蜜汁焗餐包    0.098085  0.058745  0.096218  0.016006  1.000000  0.308454  0.502025   
生炒菜心     0.308496 -0.180446 -0.184290  0.325462  0.308454  1.000000  0.369787   
鐵板酸菜豆腐   0.204898 -0.026908  0.187272  0.297692  0.502025  0.369787  1.000000   
香煎韭菜餃    0.127448  0.062344  0.121543 -0.068866  0.155428  0.038233  0.095543   
香煎羅卜糕   -0.090276  0.270276  0.077808 -0.030222  0.171005  0.049898  0.157958   
原汁原味菜心   0.428316  0.020462  0.029074  0.421878  0.527844  0.122988  0.567332   

            香煎韭菜餃     香煎羅卜糕    原汁原味菜心  
百合醬蒸鳳爪   0.127448 -0.090276  0.428316  
翡翠蒸香茜餃   0.062344  0.270276  0.020462  
金銀蒜汁蒸排骨  0.121543  0.077808  0.029074  
樂膳真味雞   -0.068866 -0.030222  0.421878  
蜜汁焗餐包    0.155428  0.171005  0.527844  
生炒菜心     0.038233  0.049898  0.122988  
鐵板酸菜豆腐   0.095543  0.157958  0.567332  
香煎韭菜餃    1.000000  0.178336  0.049689  
香煎羅卜糕    0.178336  1.000000  0.088980  
原汁原味菜心   0.049689  0.088980  1.000000  


百合醬蒸鳳爪     1.000000
翡翠蒸香茜餃     0.009206
金銀蒜汁蒸排骨    0.016799
樂膳真味雞      0.455638
蜜汁焗餐包      0.098085
生炒菜心       0.308496
鐵板酸菜豆腐     0.204898
香煎韭菜餃      0.127448
香煎羅卜糕     -0.090276
原汁原味菜心     0.428316
Name: 百合醬蒸鳳爪, dtype: float64




0.00920580305184

相關推薦

python貢獻度分析以及相關性分析例子

貢獻度又稱帕累託,80%的利潤來自20%的最暢銷的產品,而其他80%的產品只產生了20%的利潤。 #-*- coding: utf-8 -*- #菜品盈利資料 帕累託圖 from __future

使用Trinity拼接以及分析差異表達一個例子

使用Trinity拼接以及分析差異表達一個小例子  2017-06-12 09:42:47     293     0     0 Trinity 將測序資料

[Python]Python 使用 for 循環的例子

使用 例子 for ... 循環 for 循環 小例子 pytho print [Python]Python 使用 for 循環的小例子: In [7]: for i in range(5): ...: print "xxxx" ...: prin

電商大資料專案(二)-推薦系統實戰之實時分析以及離線分析

電商大資料專案-推薦系統實戰(一)環境搭建以及日誌,人口,商品分析http://blog.51cto.com/6989066/2325073電商大資料專案-推薦系統實戰之推薦演算法http://blog.51cto.com/6989066/2326209電商大資料專案-推薦系統實戰之實時分析以及離線分析htt

python資料分析】波士頓房價分析例子

一、匯入模組 %matplotlib inline #將生成的圖片嵌入網頁中 import matplotlib.pyplot as plt from sklearn import datasets from sklearn.feature_sele

【量化講堂- Python、pandas技巧系列】如何快速上手使用Python進行金融數據分析

exc 規律 專業 了解 全能 快速 想法 pac 之前 如何快速上手使用Python進行金融數據分析引言:本系列帖子“量化小講堂”,通過實際案例教初學者使用python、pandas進行金融數據處理,希望能對大家有幫助。【必讀文章】:《10年400倍策略分享-附視頻逐行講

Python數據挖掘-相關性-相關分析

bsp 相關系數 div 相關性 公式 nbsp font style afr 所需模塊 numpy、pandas 相關系數計算 首先使用numpy.mean()方法求出均值,Xsd=numpy.std()方法求出標準差; 然後在通過(X-Xmean)/Xsd公式求出z分數

python相關性分析與p值檢驗

## 最近兩天的成果 ''' ########################################## # # # 不忘初心

資料分析處理問題例子(wine資料集)

剛學資料分析時做的小例子,從notebook上覆制過來,留個紀念~ 資料集是從UCI上download下來的Wine資料集,下載地址,這是一個多分類問題,類別標籤為1,2,3。 先瞅瞅資料, import numpy as np import pandas as pd from sk

python中的記憶體管理與分析以及垃圾回收機制

1.記憶體分析和處理 程式的執行離不開對記憶體的操作,一個軟體要執行,需要將資料載入到記憶體中,通過CPU進行記憶體資料的讀寫,完成資料的運算。 1.1不可變資料型別VS可變資料型別 python中根據資料是否可以進行修改提供了兩種不同的資料型別 ⚫ 不可變資料

python資料探勘資料分析pandas的介紹及簡單例子

pandas是python下最有力的資料探勘和資料分析的工具之一,支援類似於SQL的資料庫的增、刪、查、改,並且帶有豐富的資料處理函式,支援時間序列的分析功能,支援靈活處理缺失資料。pandas基本的資料結構是Series和DataFrame,series就是序列,類似於一

three.js 例子分析

這是一個官方的小例子就是分析學習下。https://threejs.org/examples/#webgl_geometry_extrude_shapes 開頭的引入js沒什麼好說 <script src="../build/three.js"></script>

Python+gensim-文字相似度分析白進)

1、gensim使用流程 2、程式碼實現 from gensim import corpora, models, similarities import jieba # 分詞函式,返回分詞列表 def cut(sentence): generator

在批處理中使用ping命令,一個例子進行分析

   照例先說明一下我的問題:為公司開發的一個伺服器,用vc編寫,其中利用ado對oracle進行訪問(每一次有客戶端訪問伺服器的時候就對oracle資料庫進行一次update的操作),最近發現了一些

Windows下用Python你會幾種copy檔案的方法以及效率分析

001:os.system import os import tempfile filename1 = tempfile.mktemp (".txt") open (filename1, "w").close () filename2 = filename1 + ".co

排序演算法的Python實現以及時間分析

選擇排序 首先,找到陣列中最小的那個元素,其次,將它和陣列的第一個元素交換位置(如果第一個元素就是最小元素那麼它就和自己交換)。再次,在剩下的元素中找到最小的元素,將它與陣列的第二個元素交換位置。如此往復,直到將整個陣列排序。這種方法叫做選擇排序,因為它在不斷地選擇

python(dict字典相關知識以及例子:生成一個列表,存放100個隨機整數,找出出現次數最多的數字)

一、什麼是字典? #字典的使用 #子字典是一個容器類,可以用來儲存資料 #列表儲存資料特點:1、有序的 2、每一個都有一個索引,通過索引可以對資料進行查詢,修改,刪除 #字典儲存資料: key:v

python資料相關性分析實踐

分析特徵之間的相關性,得到哪個兩個特徵的具有關係,這樣對於後期的資料分析可以提供幫助。 資料來源示例: (每列都是一個特徵,每行為一個使用者) [10, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 5, 0] [4

使用python製作簡單的日誌以及日誌分析工具

       最近,我需要將多客戶模擬器在執行中產生的一些資料記錄下來,同時使用適當 的方法(例如圖形化,還有。。。?)對其進行分析。 1. 日誌的記錄     python有一個logging模組,可以用來產生日誌。     (1)學習資料        http:

Python資料相關性分析

概述 在我們的工作中,會有一個這樣的場景,有若干資料羅列在我們的面前,這組資料相互之間可能會存在一些聯絡,可能是此增彼漲,或者是負相關,也可能是沒有關聯,那麼我們就需要一種能把這種關聯性定量的工具來對資料進行分析,從而給我們的決策提供支援,本文即介紹如何使用 Python