Python-深入淺出資料分析-直方圖

阿新 • • 發佈：2020-08-21

數字的分佈
Python中的直方圖和箱形圖
各種情況的對比

在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

數字的分佈

首先書中數落的一下Excel的直方圖功能，其實呢，Excel2016已經改進了很多了

Python中的直方圖和箱形圖

用不了幾行程式碼，是不是比Excel簡單美觀點

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

df = pd.read_csv('./hfda_ch09_employees.csv', skiprows=1, names =['staff_num', 'received', 'negotiated', 'gender', 'year'])

fig = plt.figure(figsize=(12, 6))

ax1 = fig.add_subplot(1, 3, 1)
l = ax1.boxplot(df['received'].values)

ax2 = fig.add_subplot(1, 2, 2)
l = ax2.hist(df['received'], bins=50)

各種情況的對比

分析不同維度的數字分佈

fig, ((ax1, ax2), (ax3, ax4), (ax5, ax6)) = plt.subplots(nrows=3, ncols=2, figsize=(16,16))

ax1.hist(df['received'][df['year']==2007], bins=50)
ax1.set_title('year=2007')
ax2.hist(df['received'][df['year']==2008], bins=50)
ax2.set_title('year=2008')

ax3.hist(df['received'][df['gender']=='M'], bins=50)
ax3.set_title('gender=M')
ax4.hist(df['received'][df['gender']=='F'], bins=50)
ax4.set_title('gender=F')

ax5.hist(df['received'][df['negotiated']], bins=50)
ax5.set_title('negotiated=TRUE')
ax6.hist(df['received'][~df['negotiated']], bins=50)
ax6.set_title('negotiated=FALSE')

Python-深入淺出資料分析-直方圖

目錄數字的分佈Python中的直方圖和箱形圖各種情況的對比在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

Python-深入淺出資料分析-線性迴歸

目錄做一個薪水預測器怎麼做是不是有一個函式誤差分析在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

Python-深入淺出資料分析-資料圖形化

目錄問題的起源圖形化是不是會好點三種不同的主頁表現在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

Python-深入淺出資料分析-最優化

目錄寫在前面定義資料模型scipy結合業務分析歷史趨勢增加約束條件在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

Python-深入淺出資料分析-主觀概率

目錄主觀上覺得數字化後的圖形所有的言論圖形化引入貝葉斯規則真的合理嗎

資料載入、儲存及檔案格式知識圖譜-《利用Python進行資料分析》

所有內容整理自《利用Python進行資料分析》，使用MindMaster Pro 7.3製作，emmx格式，原始檔已經上傳Github，需要的同學轉左上角自行下載或者右擊儲存圖片。

資料清洗與準備知識圖譜-《利用Python進行資料分析》

資料規整：連線、聯合與重塑知識圖譜-《利用Python進行資料分析》

繪圖和視覺化知識圖譜-《利用Python進行資料分析》

資料聚合與分組操作知識圖譜-《利用Python進行資料分析》

時間序列知識圖譜-《利用Python進行資料分析》

Python常用資料分析模組原理解析

前言 python是一門優秀的程式語言，而是python成為資料分析軟體的是因為python強大的擴充套件模組。也就是這些python的擴充套件包讓python可以做資料分析，主要包括numpy，scipy，pandas，matplotlib，scikit-learn等

高階Pandas知識圖譜-《利用Python進行資料分析》

《利用Python進行資料分析》 —— （1）

《利用Python進行資料分析》 —— （1） Python的學習需要自主探索各種型別，函式和方法的文件。

《利用Python進行資料分析》 —— （2）

《利用Python進行資料分析》 —— （2）本章主要介紹Python常用的資料結構和以及Python函式等基礎知識。

"利用python進行資料分析"學習記錄01

"利用python進行資料分析"學習記錄 --day0108/02 與書相關的資料在 http://github.com/wesm/pydata-book

利用python進行資料分析（第二版）筆記

Numpy 1、建立ndarray物件 1、arr.ndim：Numpy陣列維度資訊 2、arr.shape：Numpy陣列形狀資訊

利用python進行資料分析-第四章筆記

Chapter 4 NumPy Basics: Arrays and Vectorized Computation 題外話：numpy short for numerical python

利用python進行資料分析-第五章筆記

Chapter 5 Getting Started with pandas 這一章要介紹 pandas 的基礎。都是資料處理包，pandas 和 numpy 的區別在於：

利用python進行資料分析-第六章筆記

Chapter 6 Data Loading, Storage, and File Formats Reading and Writing Data in Text Format 最常用的是 read_csv 和 read_table，不過數模競賽裡很多都是用 excel 給資料，不知道今年是個啥情況。

Python-深入淺出資料分析-直方圖

數字的分佈

Python中的直方圖和箱形圖

各種情況的對比

相關推薦