1. 程式人生 > 實用技巧 >Python資料分析與展示(學習筆記)

Python資料分析與展示(學習筆記)

目錄

1.Python語言開發工具選擇

①IPython

  • IPython是一個功能強大的互動式she11適合進行互動式資料視覺化和GUI相關應用

  • IPython的%魔術命令

a = np.random.randn(1000, 1000)

%timeit np.dot(a, a)
10 loops, best of 3: 85.7 ms per loop

%who
a        np
%hist    
%who
import numpy as np 
a = np.arrange(10)
print(a)

IPython前臺解釋指令碼 Python直譯器對程式進行執行

2.Numpy庫入門

①資料維度

  • 一維資料

    • 一維資料由對等關係的有序或無序資料構成,採用線性方式組織
    • 對應列表、陣列和集合等概念
  • 列表與陣列(一組資料的有序結構)

    • 區別
      • 列表:資料型別可以不同
      • 陣列:資料型別相同
  • 二維資料

    • 二維資料由多個—維資料構成,是一維資料的組合形式
    • 表格是典型的二維資料其中,表頭是二維資料的一部分
  • 多維資料

    • 多維資料由一維或二維資料在新維度上擴充套件形成
  • 高維資料

    • 高維資料僅利用最基本的二元關係展示資料間的複雜結構

②資料維度的 Python表示

  • 一維資料:列表和集合型別

  • 二維資料:列表型別

  • 多維資料:列表型別

  • 高維資料:字典型別或資料表示格式, JSON、XML和YAML格式

③NumPy的資料物件:ndarray

(1)NumPy介紹
  • NumPy是一個開源的 Python科學計算基礎庫,包含:

    • 一個強大的N維陣列物件 ndarray
    • 廣播功能函式
    • 整合C/C++/ Fortran程式碼的工具
    • 線性代數、傅立葉變換、隨機數生成等功能
  • NumPy是 SciPy、 Pandas等資料處理或科學計算庫的基礎

(2)NumPy的引用
import numpy as np 
(3)N維陣列物件:ndarray
  • Python已有列表型別,為什麼需要一個數組物件(型別)?

    • 陣列物件可以去掉元素間運算所需的迴圈,使一維向量更像單個數據
    • 設定專門的陣列物件,經過優化,可以提升這類應用的運算速度
  • 科學計算中,一個維度所有資料的型別往往相同

    • 陣列物件採用相同的資料型別,有助於節省運算和儲存空間