1. 程式人生 > 其它 >資料計算和分析

資料計算和分析

一、Numpy(科學計算)

1、概述

1、概念

  Numpy 是一個專門用於矩陣化運算、科學計算的開源Python
  NumPy將Python相當於變成一種免費的更強大的Matlab系統
    1、強大的 ndarray 多維陣列結構
    2、成熟的函式庫
    3、用於整合C/C++和Fortran程式碼的工具包
    4、實用的線性代數、傅立葉變換和隨機數模組
    5、Numpy和稀疏矩陣運算包scipy 配合使用非常方便

2、基本資料結構

矩陣表示:使用Numpy,易得到二維矩陣

作為ndarray物件裡的資料有時並不是所需要的,那麼可以使用ndarray物件的astype() 方法轉為指定的資料型別

2、使用

1、載入包

使用jupyter

運行當前行即可,不用從頭到尾執行

新建資料夾開始使用



2、索引

將資料轉為ndarray物件後,會需要按某種方式來抽取資料
ndarray物件提供了三種索引方式:

1、切片索引:切片索引和對列表list的切片索引相似,不過由原本的一維切片變為多維


2、下標索引,看成xy軸,通過座標點獲取

3、布林值索引



二、Pandas(資料分析)

1、概念

pandas提供了使我們能夠快速便捷地處理結構化資料的大量資料結構和函式
pandas兼具NumPy高效能的陣列計算功能以及電子表格和關係型資料庫靈活的資料處理功能

2、使用

1、導包

2、Series

Series是一種類似於一維陣列的物件,由資料(各種NumPy資料 型別)以及與之相關的資料標籤(即索引)組成
可以通過字典構建Series物件,Series物件的索引也是可以修改的

3、Dataframe

DataFrame是一個表格型的資料結構,它含有一組有序的列,每列可以是不同的值型別(數值、字串、布林值等)
DataFrame既有行索引也有列索引,可以看做由Series組成的字典