資料探索(3)Python主要資料探索函式
Python中用於資料探索的庫主要是Pandas(資料分析)和Matplotlib(資料視覺化)。
資料探索函式可大致分為統計特徵函式和統計作圖函式。
Pandas的主要統計特徵函式。
sum() 列總和
mean() 平均數
var() 方差
std() 標準差
corr()Spearman相關係數矩陣
cov()協方差矩陣
skew()偏度(3階矩陣)
Kurt()峰度(4階矩陣)
describe()給出樣本的基本描述
擴充套件統計特徵函式
cum累積計算和pd.rolling_滾動計算
cumsum() 依次給出前1、2—n個數的和
cumprod()依次給出前1、2—n個數的積
cummax()依次給出前1、2—n個數的最大值
cummin()依次給出前1、2—n個數的最小值
統計作圖函式
plot()折線圖
pei()餅圖
hist()直方圖
boxplot()箱形圖
plot(logy=True)y軸的對數圖
plot(yerr=error)誤差條形圖
相關推薦
資料探索(3)Python主要資料探索函式
Python中用於資料探索的庫主要是Pandas(資料分析)和Matplotlib(資料視覺化)。 資料探索函式可大致分為統計特徵函式和統計作圖函式。 Pandas的主要統計特徵函式。 sum() 列總和 mean() 平均數 var() 方差 std() 標準差 corr()Spear
演算法與資料結構(3):基本資料結構——連結串列,棧,佇列,有根樹
原本今天是想要介紹堆排序的。雖然堆排序需要用到樹,但基本上也就只需要用一用樹的概念,而且還只需要完全二叉樹,實際的實現也是用陣列的,所以原本想先把主要的排序演算法講完,只簡單的說一下樹的概念。但在寫的過程中才發現,雖然是隻用了一下樹的概念,但要是樹的概念沒講明白的話,其實不太好理解。所以決定先介紹一下基本的資
吳裕雄 資料探勘與分析案例實戰(3)——python數值計算工具:Numpy
# 匯入模組,並重命名為npimport numpy as np# 單個列表建立一維陣列arr1 = np.array([3,10,8,7,34,11,28,72])print('一維陣列:\n',arr1)# 一維陣列元素的獲取print(arr1[[2,3,5,7]]) # 巢狀元組建立二維陣列ar
大資料ETL實踐探索(3)---- pyspark 之大資料ETL利器
5.spark dataframe 資料匯入Elasticsearch 5.1 dataframe 及環境初始化 初始化, spark 第三方網站下載包:elasticsearch-spark-20_2.11-6.1.1.jar http://spark.apache.org/t
大資料ETL實踐探索(1)---- python 與oracle資料庫匯入匯出
文章大綱 ETL 簡介 工具的選擇 1. oracle資料泵 匯入匯出實戰 1.1 資料庫建立 1.2. installs Oracle 1.3 export / import data from oracle
大資料ETL實踐探索(2)---- python 與aws 互動
文章大綱 本文主要使用python基於oracle和aws 相關元件進行一些基本的資料匯入匯出實戰,oracle使用資料泵impdp進行匯入操作,aws使用awscli進行上傳下載操作。本地檔案上傳至aws es,spark dataframe錄
python爬蟲(3)——python爬取大規模資料的的方法和步驟
python爬取大規模資料的的方法和步驟: 一、爬取我們所需要的一線連結 channel_extract.py 這裡的一線連結也就是我們所說的大類連結: from bs4 import BeautifulSoup import requests
小白學 Python(3):基礎資料型別(下)
人生苦短,我選Python 引言 前文傳送門 小白學 Python(1):開篇 小白學 Python(2):基礎資料型別(上) 前面我們介紹過了數字,本篇我們接著聊另一個常用的基礎資料型別:字串。 什麼是字串? 字串是由字元組成的一串有限序列,如: 'geekdigging' 、 "geek
小白學 Python 資料分析(3):Pandas (二)資料結構 Series
在家為國家做貢獻太無聊,不如跟我一起學點 Python 順便問一下,你們都喜歡什麼什麼樣的文章封面圖,老用這一張感覺有點醜 人生苦短,我用 Python 前文傳送門: 小白學 Python 資料分析(1):資料分析基礎 小白學 Python 資料分析(2):Pandas (一)概述 引言 先介
大資料入門(3)配置hadoop
1、上傳hadoop-2.4.1.tar.gz 2、解壓檔案到指定目錄(目錄:admin/app) mkdir app tar -zxvf hadoop-2.4.1.tar.gz -C /app 刪
大資料之(3)Hadoop環境MapReduce程式驗證及hdfs常用命令
一、MapReduce驗證 本地建立一個test.txt檔案 vim test.txt 輸入一些英文句子如下: Beijing is the capital of China I love Beijing I love China 上傳test.txt
android的資料儲存(3)(LitePal)
在上一章的SQLiteDatebase來操作資料庫好用嗎?不同的人有不同的答案,接下來你將接觸一個開源庫LitePal,它採用了物件關係對映的(ORM)的模式,並將我們平常用到的資料庫功能進行封裝,使用一行sql語句就可以完成各種建表和增刪改查的操作。 一、配置LitePal
Kafka學習筆記(3)----Kafka的資料複製(Replica)
1. CAP理論 1.1 Cosistency(一致性) 通過某個節點的寫操作結果對後面通過其他節點的讀操作可見。 如果更新資料後,併發訪問的情況下可立即感知該更新,稱為強一致性 如果允許之後部分或全部感知不到該更新,稱為弱一致性。 若在之後的一段時間(通常該時間不是固定的)後,
長短期記憶(LSTM)系列_LSTM的資料準備(3)——如何使用差分法消除資料的趨勢和季節性
導讀: 我們的很多資料是具有季節性或者趨勢性的,就是隨著時間越來越久,資料隨著一個趨勢來變化,這種內在的趨勢對資料的預測有一定的影響。那麼怎麼來消除這個影響呢? 我們可以使用差分法,差分法簡單說就是在一系列資料中,相鄰兩個相減得到相鄰兩個值的變化量,我們在進行資料分析的過程中,只對差分之後的
內建資料型別(上)---Python基礎學習筆記(四)
內建資料的三大主要型別: 1、數字(整數、浮點數) 2、序列(字串、列表、元組) 3、對映(字典) 按照是否可原地修改值分兩大類: 不可變物件(數字,字串,元組,不可變集合) 可變物件(列表,字典,可變集合) 一、整數(不
內建資料型別(下)---Python基礎學習筆記(六)
一、if-else條件語句 條件語句,條件滿足,執行一部分程式碼,不滿足,執行另一部分程式碼 四種基本格式: 1、單if …① if條件: 條件滿足時執行的程式碼…② …③ 執行順序: S1:執行① S2
資料結構-(3)--連結串列表--程式碼實現
注:offset為插入,修改,更新的位置 main.c #include<stdio.h> #include"list.h" int main(){ //定義一個空指標接收建立的表地址 LIST * pList = NULL; //定義狀態變數接收函式返回
Java內容梳理(3)識別符號和資料型別
識別符號 1、識別符號的命名規範 (1)是由26個英文字母(大小寫),數字,下劃線_,$組成; (2)識別符號僅不能以數字開頭,大小寫敏感,識別符號不能以關鍵字和保留字命名 2、程式設計中遇到的識別符號命名處理 (1)包名:全小寫,倒域名,如百度域名:baidu.c
Python從零開始系列連載(14)——Python特色資料型別(字典)(下)
字典的操作 字典提供了很多方法對字典操作: 1.dict.keys() 作用:返回包含字典所有key的列表 2.dict.values() 作用:返回包含字典所有value的列表 3.dict.items() 作用:返
Python從零開始系列連載(18)——Python特色資料型別(函式)(中)
無返回值的函式 之前說了好多,都是有返回值的函式,那有沒有沒返回值的函式呢? 這個可以有! 函式中變數的作用域 變數的作用域就是在程式中能對這個變數操作的區域範圍 有點像初高中學的函式的定義域 Python允許同名變數的出現