pandas的基本功能(一)

阿新 • • 發佈：2018-12-26

第16天pandas的基本功能(一)

靈活的二進位制操作

體現在2個方面
- 支援一維和二維之間的廣播
- 支援缺失值資料處理

四則運算支援廣播

+add - sub *mul /div
divmod()分割槽和模運算(返回商和餘數2個結果)
- 案例:a,b=divmod(一維矩陣)
空值處理
- 矩陣中空值用NaN代替
- NaN+值=NaN
- np(numpy).nan表示空值
- 填充空值: fillna(value=值)
- np.nan == np.nan 結果為False
  - 如果a矩陣和b矩陣中有空值那麼 a == b 結果:False
  - 相同:a.equal(b )結果為:True.帶空的矩陣比較推薦使用equal
組合
- 從df2中把df1的資料不全
  - df1.combine_first(df2)
- 連線
  - 連線二維矩陣
    - df1.concat(df2,axis=0/1)
  - 連線一維矩陣
    - pd.concat([df1,df2])
  - 一維二維通用
    - df1.append(df2)

統計

所有統計函式都支援行或列~~~
- sum(0/1) mean(0/1)

統計函式

功能	描述
`count`	非NA觀測數量
`sum`	價值總和
`mean`	價值的平均值
`mad`	平均絕對偏差
`median`	算術值的中值
`min`	最低限度
`max`	最大值
`mode`	模式
`abs`	絕對值
`prod`	價值的產物
`std`	貝塞爾校正的樣本標準偏差
`var`	無偏差
`sem`	平均值的標準誤差
`skew`	樣本偏斜（第3時刻）
`kurt`	樣本峰度（第4個時刻）
`quantile`	樣本分位數（值為％）
`cumsum`	累計金額
`cumprod`	累積產品
`cummax`	累積最大值
`cummin`	累積最小值

統計函式,統計的時候自動跳過空值
len(陣列)獲取行數,包括Nan所在的行~~~count(不包括)

include

#可以指定摘要統計的東西
矩陣.describe(include=['object'])
矩陣.describe(include=['number'])

最大最小索引
- 最大數和最小數對應的索引位置
  - 最大矩陣.idxmax(axis=0/1)
  - 最小矩陣 .idxmin(axis=0/1)
最常出現值模式
- a.value_counts() 統計一維陣列中每個元素出現的次數
- a.mode()統計陣列中出現次數最多的值

分段/面元

cut和qcut

共同點
- 都可以分為好多份 pd.cut/qcut(df,4) qcut 是對等的 cut 是隨機的
不同點
- pd.cut(df,[陣列]) qcut不支援

語法 pd.cut(df,[切點列表],right=True/False)

示列

#分2組  大於18的為成年,小於18的為未成年,統計個數 
a = pd.Series([4,5,5,2,3,1,8,9,3,15,6,45,56,1,56,2,20,4,5,2,1,8,18,1,82,20,25,20,20,12,13,14])
b = pd.cut(a,[0,18,100],labels=['未成年','成年'],right=False)
b.value_counts()

為矩陣新增處理函式/支援多個函式

鏈式寫法
- (df.pipe(函式名,引數).pipe(函式名,引數).......)

apply

df.apply(函式名,axis=0/1) 為當前行或列新增處理函式

示列

#12.判斷年齡是否成年: 18歲以上成年   #成年和未成年獲救比例
"""
1.判斷是否成年
2.
"""
def age_old(b):
    
    c = b['Age']
    if c > 18:
        return '成年'
    elif c < 18:
        return '未成年'
    else:
        return '空值'
#建立新列 
df['chegnnian'] = df.apply(age_old,axis=1)
#設定全家的漢子顯示
plt.rcParams['font.size'] = 15

h_j = df.groupby(by=['Survived','chegnnian']).size()
plt.pie(h_j,labels=['成年未獲救','未成年未獲救','空值未獲救','成年獲救','未成年獲救','空值獲救'],shadow=True,autopct='%1.1f%%')
plt.axis('equal') #設定圓的形狀 正圓
plt.show()

map

df.applymap == df.map()

示列

#10.    以下肉類資料來源,food都轉換為小寫,新增一個動物列,而且字串都是小寫
data = pd.DataFrame({'food': ['bacon', 'pulled pork', 'bacon','Pastrami', 'corned beef', 'Bacon','pastrami', 'honey ham', 'nova lox'],
'price': [4, 3, 12, 6, 7.5, 8, 3, 5, 6]})
data['food'].str.lower()

#新列: 動物列
animal = { 'bacon': 'Pig', 'pulled pork': 'pIg', 'pastrami': 'cOw', 'corned beef': 'Co', 'honey Ham': 'pig', 'nova lox': 'Salmon' }
x = data['food'].map(animal)
data['animal'] = x
data

pandas的基本功能(一)

第16天pandas的基本功能(一) 靈活的二進位制操作體現在2個方面支援一維和二維之間的廣播支援缺失值資料處理四則運算支援廣播 +add - sub *mul /div divmod()分割槽和模運算(返回商和

Pandas基本功能之reindex重新索引

重新索引 reindex重置索引,如果索引值不存在，就引入缺失值引數介紹引數說明 index 用作索引的新序列 method 插值 fill_vlaue 引入

Pandas基本功能之算術運算、排序和排名

算術運算和資料對齊 Series和DataFrame中行運算和列運算有種特徵叫做廣播在將物件相加時，如果存在不同的索引對，則結果的索引就是該索引對的並集。自動的資料對齊操作在不重疊的索引處引入了NA值，NA值在算術運算中過程中傳播。 import pandas as pd from pandas im

Pandas基本功能之層次化索引及層次化彙總

層次化索引層次化也就是在一個軸上擁有多個索引級別 Series的層次化索引 data=Series(np.random.randn(10),index=[ ['a','a','a','b','b','b','c','c','d','d'], [1,2,3,1,2,3,1,2,2,3]

赫拉(hera)分散式任務排程系統之架構，基本功能(一)

文章目錄為資料平臺打造的任務排程系統前言架構設計目標支援任務的定時排程、依賴排程、手動排程、手動恢復支援豐富的任務型別：shell,hive,python,spark-sql,java

pandas基本功能（續1）

丟棄指定軸上的項丟棄某條軸上的一個或多個項很簡單，只要有一個索引陣列或列表即可。由於需要執行一些資料整理和集合邏輯，所以drop方法返回的是一個在指定軸上刪除了指定值的新物件：對於DataFrame，可以刪除任意軸上的索引值：索引、選取和過濾 Series索引（o

Pandas基本功能詳解 | 輕鬆玩轉Pandas（2）

教你學會 Pandas 不是我的目的，教你輕鬆玩轉 Pandas 才是我的目的。我會通過一系列例項來帶入 Pandas 的知識點，讓你在學習 Pandas 的路上不再枯燥。宣告：我所寫的輕鬆玩轉 Pandas 教程都是免費的，如果對你有幫助，你

一款線程安全、基本功能齊全的STL

叠代器通過指針 left nis min nbsp align github 　MiniSTL 　　目前正在完成一個STL，主要想通過該項目鍛煉C++編程、模板編程、熟悉STL、鍛煉數據結構和算法能力。　　項目的目標是實現STL的幾大構件+線程安全。項目過程中主要

一、實現一個特殊的棧，在實現棧的基本功能的基礎上，再實現返回棧中最小元素的操作

empty util run print pri ont com res 字符串請指教交流！ 1 package com.it.hxs.c01; 2 3 import java.util.Stack; 4 5 /* 6 實現一個特殊的棧，在實現棧的基本

pandas學習筆記5---DataFrame/Series基本功能之計算

OK，繼續學習pandas的基本功能之計算，pandas庫的資料結構幾乎與excel或資料庫的結構完全一樣，非常接近我們日常所用的資料形式。同時也是資料分析/挖掘計算的常用基礎庫，其計算功能的重要性自然不言而喻。本次我們針對pandas的主要資料結構Series/Data

Pandas快速教程-必要的基本功能

一.資料的快速檢視head和tail 這兩個方法可以快速的檢視一組資料的小抽樣,預設的設定是5行,當然也可以設定要返回的數目. t=df.head(2) t Out[134]: First Secend Third 0 2.0 1.0 1

【案例一】移動端購物車基本功能實現，具體操作類似淘寶購車。

還是直接上圖：這個效果圖很酷炫~ 有個坑紀念下，本來想用jquery-weui做的，然後各種倒騰，還是用css+div，媽耶！關鍵核心的jquery語句控制： //繫結全選的按鈕，讓所有購物車都選中，然後計算總數 $("#checkboxSum

一款執行緒安全、基本功能齊全的STL

MiniSTL 　　目前正在完成一個STL，主要想通過該專案鍛鍊C++程式設計、模板程式設計、熟悉STL、鍛鍊資料結構和演算法能力。　　專案的目標是實現STL的幾大構件+執行緒安全。專案過程中主要參考SGI STL原始碼，專案名稱為：MiniSTL。　　目前已完成空間配置

一步一步學SpringDataJpa——JpaRepository基本功能(Curd)

python資料分析pandas包入門學習（二）基本功能

本文參考《利用Python進行資料分析》的第五章 pandas入門 2基本功能介紹操作Series和DataFrame中的資料的基本手段。重新索引reindex 當呼叫Series的reindex將會根據新索引進行重排；當某個索引值當前不存在，就引入缺失值；fill_

《利用Python進行資料分析》第五章 pandas的基本功能

介紹操作Series和DataFrame中的資料的基本功能重新索引 pandas物件的一個重要方法是reindex，其作用是建立一個適應新索引的新物件。以之前的一個簡單示例來說 In [1]: from pandas import Series,Da

Android相機開發（一）之預覽拍照檢視圖片基本功能的實現

前言接觸Android開發有一段時間了。一開始時純粹是出於自己的興趣，空閒時寫幾個小軟體自娛自樂。剛好暑假時老闆佈置的任務跟Android相關，所以這段時間又繼續進行了Android的開發學習。現在的Android開發水平僅屬於

pandas基本用法（一）

讀取csv檔案 import pandas food_info = pandas.read_csv(file_name)# 返回一個DataFrame物件 n_rows = food_info

pandas之基本功能

pandas 的官方文件：1. 重新索引作用：建立一個適應新索引的新物件，會根據新索引對原資料進行重排，如果是新引入的索引，則會引入缺失值(也可用 fill_value 指定填充值)。reindex 的函式引數：indexNew sequence to use as

PyQt4 模擬記事本基本功能（保存，打開文件）

int .sh idt img 問題 top 我們文件 pyqt 1. 默認【保存】按鈕enable 2. 修改文本的內容後，【enable】 3. 解決字符亂碼問題：utf-8 # -*- coding: utf-8 -*- import sys from PyQt

pandas的基本功能(一)

第16天pandas的基本功能(一)

靈活的二進位制操作

相關推薦