python pandas 筆記2

阿新 • • 發佈：2018-06-22

skip array 分享一行 was read columns IE ram

1. CSV操作

1.1 pd.read_csv()

df = pd.read_csv(‘olympics.csv‘)
df.head()

技術分享圖片

# index_col =0 ，從0列開始讀取， 並跳過第一行
df = pd.read_csv(‘olympics.csv‘, index_col = 0, skiprows=1)
df.head()

技術分享圖片

1.2 rename() 方法。

for col in df.columns:
    if col[:2]==‘01‘:
        df.rename(columns={col:‘Gold 
‘ + col[4:]}, inplace=True)
    if col[:2]==‘02‘:
        df.rename(columns={col:‘Silver‘ + col[4:]}, inplace=True)
    if col[:2]==‘03‘:
        df.rename(columns={col:‘Bronze‘ + col[4:]}, inplace=True)
    if col[:1]==‘№‘:
        df.rename(columns={col:‘#‘ + col[1:]}, inplace=True) 

df.head()

技術分享圖片

2. 查詢 DataFrame

only_gold = df.where(df[‘Gold‘] > 0)
only_gold.head()

技術分享圖片

2.1 刪除NAN這行

only_gold = only_gold.dropna()
only_gold.head()

技術分享圖片

2.3 或者直接用兩次[]

only_gold = df[df[‘Gold‘] > 0]
only_gold.head()
#df[(df[‘Gold.1‘] > 0) & (df[‘Gold‘] == 0)]

技術分享圖片

3. 索引設置

df.head()

技術分享圖片

#索引設置
df[‘country‘] = df.index
df = df.set_index(‘Gold‘)
df.head()

技術分享圖片

df = df.reset_index()
df.head()

技術分享圖片

3.1 unique()方法，找獨一無二的元素。

df[‘SUMLEV‘].unique()
# array([40, 50])

df=df[df[‘SUMLEV‘] == 50]
df.head()

技術分享圖片

3.2 保留指定列

columns_to_keep = [‘STNAME‘,
                   ‘CTYNAME‘,
                   ‘BIRTHS2010‘,
                   ‘BIRTHS2011‘,
                   ‘BIRTHS2012‘,
                   ‘BIRTHS2013‘,
                   ‘BIRTHS2014‘,
                   ‘BIRTHS2015‘,
                   ‘POPESTIMATE2010‘,
                   ‘POPESTIMATE2011‘,
                   ‘POPESTIMATE2012‘,
                   ‘POPESTIMATE2013‘,
                   ‘POPESTIMATE2014‘,
                   ‘POPESTIMATE2015‘]
df = df[columns_to_keep]
df.head()

技術分享圖片

3.3 設置兩個索引值

df = df.set_index([‘STNAME‘, ‘CTYNAME‘])
df.head()

技術分享圖片

3.4 loc()方法

df.loc[‘Michigan‘, ‘Washtenaw County‘]
"""
BIRTHS2010            977
BIRTHS2011           3826
BIRTHS2012           3780
BIRTHS2013           3662
BIRTHS2014           3683
BIRTHS2015           3709
POPESTIMATE2010    345563
POPESTIMATE2011    349048
POPESTIMATE2012    351213
POPESTIMATE2013    354289
POPESTIMATE2014    357029
POPESTIMATE2015    358880
Name: (Michigan, Washtenaw County), dtype: int64
"""

df.loc[ [(‘Michigan‘, ‘Washtenaw County‘),
         (‘Michigan‘, ‘Wayne County‘)] ]

技術分享圖片

4. 丟失值的處理

df = pd.read_csv(‘log.csv‘)
df

技術分享圖片

4.1 重新設置索引

df = df.set_index(‘time‘)
df = df.sort_index()
df

技術分享圖片

df = df.reset_index()
df = df.set_index([‘time‘, ‘user‘])
df

技術分享圖片

4.2 向上填充fillna方法

df = df.fillna(method=‘ffill‘)
df.head()

技術分享圖片

5. 返回最大值的索引

參考：http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.argmax.html

#example 
>>> s = pd.Series(data=[1, None, 4, 3, 4],
...               index=[‘A‘, ‘B‘, ‘C‘, ‘D‘, ‘E‘])
>>> s
A    1.0
B    NaN
C    4.0
D    3.0
E    4.0
dtype: float64

>>> s.idxmax()
‘C‘

python pandas 筆記2

skip array 分享一行 was read columns IE ram 1. CSV操作 1.1 pd.read_csv() df = pd.read_csv(‘olympics.csv‘) df.head() # i

python學習筆記2：字符串

nbsp 大小 alpha .com format 大小寫 fin 判斷大小 key python學習筆記2：字符串總結：字符串是不可變變量，不能通過下標修改其值　　　字符串的方法都不會改變字符串原來的值，而是新生成一個字符串一、3種寫法——單引號，雙引號，三引號　

python學習筆記2

www. 內部必須 class print 依次 not 函數對象 return 學習廖雪峰的官方網站https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000

python-zx筆記2-help

-h strong 運行 idt mage pre ima wid () 在cmd運行查看模塊的方法： help—查看模塊的函數 1 help() python-zx筆記2-help

【23】Python基礎筆記2

join 鍵值什麽位置布爾獲取允許選擇內容 1、請用代碼實現：利用下劃線將列表的每一個元素拼接成字符串 li=[‘alex‘, ‘eric‘, ‘rain‘] print("_".join(li)) print(li[0]+"_"+li[1]+"_"+li[1

python學習筆記2——列表

blog post 添加 line 組成 append() 語句順序 names 1.列表簡介　　列表由一系列按特定順序排列的元素組成。你可以創建包含字母表中所有字母、數字0~9或所有家庭成員姓名的列表；也可以將任何東西加入列表中，其中的元素之間可以沒有任何關

python學習筆記2--dict

返回 class AR 方式 list post 一個數下標 int 一、list操作 list=[‘xiaohei‘,‘xiaobai‘,‘xiaohong‘]#定義一個數組 name=[]#定義一個空數組 #查 #下標是從0開始 print(list[1]) #-1

python學習筆記2-dict

返回操作學習 item python nan [1] 存在一個常用的dict操作： d={‘name‘:‘suki‘, ‘age‘:‘18‘, ‘sex‘:‘man‘, ‘addr‘:‘nanjing‘ } #字典取值方便，但是字典是沒有順序

python學習筆記2-字符串操作

rom span 不可 div bsp 報錯換行符 pri pos 一、字符串切片 #切片也能適合字符串 tittle=‘今天發蘋果‘ for i t in enumerate(tittle): #enumerate可以同時循環下標和值 print(

python學習筆記2-tuple

python學習 username name pri 127.0.0.1 str 例子 () 不能 tuple: #元組也是List,但是值不能變 a=(‘123‘,‘234‘,‘1234‘) print(a[1]) mysql=(‘127.0.0.1‘,‘3306‘,

python 學習筆記2

htm 系列 .py xtend mark 內容三引號包含開始 python 中文編碼python默認的編碼格式是ASCII格式，在沒修改格式編碼時無法正確打印漢字。解決方法只要在開頭加入#conding=utf -8[root@qiaolinux-02 python

python基礎筆記 2 流程控制 for in迴圈

#for .. in迴圈 ''' for 變數 in 容器資料： python程式碼 ... #所有容器都可以使用for..in迴圈進行遍歷 #集合(對於無序資料沒有辦法使用while迴圈來進行遍歷操作！) girls =

Python基礎筆記(2.3-2.5)

2.3 流程控制--for字典dic={'a':1,'b':2}for k in dic: 遍歷字典print k 格式化輸出 iteritems() 方法用法和items()方法一樣它返回的也是一個物件和xrange()異曲同工小例子：通過python寫乘法口訣#!/usr/bin/pytho

【Python學習筆記2】turtle庫繪相簿使用

5.in[‘C’,’c’]保留字，二元關係操作，符合右側即為真， 6.print（“這裡輸入文字：%.2fF”%f）表示二位小數的浮點數，%f表示輸出的是f的值。 7.迴圈 for i in range (10): 執行 8.

Matplotlib python 學習筆記2

import matplotlib.pyplot as plt import numpy as np x = np.linspace(-3,3,50) y = 2*x + 1 plt.figure(num=1,figsize=(8,5)) plt.plot

Python--學習筆記2 常用庫 <利用Python進行資料分析>

numpy 科學計算包：多維陣列物件；數學運算函式；隨機數；傅立葉變換可以作為演算法之間傳遞資料的容器。 pandas 快速處理結構化資料和函式。 dataframe，面向列的二維表結構，含有行標和列標。 matplotliba &nb

pandas筆記2---reset_index函式drop與inplace引數的理解

本文將分為三部分： 1. reset_index函式：修改排序，否則可能會產生錯誤，所以對DataFrame做完合併，或者做分組聚合（groupby,agg,transform等函式）後，最好做一個 reset_index處理。 2.drop引數的理解： drop=Tr

python學習筆記2：分支迴圈

三大結構順序：程式由上往下執行分支： if ：else ：elif 迴圈：for while 迴圈 for i in [可迭代序列]： while True:break #注意，一般在python中，如果由表示數字範圍的兩個數，一般是包含左邊數字不包含右邊數字:ra

python學習筆記2：分支循環

and lse 猝死常用學習一輪 python學習語句次循環三大結構順序：程序由上往下執行分支： if ：else ：elif 循環：for while 循環 for i in [可叠代序列]： while True:break #註意，一般在pyt

python學習筆記2（隨機數，運算子與表示式）

隨機數的常見操作 #隨機數 import random print(random.choice([1,3,5,7,9，aa])) #從1，3，5，7，9，aa中隨機取一個 print(random.choice(range(5))) #range(5)=[0,1,2,3,4] pr

python pandas 筆記2

相關推薦