Pandas 新增修改資料 + 資料統計函式

阿新 • • 發佈：2022-03-06

新增修改資料

# 1）新增Series
    s1 = pd.Series(list(range(4)), name='F')

# 2）新增DataFrame的資料
    df = df.append({'A':i}, ignore_index=True)

# 3）使用concat新增DataFrame資料
     pd.concat(
                [pd.DataFrame([i], columns=['A']) for i in range(5)],
                ignore_index=True
            )

# 4)df.apply方法
# 利用函式，新增一列 值為其他列的條件篩選後自定義的值
def get_temperature_type(df):
            if df['bWendu'] > 0:
                return '高溫'
            if df['bWendu'] < 0:	# 這裡如果temperature_type為已有列為修改，否則新增
                return '低溫'	# axis=1，指定索引為columns,新增一列名字為temperature_type
        new_column = df.loc[:, 'temperature_type'] = df.apply(get_temperature_type, axis=1) 
df['temperature_type'].value_counts()	# 檢視新列計數

# 5）df.assign方法
# 在原有列的基礎上新增列 ，新列的名稱為yWendu_huashi和bWendu_huashi
df.assign(
	yWendu_huashi = lambda df:df['yWendu'] * 9/5 + 32,
	bWendu_huashi = lambda df:df['bWendu'] * 9/5 + 32
)

# 6）條件選擇分組賦值
# 新增一列並重新利用條件選擇賦值
df['wencha_type'] = ''	# 如果成立 認為wencha_type新列為後面的值
df.loc[df['bWendu'] - df['yWendu'] > 0, 'wencha_type'] = '溫差大'	# 如果b溫度-y溫度>0，那麼將溫差大複製給wencha_type新列
df.loc[df['bWendu'] - df['yWendu'] <=0, 'wencha_type'] = '溫差正常'
df['wencha_type'].value_counts()	# 檢視新列數量

資料統計函式

1）彙總類 + 去重 + 計數
# 1.1)取出所有的統計結果
df.describe()

# 1.2)平均值
df['bWendu'].mean()

# 1.3)標準差
df['bWendu'].std()

# 1.4)最大值
df['bWendu'].max()

# 1.5)最小值
df['bWendu'].min()

# 1.6)去重
df['fengxiang'].unique()

# 1.7)計數
df['fengxiang'].value_counts()

# 2)相關係數和協方差
"""
相關係數：衡量相似程度，當他們的相關係數為1時，說明兩個變數變化時的正向相似最大，當相似係數為-1時候，說明兩個變數的反向相似程度最大
相關係數矩陣：df.corr()

協方差：衡量同向反向程度，如果協方差為正，說明x，y同向變化，協方差越大說明同向程度越高。如果協方差為負，說明x，y反向運動，協方差越小說明反向程度越高
協方差矩陣:df.cov()
"""
# 單獨檢視2個列的相關係數和協方差：
    df['aqi'].corr(df['bWendu'])	# # 檢視空氣質量和最高溫度的相關係數
    df['aqi'].corr(df['bWendu']) - df['aqi'].corr(df['yWendu'])		# 空氣質量和溫差的相關係數

Pandas 新增修改資料 + 資料統計函式

新增修改資料 # 1）新增Series s1 = pd.Series(list(range(4)), name=\'F\') # 2）新增DataFrame的資料

numpy中處理含nan資料的統計函式及其效率

技術標籤：技術綜合pythonnumpy numpy 庫中的一些統計函式，它們在遇到含 nan 的資料時都無法正常使用，需要換成可用的同名函式（即在函式名前加“nan”）。

5-Pandas之常用的描述性統計函式、彙總函式

常用的描述性統計函式函式作用函式作用 count 非缺失樣本的數量 sum 求和 mean 均值

KTL 一個支援C++14編輯公式的K線技術工具平臺 - 第五版，支援sqlite3，全新sqlite3zz語法超簡單使用sqlite3; 新增方差等統計函式。

K，K線，Candle蠟燭圖。 T，技術分析，工具平臺 L，公式Language語言使用c++14，Lite小巧簡易。

Pandas系列教程（5）Pandas資料統計函式

Pandas資料統計函式 1、讀取csv資料 import pandas as pd file_path = \"../../datas/files/beijing_tianqi_2018.csv\"

Python實現Mysql資料統計及numpy統計函式

Python實現Mysql資料統計的例項程式碼如下所示： import pymysql import xlwt excel=xlwt.Workbook(encoding=\'utf-8\')

5.pandas新增資料列

有的時候，表格自帶的資料根本沒有辦法滿足我們，我們經常會新加一列資料或者對原有的資料進行修改

16-Pandas資料分組的函式應用（apply()、agg()和transform()、applymap()）

將自己定義的或其他庫的函式應用於Pandas物件，有以下3種方法： apply()：逐行或逐列應用該函式

Python資料分析：統計函式繪製簡單圖形

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Pandas系列教程（4）Pandas新增資料列

Pandas新增資料列在進行資料分析時，經常需要按照一定的條件建立新的資料列，然後進行進一步分析

python pandas dataframe修改已有資料的值

import pandas as pd datas = [ [1,2,3], [2,3,4], [3,4,5] ] df = pd.DataFrame(datas,index=[\'a\',\'b\',\'c\'],columns=[\'aa\',\'bb\',\'cc\'])

Java讀取Excel檔案的內容，歸檔到json檔案中（對json資料進行讀取、新增/修改put、刪除remove操作）

Java讀取Excel檔案的內容，歸檔到json檔案中（對json資料進行讀取、新增/修改put、刪除remove操作）

5-Pandas資料分組的函式應用（df.apply()、df.agg()和df.transform()、df.applymap()）

將自己定義的或其他庫的函式應用於Pandas物件，有以下3種方法： apply()：逐行或逐列應用該函式

【競技遊戲資料專精06】地鐵逃生統計函式圖

寫英文是因為matplotlib沒有中文字型我反正都是瞎寫的，你會不會英文無所謂，看漢語解說就行

盤點Pandas中資料刪除drop函式的一個細節用法

大家好，我是皮皮。一、前言前幾天在Python最強王者群有個叫【Chloe】的粉絲問了一個關於Pandas中的drop函式的問題，這裡拿出來給大家分享下，一起學習。

Oracle連續相同資料的統計

有些事情始終是需要堅持下去的。。。今天覆習一下之前用到的連續相同資料的統計。

利用pandas將非數值資料轉換成數值的方式

handle non numerical data 舉個例子，將性別屬性男女轉換成0-1，精通ML的小老弟們可以略過本文~~，

Python 中pandas索引切片讀取資料缺失資料處理問題

引入　　numpy已經能夠幫助我們處理資料，能夠結合matplotlib解決我們資料分析的問題，那麼pandas學習的目的在什麼地方呢？ numpy能夠幫我們處理處理數值型資料，但是這還不夠很多時候，我們的資料除了數值之外，還

python檔案和資料夾複製函式

本文例項為大家分享了python檔案和資料夾複製函式，供大家參考，具體內容如下

利用Pandas來清除重複資料的實現方法

一.前言最近剛好在練手一個數據挖掘的專案，眾所周知，資料探勘中比較重要的一步為資料清洗，而對重複資料的處理也是資料清洗中經常碰到的一項。本文將僅介紹如何利用Pandas來清除重複資料(主要指重複行)，話不多說