Dataframe根據缺測率對行或列求取平均值

阿新 • • 發佈：2022-05-13

Dataframe自帶的求取平均值的演算法只能忽略nan，無法根據nan出現的頻次計算平均值。

import pandas as pd
import numpy as np

df = pd.DataFrame([[1,np.nan,np.nan,np.nan,np.nan],[2,3,np.nan,np.nan,np.nan],[3,4,5,np.nan,np.nan],[4,5,6,7,np.nan]], index=['a', 'b', 'c', 'd'], columns=['A','B','C','D','E'])
print(df)

結果：

   A    B    C    D   E
a  1  NaN  NaN  NaN NaN
b  2  3.0  NaN  NaN NaN
c  3  4.0  5.0  NaN NaN
d  4  5.0  6.0  7.0 NaN

下面是我編寫的自定義函式

def df_mean(u0, axis, limit):
    """
    dataframe對 行或列 根據缺測率求取平均。
    :param u0: 求取平均的dataframe
    :param axis: 行或列，1為逐行對列求平均，0為逐列對行求平均
    :param limit: 缺測率標準，0-1。缺測率大於等於limit的，平均值定義為nan
    :return:
    """
    umean=[]
    if axis==1:
        for ij in u0.index:
            if u0.loc[ij, :].isna().sum()/len(u0.loc[ij,:]) >= limit:
                umean.append(np.nan)
            else:
                umean.append(u0.loc[ij,:].mean())
        umean=pd.Series(umean, index=u0.index)
    elif axis==0:
        for ij in u0.columns:
            if u0.loc[:, ij].isna().sum() / len(u0.loc[:, ij]) >= limit:
                umean.append(np.nan)
            else:
                umean.append(u0.loc[:, ij].mean())
        umean=pd.Series(umean, index=u0.columns)
    else:
        print('Error for axis')
    return umean

直接用df.mean()求取平均值的結果：

print(df.mean(axis=0))

A    2.5
B    4.0
C    5.5
D    7.0
E    NaN
dtype: float64

利用自定義函式求取的結果：

print(df_mean(df, axis=0, limit=0.6))

A    2.5
B    4.0
C    5.5
D    NaN
E    NaN
dtype: float64

可以看出，‘D’和‘E’列的缺測率大於0.6，求取的平均值定義為nan了。

Dataframe根據缺測率對行或列求取平均值

Dataframe自帶的求取平均值的演算法只能忽略nan，無法根據nan出現的頻次計算平均值。

numpy.ndarray 實現對特定行或列取值

如下所示： import numpy as np b = [[1,2,0],[4,5,[7,8,1],11,1] ] a=np.array([b]).reshape((5,3)) print(a)

python中pandas庫中DataFrame對行和列的操作使用方法示例

用pandas中的DataFrame時選取行或列： import numpy as np import pandas as pd from pandas import Sereis,DataFrame

pandas.DataFrame刪除/選取含有特定數值的行或列

1.刪除/選取某列含有特殊數值的行 import pandas as pd import numpy as np a=np.array([[1,2,3],[4,5,6],[7,8,9]])

修改Pandas的行或列的名字(重新命名)

pandas.DataFrame.rename 使用函式：DataFrame.rename(mapper=None,index=None,columns=None,axis=None,copy=True,inplace=False,level=None)

numpy 陣列增加列，增加行的函式：column_stack,row_stack，刪除行或列的函式，delete

技術標籤：科學計算 def fun_ndarray(): a = [[1,2,7], [-6,-2,-3], [-4,-8,-55] ] b = [3,5,6] a = np.array(a)

Python學習筆記：pd.drop刪除行或列

一、介紹通過指定標籤名稱和相應的軸，或直接指定索引或列名稱，刪除行或列。

element ui table 合併行或列

iqcarraySpanMethod({ row, column, rowIndex, columnIndex }) { let rowspan = 1, colspan = 1; if (column.property == \"InspectBatchNo\" || column.property == \"ProductNo\") {

C++ - cv::Mat資料型別 + 提取某些行或列

簡介 1、cv::Mat 資料型別 2、cv::Mat 提取某些行或列 cv::Mat 資料型別在以下兩個場景中使用OpenCV時，我們必須事先知道矩陣元素的資料型別：

pamdas-DataFrame使用索引或切片獲取行和列

技術標籤：pandasPython基礎知識pandas 程式碼示例： import pandas as pd df = pd.read_csv(\'test.csv\')

pandas按行按列遍歷Dataframe的幾種方式

遍歷資料有以下三種方法：簡單對上面三種方法進行說明： iterrows(): 按行遍歷，將DataFrame的每一行迭代為(index,Series)對，可以通過row[name]對元素進行訪問。

Python pandas.DataFrame 找出有空值的行

0.摘要 pandas中DataFrame型別中，找出所有有空值的行，可以使用.isnull()方法和.any()方法。

python列印檔案的前幾行或最後幾行教程

寫一個類似linux head的小工具，在window下用。 head.py # -*- coding: UTF-8 -*- #!/usr/bin/python

Java 凍結或解除凍結Excel中的行和列的方法

當Excel表格中有大量資料時，為了方便瀏覽，我們可通過凍結視窗這一功能將某幾行或某幾列的資料凍結起來，這樣在我們滾動視窗時，這幾行或幾列的資料就會被固定住，而不會隨著其他單元格的移動而移動。總的來說，Exc

DataGridView對行號操作

/// /// 置底 /// /// /// 要置底的行號 public static void BottomDataGridView(DataGridView dataGridView,int index)

QueryDSL根據經緯度獲取附近的地點或人

之前在mybatis中的寫法： /** * @author zengwei * @email [email protected] * @date 2020/7/23 */

JS根據不同瀏覽器載入不同css或JS

java 根據漢字生成拼音全拼或拼音首字母的示例

1.情景展示　　java 根據中文生成對應的拼音 2.準備工作　　所需jar包：pinyin4j-2.5.0.jar　　

【PHP】PHP程式碼處理（普通/不重要的）併發情況，例如pv統計（不使用MySQL行或表鎖、避免程式冗餘）

1、PHP程式碼處理（普通/不重要的）併發情況，例如統計pv資料：什麼意思呢？

改變vxe-table或element-ui 表格第一行或某一行樣式

技術標籤：vuetablevue 關鍵點：給表格新增屬性 :cell-style=“cellStyle” cellStyle(row, column, rowIndex, columnIndex) {

Dataframe根據缺測率對行或列求取平均值

相關推薦