python 浮點數四捨五入需要注意的地方

阿新 • • 發佈：2020-08-20

本文主要分享基於python的資料分析三方庫pandas，numpy的一次爬坑經歷，發現並分析了python語言對於浮點數精度處理不準確的問題，並在最後給出合理的解決方案。如果你也在用python處理資料，建議看一下，畢竟0.1的誤差都可能造成比較大的影響。

問題出現

早上到了公司，領導發了幾個檔案過來，說這兩天測試環境跑出來的資料，與實際情況有所出入，看看哪出的問題，儘快解決···

開始排查

先對比資料，發現並不是所有的資料都出現問題，只有10%左右的資料有這個問題，說明應該不是邏輯上的問題，初步判斷可能為個別情況需要特殊處理，考慮不周導致
檢查梳理各個運算模組，用debug斷點除錯一波，確定了資料出現偏差的模組

通過單獨測試這個單元模組最終確定，涉及到兩數相除結果為0.5(浮點數)的地方有問題
預期結果：np.round(0.5)=1，實際運算結果：np.round(0.5)=0，於是我做了如下的試驗

# 基於python3.7版本 
>>> import numpy as np 
 
# 先看看 0 < x < 1 這個範圍的結果，發現有問題 
>>> np.round(0.50) 
0.0 
>>> np.round(0.51) 
1.0 
>>> np.round(0.49) 
0.0 
 
# 我擔心是不是隻有小數點為.5的都會呈現這種問題,所以測試了 x > 1的結果，發現還是有問題 
>>> np.round(1.5) 
2.0 
>>> np.round(2.5) 
2.0 
>>> np.round(3.5) 
4.0 
>>> np.round(4.5) 
4.0

通過對比，發現確實涉及到.5的值會有些和預想的不同，看看啥原因

分析問題

確實發現了關於浮點數(.5出現了理解上的偏差)，看看官方文件怎麼解釋這個現象

numpy.around(a,decimals=0,out=None)[source]
Evenly round to the given number of decimals.

# 對於恰好介於四捨五入的十進位制值之間的中間值(.5)，NumPy會四捨五入為最接近的偶數值。
# 因此1.5和2.5四捨五入為2.0，-0.5和0.5四捨五入為0.0，依此類推。
For values exactly halfway between rounded decimal values,

NumPy rounds to the nearest even value.
Thus 1.5 and 2.5 round to 2.0,-0.5 and 0.5 round to 0.0,etc.

# np.around使用快速但有時不精確的演算法來舍入浮點資料型別。
# 對於正小數，它等效於np.true_divide（np.rint（a * 10 **小數），10 **小數），
# 由於IEEE浮點標準[1]和十次方縮放時引入的錯誤
np.around uses a fast but sometimes inexact algorithm to round floating-point datatypes.
For positive decimals it is equivalent to np.true_divide(np.rint(a * 10**decimals),10**decimals),
which has error due to the inexact representation of decimal fractions in the IEEE floating point standard [1]
and errors introduced when scaling by powers of ten

其實也就是說：對於帶有.5這種剛好介於中間的值，返回的是相鄰的偶數值
白話解釋：如果一個數字帶有浮點數(.5)，整數部分為偶數，則返回這個偶數;整數部分奇數，則返回這個奇數+1的偶數
規律解釋：如果整數部分能夠整除2，則返回整數部分;如果整數部分不能整除2，則返回整數部分 +1

解決問題

先不做任何改動，看下資料誤差的情形

# 我們為了先看下現象,構造如下案例 
import pandas as pd 
import numpy as np 
 
df = pd.DataFrame({"num1": [1,1,1.5,5,7.5],"num2": [2,3,6,3]}) 
 
df["真實值"] = df["num1"] / df["num2"] 
# 看下round函式過後的結果 
df["偏差值"] = np.round(df["num1"] / df["num2"])

原始結果圖片如下

python 浮點數四捨五入需要注意的地方

不做處理，期望值和偏差值不等的情況出現

我的解決方案

我根據我的精度要求，構建精度範圍所需要保留的小數點的最後一位，通過這個數字是否為5，判斷是否需要向上取整
舉例來說，本案例中我只需要保留整數部分的資料，那麼我只需要確定小數點後第一位是否是數字5就可以了

上程式碼

import pandas as pd 
import numpy as np 
import math 
 
df = pd.DataFrame({"除數": [1,"被除數": [2,3]}) 
 
# 記錄真實值 
df["真實值"] = df["除數"] / df["被除數"] 
 
# 記錄整數部分 
df["輔助整數列"] = df["真實值"].apply(lambda x: math.modf(x)[1]) 
 
# 記錄小數部分,因為我的最後結果精度為只保留整數部分,所以我只需要保留一個小數點位進行判斷是否需要進位操作 
df["輔助小數列"] = df["真實值"].apply(lambda x: str(math.modf(x)[0]).split(".")[1][0]) 
 
# 小數點後的第一位是為5，則向上取整，不是5則呼叫原np.round就行了 
df["期望值修正"] = df.apply(lambda x: x.輔助整數列 + 1 if (x.輔助小數列 == "5") else np.round(x.真實值),axis=1)

結果如下所示

python 浮點數四捨五入需要注意的地方

以上就是python 四捨五入需要注意的地方的詳細內容，更多關於python 四捨五入的資料請關注我們其它相關文章！

python 浮點數四捨五入需要注意的地方

python 浮點數四捨五入需要注意的地方

Python浮點數四捨五入問題的分析與解決方法

Python 列表推導式需要注意的地方

python 浮點數相加相相除_來聊聊Python裡的“數”

控制Python浮點數輸出位數

Python命令列引數定義及需要注意的地方

在 Python 中使用 JSON 時需要注意的編碼問題

詳解Python在使用JSON時需要注意的編碼問題

Python中關於浮點數的冷知識

c# 閉包的相關知識以及需要注意的地方

零基礎學習C/C++需要注意的地方

Python numpy 浮點數精度問題

Python如何執行精確的浮點數運算

4. 解密Python中最簡單的物件--浮點數的底層實現

next v5升級到next v7需要注意的地方

python 高精度浮點數計算模組decimal

C++建構函式丟擲異常需要注意的地方

Java 停止執行緒需要注意的地方

python閉包與引用以及需要注意的陷阱

python做浮點數運算時的坑記錄

python 浮點數四捨五入需要注意的地方

相關推薦