java 浮點數值計算誤差

阿新 • • 發佈：2019-01-29

問題

當我們執行如下函式時

	public void test() {
		System.out.println(2.0-1.1); //=>0.8999999999999999
	}

我們發現其結果並非是我們預想的0.9

原因

其主要原因是浮點數值採用二進位制系統表示，而在二進位制系統中無法精確表示1/10。這就好像十進位制無法精確表示1/3一樣。如果需要在數值計算中不含有任何舍入誤差，就應該使用BigDecimal類.

上述原因摘自“Java 核心技術卷一 (第九版) p35”

解決方案

public void test() {
    System.out.println(new BigDecimal("2.0").subtract(new BigDecimal("1.1")));
}

詳解

首先我們要知道，計算機是如何將10進位制的浮點型別轉化成2進位制進行計算的。這裡我們需要知道一個概念，所有的浮點數值計算都遵循IEEE 745規範，所以我們來看一個該規範。

IEEE 745規範定義

IEEE 754是最廣泛使用的二進位制浮點數算術標準，被許多CPU與浮點運算器所採用。IEEE 754規定了多種表示浮點數值的方式，在本文件裡只介紹32bits的float浮點型別。它被分為3個部分，分別是符號位S（sign bit）、指數偏差E（exponent bias）和小數部分F（fraction）。

其中S位佔1bit，為bit31。S位為0代表浮點數是正數，S位為1代表浮點數是負數，比如說0x449A522C的S位為0，表示這是一個正數，0x849A522C的S位為1，表示這是一個負數。
E位佔8bits，為bit23~bit30。E位代表2的N次方，但需要減去127，比如說E位為87，那麼E位的值為2（87-127）=9.094947017729282379150390625e-13。
F位佔23bits，為bit0~bit22。F位是小數點後面的位數，其中bit22是2-1=0.5，bit21是2-2=0.25，以此類推，bit0為2-23=0.00000011920928955078125。但F位裡隱藏了一個1，也就是說F位所表示的值是1+（F位bit22~bit0所表示的數值），比如說F位是0b10100000000000000000001，只有bit22、bit20和bit0為1，那麼F位的值為1+(2-1+2-3+2-23)，為1.62500011920928955078125。
綜上所述，從二進位制數換算到浮點數的公式為：(-1)S×2E-127×(1+F)。但還有幾個特殊的情形：
若E位為0並且F位也為0時表示浮點數0，此時浮點數受S位影響，表現出+0和-0兩種0，但數值是相等的。比如二進位制數0x00000000表示+0，二進位制數0x80000000表示-0。
若E位為0並且F位不為0時浮點數為(-1)S×2-126×F，注意，E位的指數是-126，而不是0-127=-127，而且F位是0.xx格式而不是1.xx格式，比如0x00000001的浮點數為2-126×2-23=1.4012984643248170709237295832899e-45，而不是20-121×（1+2-23）。一旦E為不為0，從0變為1，不是增加2倍的關係，因為公式改變了。
若E位為255並且F位不為0時表示非數值，也就是說是非法數，例如0x7F800001。
若E位為255並且F位為0時表示無窮大的數，此時浮點數受S位影響，例如0x7F800000表示正無窮大，0xFF800000表示負無窮大。當我們使用1個數除以0時，結果將被記作0x7F800000。

上述定義摘自：http://bbs.chinaunix.net/thread-3746530-1-1.html

上述解釋為float型別轉化規則，與double型別規則一樣，double型別就不在進行贅述了。

示例2.0-1.1預算

下面我們來回顧一下2.0-1.1的問題，我們先將這2個數轉化為2進位制

2.0=10.0000000000000000
1.1=01.0001100110011001 //此為無限迴圈小數
10.0000000000000000-01.0001100110011001=0.1110011001100111

轉為10進位制只能接近0.8999999999999999了。

java 浮點數值計算誤差

問題當我們執行如下函式時 public void test() { System.out.println(2.0-1.1); //=>0.8999999999999999 } 我們發現其結果並非是我們預想的0.9 原因其主要原因是浮點數值採用二進

java 浮點計算處理方案

32位微處理器開始支援浮點運算，java語言自己支援浮點運算。浮點運算導致的問題有：四捨五入出錯，四則運算出錯，運算結果格式古怪等等。問題的原因其實簡單： 1.計算機儲存的數是近似數，同時為了顯示不會太長根據需要會進行適當的舍操作 2.計算機儲存的數是不連續的，這不同

T1010 計算分數的浮點數值（#Ⅰ- 2

【題目描述】兩個整數a和b分別作為分子和分母，既分數a/b，求它的浮點數值(雙精度浮點數，保留小數點後9位)。【輸入】輸入僅一行，包括兩個整數a和b。【輸出】輸出也僅一行，分數

20171203 計算分數的浮點數值

描述兩個整數a和b分別作為分子和分母，既分數 a/b ，求它的浮點數值（雙精度浮點數，保留小數點後9位）輸入輸入僅一行，包括兩個整數a和b 輸出輸出也僅一行，分數 a/b 的浮點數值（雙精度浮點數，保留小數點後9位） #include <stdio.h&

浮點數值需要注意的

浮點數不能用是否等於判斷(因為舍入誤差的原因，永遠不要測試某個特定的浮點數值)；因為0.1+0.2 != 0.3 1.1+1.3 ！= 2.4 ES6中通過Number.EPSILON（1與大於1的最小浮點數的差，為2的-52次冪，成為極小量）可以判定某個特定的浮點數值 function wi

IEEE中的浮點編碼計算

float型別在記憶體中佔4位元組，最高位表示符號位，剩下31位，從右向左取8位用於表示指數，其餘用於表示尾數在進行二進位制轉化前，需要進行科學記數法轉換，具體步驟如下 1.看符號位，正數為0，負數為1 2.將數轉化為相應的二進位制數 3.用科學記數法轉化為相應

Python 小技巧：Python3 表示最大整數值和浮點數值

一、引言這是我在學習《Python Algorithms 2nd》一書中第 28 頁時候受到的啟發： For intergral weights, you could use sys.maxint , even though it’s not g

C++中檢查浮點數值有效性

今天在專案中檢查到一個bug，程式會在某些情況下崩潰，最終認定是計算一個比值時，被除數和除數均為零，導致計算結果是個無效值，在後面的程式碼將使用這個無效值時導致了崩潰。需要對這個結果是否有效進行判斷。下面列出 IEEE 推薦的對浮點型的常用函式，包括特殊值（無窮、無效）

c++浮點數值輸出

#include<iostream> #include<iomanip> using namespace std; int main() { cou

記一次 JavaScript 浮點型數字誤差引發的問題

需求車間的工人在生產出來產品後，需要完成初步的自檢，並通過手機上報。在實際生產中，使用者（工人）不方便進行數值的輸入，因而表單中的一些項設計成 picker 模式以供選取數值。數值的取值範圍，根據允許的誤差範圍生成。示例如下：示例一 // 誤差 0.01mm ~ 0.06mm // picker 展示的數

java基本類型（數值範圍）：浮點的底層表示定義，float計算快一些

方法 -1 att ieee754 符號位無法字符類數值計算小數 Java八種基本類型: 六種數字類型（四個整數型，兩個浮點型），一種字符類型，一種布爾型。詳細例如以下 1、整數：包含int,short,byte,long

java基本型別（數值範圍）：浮點的底層表示定義，float計算快一些

Java八種基本型別: 六種數字型別（四個整數型，兩個浮點型），一種字元型別，一種布林型。具體如下 1、整數：包括int,short,byte,long 2、浮點型：float,d

Java中浮點型資料Float和Double進行精確計算的問題

Java中浮點型資料Float和Double進行精確計算的問題來源 https://www.cnblogs.com/banxian/p/3781130.html 一、浮點計算中發生精度丟失大概

Java中浮點型數據Float和Double進行精確計算的問題

file 2.4 設置數據有一個對比科學單個做到 Java中浮點型數據Float和Double進行精確計算的問題來源 https://www.cnblogs.com/banxian/p/3781130.html 一、浮點計算中發生精度丟失大

java中金額(浮點表示)的計算

java中進行金額的計算經常浮點數丟失精度,造成這種問題的原因應該與cpu對浮點數的計算方式有關,有下面的介紹:從原理上來講，任何一門語言對於浮點數的計算都是不精確的。因為現在的Computer都是基於二進位制數來儲存計算的。例如計算8＋3時，Computer會轉換為二進位

Java浮點數float，bigdecimal和double精確計算的精度誤差問題

1.double小數轉bigdecimal後四捨五入計算有誤差案例： double g= 12.35; BigDecimal bigG=new BigDecimal(g).setScale(1, BigDecimal.ROUND_HALF_UP); //期望

字節數組byte[]和整型,浮點型數據的轉換——Java代碼

amp gravity img 如何 class 機器保存 clas -m 近期在寫C++ socket和java socket之間的通信程序，涉及到整數浮點數的傳輸。須要從字節數組還原數據，查了一些資料。總結例如以下 1. 整數和浮點數的機器表示在機器

Java復習之整型自動轉換成浮點型

自動 string 自動轉換 oat 整型 fop ring java 轉換 class DataCon { 　　public static void main(String args[]) 　　{ 　　　　int nop1=2; 　　　　float fop2=2.25f;

JS浮點計算精度問題分析與解決

href 動態控制 hub 截斷 max fix math floating 方案問題描述在JS計算四則運算時會遇到精度丟失的問題，會引起諸多問題，看看以下例子：例如：在chrome控制臺輸入 0.1 + 0.7 輸出結果是 0.7999999999999999 例如

DSP定點與浮點計算

精度變量技術分享高精轉換關系例如 align 進制給定在定點DSP芯片中，采用定點數進行數值運算，其操作數一般采用整型數來表示。一個整型數的最大表示範圍取決於DSP芯片所給定的字長，一般為16位或24位。顯然，字長越長，所能表示的數的範圍越大，精度也越高。如無

java 浮點數值計算誤差

問題

原因

解決方案

詳解

IEEE 745規範定義

示例2.0-1.1預算

相關推薦