1. 程式人生 > 其它 >【C語言】浮點數的祕密

【C語言】浮點數的祕密

目錄

IEEE 754 標準

儲存方式:符號位,指數,尾數
IEEE 浮點數算術標準:IEEE 754

型別 符號位 指數 尾數
float 1 8 23
double 1 11 52

以 float 為例,討論浮點數。

浮點型別與整數型別的記憶體表示方法不同,浮點型別的記憶體表示法相對複雜。

根據 IEEE 754 標準,float 將自身 32bits 分成三個部分,符號位 S 佔 1bit,指數 E 佔 8bits,尾數 M 佔 23bits。

下面用一個共用體討論 float 型別的記憶體表示。

union
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指數
        uint32_t E : 8;  // 尾數
        uint32_t S : 1;  //符號位
    };
    uint32_t v; //機器碼
} f;

浮點數計算公式:
$$f = (-1){S}2{E-127}1.M$$

舉個例子:已知機器碼 f.v = 0x41360000,求真值 f.f。

  1. 機器碼展開成二進位制 0x41360000 -> 0b0100 0001 0011 0110 0000 0000 0000 0000;切分得到 S = 0b0 = 0x0 = 0,E = 0b100 0001 0 = 0x82 = 130,M = 0b011 0110 0000 0000 0000 0000 = 0x360000;
  2. 1.M 為二進位制小數計算,根據 S 和 E 得正號乘 2 的立方乘 1.M,即小數點右移動三位,真值 f.f = 0b1011.011 = 11.375。

程式碼驗證:

#include <stdio.h>
#include <stdint.h>

union uFloat
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指數
        uint32_t E : 8;  // 尾數
        uint32_t S : 1;  //符號位
    };
    uint32_t v; //機器碼
} f;

void uPrintln(union uFloat uf)
{
    printf("f: %f\nS: 0x%x, E: 0x%x, M: 0x%x\nv: 0x%08x\n", uf.f, uf.S, uf.E, uf.M, uf.v);
}

int main(void) {
    f.v = 0x41360000;
    uPrintln(f);
    printf("sizeof: %d\n", sizeof(f));
    return 0;
}

輸出:

f: 11.375000
S: 0x0, E: 0x82, M: 0x360000
v: 0x41360000
sizeof: 4

不精確的型別

在有限的位數裡,浮點型別比 uint32_t 表達了更大的範圍,導致部分資料丟失,不能表示所有準確的數值,是一種不精確的型別。

比如開區間 (338291141358099960719503586036763590656.0,339620349071475272940736969149792649216.0)中,至少有 4202553 個整數皆不能正常表示。

int main(void) {
    f.f = 338291141358099960719503586036763599657.000000;
    uPrintln(f);
    return 0;
}

輸出:

f: 338291141358099960719503586036763590656.000000
S: 0x0, E: 0xfe, M: 0x7e8081
v: 0x7f7e8081

浮點型資料越接近零值,誤差越小,反之越大。

驗證

通過兩個簡單的程式驗證這個結論。

這個 C 程式的作用是增加機器碼間隔取樣對應的浮點數,並列印到表格檔案中。

#include <stdio.h>
#include <stdint.h>

union
{
    float f;
    struct
    {
        uint32_t M : 23; // 指數
        uint32_t E : 8;  // 尾數
        uint32_t S : 1;  //符號位
    };
    int32_t i;
} u;

void uPrintln(float f)
{
    u.f = f;
    printf("i: %d, f: %f, S: %d, E: %d, M: %d\n", u.i, u.f, u.S, u.E, u.M);
}

void ufPrintln(float f, FILE *fp)
{
    u.f = f;
    fprintf(fp, "%d,0x%08x,%f,%d,%d,%d,\n", u.i, u.i, u.f, u.S, u.E, u.M);
}

void pPrintfln(uint32_t cur, uint32_t max)
{
    static uint64_t tmp = 0;
    uint64_t pten = cur * 100 / max;
    if (tmp != pten)
    {
        tmp = pten;
        printf("\rprocessing: %d", pten);
    }
}

#define MAX UINT32_MAX
#define INT UINT16_MAX

int main(void)
{
    FILE *fp = NULL;

    fp = fopen("float.csv", "w+");
    if (fp == NULL)
    {
        printf("open error!\n");
        return -1;
    }
    printf("open successful!\n");
    fprintf(fp, "i,i,f,S,E,M,\n");
    for (uint32_t i = 0; i < MAX; i += INT)
    {
        u.i = i;
        ufPrintln(u.f, fp);
        pPrintfln(i, MAX);
    }
    fclose(fp);

    return 0;
}

這個 python 檔案的作用是讀取表格檔案,描點作圖。

import matplotlib.pyplot as plt
import pandas as pds

data = pds.read_csv('./float.csv')
data.plot(x="i.1", y="f")
plt.show()

可見,當機器碼增加到一定程度時,浮點數值開始指數級變化,這就表示在兩個相鄰的機器碼之間,跨越、丟失的浮點數越多。

交流

微信公眾號:物聯指北
B站:物聯指北
千人企鵝群:658685162