【C語言】浮點數的祕密
阿新 • • 發佈:2022-05-10
目錄
IEEE 754 標準
儲存方式:符號位,指數,尾數
IEEE 浮點數算術標準:IEEE 754
型別 | 符號位 | 指數 | 尾數 |
---|---|---|---|
float | 1 | 8 | 23 |
double | 1 | 11 | 52 |
以 float 為例,討論浮點數。
浮點型別與整數型別的記憶體表示方法不同,浮點型別的記憶體表示法相對複雜。
根據 IEEE 754 標準,float 將自身 32bits 分成三個部分,符號位 S 佔 1bit,指數 E 佔 8bits,尾數 M 佔 23bits。
下面用一個共用體討論 float 型別的記憶體表示。
union { float f; //真值 struct { uint32_t M : 23; // 指數 uint32_t E : 8; // 尾數 uint32_t S : 1; //符號位 }; uint32_t v; //機器碼 } f;
浮點數計算公式:
$$f = (-1){S}2{E-127}1.M$$
舉個例子:已知機器碼 f.v = 0x41360000,求真值 f.f。
- 機器碼展開成二進位制 0x41360000 -> 0b0100 0001 0011 0110 0000 0000 0000 0000;切分得到 S = 0b0 = 0x0 = 0,E = 0b100 0001 0 = 0x82 = 130,M = 0b011 0110 0000 0000 0000 0000 = 0x360000;
- 1.M 為二進位制小數計算,根據 S 和 E 得正號乘 2 的立方乘 1.M,即小數點右移動三位,真值 f.f = 0b1011.011 = 11.375。
程式碼驗證:
#include <stdio.h> #include <stdint.h> union uFloat { float f; //真值 struct { uint32_t M : 23; // 指數 uint32_t E : 8; // 尾數 uint32_t S : 1; //符號位 }; uint32_t v; //機器碼 } f; void uPrintln(union uFloat uf) { printf("f: %f\nS: 0x%x, E: 0x%x, M: 0x%x\nv: 0x%08x\n", uf.f, uf.S, uf.E, uf.M, uf.v); } int main(void) { f.v = 0x41360000; uPrintln(f); printf("sizeof: %d\n", sizeof(f)); return 0; }
輸出:
f: 11.375000
S: 0x0, E: 0x82, M: 0x360000
v: 0x41360000
sizeof: 4
不精確的型別
在有限的位數裡,浮點型別比 uint32_t 表達了更大的範圍,導致部分資料丟失,不能表示所有準確的數值,是一種不精確的型別。
比如開區間 (338291141358099960719503586036763590656.0,339620349071475272940736969149792649216.0)中,至少有 4202553 個整數皆不能正常表示。
int main(void) { f.f = 338291141358099960719503586036763599657.000000; uPrintln(f); return 0; }
輸出:
f: 338291141358099960719503586036763590656.000000
S: 0x0, E: 0xfe, M: 0x7e8081
v: 0x7f7e8081
浮點型資料越接近零值,誤差越小,反之越大。
驗證
通過兩個簡單的程式驗證這個結論。
這個 C 程式的作用是增加機器碼間隔取樣對應的浮點數,並列印到表格檔案中。
#include <stdio.h>
#include <stdint.h>
union
{
float f;
struct
{
uint32_t M : 23; // 指數
uint32_t E : 8; // 尾數
uint32_t S : 1; //符號位
};
int32_t i;
} u;
void uPrintln(float f)
{
u.f = f;
printf("i: %d, f: %f, S: %d, E: %d, M: %d\n", u.i, u.f, u.S, u.E, u.M);
}
void ufPrintln(float f, FILE *fp)
{
u.f = f;
fprintf(fp, "%d,0x%08x,%f,%d,%d,%d,\n", u.i, u.i, u.f, u.S, u.E, u.M);
}
void pPrintfln(uint32_t cur, uint32_t max)
{
static uint64_t tmp = 0;
uint64_t pten = cur * 100 / max;
if (tmp != pten)
{
tmp = pten;
printf("\rprocessing: %d", pten);
}
}
#define MAX UINT32_MAX
#define INT UINT16_MAX
int main(void)
{
FILE *fp = NULL;
fp = fopen("float.csv", "w+");
if (fp == NULL)
{
printf("open error!\n");
return -1;
}
printf("open successful!\n");
fprintf(fp, "i,i,f,S,E,M,\n");
for (uint32_t i = 0; i < MAX; i += INT)
{
u.i = i;
ufPrintln(u.f, fp);
pPrintfln(i, MAX);
}
fclose(fp);
return 0;
}
這個 python 檔案的作用是讀取表格檔案,描點作圖。
import matplotlib.pyplot as plt
import pandas as pds
data = pds.read_csv('./float.csv')
data.plot(x="i.1", y="f")
plt.show()
可見,當機器碼增加到一定程度時,浮點數值開始指數級變化,這就表示在兩個相鄰的機器碼之間,跨越、丟失的浮點數越多。
交流
微信公眾號:物聯指北
B站:物聯指北
千人企鵝群:658685162