單精度的浮點數有效數字為什麼是七位

1樓：假面

單精度數的尾數用23位儲存，加上預設的小數點前的1位1，2^(23+1) = 16777216。

因為 10^7 < 16777216 < 10^8，所以說單精度浮點數的有效位數是7位。

雙精度的尾數用52位儲存，2^(52+1) = 9007199254740992，

因為10^16 < 9007199254740992 < 10^17，所以雙精度的有效位數是16位。

擴充套件資料：

「浮點數的精度取決於尾數部分。尾數部分的位數越多，能夠表示的有效數字越多。」這句贊同，所以雙精度的有效位數肯定比單精度的多。

一個數如果有效位數大於7位如1.27893456076（12位），用float來表示就不能準確的儲存了。

執行:float a = 1.23456789076f;// --->a = 1.2345679

即用1.23456789076在計算機中儲存成float的格式只能逼近到第七位，

能不能準確儲存還取決於這個數字（十進位制數）能不能用有限的二進位制位數準確的表示。 float = 2.202 float = 2.25

如果小數部分轉化為二進位制時候得到一個無窮值，則會根據尾數部門的長度捨棄多餘的部分，從而儲存一個近似的浮點值，這就解釋了為什麼在比較浮點數值時候要做一個區間比較而不是等值比較。

溢位處理

浮點數的溢位是以其階碼溢位表現出來的。在加\減運算過程中要檢查是否產生了溢位：若階碼正常，加（減）運算正常結束；若階碼溢位，則要進行相應處理。另外對尾數的溢位也需要處理。

階碼上溢超過了階碼可能表示的最大值的正指數值，一般將其認為是+∞和－∞。

階碼下溢超過了階碼可能表示的最小值的負指數值，一般將其認為是0。

尾數上溢兩個同符號尾數相加產生了最高位向上的進位，將尾數右移，階碼增1來重新對齊。

尾數下溢在將尾數右移時，尾數的最低有效位從尾數域右端流出，要進行舍入處理。

2樓：匿名使用者

浮點數7位有效數字。

雙精度數16位有效數字。

浮點數取值範圍：

負數取值範圍為 -3.4028235e+38 到 -1.401298e-45，正數取值範圍為 1.401298e-45 到 3.4028235e+38。

雙精度數取值範圍：

負值取值範圍-1.79769313486231570e+308 到 -4.94065645841246544e-324，正值取值範圍為 4.

94065645841246544e-324 到 1.79769313486231570e+308。

c/c++中浮點數的表示遵循ieee 754標準。

一個浮點數由三部分組成：符號位s、指數部分e（階碼）以及尾數部分m（如下）。

floating

s--------e-------m

1位-----8位-----23位

double

s--------e-------m

1位-----11位----52位

十進位制數的換算計算公式為（n^m表示n的m次冪，b表示前面的數字是二進位制）：

s * 2^(e-127) * (1.m)b

浮點數的精度取決於尾數部分。尾數部分的位數越多，能夠表示的有效數字越多。

單精度數的尾數用23位儲存，加上預設的小數點前的1位1，2^(23+1) = 16777216。因為 10^7 < 16777216 < 10^8，所以說單精度浮點數的有效位數是7位。

雙精度的尾數用52位儲存，2^(52+1) = 9007199254740992，10^16 < 9007199254740992 < 10^17，所以雙精度的有效位數是16位。

另外：如果你在pi值的有效位後增加數字的話，結果是不會變化的，由於pi值是以常數方式賦值，可以在常數後面加個'f'，如pi = 3.1415926f;否則編譯器會先把常數當作double型別，然後再截斷後面的值變為浮點值，這樣的話，就有可能pi的值會有不同，造成你看到的現象。

3樓：

10^16 < 9007199254740992 這錯了吧！！！

10^15 < 9007199254740992<10^16

雙精度的有效位數是保證15位，部分資料可以取到16位。

4樓：

一個浮點數由三部分組成：符號位s、指數部分e（階碼）以及尾數部分m： floating

s--------e-------m

1位-----8位-----23位

浮點數的精度取決於尾數部分。尾數部分的位數越多，能夠表示的有效數字越多。

單精度數的尾數用23位儲存，加上預設的小數點前的1位1，2^(23+1) = 16777216。因為 10^7 < 16777216 < 10^8，所以說單精度浮點數的有效位數是7位。

單精度浮點數的精度為什麼是7位

5樓：重小樓

這個比較複雜，建議你找一下ieee754標準看一下。

這個簡單說一下吧：

在ieee754標準中進行了單精度浮點數(float)和雙精度數浮點數(double)的定義。float有32bit，double有64bit。它們的構成包括符號位、指數位和尾數位。

這些位的構成如下：

float---第31位(佔1bit)---第30-23位(佔8bit)----第22-0位(佔23bit)

double--第63位(佔1bit)---第62-52位(佔11bit)---第51-0位(佔52bit)

取值範圍主要看指數部分：

float的指數部分有8bit(2^8)，由於是有符號型，所以得到對應的指數範圍-128~128。

double的指數部分有11bit(2^11)，由於是有符號型，所以得到對應的指數範圍-1024~1024。

由於float的指數部分對應的指數範圍為-128~128，所以取值範圍為：

-2^128到2^128，約等於-3.4e38 — +3.4e38

精度(有效數字)主要看尾數位：

float的尾數位是23bit，對應7~8位十進位制數，所以有效數字有的編譯器是7位，也有的是8位

6樓：star犀利

因為尾數部分是23位(0-22)，而2^23是8388608，有7位，而指數跟符號只不過是有多少個0的問題，所以有效位數是7位。

c語言中單精度浮點數和雙精度分別如何表示？有什麼差別？

7樓：濫晴

float為單精度，dao記憶體中佔4個位元組，有效數版位是7位（因為有正負權，所以不是8位），在我的電腦且vc++6.0平臺中預設顯示是6位有效數字。

double為雙精度，佔8個位元組，有效數位是16位，但在我的電腦且vc++6.0平臺中預設顯示同樣是6位有效數字。

佔用位元組空間不同。

一個float變數佔用四位元組，一個double型別變數，一般佔用8位元組。

表示範圍不同。

float表示範圍為-3.4e-38～3.4e+38。double 表示範圍為-1.7e-308～1.7e+308。

精度不同。

float在表示十進位制時，有效數字為6到7位。double在表示十進位制時，有效數字為15到16位。

輸入輸出格式不同。

在c語言中，輸入輸出格式化字串，float使用%f，而double使用%lf。

8樓：匿名使用者

c語言中，單精度浮點copy型為float，雙精度浮點型為double。具體區別如下：

1、佔用位元組空間不同。

一個float變數佔用四位元組，一個double型別變數，一般佔用8位元組。

2、表示範圍不同。

float表示範圍為-3.4e-38～3.4e+38。

double 表示範圍為-1.7e-308～1.7e+308。

3、精度不同。

float在表示十進位制時，有效數字為6到7位。

double在表示十進位制時，有效數字為15到16位。

4、輸入輸出格式不同。

在c語言中，輸入輸出格式化字串，float使用%f，而double使用%lf。

python雙精度浮點數用什麼表示

單精度浮點數在機內佔4個位元組，用32位二進位制描述。雙精度浮點數在機內佔8個位元組，用64位二進位制描述。對程式設計人員來說，double 和 float 的區別是double精度高，有效數字16位，float精度7位。但double消耗記憶體是float的兩倍，double的運算速度比float...

浮點數所能表示的數值範圍和精度撒於什麼

浮點數所能表示的數值範圍和精度取決於階碼和尾數。階碼採用指數的實際值加上固定的偏移值的辦法表示浮點數的指數，好處是可以用長度為個位元的無符號整數來表示所有的指數取值，這使得兩個浮點數的指數大小的比較更為容易，實際上可以按照字典序比較兩個浮點表示的大小。這種移碼錶示的指數部分，中文稱作階碼。定點數...

為什麼雙精度有16位有效數字，單精度有7位

浮點數7位有效數字。雙精度數16位有效數字。浮點數取值範圍負數取值範圍為 3.4028235e 38 到 1.401298e 45，正數取值範圍為 1.401298e 45 到 3.4028235e 38。雙精度數取值範圍負值取值範圍 1.79769313486231570e 308 到 4.9...

單精度的浮點數有效數字為什麼是七位

python雙精度浮點數用什麼表示

浮點數所能表示的數值範圍和精度撒於什麼

為什麼雙精度有16位有效數字，單精度有7位

相關推薦