❶ 浮點數的取值范圍用二進製表示的
目前多數系統都按照ieee-754標准來規定浮點數的存儲格式。ieee754規定,單精度浮點數用4位元組存儲,雙精度浮點數用8位元組存儲,分為三個部分:符號位、階碼和尾數。階碼即指數,尾數即有效小數位數。單精度格式階碼佔8位,尾數佔24位,符號位1位,雙精度則為11位階碼,53位尾數和1位符號位,
顯然差別就出來了。即使都是4位元組存儲的單精度浮點數,還有不使用ieee754標準的,我記得字長32位的大型ibm系列機就是1位符號位,24位尾數,7位階碼,基數16,而不是2,與此標准不同。所以浮點數的表示範圍依賴的因素較多較復雜,主要取決於表示一個浮點數所用的位元組數和階碼的大小與長度。說法不一樣,但應該都是有根據的。
❷ 浮點數的表示範圍
目前多數系統都按照IEEE-754標准來規定浮點數的存儲格式。IEEE754規定,單精度浮點數用4位元組存儲,雙精度浮點數用8位元組存儲,分為三個部分:符號位、階碼和尾數。階碼即指數,尾數即有效小數位數。單精度格式階碼佔8位,尾數佔24位,符號位1位,雙精度則為11位階碼,53位尾數和1位符號位,
顯然差別就出來了。即使都是4位元組存儲的單精度浮點數,還有不使用IEEE754標準的,我記得字長32位的大型IBM系列機就是1位符號位,24位尾數,7位階碼,基數16,而不是2,與此標准不同。所以浮點數的表示範圍依賴的因素較多較復雜,主要取決於表示一個浮點數所用的位元組數和階碼的大小與長度。說法不一樣,但應該都是有根據的。
❸ IEEE 754啥意思java中float和double的存儲方式就是用IEEE 754表示嗎通俗一點講講,必採納
IEEE二進制浮點數算術標准(IEEE 754)是最廣泛使用的浮點數運算標准,它規定了四種表示浮點數值的方式:單精確度(32位元)、雙精確度(64位元)、延伸單精確度(43位元以上,很少使用)與延伸雙精確度(79位元以上,通常以80位元實做)。
2.1 實數的IEEE 754表示形式
一個實數V在IEEE 754標准中可以用V=(-1)s×M×2E 的形式表示[3,4],說明如下:
(1)符號s(sign)決定實數是正數(s=0)還是負數(s=1),對數值0的符號位特殊處理。
(2)有效數字M(significand)是二進制小數,M的取值范圍在1≤M<2或0≤M<1。
(3)指數E(exponent)是2的冪,它的作用是對浮點數加權。
2.2 浮點格式
浮點格式是一種數據結構,它規定了構成浮點數的各個欄位,這些欄位的布局,及其算術解釋[2]。IEEE 754浮點數的數據位被劃分為3個欄位,對以上參數值進行編碼:
(1)一個單獨的符號位s直接編碼符號s。
(2)k位的偏置指數e(e=ek-1…e1e0)編碼指數E,移碼表示。
(3)n位的小數f(fraction)(f=fn-1…f1f0)編碼有效數字M,原碼表示。
2.3 浮點數的分類
根據偏置指數e的值,被編碼的浮點數可分成三種類型。
(1)規格化數
當有效數字M在范圍1≤M<2中且指數e的位模式ek-1…e1e0既不全是0也不全是1時,浮點格式所表示的數都屬於規格化數。這種情況中小數f(0≤f<1 ) 的二進製表示為0. fn-1…f1f0。有效數字M=1+f,即M=1. fn-1…f1f0 (其中小數點左側的數值位稱為前導有效位) 。我們總是能調整指數E,使得有效數字M在范圍1≤M<2中,這樣有效數字的前導有效位總是1,因此該位不需顯示表示出來,只需通過指數隱式給出。
需要特別指出的是指數E要加上一個偏置值Bias,轉換成無符號的偏置指數e,也就是說指數E要以移碼的形式在存放計算機中。且e、E和Bias三者的對應關系為e=E+Bias,其中Bias=2k-1-1。
(2)非規格化數
當指數e的位模式ek-1…e1e0全為零(即e=0)時,浮點格式所表示的數是非規格化數。這種情況下,E=1-Bais,有效數字M=f=0. fn-1…f1f0 ,有效數字的前導有效位為0。
非規格化數的引入有兩個目的。其一是它提供了一種表示數值0的方法,其二是它可用來表示那些非常接近於0.0的數。
(3)特殊數
當指數e的位模式ek-1…e1e0全為1時,小數f的位模式fn-1…f1f0全為0(即f=0)時,該浮點格式所表示的值表示無窮,s=0 時是+∞,s=1時是-∞。
當指數e的位模式ek-1…e1e0全為1時,小數f的位模式fn-1…f1f0不為0(fn-1、…、f1、f0、至少有一個非零即f≠0)時,該浮點格式所表示的值被稱為NaN(Not a Number)。比如當計算 或∞-∞時用作返回值,或者用於表示未初始化的數據。
3 IEEE 754浮點存儲格式
與浮點格式對應,浮點存儲格式規定了浮點格式在存儲器中如何存放。IEEE標準定義了這些浮點存儲格式,但具體選擇哪種存儲格式由實現工具(程序設計語言)決定。
匯編語言軟體有時取決於所使用的存儲格式,但更高級的語言通常僅處理浮點數據類型的語言概念。這些浮點數據類型在不同高級語言中有不同的名字,相應的IEEE格式如表1。
表1 IEEE 格式和語言類型
IEEE精度 C,C++ FORTRAN
單精度 float REAL or REAL*4
雙精度 double DOUBLE PRECISION or REAL*8
擴展雙精度 long double REAL*16 [僅適用於SPARC和PowerPC]
IEEE 754標准准確地定義了單精度和雙精度浮點格式,並為這兩種基本格式的分別定義了擴展格式,表1里擴展雙精度格式是IEEE標準定義的擴展雙精度類中的一種。
下面詳細討論在Intel x86和SPARC平台上使用的三種IEEE浮點存儲格式。
3.1 單精度格式
IEEE單精度浮點格式共32位,包含三個構成欄位:23位小數f,8位偏置指數e,1位符號s。將這些欄位連續存放在一個32位字里,並對其進行編碼。其中0:22位包含23位的小數f; 23:30位包含8位指數e;第31位包含符號s。如圖1所示。
圖1 單精度存儲格式
一般地,32位字的第0位存放小數f的最低有效位LSB(the least significant bit),第22位存放小數f的最高有效位MSB(the most significant bit);第23位存放偏置指數的最低有效位LSB,第30位存放偏置指數的最高有效位MSB;最高位,第31位存放符號s。
3.2 雙精度格式
IEEE雙精度浮點格式共64位,佔2個連續32位字,包含三個構成欄位:52位的小數f,11位的偏置指數e,1位的符號位s。將這2個連續的32位字整體作為一個64位的字,進行重新編號。其中0:51位包含52位的小數f;52:62位包含11位的偏置指數e;而最高位,第63位包含符號位s。如圖2所示。
圖 2 雙精度浮點數的存儲格式
f[31:0]存放小數f的低32位,其中第0位存放整個小數f的最低有效位LSB,第31位存放小數f的低32位的最高有效位MSB。
在另外的32位的字里,第0 到19位,即f[51:32],存放小數f的最高的20位,其中第0位存放這20位最高有效數中的最低有效位LSB,第19位存放整個小數f的最高有效位MSB。第20到30位,即e[52:62],存放11位的偏置指數e,其中第20位存放偏置指數的最低有效位LSB,第30位存放最高有效位MSB。最高位,第31位存放符號位s。
在Intel x86結構計算機中,數據存放採用小端法(little endian),故較低地址的32位的字中存放小數f的f[31:0]位。而在在SPARC結構計算機中,因其數據存放採用大端法(big endian),故較高地址的32位字中存放小數f的f[31:0]位。
3.3 擴展雙精度格式
⑴ 擴展雙精度格式(SPARC 結構計算機)
該4倍精度浮點環境符合IEEE關於擴展雙精度格式的定義。該浮點環境的4倍精度浮點格式共128位,佔4個連續32位字,包含3個構成欄位:112位的小數f,15位的偏置指數e,和1位的符號s。將這4個連續的32位字整體作為一個128位的字,進行重新編號。其中0:110位包含小數f;112:126位包含偏置指數e;第127位包含符號位s。如圖3所示。
在SPARC結構計算機中,地址最高的32位字存放小數的32位最低有效位,即f[31:0];但是在PowerPC結構計算機中,卻是地址最低的32位字存放這些位。
緊鄰的兩個32位字(在SPARC機中向下計算,在PowerPC機中向上計算)分別存放f[63:32]和f[95:64]。
最後一個字的第0到15位存放小數的最高16位,即f[111:96]。其中第0位存放該16位的最低有效位,第15位存放整個小數f的最高有效位。第16到30位存放15位的偏置指數e,其中第16位存放偏置指數的最低有效位,第30位存放它的最高有效位。最高位,第31位存放符號s。
圖 3 擴展雙精度存儲格式 (SPARC 結構計算機)
⑵ 擴展雙精度格式(Intel x86結構計算機)
該浮點環境雙精度擴展格式符合IEEE雙精度擴展格式的定義。該浮點環境的擴展雙精度格式共80位,佔3個連續32位字,包含四個構成欄位:63位的小數f,1位顯式前導有效位(explicit leading significand bit)j,15位偏置指數e,和1位符號位s。將這3個連續的32位字整體作為一個96位的字,進行重新編號。其中0:63包含63位的小數f,第63位包含前導有效位j,64:78位包含15位的偏置指數e,最高位第79位包含符號位s。
在Intel結構系計算機中,這些欄位依次存放在十個連續的位元組中。但是,由於 UNIX System V Application Binary Interface Intel 386 Processor Supplement (Intel ABI) 要求雙精度擴展參數,從而佔用堆棧中3個相連地址的32位字,其中最高一個字的高16位未被使用,如圖4所示。
圖4 擴展雙精度存儲格式(Intel x86結構計算機)
地址最低的32位字存放小數f的低32位,即f[31:0]。其中第0位存放整個小數f的最低有效位LSB 第31位存放小數低32位的最高有效位MSB。
地址居中的32位字,第0到30位存放小數f的31位最高位,即f[62:32]。其中第0位存放31位最高小數位的最低有效位LSB,第30位存放整個小數的最高有效位,地址居中的32位字的最高位第31位存放顯式的前導有效位j。
地址最高32位字里,第0到14位存放15位的偏置指數e,第0位存放偏置指數的最低有效位LSB,第14位存放最高有效位MSB,第15位存放符號位s。雖然地址最高的32位字的高16位在Intel x86結構系列機種未被使用,但他們對符合Intel ABI的規定來說,是必需的。
4 總結
以上討論了Intel x86、Power PC和SPARC平台上使用的三種IEEE 754浮點數格式及其存儲格式,下面對浮點數的相關參數進行總結,具體見表2。
表2 IEEE 浮點格式參數總結
參數 浮點格式
單精度 雙精度 擴展雙精度(Intel x86) 擴展雙精度(SPARC)
小數f寬度n 23 52 63 112
前導有效位 隱含 隱含 顯式 隱含
有效數字M精度p 24 53 64 113
偏置指數寬度k 8 11 15 15
偏置值Bias +127 +1023 +16383 +16383
符號位寬度 1 1 1 1
存儲格式寬度 32 64 80 128
參考文獻
[1] David Goldberg with Doug Priest. What Every Computer Scientist Should Know about Floating-Point Arithmetic. http://grouper.ieee.org/
[2] Sun Corporation.Numerical Computation Guide, pp1-11. http://docs.sun.com
[3] Randal E.Bryant,David O'Hallaron. Computer Systems Aprogrammer』s Perspective(英文版) [M] .北京:電子工業出版社,2004
[4]David A. Patterson, John L. Hennessy.Computer Organization & Design: The Hardware/Software Interface. (英文版 第二版) [M] . 北京:機械工業出版社,1999.275~321
❹ IEEE 754浮點表示法的范圍是怎麼計算的
標准表示法
為便於軟體的移植,浮點數的表示格式應該有統一標准.1985年IEEE(Institute of
Electrical and Electronics
Engineers)提出了IEEE754標准.該標准規定基數為2,階碼E用移碼表示,尾數M用原碼表示,根據原碼的規格化方法,最高數字位總是1,該
標准將這個1預設存儲,使得尾數表示範圍比實際存儲的一位.實數 的IEEE754標準的浮點數格式為:
具體有三種形式:
表3 IEEE754三種浮點數的格式參數
浮點數
類型 存儲位數 偏移值( )
階碼E的取值范圍 真值表達式
數符(s) 階碼(E) 尾數(M) 總位數 十六進制 十進制
短實數 1 8 23 32 7FH 127 1~254
長實數 1 11 52 64 3FFH 1023 1~2046
臨時實數 1 15 64 80 3FFFH 16383 1~32766
對於階碼為0或為255(2047)的情況,IEEE有特殊的規定,由於篇幅有限,在此不討論.
在浮點數總位數不變的情況下,其精度值與范圍值是矛盾的,因此一般的機器都提供有單、雙精度兩種格式.表4中列出了IEEE754單精度浮點數的表示範圍,對於雙精度只需要修改一下偏移值和尾數位數即可.
表4 IEEE754單精度、雙精度浮點數范圍
典型範圍 浮點數代碼 真 值
數符(Ms) 階碼(E) 尾數(M)
最大正數
最小正數
絕對值最大的負數
絕對值最小的負數 0
0
1
1 11111110
00000001
11111110
00000001 11………11
00………00
11………11
00………00
標
准浮點數的存儲格式與圖1(b)相似,只是在尾數中隱含存儲著一個1,因此在計算尾數的真值時比一般形式要多一個整數1.對於階碼E的存儲形式因為是
127的偏移,所以在計算其移碼時與人們熟悉的128偏移不一樣,正數的值比用128偏移求得的少1,負數的值多1,為避免計算錯誤,方便理解,常將E當
成二進制真值進行存儲.例如:將數值-0.5按IEEE754單精度格式存儲,先將-0.5換成二進制並寫成標准形式:-0.510=-0.12=-
1.0×2-12,這里s=1,M為全0,E-127=-1,E=12610=011111102,則存儲形式為:
1 01111110 000000000000000000000000=BE00000016
這里不同的下標代表不同的進制.
❺ IEEE 754格式是什麼
IEEE二進制浮點數算術標准(IEEE 754)是最廣泛使用的浮點數運算標准,它規定了四種表示浮點數值的方式:單精確度(32位元)、雙精確度(64位元)、延伸單精確度(43位元以上,很少使用)與延伸雙精確度(79位元以上,通常以80位元實做)。
浮點數
在 C 語言中,有兩種存儲浮點數的方式,分別是 float 和 double ,當然了還有long double。這幾種浮點型所容納的長度不同,當然它們存儲的精度也就不同了。
對於整形而言,比如 int 、short 、char 之類的,在內存中的存儲方式都是用補碼進行表示。而浮點數在內存中並沒有使用補碼進行表示。浮點數在內存中存儲的方式使用了IEEE的編碼表示方式,即使用符號、指數和尾數的形式進行存儲的。
❻ IEEE754浮點數表示法中階碼的范圍是多少
階碼 E = 實際指數 e + 偏移量。
階碼 E 是八位。
最小:0000 0000(十進制 0);
最大:1111 1111(十進制 255)。
全 0 全 1 時,已有定義,就不詳細說了。
E,只能用:1 ~ 254。
那麼,偏移量選 128,e 只能是:-127~+126。
如果,偏移量選 127,e 就能是:-126~+127。
選後者,浮點數最大值的范圍,就是前者的兩倍!
❼ 無法理解IEEE754規定中指數部分實際取值范圍是-127~128,而不是-127~127或-128~127
實際的指數值 E = e - Bias, e就是8位指數域的編碼制(作為無符號數), 取值范圍為0-255 (但e=0和255作為特殊用途.Bias = 127, 那麼 E的范圍就應該為-126~127。
當e= 0時,E = 1 - Bias , 用來表示0附近的數,0.fnfn-1...f1f0
當e = 255時,如果fraction部分也是0,用來表示無窮大,符號位為1表示負無窮大,0表示正無窮大
如果fraction部分非0,表示NaN, 即 Not a number.
❽ ieee754標準的32位浮點規格化數是多少
ieee754標準的32位浮點規格化數是。
第一,先轉換為二進制數,第二,轉化為規格化數,第三,按1823轉化。
27/64=0.421875用二進制數表示為0.011011=1.1011×e^(-2)。
E=e+127=125用二進制數表示為01111101。
M=1011。
S=0。
SEM即:。
單精度浮點數極值情況規定,最大的非規約數實際指數為-126,有偏移指數為0,指數域為00000000;最大的規約數實際指數為127,有偏移指數為254,指數域為11111110。
IEEE754標準的相關要求規定:
1、對於一個數,其二進制科學計數法表示下的指數的值,為指數的實際值;而根據IEEE 754標准對指數部分的編碼的值,為浮點數表示法指數域的編碼值。
2、指數偏差(表示法中的指數為實際指數減掉某個值)為 ,其中的e為存儲指數的比特的長度。減掉一個值為指數必須是有號數才能表達很大或很小的數值,但是有號數通常的表示法——補碼,將會使比較變得困難。
計算機組成原理:
若不對浮點數的表示作出明確規定,同一個浮點數的表示就不是唯一的。例如,十進制數可以表示成1.11×100,0.111×101,0.0111×102等多種形式。
❾ IEEE754是什麼
IEEE754代碼
標准表示法
為便於軟體的移植,浮點數的表示格式應該有統一標准(定義)。1985年IEEE(Institute of Electrical and Electronics Engineers)提出了IEEE754標准。該標准規定基數為2,階碼E用移碼表示,尾數M用原碼表示,根據原碼的規格化方法,最高數字位總是1,該標准將這個1預設存儲,使得尾數表示範圍比實際存儲的一位。實數 的IEEE754標準的浮點數格式為:
具體有三種形式:
表3 IEEE754三種浮點數的格式參數
浮點數
類型 存儲位數 偏移值( )
階碼E的取值范圍 真值表達式
數符(s) 階碼(E) 尾數(M) 總位數 十六進制 十進制
短實數 1 8 23 32 7FH 127 1~254
長實數 1 11 52 64 3FFH 1023 1~2046
臨時實數 1 15 64 80 3FFFH 16383 1~32766
對於階碼為0或為255(2047)的情況,IEEE有特殊的規定。
在浮點數總位數不變的情況下,其精度值與范圍值是矛盾的,因此一般的機器都提供有單、雙精度兩種格式。表4中列出了IEEE754單精度浮點數的表示範圍,對於雙精度只需要修改一下偏移值和尾數位數即可。
表4 IEEE754單精度、雙精度浮點數范圍
典型範圍 浮點數代碼 真 值
數符(Ms) 階碼(E) 尾數(M)
最大正數
最小正數
絕對值最大的負數
絕對值最小的負數 0
0
1
1 11111110
00000001
11111110
00000001 11………11
00………00
11………11
00………00
標准浮點數的存儲格式與圖1(b)相似,只是在尾數中隱含存儲著一個1,因此在計算尾數的真值時比一般形式要多一個整數1。對於階碼E的存儲形式因為是 127的偏移,所以在計算其移碼時與人們熟悉的128偏移不一樣,正數的值比用128偏移求得的少1,負數的值多1,為避免計算錯誤,方便理解,常將E當成二進制真值進行存儲。例如:將數值-0.5按IEEE754單精度格式存儲,先將-0.5換成二進制並寫成標准形式:-0.510=-0.12=-1.0×2-12,這里s=1,M為全0,E-127=-1,E=12610=011111102,則存儲形式為:
1 01111110 000000000000000000000000=BE00000016
這里不同的下標代表不同的進制。
❿ IEEE754的范圍是10^-38~10^38,為什麼還可以表示最大正整數2^128-2^104
單精度浮點32位,其中指數段有8bits,指數范圍為[-127,127] 2的127次方約等於1.7*10的38次方。 38次方是數量級,所以得出命題結論。