電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 26|回復(fù): 0
收起左側(cè)

浮點(diǎn)數(shù)精度問題全解析

[復(fù)制鏈接]

502

主題

502

帖子

3383

積分

四級(jí)會(huì)員

Rank: 4

積分
3383
跳轉(zhuǎn)到指定樓層
樓主
0、導(dǎo)讀這篇文章主要探討了浮點(diǎn)數(shù)在計(jì)算機(jī)中的表示、存儲(chǔ)和精度問題。通過詳細(xì)的解釋和示例,您將了解浮點(diǎn)數(shù)誤差的根源。文章內(nèi)容較多,大約3700余字,閱讀時(shí)間約為10分鐘,建議先收藏,待有空時(shí)再細(xì)細(xì)品讀。
1、引言0.1 + 0.2 為什么不等于 0.3 ?
當(dāng)被問及浮點(diǎn)數(shù)為何存在誤差時(shí),你將如何回答?
沒看完這篇文章之前你可能會(huì)回答:"哼,反正我就知道有誤差..."
閱讀完這篇文章后,你將能夠更準(zhǔn)確地回答這類問題,讓我們開始這段學(xué)習(xí)之旅吧!
2、浮點(diǎn)數(shù)存儲(chǔ)格式浮點(diǎn)型在內(nèi)存中的存儲(chǔ)不是像整形那樣直接存儲(chǔ)的,而是用一種二進(jìn)制的科學(xué)計(jì)數(shù)法來表示的,具體的數(shù)學(xué)表達(dá)式為
V = (-1) s × M × 2 e其中,e = E - 127
在計(jì)算機(jī)科學(xué)領(lǐng)域,IEEE 754 是一種標(biāo)準(zhǔn),用于定義浮點(diǎn)數(shù)的表示方法,浮點(diǎn)型數(shù)據(jù)的存儲(chǔ)格式如下

請(qǐng)務(wù)必記住,尾數(shù)存儲(chǔ)用原碼,階碼存儲(chǔ)用移碼
  • S(符號(hào)位):0代表正數(shù),1代表負(fù)數(shù)。
  • E(階碼):指數(shù)字段需要同時(shí)表示正指數(shù)和負(fù)指數(shù)。為了得到存儲(chǔ)的指數(shù),在實(shí)際指數(shù)上加一個(gè)偏置,其中e=E-127。
  • M(尾數(shù)):一個(gè)規(guī)范化尾數(shù)就是小數(shù)點(diǎn)左邊只有一個(gè)1,然后是小數(shù)點(diǎn)后面的尾數(shù)部分。注意本文后續(xù)使用的e表示科學(xué)計(jì)數(shù)法中的指數(shù)部分,E表示存儲(chǔ)格式中的階碼,默認(rèn)的對(duì)象都指單精度的浮點(diǎn)數(shù)。
    3、轉(zhuǎn)換流程接下來我選擇了一個(gè)戀愛腦的數(shù)字,將1314.520轉(zhuǎn)換到32位單精度IEEE 754二進(jìn)制浮點(diǎn)表示標(biāo)準(zhǔn)。
    3.1、將整數(shù)部分轉(zhuǎn)換為二進(jìn)制將整數(shù)部分反復(fù)除以2,并記錄每次的余數(shù),直到商為0為止。
    division = quotient + remainder;
    1314 ÷ 2 = 657 + 0;
    657  ÷ 2 = 328 + 1;
    328  ÷ 2 = 164 + 0;
    164  ÷ 2 = 82  + 0;
    82   ÷ 2 = 41  + 0;
    41   ÷ 2 = 20  + 1;
    20   ÷ 2 = 10  + 0;
    10   ÷ 2 = 5   + 0;
    5    ÷ 2 = 2   + 1;
    2    ÷ 2 = 1   + 0;
    1    ÷ 2 = 0   + 1;
    從上面構(gòu)造的列表的底部開始取所有余數(shù),即為整數(shù)部分的二進(jìn)制表示。131410=101 0010 00102
    3.2、將小數(shù)部分轉(zhuǎn)為二進(jìn)制將小數(shù)部分不斷乘以2,并記錄每次的整數(shù)部分,直到小數(shù)部分為0或達(dá)到所需的精度為止
    #) multiplying = integer + fractional part;
    1) 0.52 × 2 = 1 + 0.04;
    2) 0.04 × 2 = 0 + 0.08;
    3) 0.08 × 2 = 0 + 0.16;
    4) 0.16 × 2 = 0 + 0.32;
    5) 0.32 × 2 = 0 + 0.64;
    6) 0.64 × 2 = 1 + 0.28;
    7) 0.28 × 2 = 0 + 0.56;
    8) 0.56 × 2 = 1 + 0.12;
    9) 0.12 × 2 = 0 + 0.24;
    10) 0.24 × 2 = 0 + 0.48;
    11) 0.48 × 2 = 0 + 0.96;
    12) 0.96 × 2 = 1 + 0.92;
    13) 0.92 × 2 = 1 + 0.84;
    14) 0.84 × 2 = 1 + 0.68;
    15) 0.68 × 2 = 1 + 0.36;
    16) 0.36 × 2 = 0 + 0.72;
    17) 0.72 × 2 = 1 + 0.44;
    18) 0.44 × 2 = 0 + 0.88;
    19) 0.88 × 2 = 1 + 0.76;
    20) 0.76 × 2 = 1 + 0.52;
    21) 0.52 × 2 = 1 + 0.04;
    22) 0.04 × 2 = 0 + 0.08;
    23) 0.08 × 2 = 0 + 0.16;
    24) 0.16 × 2 = 0 + 0.32;
    雖然我們沒有得到任何等于0的小數(shù)部分,但是我們有足夠的迭代(超過尾數(shù)限制)。
    從頂部開始依次取乘法運(yùn)算的所有整數(shù)部分,即為小數(shù)部分的二進(jìn)制:0.5210=0.1000 0101 0001 1110 1011 10002
    3.3、規(guī)范化前面得出了整數(shù)以及小數(shù)部分的二進(jìn)制表示,合并以后即:
    1314.5210= 101 0010 0010.1000 0101 0001 1110 1011 10002
    將小數(shù)點(diǎn)向左移動(dòng) 10 位,使其左邊只剩下一位非零的數(shù)字
    1314.5210= 101 0010 0010.1000 0101 0001 1110 1011 10002= 101 0010 0010.1000 0101 0001 1110 1011 10002 ×2 0= 1.0100 1000 1010 0001 0100 0111 1010 1110 002 ×2 10
    再回顧一下浮點(diǎn)數(shù)的數(shù)學(xué)表達(dá)式 V = (-1) s × M × 2 e 由此可知
    s = 0
    M = 1.0100 1000 1010 0001 0100 0111 1010 1110 00
    e = 10
    3.4、調(diào)整階碼根據(jù)規(guī)范化得知指數(shù) e = 10,又根據(jù)公式 e = E - 127 可得知道 E=137,所以八位階碼的二進(jìn)制表示如下所示:
    E = 13710 = 1000 10012
    3.5、尾數(shù)舍入由第三步規(guī)范化得出的尾數(shù)M有34位,但是存儲(chǔ)格式中尾數(shù)只有23位,下面劃線的是多出的部分,所以需要對(duì)尾數(shù)按照一定的方式進(jìn)行四舍五入。
    M = 1. 0100 1000 1010 0001 0100 011 1 1010 1110 00
    一共有四種舍入方式,
  • 向偶數(shù)舍入,就近舍入(默認(rèn))。
  • 朝0舍入:即朝數(shù)軸零點(diǎn)方向舍入,即直接截尾。
  • 朝正無窮舍入:對(duì)正數(shù)而言,只要多余位不全為0則向最低有效位進(jìn)1;負(fù)數(shù)則直接截尾。
  • 朝負(fù)無窮舍入:對(duì)負(fù)數(shù)而言,向最低有效位進(jìn)1;正數(shù)若多余位不全部為0則簡單截尾。向偶數(shù)舍入,簡單理解就要讓尾數(shù)的最后一位為0,讓其保持偶數(shù),能夠被2整除。當(dāng)尾數(shù)的最低位為0時(shí),已經(jīng)是屬于偶數(shù)了,無需處理。當(dāng)尾數(shù)最低位為1時(shí),需要加1,使其保持偶數(shù)。
    因?yàn)楸纠?jì)算出尾數(shù)的最后一位為1,按照就近舍入(向偶舍入)原則需要加1使其保持偶數(shù)。
    所以經(jīng)過調(diào)整后的M為
    M = 0100 1000 1010 0001 0100 011 + 1
    M = 0100 1000 1010 0001 0100 100
    3.6、組三元素根據(jù)前面的步驟可以得知
    s = 0
    E = 1000 1001 2
    M = 0100 1000 1010 0001 0100 100 2
    1324.5210 = 0-1000 1001-0100 1000 1010 0001 0100 1002
    我們?nèi)ヒ粋(gè)轉(zhuǎn)換網(wǎng)站上驗(yàn)證一下轉(zhuǎn)換結(jié)果,網(wǎng)站鏈接放在文章末尾了。

    floatConverterIEEE754可以看到,跟我們轉(zhuǎn)換的結(jié)果是相同的,說明網(wǎng)站轉(zhuǎn)換也是選擇向偶數(shù)舍入的。
    4、單/雙精度浮點(diǎn)數(shù)比較4.1、存儲(chǔ)格式類型符號(hào)位指數(shù)長度(Bit)尾數(shù)長度(Bit)float1823double111524.2、精度浮點(diǎn)數(shù)的精度是由尾數(shù)的位數(shù)來決定的。
    對(duì)于float型浮點(diǎn)數(shù),尾數(shù)部分23位,換算成十進(jìn)制就是 2^23=8388608,所以十進(jìn)制精度只有6 ~ 7位;
    這里的數(shù)字6和7可能會(huì)引起疑問,如何理解它們呢?
    由于浮點(diǎn)數(shù)尾數(shù)的舍入問題,最后一位可能存在舍入誤差,因此不完全準(zhǔn)確。因此,可以準(zhǔn)確表示的是后六位,而第七位則可能含有誤差。
    對(duì)于double型浮點(diǎn)數(shù),尾數(shù)部分52位,換算成十進(jìn)制就是 2^52 = 4503599627370496,所以十進(jìn)制精度只有15 ~ 16位
    類型有效位字節(jié)數(shù)float6 - 74double15 - 1684.3、浮點(diǎn)數(shù)范圍類型最小值最大值float1.175494351 E - 383.402823466 E + 38double2.2250738585072014 E - 3081.7976931348623158 E + 3084.4、浮點(diǎn)數(shù)比較浮點(diǎn)數(shù)的比較通常用兩數(shù)之差的絕對(duì)值小于一個(gè)自定義的數(shù)值時(shí),代表兩者相等,如下所示:
    /**
    *Author:(公眾號(hào):typedef)
    */
    #define FLOAT_EPSILON (0.000001) //Define your own tolerance
    #define FloatIsEqual(a, b) ((fabs((a)-(b)))
    另外一種方法是將浮點(diǎn)數(shù)同時(shí)放大一個(gè)倍數(shù),然后轉(zhuǎn)成整數(shù)之間的比較,比如同時(shí)放大10000倍等。
    5、階碼相關(guān)問題探索首先階碼E是用移碼表示的,那么問題來了,什么叫移碼?移碼怎么計(jì)算?移碼的含義是?浮點(diǎn)數(shù)為什么要用移碼表示?
    在解答這些知識(shí)點(diǎn)時(shí),我們需要下面兩點(diǎn)需要達(dá)成一致
  • 階碼使用的是非標(biāo)準(zhǔn)移碼
  • 階碼是一個(gè)無符號(hào)的整數(shù)5.1、什么是移碼移碼是補(bǔ)碼表示中最高符號(hào)位取反的結(jié)果。舉個(gè)例子,上面計(jì)算1314.52時(shí),指數(shù)是為10的。
    +1010 = 0000 10102(真值)
    原碼:0000 1010
    反碼:0000 1010
    補(bǔ)碼:0000 1010
    移碼:1000 1010
    所以10對(duì)應(yīng)標(biāo)準(zhǔn)的移碼 1000 1010 。
    5.2、如何計(jì)算移碼注意浮點(diǎn)數(shù)中移碼的計(jì)算是非標(biāo)準(zhǔn)的,僅偏移2n-1-1=127。所以移碼的計(jì)算公式如下所示,其中n為階碼的位數(shù):
    E = e + 2 n-1 - 1
    E = e + 127
    所以10對(duì)應(yīng)的移碼為137。
    5.3、為什么要用移碼表示它通過將數(shù)值加上一個(gè)固定的偏移量,使得原本可能是負(fù)數(shù)的數(shù)值變?yōu)榉秦?fù)數(shù),從而簡化了計(jì)算機(jī)中有符號(hào)數(shù)的表示和比較操作。使得計(jì)算機(jī)能夠直接使用整數(shù)運(yùn)算來比較浮點(diǎn)數(shù)的大小。
    6、指數(shù)e6.1、指數(shù)范圍浮點(diǎn)數(shù)指數(shù)部分的實(shí)際取值范圍是 [-2(e-1)+2, 2(e-1)-1],其中 e 為指數(shù)所占位數(shù)。32位浮點(diǎn)數(shù),指數(shù)占8位,實(shí)際取值范圍是 [-126, 127]。
    -127用作表示0,128 用作表示無窮大和 NaN。NaN 是 "Not a Number" 的縮寫,中文意思是“非數(shù)字”,通常用于表示一個(gè)未定義或不可表示的值。
    換言之,8位階碼的表示范圍是[0, 255],其中0和255用于表示特殊值。因此,根據(jù)公式推導(dǎo),指數(shù)e的實(shí)際取值范圍是[-126, 127]。
    6.2、特殊值形式指數(shù)(e)階碼(E)小數(shù)部分零-12700無窮1282e-1 = 2550NaN(非數(shù))1282e-1 = 255非07、文中問題解答此時(shí)再來回答文中引言提出的問題, 0.1 + 0.2 為什么不等于 0.3 ?
    /**
    * Author:(公眾號(hào):typedef)
    */
    #include
    int main() {
      double a = 0.1 + 0.2;
      printf("%.17f", a);
    }
    輸出為0.30000000000000004,由于在尾數(shù)舍入時(shí)會(huì)帶來一定的誤差,所以并不完全相等。
    當(dāng)在被問及浮點(diǎn)數(shù)為何存在誤差時(shí),你將如何回答?歡迎文章留言說出你的看法。
    如果不從技術(shù)的角度回答這個(gè)問題,可以這樣回答:整數(shù)是離散的,有限的并能夠被計(jì)算機(jī)表示的,小數(shù)部分是連續(xù)的,包含無窮多的數(shù),數(shù)量之多是無法被計(jì)算機(jī)存儲(chǔ)的,只能存儲(chǔ)計(jì)算機(jī)能夠表示的最接近這個(gè)數(shù)值的小數(shù)部分,所以可能會(huì)不相等。
    8、參考鏈接
  • https://www.cnblogs.com/gyunf/p/12816817.html
  • https://www.h-schmidt.net/FloatConverter/IEEE754.html
  • https://zh.wikipedia.org/wiki/IEEE_754
  • https://docs.pingcode.com/ask/304021.html9、總結(jié)本篇文章深入分析了浮點(diǎn)數(shù)的存儲(chǔ)格式到轉(zhuǎn)換流程,再到指數(shù)e以及階碼E的探索,大家應(yīng)該對(duì)浮點(diǎn)數(shù)有了更全面的理解。
    猜你喜歡:
    一個(gè)非常輕量的嵌入式日志庫!
    一個(gè)非常輕量的嵌入式線程池庫!
    Github上熱門 C 語言項(xiàng)目匯總!
    實(shí)用 | 10分鐘教你通過網(wǎng)頁點(diǎn)燈
    WiFi6+藍(lán)牙+星閃,三合一開發(fā)板,真香!
  • 發(fā)表回復(fù)

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表