用浮點對模擬雙精度算術
在數值能力有限的嵌入式系統中,模擬雙精度資料類型變得有必要某些演算法。本文探討了使用兩個「浮點」值的元組來模擬「雙精度」資料類型的技術,以提高精度。
兩個模擬雙精確度值之間的比較操作遵循簡單的字典順序。然而,由於需要檢測進位,加法操作帶來了挑戰。根本問題是,此操作應使用哪個基數?雖然 FLT_MAX 可能是潛在的候選者,但它需要進一步考慮。
模擬加法
為了模擬加法,我們不僅需要考慮單一組件的加法,還需要考慮加法。還有結轉的潛力。用於操作的基數應提供足夠的分辨率來捕獲所有可能的進位。
一種方法是使用浮點數資料型別 FLT_MAX 和 -FLT_MAX 的兩個邊界總和作為基數。這確保了添加低成分時產生的任何進位都會被計入高成分的添加中。
偵測進位
偵測進位- outs 需要在新增各元件期間監視上溢或下溢狀態。如果在添加低位成分時發生溢出,則指示進位,並應將其添加到高位成分中。同樣,低位分量減法中的下溢會觸發進位,可以用相同的方式處理。
進一步研究的資源
其他見解可以從雙浮法技術領域的研究中獲得。兩篇值得注意的論文是:
這些資源提供了有關實作float-float 運算子和最佳化其效能的寶貴資訊。
以上是使用浮點對模擬雙精度加法的最佳基礎是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!