為什麼硬件除法比乘法要花更長的時間？

Marko Gulin

2017-01-17 00:45:42 UTC

view on stackexchange narkive permalink

為什麼在微控制器上硬件除法比乘法要花更長的時間？例如，在dsPIC上，除法需要19個週期，而乘法僅需要一個時鐘週期。

我瀏覽了一些教程，包括Wikipedia上的 除法算法 和 乘法算法 。這是我的理由。

除法算法（類似於Wikipedia上的具有恢復功能的慢除法）是一種遞歸算法。這意味著將步驟 k 的（中間）結果用作步驟 k + 1 的輸入，這意味著這些算法無法並行化。因此，至少需要 n 個週期才能完成除法，而 n 是除數中的許多位。對於16位分紅，至少等於16個週期。

乘法算法不需要遞歸，這意味著可以並行化它。但是，有許多不同的乘法算法，我不知道微控制器可以使用哪種算法。乘法如何在硬件/微控制器上工作？

我找到了 Dadda乘法器算法，該算法只需要一個時鐘週期即可完成。但是，我沒有得到的是Dadda的算法分三步進行，而步驟1的結果用於步驟2，依此類推。因此，這至少需要三個時鐘週期才能完成。

算法並沒有真正定義時鐘週期數。您的特定CPU可能有一個硬件乘法器/除法器以一個週期或20個週期工作，而與內部實現無關。

OP，您能否提供一個鏈接，以提供您所談論的19對1週期的更多信息？有關您的DSP的一些特定說明。

感謝您的回答。這是我的微控制器的數據表：http://ww1.microchip.com/downloads/en/DeviceDoc/70005127c.pdf。請參閱指令集概述，從第292頁開始。它說所有DIV指令都需要18個週期，而所有MUL指令只需要1個週期。但是，不僅對於這種MCU來說並不常見，我已經在許多其他MCU中看到了這一點。

如果**您**進行紙和鉛筆的乘法和除法，那需要更長的時間？為什麼？

@Curd,很好，它們差不多，不是嗎。是給我的。我認為這沒有您想像的那麼好。

我在我心目中的紙筆除法算法@TonyM固有地在每一步中應用了一系列除數-乘以×1位數的乘法，並取模運算和減法，因此使用* that *方法在我腦海中進行除法運算時，我認為除乘法運算外需要更多的努力。您的觀點仍然是正確的，因為沒有盡力嘗試除數適合剩餘數的次數，而是一種很好的啟發式方法

另一個因素是經濟和使用方式。大多數用法調用乘除的次數遠多於除法。將大面積的矽專用於較不頻繁使用的更快的硬件除法功能，在經濟上很差。最好製造出更小，更便宜的芯片，或者以更有效率的方式使用額外的邏輯。順便說一句，當我開始使用小型計算機時，劃分並不總是一條指令。在某些計算機上，這是一個軟件庫調用，例如平方根。

-1

順便說一句，是否有機器在硬件上進行了十分之一的優化？

@nigel222 puuuh;我可以想像某些袖珍計算器MCU可能具有BCD轉換單元/指令，而這在軟件中實現起來很簡單（只是忽略最低位數）。

@MarkoGulin可能還會補充說，當頻繁執行除法運算時，您實際上可能需要浮點數，這些天在許多CPU上都可用，而除法運算又是另一種問題（它確實包含至少一個定點除法，但輸入範圍有限）

從歷史上看，甚至大型機都實現了BCD字符串指令。在財務編程中，二進製到十進制轉換的成本被認為太高了。如今，在通用計算機的CPU中幾乎所有要註冊的寄存器都是“免費的”，並且正在訪問RAM，這會減慢速度。從那時到現在，為整數到小數的轉換優化除以十？我只是想知道-從來沒有聽說過。

值得注意的是浮點數除法。Cray-1沒有一個，只有一個倒數逼近指令，然後又使用一個乘法和另外兩個指令來完成全精度除法。英特爾浮點單元還具有倒數逼近指令。我不知道用了什麼。同樣，x = y / const乘以const的倒數進行乘法運算。fdiv僅在除以變量時才需要。

[為什麼除法比乘法更昂貴？]（http://stackoverflow.com/q/15745819/995714），[為什麼除法比其他算術運算複雜得多？]（http://scicomp.stackexchange.com/ q / 187/22956）

@TonyM:我懷疑兩者都花在同一時間。當然，您必須查看不止1個2位數字的計算。只需嘗試：將兩個隨機的6位數字相乘即可得到12個結果，然後將一個隨機的12位數字除以一個隨機的6位數字即可得到一個6位的結果，並查看需要多長時間。

除

線數：145

線位數：320

公共線路數量：4

公共電匯位數：25

內存數量：0

內存位數：0

進程數：0

單元數：219

SB_CARRY 85
SB_DFF 8
SB_LUT4 126

值得注意的是，為全角乘法器和最大除法器生成的Verilog的大小不是那麼極端。但是，如果您看下面的圖片，您會注意到乘法器的深度可能為15，而除法器的深度更像是50左右。關鍵路徑（即在操作過程中可能出現的最長路徑）決定了速度！

無論如何，您將無法閱讀該內容，以獲得視覺印象。我認為可能會發現複雜性上的差異。這些是單週期乘法器/除法器！