Why is pow(a, d, n) so much faster than a**d % n?

小开

最佳答案

参见关于模幂运算的维基百科文章。基本上，当你做 a**d % n，你实际上必须计算 a**d，这可能是相当大的。但是有一些方法可以计算 a**d % n而不必计算 a**d本身，这就是 pow所做的。**操作符不能这样做，因为它不能“预见未来”，知道你将立即采取模。

小开

做模幂运算有一些捷径: 例如，你可以找到从 1到 log(d)的每个 i的 a**(2i) mod n，然后把你需要的中间结果相乘(mod n)。一个专用的模幂函数，比如3参数的 pow()，可以利用这些技巧，因为它知道你在做同余关系。Python 解析器无法识别这一点，因为只有表达式 a**d % n，所以它将执行完整的计算(这将花费更长的时间)。

小开

The way x = a**d % n is calculated is to raise a to the d power, then modulo that with n. Firstly, if a is large, this creates a huge number which is then truncated. However, x = pow(a, d, n) is most likely optimized so that only the last n digits are tracked, which are all that are required for calculating multiplication modulo a number.

小开

布伦巴恩回答了你的主要问题:

why is it almost twice as fast when run with Python 2 or 3 than PyPy, when usually PyPy is much faster?

如果你读过 PyPy 的性能页，你会发现这正是 PyPy 所不擅长的ーー事实上，他们给出的第一个例子就是:

不好的例子包括使用大长度进行计算-这是由不可优化的支持代码执行的。

从理论上讲，将一个巨大的指数运算后跟一个 mod 运算转换成模数运算(至少在第一次运算之后)是一个 JIT 可能能够实现的转换... ... 但 PyPy 的 JIT 不能。

顺便说一句，如果你需要使用大整数进行计算，你可能想看看像 gmpy这样的第三方模块，它有时比 CPython 的本机实现在某些情况下在主流用法之外快得多，而且还有很多额外的功能，你不得不自己编写，代价是不方便。