该怎样去加速幂运算的过程呢?既然我们觉得将幂运算分为n步进行太慢,那我们就要想办法减少步骤,把其中的某一部分合成一步来进行。

比如,如果 nn 能被 22 整除,那我们可以先计算一半,得到 an2a^\frac n 2 的值,再把这个值平方得出结果。这样做虽然有优化,但优化的程度很小,仍是线性的复杂度。

再比如,如果我们能找到 2k=n2^k=n ,那我们就能把原来的运算优化成 a1,a2,a4,a8...a^1,a^2,a^4,a^8... 只需要 kk 次运算就可以完成,效率大大提升。可惜的是,这种条件显然太苛刻了,适用范围很小。不过这给了我们一种思路,虽然我们很难找到 2k=n2^k=n 但我们能够找到 2k1+2k2+2k3+......+2km=n2^{k_1}+2^{k_2}+2^{k_3}+......+2^{k_m}=n 。这样,我们可以通过递推,在很短的时间内求出各个项的值。

我们都学习过进制与进制的转换,知道一个 bb 进制数的值可以表示为各个数位的值与权值之积的总和。比如, 22 进制数 10011001 ,它的值可以表示为 1010 进制的 1×23+0×22+0×21+1×201×2^3+0×2^2+0×2^1+1×2^0 ,即 99 。这完美地符合了上面的要求。 可以通过 22 进制来把 nn 转化成 2km2^{k_m} 的序列之和,而 22 进制中第 ii 位(从右边开始计数,值为 11 或是 )则标记了对应的 2i12^{i−1} 是否存在于序列之中。 譬如, 1313 为二进制的 11011101 ,他可以表示为 23+22+202^3+2^2+2^0 ,其中由于第二位为 , 212^1 项被舍去。

如此一来,我们只需要计算 a1a2a4a8...a2kma^1、a^2、a^4、a^8... a^{2^{k_m}} 的值(这个序列中的项不一定都存在,由 nn 的二进制决定)并把它们乘起来即可完成整个幂运算。借助位运算的操作,可以很方便地实现这一算法,其复杂度为 O(logn)\Omicron(\log n)

long long qpow(long long a, long long n, long long mod) {
    long long res = 1;
    a %= mod;
    while (n) {
        if (n & 1) res = (res * a) % mod;
        a = (a * a) % mod;
        n >>= 1;
    }
    return res % mod;
}

发表回复