自然数方幂和快速算法

之前写过一篇博文:自然数方幂和公式,这次写的目的是因为上次是从数学上完美的解决了这个问题,这次我们要从计算上完美到无法诠释的解决这个问题,当然这归功于我看到的一份sgtlaugh的代码。经过解读体会到其中的奥秘,特此记录。一句话,简直不敢相信。

如果有人说他能在 $O(k)$ 时空复杂度求解 $\sum_{i=1}^n i^k$,你肯定会说这怎么可能别忽悠我了,那我只能说,因为你没看过这篇博文。

$O(k)$ 复杂度 求 $\sum_{i=1}^n i^k$ 其中 $n \leq k$。

我之前一直以为要用 $k \log k$ 的复杂度才能解决这个问题,其实我们只需对所有素数 $p$ 计算 $p^k$ 即可。对于一般的 $i$ 我们先预处理 其最小素因子$sp[i]$。计算 $sp[i]^k \cdot (i/sp[i])^k$ 即可(具体可见最后代码)。由于素数的阶为 $O(\frac{k}{\log k})$ 因此整个复杂度即为 $O(k)$。

由 Lagrange 插值多项式得出最终答案。

因为我们知道 $\sum_{i=1} ^n i^k$ 一定是一个关于$n$的次数为 $k+1$ 的多项式。因此,我们只需计算其在$0,\cdots,k+1$ 上的取值,用 Lagrange 插值多项式即可知道答案。

对于一个次数不超过 $n$ 的多项式 $f(x)$,其在不同位置 $x_0,\cdots,x_n$ 的取值唯一决定了这个多项式:

$$ f(x) = \sum_{i=0} ^n f(x_i) \prod_{j=0,j \neq i} ^n \frac{x-x_j}{x_i - x_j} $$

具体到本问题,我们取 $x=n,nk=k+1,x_i=i$ 那么

$$ f(n) = \sum_{i=0} ^{nk} (-1)^{nk-i} f(x_i) {n \choose i} {n-i-1 \choose nk-i } $$

例题:Codeforces 622F

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
#include <bits/stdc++.h>
typedef long long LL;
using namespace std;
/*------ Welcome to visit blog of dna049: http://dna049.com ------*/
const int N = 1e6+6;
const LL mod = 1e9+7;
int sp[N],p[N];
int spf(){ // samllest prime factor
int cnt=0;p[cnt++]=2;
for(int i=2;i<N;i+=2) sp[i]=2;
for(int i=1;i<N;i+=2) sp[i]=i;
for(int i=3;i<N;i+=2){
if(sp[i]==i) p[cnt++] = i;
for(int j = 1;j < cnt && p[j]<=sp[i] && i * p[j] < N; ++j) {
sp[i * p[j]] = p[j];
}
}
return cnt;
}
LL pow_mod(LL x,LL n,LL p){
LL r=1;
while(n){
if(n&1) r=r*x%p;
n>>=1; x=x*x%p;
}
return r;
}
LL inv[N],AP[N],AS[N],f[N];
LL getpowsum(LL n,int k){ // mod > k
if(k==0) return n%mod;
if(p[0]!=2) spf();
int nk=k+1;
f[0]=0;f[1]=1;
for(int i=2;i<=nk;++i){
if(sp[i]==i) f[i]=pow_mod(i,k,mod);
else f[i]=f[sp[i]]*f[i/sp[i]]%mod;
}
for(int i=1;i<=nk;++i){
f[i]+=f[i-1];
if(f[i]>=mod) f[i]-=mod;
}
if(n<=nk) return f[n];
LL tmp = 1;
for(int i=2;i<=nk;++i) tmp=tmp*i%mod;
inv[nk] = pow_mod(tmp,mod-2,mod);
for(int i=nk-1;i>=0;--i) inv[i]=inv[i+1]*(i+1)%mod;
AP[0]=AS[nk]=1;
for(int i=1;i<=nk;++i) AP[i]=AP[i-1]*(n+1-i)%mod;
for(int i=nk-1;i>=0;--i) AS[i]=AS[i+1]*(n-i-1)%mod;
LL res = 0;
for(int i=1;i<=nk;++i){ // because f(i)=0
LL x = f[i]*AP[i]%mod*AS[i]%mod*inv[i]%mod*inv[nk-i]%mod;
if((nk-i)&1) res-=x; // be careful
else res+=x;
}
return (res%mod+mod)%mod;
}
int main(){
// freopen("/Users/dna049/Desktop/AC/in","r",stdin);
LL n;
int k;
while(cin>>n>>k){
cout<<getpowsum(n,k)<<endl;
}
return 0;
}

实际上我们可以不求 $\mod p$ 后的答案,利用大数类得到标准答案,但是这时因为数字实在太大,每次乘法的用时过大,因此仅适合 $k<n$ 的情况

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
cpp_int f[N];
cpp_int getpowsum(LL n,int k){
if(k==0) return cpp_int(n);
if(p[0]!=2) spf();
int nk=2*k+1;
f[0]=0;f[1]=1;
for(int i=2;i<=nk+1;++i){
if(sp[i]==i) f[i]=pow(cpp_int(i),k);
else f[i]=f[sp[i]]*f[i/sp[i]];
}
for(int i=1;i<=nk;++i) f[i]+=f[i-1];
if(n<=nk) return f[n];
cpp_int res = 0,tl=1,tr=1;
for(int i=nk-1;i>=0;--i) tr=tr*(n-i-1)/(nk-i);
for(int i=0;i<=nk;++i){
if((nk-i)&1) res -= f[i]*tl*tr;
else res += f[i]*tl*tr;
tl = tl*(n-i)/(i+1);
tr = tr*(nk-i)/(n-i-1);
}
return res;
}

其实如果我们知道最终的上届,求出多个 $\mod p$ 后的答案,再用中国剩余定理貌似很不错。

该方法可以推广成求 $\sum_{i=1}^n f(i)^k$,其中$f(x)$是多项式。具体分析即可。

这种情况一般很难再做到 $O(k)$ 时刻复杂度,而变成了 $O(k \log k) \deg f$ 复杂度,