51nod 1172 Partial Sums V2
阿新 • • 發佈:2018-05-28
string namespace ostream const AI i++ += long 機智
於是找規律,發現\(ans_k=\sum_{i+j=k}A_iC_{j+n-1}^{j}\)
然後NTT
但是,\(10^9+7\)並沒有原根,所以祭出三模數NTT(如果有人想用高精度,我也沒辦法)。
因為\((10^9+7)^2*n\approx10^{23}\),所以找三個\(10^9\)左右的模數。
假設
\[ans≡a_0(mod\ m_0)\]
\[ans≡a_1(mod\ m_1)\]
\[ans≡a_2(mod\ m_2)\]
因為\(m_0m_1m_2\)會爆long long
所有,通過CRT(中國剩余定理)合並前兩項,於是\(M=m_0*m_1\)
\[ans≡A(mod\ M)\]
\[ans≡a_2(mod\ m_2)\]
設\(ans=kM+A\)
因為\[kM+A≡ans≡a_2(mod\ m_2)\]
所以\[k≡(a_2-A)M^{-1}(mod\ m_2)\]
那麽根據上面的式子求出k,通過\(kM+A=ans\)就可以求出ans了。
題目
給出一個數組A,經過一次處理,生成一個數組S,數組S中的每個值相當於數組A的累加,比如:A = {1 3 5 6} => S = {1 4 9 15}。如果對生成的數組S再進行一次累加操作,{1 4 9 15} => {1 5 14 29},現在給出數組A,問進行K次操作後的結果。(輸出結果 Mod 10^9 + 7)
分析
發現,每次處理相當於將A卷上一個\(I(\forall a_i=1)\)
於是機智的我在wiki又發現狄利克雷卷積滿足交換律(我居然才知道)
於是快速冪咯,時間復雜度\(O(nlog^2n)\),常數巨大,在51nod的老爺機上根本過不了。
然後就TLE得一塌糊塗。
然後NTT
但是,\(10^9+7\)並沒有原根,所以祭出三模數NTT(如果有人想用高精度,我也沒辦法)。
因為\((10^9+7)^2*n\approx10^{23}\),所以找三個\(10^9\)左右的模數。
假設
\[ans≡a_0(mod\ m_0)\]
\[ans≡a_1(mod\ m_1)\]
\[ans≡a_2(mod\ m_2)\]
因為\(m_0m_1m_2\)會爆long long
所有,通過CRT(中國剩余定理)合並前兩項,於是\(M=m_0*m_1\)
\[ans≡A(mod\ M)\]
\[ans≡a_2(mod\ m_2)\]
設\(ans=kM+A\)
因為\[kM+A≡ans≡a_2(mod\ m_2)\]
所以\[k≡(a_2-A)M^{-1}(mod\ m_2)\]
那麽根據上面的式子求出k,通過\(kM+A=ans\)就可以求出ans了。
#include <cmath> #include <iostream> #include <cstdio> #include <cstdlib> #include <cstring> #include <algorithm> #include <queue> #include <map> #include <bitset> #include <set> const int maxlongint=2147483647; const long long mo=1e9+7; const int N=200005; using namespace std; long long mod[3]={469762049,998244353,1004535809},M=mod[0]*mod[1],W[3][N]; long long f[3][N],g[3][N],v[3][N],v_[N],jc[3][N],ny[3][N],inv[N]; int n,m,fn; long long poww(long long x,long long y,int z) { long long s=1; x%=mod[z]; for(;y;x=x*x%mod[z],y>>=1) if(y&1) s=s*x%mod[z]; return s; } long long mul(long long x,long long y,long long mo) { long long s=0; x%=mo; for(;y;x=(x+x)%mo,y>>=1) if(y&1) s=(s+x)%mo; return s; } void NTT(long long *f,int type,int z) { for(int i=0,p=0;i<fn;i++) { if(i<p) swap(f[i],f[p]); for(int j=fn>>1;(p^=j)<j;j>>=1); } for(int i=2;i<=fn;i<<=1) { int half=i>>1,pe=fn/i; for(int j=0;j<half;j++) { long long w=!type?W[z][j*pe]:W[z][fn-j*pe]; for(int k=j;k<fn;k+=i) { long long x=f[k],y=f[k+half]*w%mod[z]; f[k]=(x+y)%mod[z],f[k+half]=(x-y+mod[z])%mod[z]; } } } if(type) { long long ni=poww(fn,mod[z]-2,z); for(int i=0;i<fn;i++) f[i]=f[i]*ni%mod[z]; } } long long CRT(long long a0,long long a1,long long a2) { long long n0=poww(mod[1],mod[0]-2,0),n1=poww(mod[0],mod[1]-2,1); long long A=(mul(a0*mod[1]%M,n0%M,M)+mul(a1*mod[0]%M,n1%M,M))%M,n2=poww(M%mod[2],mod[2]-2,2); long long k=(a2-A)%mod[2]*n2%mod[2]; k=(k%mod[2]+mod[2])%mod[2]; return (k%mo*(M%mo)%mo+A)%mo; } int main() { scanf("%d%d",&n,&m); for(fn=1;fn<=n*2+2;fn<<=1); inv[0]=inv[1]=1; for(int i=2;i<=fn;i++) inv[i]=(-(mo/i)*inv[mo%i]%mo+mo)%mo; for(int i=0;i<n;i++) scanf("%lld",&f[0][i]),f[1][i]=f[2][i]=f[0][i]; for(int j=0;j<3;j++) { W[j][0]=1,W[j][1]=poww(3,(mod[j]-1)/fn,j); for(int i=2;i<=fn;i++) W[j][i]=W[j][i-1]*W[j][1]%mod[j]; for(int i=0;i<n;i++) v[j][i]=1; g[j][0]=1; for(int i=1;i<n;i++) g[j][i]=g[j][i-1]*(i+m-1)%mo*inv[i]%mo; } for(int j=0;j<3;j++) { NTT(f[j],0,j),NTT(g[j],0,j); for(int i=0;i<fn;i++) f[j][i]=f[j][i]*g[j][i]%mod[j]; NTT(f[j],1,j); } for(int i=0;i<n;i++) printf("%lld\n",CRT(f[0][i],f[1][i],f[2][i])); }
51nod 1172 Partial Sums V2