1. 程式人生 > >UOJ #86 mx的組合數 (數位DP+NTT+原根優化)

UOJ #86 mx的組合數 (數位DP+NTT+原根優化)

const sca fin print 數位 bit 突破口 dde nvl

題目傳送門

總結一下,本題有很多重要的突破口

1.Lucas定理

看到n,m特別大但模數特別小時,容易想到$lucas$定理

$C_{n}^{m}=C_{n/p}^{m/p}\cdot C_{n\;mod\;p}^{m\;mod\;p}\;(mod\;p)$

但普通的$lucas$顯然不適用於多次計算,我們可以把$lucas$定理展開

我們把$n$和$m$都看成兩個$p$進制數$a$和$b$

$C_{n}^{m}=\pi C_{a_{i}}^{b_{i}}\;(mod\;p)$

這個展開顯然成立

2.數位$DP$

想到了上一條進制轉化,很容易就聯想到數位$DP$

定義$f[i][j]$表示枚舉到第$i$位,余數是$j$的方案數

轉移十分經典,設現在要填上的數是$x$,$0$表示沒達到上界,$1$達到上界,設$z=C_{x}^{b_{i+1}}$

$f0[i][j\cdot z\;mod\;p]+=f0[i][j]$

$x<a_{i+1}$時,$f0[i][j\cdot z\;mod\;p]+=f1[i][j]$

$x=a_{i+1}$時,$f1[i][j\cdot z\;mod\;p]+=f1[i][j]$

總復雜度$O(p^2log_{p}n)$

3.原根優化與多項式乘法

上面的$p^{2}$轉移咋這麽無腦呢,是不是有啥優化啊?是的

由於$p$是一個質數,它一定存在一個原根$g$

這就要涉及到離散對數了。其實這是一個映射

$g^{ind(x)}\equiv x\;(mod\;p)$

$ind(x)\;(ind(x)\in[0,p-1))$與$x\;(x\in [1,p))$是一組一一映射

那麽$j\cdot z\;mod\;p$

$=g^{ind(j)+ind(z)\;(mod\;p-1)}\;mod\;p$

我們利用映射關系,把底數化成指數

這樣轉移變成了卷積的形式,用多項式乘法每次$O(plogp)$計算

計算出結果後,再逆映射回來得到實際的答案

而離散對數的映射並不能處理余數等於$0$的情況,我們每次$O(p)$單獨討論即可

總時間$O(plogplog_{p}n)$

  1 #include <bits/stdc++.h>
  2 #define N1 (1<<16)+10
  3 #define dd double
  4 #define ld long double
  5 #define ll long long
  6 #define uint unsigned int 
  7 #define i128 __int128
  8 using namespace std;
  9 
 10 const int inf=0x3f3f3f3f;
 11 i128 gi128()
 12 {
 13     i128 ret=0;int fh=1;char c=getchar();
 14     while(c<0||c>9){if(c==-)fh=-1;c=getchar();}
 15     while(c>=0&&c<=9){ret=ret*10+c-0;c=getchar();}
 16     return ret*fh;
 17 }
 18 ll qpow(ll x,ll y,const int &p)
 19 {
 20     ll ans=1;
 21     for(;y;x=x*x%p,y>>=1) if(y&1) ans=ans*x%p;
 22     return ans;
 23 }
 24 const ll p=998244353;
 25 namespace NTT{
 26 ll a[N1],b[N1],c[N1],Wn[N1],_Wn[N1];
 27 int r[N1];
 28 ll qpow(ll x,ll y)
 29 {
 30     ll ans=1;
 31     for(;y;x=x*x%p,y>>=1) if(y&1) ans=ans*x%p;
 32     return ans;
 33 }
 34 void NTT(ll *s,int len,int type)
 35 {
 36     int i,j,k; ll wn,w,t;
 37     for(i=0;i<len;i++) if(i<r[i]) swap(s[i],s[r[i]]);
 38     for(k=2;k<=len;k<<=1)
 39     {
 40         wn=(type>0)?Wn[k]:_Wn[k];
 41         for(i=0;i<len;i+=k)
 42         {
 43             for(j=0,w=1;j<(k>>1);j++,w=w*wn%p)
 44             {
 45                 t=w*s[i+j+(k>>1)]%p;
 46                 s[i+j+(k>>1)]=(s[i+j]+p-t)%p;
 47                 s[i+j]=(s[i+j]+t)%p;
 48             }
 49         }
 50     }
 51 }
 52 void Pre(int len,int L)
 53 {
 54     int i;
 55     for(i=0;i<len;i++) r[i]=(r[i>>1]>>1)|((i&1)<<(L-1));
 56     for(i=1;i<=len;i<<=1) Wn[i]=qpow(3,(p-1)/i), _Wn[i]=qpow(Wn[i],p-2);
 57 }
 58 void Main(int len)
 59 {
 60     int i,invl=qpow(len,p-2);
 61     NTT(a,len,1); NTT(b,len,1);
 62     for(i=0;i<len;i++) c[i]=a[i]*b[i]%p;
 63     NTT(c,len,-1);
 64     for(i=0;i<len;i++) c[i]=c[i]*invl%p;
 65     memset(a,0,sizeof(a)); memset(b,0,sizeof(b)); 
 66 }
 67 };
 68 
 69 int T,m,G;
 70 i128 n,l,r;
 71 int a[N1],b[N1],tmp[N1];
 72 ll f0[2][N1],f1[2][N1],mul[N1],_mul[N1],ans[N1];
 73 
 74 inline ll C(int N,int M)
 75 { 
 76     if(M>N) return 0;
 77     return mul[N]*_mul[M]%m*_mul[N-M]%m;
 78 }
 79 
 80 int pr[N1],use[N1],ind[N1],_ind[N1],son[N1];
 81 void get_ind()
 82 {
 83     int i,j,ns=0,flag,x,cnt=0,sz=0;
 84     for(i=2;i<=m-1;i++)
 85     {
 86         if(!use[i]) pr[++cnt]=i;
 87         for(j=1;j<=cnt&&i*pr[j]<=m-1;j++)
 88         {
 89             use[i*pr[j]]=1;
 90             if(i%pr[j]==0) break;
 91         }
 92     }
 93     for(j=1;j<=cnt;j++) if((m-1)%pr[j]==0) son[++sz]=(m-1)/pr[j];
 94     for(i=2;i<=m-2;i++) 
 95     {
 96         flag=1;
 97         for(j=1;j<=sz;j++) if(qpow(i,son[j],m)==1){ flag=0; break;}
 98         if(flag){ G=i; break; }
 99     }
100     ind[1]=0; _ind[0]=1; ind[0]=m-1;
101     for(i=1,x=1;i<=m-2;i++) x=x*G%m, ind[x]=i, _ind[i]=x; 
102 }
103 //using NTT::a; using NTT::b; using NTT::c; 
104 void solve(i128 w,int type)
105 {
106     int i,j,k,nw=0,nn=0,len,L,now=0,pst=1;
107     if(w<n){ ans[0]=((w+1)*type%p+ans[0]+p)%p; return; }
108     while(w>0) nw++,tmp[nw]=w%m,w/=m;
109     for(i=1;i<=nw;i++) a[nw-i+1]=tmp[i];
110     i128 N=n;
111     while(N>0) nn++,tmp[nn]=N%m,N/=m;
112     for(i=1;i<=nn;i++) b[nw-i+1]=tmp[i];
113     
114     for(len=1,L=0;len<m+m-1;len<<=1,L++);
115     NTT::Pre(len,L);
116     
117     memset(f0,0,sizeof(f0)); memset(f1,0,sizeof(f1));
118     for(j=0;j<a[1];j++) f0[1][C(j,b[1])]++;
119     f1[1][C(a[1],b[1])]++;
120     for(i=1;i<nw;i++)
121     {
122         memset(f0[now],0,sizeof(f0[now])); memset(f1[now],0,sizeof(f1[now])); 
123         
124         for(j=1;j<m;j++) NTT::a[ind[j]]=f0[pst][j];
125         for(j=0;j<m;j++) NTT::b[ind[C(j,b[i+1])]]++;
126         for(j=1;j<m;j++) (f0[now][0]+=f0[pst][j]*NTT::b[m-1])%=p;
127         (f0[now][0]+=f0[pst][0]*m)%=p; NTT::b[m-1]=0;
128         NTT::Main(len);
129         for(j=0;j<len;j++) (f0[now][_ind[j%(m-1)]]+=NTT::c[j])%=p;
130         
131         for(j=1;j<m;j++) NTT::a[ind[j]]=f1[pst][j];
132         for(j=0;j<a[i+1];j++) NTT::b[ind[C(j,b[i+1])]]++;
133         for(j=1;j<m;j++) (f0[now][0]+=f1[pst][j]*NTT::b[m-1])%=p;
134         (f0[now][0]+=f1[pst][0]*a[i+1])%=p; NTT::b[m-1]=0;
135         NTT::Main(len);
136         for(j=0;j<len;j++) (f0[now][_ind[j%(m-1)]]+=NTT::c[j])%=p;
137         
138         for(k=0;k<m;k++)
139         (f1[now][k*C(a[i+1],b[i+1])%m]+=f1[pst][k])%=p;
140         
141         swap(now,pst);
142     }
143     for(i=0;i<m;i++) (ans[i]+=(f0[pst][i]+f1[pst][i])*type%p+p)%=p;
144 }
145 
146 int main()
147 {
148     int i,j,x,cnt=0;
149     scanf("%d",&m); n=gi128(); l=gi128(); r=gi128(); l--;
150     mul[0]=mul[1]=_mul[0]=_mul[1]=1;
151     for(i=2;i<m;i++) mul[i]=mul[i-1]*i%m, _mul[i]=qpow(mul[i],m-2,m);
152     get_ind();
153     solve(r,1); 
154     solve(l,-1);
155     for(i=0;i<m;i++) printf("%lld\n",ans[i]);
156     return 0;
157 }  

UOJ #86 mx的組合數 (數位DP+NTT+原根優化)