1. 程式人生 > >演算法記錄——pallard rho(大整數分解)

演算法記錄——pallard rho(大整數分解)

要解決的問題很簡單,對一個整數進行分解質因數。

首先還是效率非常低的暴力演算法,相信大家都會,不多提。

和上次一樣,當數達到非常大的時候,分解將變得非常困難。於是這次又帶來一個提升分解速度的“非完美”演算法。之所以打引號,是因為這次不完美的不是結果,而是時間效率。

Pollard Rho演算法分解一個數n的過程大體上是這樣子的:

1、找到一個數p,使得p|n

,將n分解為p與n/p

2、如果p或n/p不為質數,將其帶入遞迴上述過程

3、如果其是質數,將其記錄並退出

是不是很sb。。。有人就會問了:這跟暴力分解有什麼區別?好像時間複雜度還比暴力高一些。。。

所以:下面的優化才是關鍵。

第一個優化,使用Miller Rabin演算法判定其是否為質數,這個不多提。

關鍵就在於接下來的這個優化。

對於一個大整數n,我們要找到一個p滿足p|n

,這顯然如大海撈針。但是如果我們要找出p1、p2,使得abs(p1−p2)|n

,這看起來似乎要容易一些。實際上我們只需要找出gcd(abs(p1−p2),n)>1

的p1、p2,則其gcd值肯定為n的約數。這看起來又容易了一些。

實際上,不止容易一些,而是容易許多。根據某個玄學理論(生日悖論,詳見百度,在此不贅述),這種兩兩比較的方式,在加入比較的數越來越多的時候,其概率會大大提升,比找一個數的概率提升快很多。

於是現在,找p的過程變成了這個樣子:

1、找到一個數p1

2、通過某種玄學推導手段找出一個與p1對應的p2

3、判斷gcd(abs(p1−p2),n)

是否大於1,不大於則將p2作為新的p1,重複過程,否則就找到了

怎麼又是玄學?因為只有通過推導手段,才能保證不做重複判斷,浪費時間。理論上的推導手段可以有很多,但實際使用中統一使用如下公式推導:

 

p2=(p12+c)modn

 

其中c為隨機常數。

這個公式的好處:

1、顯然推匯出來的p2-p1差值基本不會相等。

2、可以證明,該推導結果會出現迴圈。也就是說,在出現迴圈之前,結果不會重複,少做了許多無用的判斷。

出現迴圈了怎麼辦?換一個隨機常數再搞。這就是該演算法“非完美”的地方,如果人品太差那就。。。不過根據上面函式影象可知,兩個隨機常數產生的推導結果基本不會有重複,所以就可以放心開搞了。

最後一點,判環怎麼判?floyd判圈演算法搞定。(一個標記以另一個標記幾倍速度走,在環上總能碰到。詳見百度)

需要注意的是,之所以不能一個標記定在原地,是因為迴圈節不一定在開頭就產生,可能走著走著才遇到迴圈。這條路徑就類似於ρ

,Pollard Rho演算法因此得名。

最後附上程式碼。

 

C++示例程式碼

#include <iostream>
#include <cstring>
#include <cstdlib>
#include <stdio.h>
#include <algorithm>
#include <math.h>
#include <stdlib.h>

#include<time.h>
#define ll long long

#define INF 0x3f3f3f3f
#define maxn 10000+10
#define cle(a) memset(a,0,sizeof(a))
const double eps=1e-5;
using namespace std;

const int S=20;//隨機演算法判定次數,S越大,判錯概率越小
//計算 (a*b)%c.   a,b都是long long的數,直接相乘可能溢位的
//  a,b,c <2^63
ll mult_mod(ll a,ll b,ll c)
{
    a%=c;
    b%=c;
    ll ret=0;
    while(b)
    {
        if(b&1)
        {
            ret+=a;
            ret%=c;
        }
        a<<=1;
        if(a>=c)
            a%=c;
        b>>=1;
    }
    return ret;
}
ll pow_mod(ll x,ll n,ll mod)
{
    if(n==1)
        return x%mod;
    x%=mod;
    ll tmp=x;
    ll ret=1;
    while(n)
    {
        if(n&1)
            ret=mult_mod(ret,tmp,mod);
        tmp=mult_mod(tmp,tmp,mod);
        n>>=1;
    }
    return ret;
}
//以a為基,n-1=x*2^t      a^(n-1)=1(mod n)  驗證n是不是合數
//一定是合數返回true,不一定返回false
bool check(ll a,ll n,ll x,ll t)
{
    ll ret=pow_mod(a,x,n);
    ll last=ret;
    for(int i=1; i<=t; i++)
    {
        ret=mult_mod(ret,ret,n);
        if(ret==1&&last!=1&&last!=n-1)
            return true;//合數
        last=ret;
    }
    if(ret!=1)
        return true;
    return false;
}

// Miller_Rabin()演算法素數判定
//是素數返回true.(可能是偽素數,但概率極小)
//合數返回false;
bool Miller_Rabin(ll n)
{
    if(n<2)
        return false;
    if(n==2)
        return true;
    if((n&1)==0)
        return false;//偶數
    ll x=n-1;
    ll t=0;
    while((x&1)==0)
    {
        x>>=1;
        t++;
    }
    for(int i=0; i<S; i++)
    {
        ll a=rand()%(n-1)+1;//rand()需要stdlib.h標頭檔案
        if(check(a,n,x,t))
            return false;//合數
    }
    return true;
}

ll factor[100];//質因數分解結果(剛返回時是無序的)
int tol;//質因數的個數。陣列小標從0開始
ll gcd(ll a,ll b)
{
    if(a==0)
        return 1;//???????
    if(a<0)
        return gcd(-a,b);
    while(b)
    {
        ll t=a%b;
        a=b;
        b=t;
    }
    return a;
}
ll Pollard_rho(ll x,ll c)
{
    ll i=1,k=2;
    ll x0=rand()%x;
    ll y=x0;
    while(1)
    {
        i++;
        x0=(mult_mod(x0,x0,x)+c)%x;
        ll d=gcd(y-x0,x);
        if(d!=1&&d!=x)
            return d;
        if(y==x0)
            return x;
        if(i==k)
        {
            y=x0;
            k+=k;
        }
    }
}
//對n進行素因子分解
void findfac(ll n)
{
    if(Miller_Rabin(n))//素數
    {
        factor[tol++]=n;
        return;
    }
    ll p=n;
    while(p>=n)
        p=Pollard_rho(p,rand()%(n-1)+1);
    findfac(p);
    findfac(n/p);
}
int main()
{
    ll n;
    while(cin>>n)
    {
        tol=0;
        findfac(n);
        for(int i=0; i<tol; i++)
            cout<<factor[i]<<endl;
        //質因子
    }
    return 0;
}

pytho示例程式碼

from random import randint

f = []


def gcd(m, n):
    if n > 0:
        return gcd(n, m % n)
    return m


def isPrime(n):
    if n < 2:
        return True
    for i in range(2, int(n ** 0.5) + 1):
        if n % i == 0:
            return False
    return True


def ifenough(num):
    m = 1
    for i in f:
        m *= i
    if m == num:
        return 0
    if m > num:
        return 1
    return 2


def PollardRho(num, n):
    if (isPrime(n)):
        f.append(n)
        return;
    x = []
    i = 1
    x.append(-1)
    x.append(randint(1, n))

    y = x[1]
    k = 2
    while True:
        i += 1
        x.append((abs(x[i - 1] * x[i - 1] - 1)) % n)

        d = gcd(abs(y - x[i]), n)

        if d > 1 and d < n:
            PollardRho(num, d)
            PollardRho(num, n / d)

        if i == k:
            y = x[i]
            k = 2 * k

        if x.index(x[i], 0, i + 1) != i or ifenough(num) == 0 or ifenough(num) == 1:
            break


def repeat(n):
    while True:
        f[:] = []
        PollardRho(n, n)
        if ifenough(n) == 0:
            f.sort(key=None, reverse=False)
            for index, j in enumerate(f):
                if index != len(f) - 1:
                    print(j, '*')
                else:
                    print(j)
            break


if __name__ == '__main__':
    n = int( input('please enter the number you want to divide:'))
    repeat(n)