暴力分塊矩陣乘法

阿新 • • 發佈：2018-12-31

題引

題解

樸素的演算法 O(4096 * 64 * 4096) = O(1e9) 不用想是超時的。

因為每次矩陣乘法中存在很多重複的計算。

考慮將矩陣進行分塊優化。預處理出每塊的值。

怎麼分塊。考慮對A矩陣的列分塊，和B矩陣的行分塊。因為p是公共的邊,且p <= 64

需要注意到的是 B矩陣中的取值僅有01那麼如果對B矩陣進行分塊的話。考慮每塊8個01串。那麼每一塊的取值為[0,255]

於是我們預處理出A[i][j][0,255]的每種取值。i表示A矩陣的i行。j表示每行的第幾塊數。[0,255]表示當前塊與所有01序列的取值。

A切完一共4096*8塊，每塊都預處理出256種情況，預處理的空間是4096*8*256，時間是4096*8*8*256。

那麼在進行乘的時候就按照分好的塊再去做乘法。時間為 4096 * 4096 * 8

程式碼

#include<bits/stdc++.h>
#define rep(i,a,n) for(int i=a;i<=n;i++) 
using namespace std;
const int maxn = 4100;
int A[maxn][70],B[maxn][70];
int RA[maxn][10][260],RB[10][maxn];
char str[70];
int n,p,m;
inline void debug() {
    rep(i,0,n-1) {
        rep(j,0,p-1) printf("%d ",A[i][j]);
        printf("\n");
    }
    rep(i,0,p-1) {
        rep(j,0,m-1) printf("%d ",B[i][j]);
        printf("\n");
    }
}
inline void solve() {
    memset(A,0,sizeof(A));
    memset(B,0,sizeof(B));
    memset(RA,0,sizeof(RA));
    memset(RB,0,sizeof(RB));
    rep(i,0,n-1) rep(j,0,p-1){
        scanf("%s",str);int len = strlen(str),temp = 0;
        rep(k,0,len-1) {
            if(str[k] >= '0' && str[k] <= '9') temp = temp * 16 + str[k] - '0';
            else temp = temp * 16 + str[k] - 'A' + 10;
        }
        A[i][j] = temp;
    }
    rep(i,0,m-1) {
        scanf("%s",str);
        rep(j,0,p-1) B[i][j] = str[j]-'0';
    }
    p = (p-1)/8+1;  //將p進行分塊,每8個一塊
    rep(i,0,n-1) rep(j,0,p-1) {
        int base = j * 8;
        rep(k,0,255) rep(l,0,7) if(k & (1<<l)) RA[i][j][k] += A[i][base+l];
    }
    rep(i,0,p-1) rep(j,0,m-1) {
        int base = i * 8;
        rep(l,0,7) RB[i][j] += (B[j][base+l] << l);
    }
    int res = 0;
    rep(i,0,n-1) rep(j,0,p-1) rep(k,0,m-1) {
        res ^= RA[i][j][RB[j][k]];
    }
    printf("%d\n",res);
}
int main()
{
    while(~scanf("%d%d%d",&n,&p,&m)) {
        solve();
        //debug();
    }
    return 0;
}

暴力分塊矩陣乘法

題引題解樸素的演算法 O(4096 * 64 * 4096) = O(1e9) 不用想是超時的。因為每次矩陣乘法中存在很多重複的計算。考慮將矩陣進行分塊優化。預處理出每塊的值。怎麼分塊。考慮對A矩陣的列分塊，和B矩陣的行分塊。因為p是公共的邊,

矩陣基礎 (3). 分塊矩陣的加法和乘法運算

摘要本文主要講述分塊矩陣的加法運算和乘法運算。將矩陣進行分塊操作有很多的好處，特別是在高效能平行計算領域內，矩陣的分塊化操作更是有很多益處。 1. 分塊矩陣加法運算給定矩陣A，B分別如下，矩陣A+B=C，矩陣C如下，分塊矩陣的加法運算非常顯然，這裡就不再多費

poj 3233 矩陣乘法（分塊矩陣）

題解：Sn為所求矩陣，則這樣，此題就變成了求矩陣冪和矩陣乘法，分塊矩陣乘法和普通矩陣一樣的。 code： /* adrui's submission Language : C++ Result : Accepted Love : ll Favorite

轉置矩陣的分塊並行乘法（C語言實現），計算矩陣C[rawn][rawn]=A[rawm][rawn]'B[rawm][rawn]，子塊大小為ST，其演算法實現原理參加本程式碼的附件。

#include <stdio.h> #include <stdlib.h> #include <string.h> #include <math.h> #define rawm 4 #define rawn 4 #defi

程式效能優化探討（6）——矩陣乘法優化之分塊矩陣

有一種性格叫做偏執，有一種矩陣優化運算叫做分塊。實話說，也許我這輩子也用不上這種隨牛B但很複雜的演算法，有些版本的教材直接刪除這個內容。但越是這樣我越想不過，因此借寫這篇部落格，把分塊矩陣乘法徹底分析清楚。把矩陣乘法進行分塊優化，

bzoj5037 線段樹練習4加強版（暴力分塊）

log del string 技術分享 iostream || getc code click 　　求大爺教線段樹怎麽寫啊QAQ 　　只會寫分塊...一開始腦抽寫成了O(NKlogN)還被CZL大爺嘲諷了一發T T 　　f[i][j]表示在第i塊中，模k為j的數有幾個，

Latex 分塊矩陣的處理

begin code col log 分塊 class lam 如果 gin 在 \(\mathrm{\LaTeX}\) 中，如果想輸入類似的矩陣：可以這樣實現： \[ \left[ \begin{array}{cc|cc|c} \lambda &

HDU-6395多校7 Sequence（除法分塊+矩陣快速冪）

review lse %d sca code left define hdu fin Sequence Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others

線性代數分塊矩陣的練習

需要計算兩個2*2矩陣的乘法,2*2矩陣求逆的公式需要記熟這是一個3*3可以分為1*1和2*2塊的例子，求a使用2*(9-a^2)=10-》a=2 根據分塊矩陣，直接寫出一個特徵值2，（1，0，0），另外兩個特徵向量求解2*2的矩陣，（0，x，y），（0，x1,y1

分塊矩陣求行列式

分塊矩陣求行列式將矩陣寫為 P = [A,B;B,A],那麼det(P)=det(A)det(A-BA^-1B)=def(A-BA^-1B) a=[1;-1] A*a=b1 B*a=b2 a=0或a=1均可構造無窮多解 def(A)*

poj 3233 Matrix Power Series （構造分塊矩陣）

題目連結：哆啦A夢傳送門題意：自己看。參考部落格：神犇題解：分塊矩陣：分塊矩陣可以構造求和。例如：我們可以這樣構造，還需注意一點的是：算完S(k+1)，取出右上角矩陣分塊後，還需減掉單位矩陣E。程式碼不是我寫的，我就按自己習慣改了下變數

2018 Multi-University Training Contest 7 1010 Sequence【整數分塊+矩陣冪】

題意：在擴充套件斐波納挈的基礎上加了一個變數P/nP/n。求第nn項的取值。分析：考慮將每一種P/nP/n進行矩陣快速冪，也就是進行了整數分塊處理。對於每一個整數塊可以使用矩陣快速冪，然後維護A，BA，B用作下一次的矩陣快速冪使用。整數分塊：通過

Loj#6285.數列分塊入門-9-暴力分塊

（有任何問題歡迎留言或私聊 && 歡迎交流討論哦題目：傳送門給出一個長為 n 的數列，以及 n 個詢問，詢問區間[L, R]的最小眾數。思路： 1.分塊暴力搞：離散化資料預處理出每兩個塊間的眾數f

matlab矩陣分塊與把分塊矩陣還原

A=rand(256,64); %將A分塊 B=mat2cell(A,ones(256/16,1)*16,ones(64/16,1)*16); %ones（a,b）為建立a行b列的值為1

matlab 分塊矩陣對角合併

引用：http://www.ilovematlab.cn/thread-74502-1-1.html 如：A=[ 1 2 3 2 3 4] B=[1 2

hdu 6395 Sequence 分塊矩陣快速冪

容易知道 p/i (i=3......n); 在某一區間內是相同的，記錄前一個區間的fn-1,fn-2,對本區間進行矩陣快速冪，確定本區間的界限可以用一句話即 j=(p/i)==0?n:min(n,p/(p/i))，並不需要二分； AC 程式碼 #include

POJ 3233 Matrix Power Series(求矩陣冪的和——分塊矩陣快速冪 or 二分遞迴+矩陣快速冪)

Matrix Power Series Time Limit: 3000MS Memory Limit: 131072K Total Submissions: 21451 Accepted:

[R]R語言中用cbind() 和rbind() 構建分塊矩陣

用cbind() 和rbind() 構建分塊矩陣正如前面所暗示的，可以利用函式cbind() 和rbind() 把向量和矩陣拼成一個新的矩陣。概略地說，cbind() 把矩陣橫向合併成一個大矩陣（列方式），而rbind()是縱向合併（行方式）。在命令中> X <

牛客國慶集訓派對Day2 A 矩陣乘法(思維分塊)

題目連結題意: 給你兩個矩陣A,B, A是n*p，B是p*m，B是一個只有0，1組成的矩陣，Aij<65536 C=A*B，讓你求出C的裡面所有元素的異或和解析: 官方的標解是分塊，每8個分一組。例如對於A，每行行每8個分成一組，對於B，

為什麼大型矩陣乘法要用分塊

對於矩陣乘法,我們一般會用三重迴圈來實現,但當矩陣維數相當大時,將矩陣分分塊分割成為近似CPU快取大小,會大大提高計算效率.原因就是直接三重迴圈會導致單個矩陣元素來來回回的從快取進出,而分塊後,進出的資料是以分塊矩陣的大小為單位的.另外,平時我們估算演算法的效率主

暴力分塊矩陣乘法

題引

題解

程式碼

相關推薦