MPI實現矩陣乘法程式--實現MPI傳遞連續陣列

阿新 • • 發佈：2019-02-11

怎麼樣用用MPI編寫兩個n階的方陣A和B的相乘程式，結果存放在方陣C中，A、B和C都在節點0中呢？

//#include<stdio.h>
//#include<math.h>
//#pragma comment(lib,"mpi.lib")
#include<mpi.h>
#include<stdio.h>
#include <iostream>
#include<math.h>
#pragma comment(lib,"mpi.lib")
#define n 1000
using namespace std;
int main(int argv, char *argc[])
{
	int rank, p, a;
	MPI_Init(&argv, &argc);
	MPI_Comm_rank(MPI_COMM_WORLD, &rank);
	MPI_Comm_size(MPI_COMM_WORLD, &p);
	MPI_Status status;
	if (p!=1)
	a = n / (p - 1);
	if (rank == 0)
	{
		int* A = new int[n*n];
		int* B = new int[n*n];
		int* C = new int[n*n];
	//	int * recptr = NULL;
		for (int i = 0; i < n; i++)
		for (int j = 0; j < n; j++)// 時間是 O nn
		{
			A[i*n + j] = i + j;	//A[i][j]
			B[i*n + j] = 1;	//B[i][j]
		}
		if (p == 1)
		{
			double tb, te;
			tb = MPI_Wtime();
			for (int i = 0; i < n; i++)
			for (int j = 0; j < n; j++)
			{
				C[i*n + j] = 0;	//C[i][j]
				for (int k = 0; k < n; k++)
				{
					C[i*n + j] = A[i*n + k] * B[k*n + j];
				}


			}
			te = MPI_Wtime();
			cout << "time is " << te - tb;// << "s" << endl;
		}


		if (p != 1)
		{
			double tb, te;
			
			tb = MPI_Wtime();
			for (int i = 0; i < p-1; i++){//給每個暫存器傳送  陣列 A，B，C
				MPI_Send(&A[0+0], n*n, MPI_INT, i+1, 1, MPI_COMM_WORLD);//每個傳送 a行，a*n大小的資料 
				MPI_Send(&B[0+0], n*n, MPI_INT, i+1,2, MPI_COMM_WORLD);
				
			}
			for (int i =0; i < p-1; i++)
					MPI_Recv(&C[i*a+0], a*n, MPI_INT, i+1,3, MPI_COMM_WORLD, &status);//每個接受 a行，a*n大小的資料 
			
			te = MPI_Wtime();
			cout << "time is " << te - tb;// << "s" << endl;
		}

		delete[] A;
		delete[] B;
		delete[] C;
	}

	if (p != 1)
	if (rank != 0){
		int* A = new int[n*n];
		int* B = new int[n*n];
		int* C = new int[n*n];
		
		MPI_Recv(&A[0+0], n*n, MPI_INT, 0, 1, MPI_COMM_WORLD, &status);//從A[0][0]和B[0][0]開始接受
		MPI_Recv(&B[0+0], n*n, MPI_INT,0, 2, MPI_COMM_WORLD, &status);

		for (int i =a*(rank-1); i < (a*(rank)); i++)//按照行間隔分，每個cpu計算自己的a行
		for (int j = 0; j < n; j++)
		{
			C[i*n + j] = 0;	//C[i][j]
			for (int k = 0; k < n; k++)
			{
				C[i*n + j] = A[i*n + k] * B[k*n + j];
			}
		}
		{//向rank=0傳送自己的那a行C,大小是a*n
			//int * sendptr = &(C[a*(rank - 1)+0]);
			MPI_Send(&C[a*(rank - 1) + 0], a*n, MPI_INT, 0,3, MPI_COMM_WORLD);//起始地址是C[rank-1][0],大小是a*n
		}
	}
	MPI_Finalize();
	return 0;
}

經過測試，不同節點數的加速比如下：

兩個節點之所以沒有變化是因為，一個負責傳送資料，一個負責計算資料，還要傳送回來，實際上和一個計算是沒什麼差別的。但是隨著節點數的增加，時間下降的速度呈指數小於0的指數函式下降趨勢，加速比呈k=0.27的一次方程上漲，從與上一個節點的加速比例比較來看，可見每增加一倍節點的數量，只能提高1.2的速度。

MPI實現矩陣乘法程式--實現MPI傳遞連續陣列

怎麼樣用用MPI編寫兩個n階的方陣A和B的相乘程式，結果存放在方陣C中，A、B和C都在節點0中呢？ //#include<stdio.h> //#include<math.h> //#pragma comment(lib,"mpi.lib") #

分治法實現矩陣乘法

name cout namespace size cas put 分治 ade add 整體的思路就是分，加&乘，拼 #include <iostream> #include <cstddef> #include <cstdlib&g

用MapReduce實現矩陣乘法

import org.apache.hadoop.mapred.JobConf; public class MainRun { public static final String HDFS = "hdfs://192.168.1.210:

[資料結構]稀疏矩陣乘法演算法實現

作者zhonglihao演算法名稀疏矩陣乘法 Sparse Matrix Multiplication分類資料結構複雜度O(n^2)形式與資料結構C++程式碼一維結構體儲存特性極簡封裝不使用連結串列不需要轉置計算過程容易理解具體參考出處《演算法導論》(寫的不想看)備註

[線性代數]矩陣乘法演算法實現

作者zhonglihao 演算法名矩陣乘法 Matrix Multiplication分類線性代數複雜度n^3形式與資料結構C++實現一維陣列儲存特性指標封裝返回具體參考出處教科書備註// ConsoleApplication1.cpp : 定義控制檯應用程式的入口

C語言之兩矩陣乘法的實現

首先我們要清楚矩陣乘法實現需要滿足的條件，矩陣相乘最重要的方法是一般矩陣乘積。它只有在第一個矩陣的列數（column）和第二個矩陣的行數（row）相同時才有意義[1] 。一般單指矩陣乘積時，指的便是一般矩陣乘積。一個m×n的矩陣就是m×n個數排成m行n列的一

STM32F407實現矩陣鍵盤程式

由於最近在做一個有關按鍵的專案，有用到矩陣鍵盤，因為網上有關矩陣鍵盤的程式很少，所以我就自己寫一個發上去供大家參考，該程式所用到的GPIO口是PD0--PD7，至於矩陣鍵盤的原理就不一一描述了，直接上程式，具體程式如下： //GPIO初始化函式 void GPIO_Con

python中實現矩陣乘法

# TODO 計算矩陣乘法 AB，如果無法相乘則raise ValueError def matxMultiply(A, B): multiply = [] if len(A[0]) != len(B): raise ValueError

壓縮稀疏矩陣以及使用三元組實現矩陣乘法，簡單易懂

思路：既然使用三元組去實現，所以首先要定義一個三元組 typedef struct node { int row, col, v;//分別代表行數，列數，以及元素的值，整個式子表示在原矩陣的第row行，第col列，有一個值為v的數 } node;

CRC校驗實現原理以及程式實現研究

在學習mdobus過程中，曾遇到過CRC校驗，之前一直不是很明白其原理，現在利用一點閒暇時間學習下。不同別的校驗方式，想弄明白CRC校驗的原理以及程式實現過程還真得有點耐心，琢磨一下數學公式。 1. 什麼是CRC校驗一句話總結：將需要傳遞的資料塊看成一個資訊多

MPI矩陣乘法的兩種實現方法

MPI矩陣乘法去年學習了平行計算，接觸了MPI、Pthreads和OpenMP等常用的並行方法實現了並行的矩陣乘法，本章在此總結一下MPI的矩陣乘法使用。使用簡單的MPI_Send和MPI_Recv實現使用較高階的MPI_Scatter和MPI_Ga

MPI：非阻塞實現節點間的迴圈訊息傳遞

非阻塞實現節點間的迴圈訊息傳遞一、題目要求 MPI非阻塞方式實現節點間的迴圈訊息傳遞二、思路使用MPI_Isend、MPI_Irecv和MPI_Wait等函式；三、我的程式碼 #

MPI 和OPENMP 混合程式設計實現矩陣LU分解

#include "stdio.h" #include "stdlib.h" #include "mpi.h" #include "omp.h" /***************MPI openMP 混合實現LU分解*******************/ /************ Yingfeng Ch

java實現兩個矩陣乘法有個錯誤希望有大佬幫忙

//java實現兩個矩陣相乘有個錯誤在下邊有沒有哪個大佬幫我看看十分感謝 package 實驗五; import java.util.Scanner; public class Matrix { private int rows; private int cols;

基於MapReduce的大矩陣乘法（Spark實現）

矩陣-向量乘法實現 xi=∑j=1nmijvj Map函式 Map函式應用於M的一個元素，但是如果執行Map任務的計算節點還沒有將v讀到記憶體，那麼首先以一個整體的方式讀入v，然後v就可以被該Map任務中執行的Map函式所用。每個Map任務將整個向量v和矩陣

矩陣乘法（行邏輯連結的順序表）及程式碼實現

矩陣相乘的前提條件是：乘號前的矩陣的列數要和乘號後的矩陣的行數相等。且矩陣的乘法運算沒有交換律，即 A*B 和 B*A 是不一樣的。例如，矩陣A：矩陣B：由於矩陣 A 的列數和矩陣 B 的行數相等，可以進行 A*B 運算（不能進行 B*A 運算）。計算方法是：用矩陣A的第 i 行和矩陣B中的每

CUDA程式設計--實現並行矩陣乘法【80行程式碼】

簡述這裡只寫了方陣之間的乘法，但是本質上都是一樣的。我測試過100規模的方陣之間的乘法，沒有問題。程式碼讀取檔案data.txt 資料格式就是一個數值N，然後來連續的兩個N*N的矩陣。用空格隔開。 #include "cuda

大矩陣乘法運算map reduce實現思路

實現思路：儲存：大矩陣很多都是稀疏矩陣，並且有可能有上百萬的行和上百萬的列。那麼矩陣可以存在類似HBase面向列的分散式資料庫中。假設HTable中有兩個表A和表B分別儲存兩個巨型矩陣a和b。表A和表B都是隻有一個列族。列名都是1開始計數。那麼表A和表B所儲存的矩

Java實現ACM中的矩陣乘法

問題 F: 矩陣乘法題目描述請你實現一個程式，用於求兩個矩陣的乘積。輸入包括一系列的測試用例，每個測試用例的第一行包含三個整數a，b，c，其中a是第一個矩陣的行數，b是第一個矩陣的列數並且是第二個矩陣的行數，c是第二個矩陣的列數，接下來是a行，每行包含b個整數，每個整數用空格

動態規劃實現矩陣連乘法問題

矩陣鏈乘法問題( matrix-chain multiplication problem ) 　　(1)問題描述　　給定n個矩陣的鏈<A 1 ,A 2 ,…,A n >，其中i=1,2,…,n，矩陣A i的維數為p i-1 ×p i 。求一個完全“括號化方案”，使得計算乘積A 1

MPI實現矩陣乘法程式--實現MPI傳遞連續陣列

相關推薦