Parallel Programming with MPI

MPI 并行编程入门中国科学院计算机网络信息中心超级计算中心

参考材料张林波清华大学出版社莫则尧科学出版社都志辉清华大学出版社

消息传递平台 MPI 什么是 MPI (Message Passing Interface) 是函数库规范, 而不是并行语言 ; 操作如同库函数调用是一种标准和规范, 而非某个对它的具体实现 (MPICH 等 ), 与编程语言无关是一种消息传递编程模型, 并成为这类编程模型的代表 What is the message? DATA+ENVELOPE MPI 的目标较高的通信性能较好的程序可移植性强大的功能

MPI 的产生 1992-1994 年,MPI 1.1 版本问世 1995-1997 年,MPI 2.0 版本出现扩充并行 I/O 远程存储访问动态进程管理等 MPI 的语言绑定 Fortran( 科学与工程计算 ) C( 系统和应用程序开发 ) 主要的 MPI 实现并行机厂商提供消息传递平台 MPI 高校科研部门 MPICH (http://www.mcs.anl.gov/mpi/mpich ) LAMMPI (http://www.lam-mpi.org/)

MPI 程序编译与运行程序编译 C: %mpicc -o mpiprog mpisrc.c Fortran 77: %mpif77 -o mpiprog mpisrc.f 程序运行消息传递平台 MPI %mpirun -np 4 mpiprog 程序执行过程中不能动态改变进程的个数申请的进程数 np 与实际处理器个数无关

MPI 基础知识进程与消息传递 MPI 重要概念 MPI 函数一般形式 MPI 原始数据类型 MPI 程序基本结构 MPI 几个基本函数并行编程模式

进程与消息传递单个进程 (process) 进程与程序相联, 程序一旦在操作系统中运行即成为进程进程拥有独立的执行环境 ( 内存寄存器程序计数器等 ), 是操作系统中独立存在的可执行的基本程序单位串行应用程序编译形成的可执行代码, 分为指令和数据两个部分, 并在程序执行时独立地申请和占有内存空间, 且所有计算均局限于该内存空间进程 1 进程 2 内存

进程与消息传递单机内多个进程多个进程可同时存在于单机内同一操作系统操作系统负责调度分时共享处理机资源 (CPU 内存存储外设等) 进程间相互独立 ( 内存空间不相交 ) 在操作系统调度下各自独立地运行, 例如多个串行应用程序在同一台计算机运行进程间可以相互交换信息例如数据交换同步等待, 消息是这些交换信息的基本单位, 消息传递是指这些信息在进程间的相互交换, 是实现进程间通信的唯一方式

进程与消息传递包含于通过网络联接的不同处理器的多个进程进程独立存在, 并位于不同的处理器, 由各自独立的操作系统调度, 享有独立的 CPU 和内存资源进程间相互信息交换, 可依靠消息传递最基本的消息传递操作包括发送消息 send 接受消息 receive 进程同步 barrier 归约 reduction 等

MPI 重要概念进程组 (process group) 指 MPI 程序的全部进程集合的一个有序子集且进程组中每个进程被赋于一个在该组中唯一的序号 (rank), 用于在该组中标识该进程序号的取值范围是 [0, 进程数 -1] 通信器 (communicator) 理解为一类进程的集合即一个进程组, 且在该进程组, 进程间可以相互通信任何 MPI 通信函数均必须在某个通信器内发生 MPI 系统提供省缺的通信器 MPI_COMM_WORLD, 所有启动的 MPI 进程通过调用函数 MPI_Init() 包含在该通信器内 ; 各进程通过函数 MPI_Comm_size() 获取通信器包含的 ( 初始启动 ) 的 MPI 进程个数组内通信器和组间通信器

MPI 重要概念进程序号 (rank) 用来在一个进程组或通信器中标识一个进程 MPI 程序中的进程由进程组或通信器序号唯一确定, 序号相对于进程组或通信器而言 ( 假设 np 个处理器, 标号 0 np-1) 同一个进程在不同的进程组或通信器中可以有不同的序号, 进程的序号是在进程组或通信器被创建时赋予的 MPI 系统提供了一个特殊的进程序号 MPI_PROC_NULL, 它代表空进程 ( 不存在的进程 ), 与 MPI_PROC_NULL 间的通信实际上没有任何作用消息 (message) 分为数据 (data) 和包装 (envelope) 两个部分包装由接收进程序号 / 发送进程序号消息标号和通信器三部分组成 ; 数据包含用户将要传递的内容

MPI 重要概念 MPI 对象 MPI 系统内部定义的数据结构, 包括数据类型 ( 如 MPI_INT) 通信器(MPI_Comm) 通信请求(MPI_Request) 等, 它们对用户不透明在 FORTRAN 语言中, 所有 MPI 对象均必须说明为整型变量 INTEGER MPI 联接器 (handles) 联接 MPI 对象的具体变量, 用户可以通过它访问和参与相应 MPI 对象的具体操作例如,MPI 系统内部提供的通信器 MPI_COMM_WORLD 在 FORTRAN 语言中, 所有 MPI 联接器均必须说明为整型变量 INTEGER

MPI 函数一般形式 C: error = MPI_Xxxxx(parameter,...); MPI_Xxxxx(parameter,...); 整型错误码由函数值返回除 MPI_Wtime() 和 MPI_Wtick() 外, 所有 MPI 的 C 函数均返回一个整型错误码成功时返回 MPI_SUCCESS, 其他错误代码依赖于执行 Fortran 77 : CALL MPI_XXXXX(parameter,...,IERROR) 整型错误码由函数的参数返回除 MPI_WTIME() 和 MPI_WTICK() 外为子函数程序 (function), Fortran77 的所有 MPI 过程都是 Fortran77 的子例行程序 (subroutine)

MPI 原始数据类型 MPI Datatype MPI_CHAR MPI_SHORT MPI_INT MPI_LONG MPI_UNSIGNED_CHAR MPI_UNSIGNED_SHORT MPI_UNSIGNED MPI_UNSIGNED_LONG MPI_FLOAT MPI_DOUBLE MPI_LONG_DOUBLE MPI_BYTE MPI_PACKED C Datatype Signed char Signed short int Signed int Signed log int Unsigned char Unsigned short int Unsigned int Unsigned long int Float Double Long double MPI_BYTE 一个字节 MPI_PACKED 打包数据

MPI 原始数据类型 MPI Datatype MPI_INTEGER MPI_REAL MPI_DOUBLE_PRECISION MPI_COMPLEX MPI_LOGICAL MPI_CHARACTER Fortran Datatype INTEGER REAL DOUBLE PRECISION COMPLEX LOGICAL CHARACTER(1) MPI_BYTE MPI_PACKED

MPI 程序基本结构 MPI include file 变量定义 MPI 环境初始化执行程序进程间通信 #include <mpi.h> void main (int argc, char *argv[]) { int np, rank, ierr; ierr = MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD,&rank); MPI_Comm_size(MPI_COMM_WORLD,&np); /* Do Some Works */ ierr = MPI_Finalize(); } 退出 MPI 环境

MPI 几个基本函数 Index MPI_Init MPI_Initialized MPI_Comm_size MPI_Comm_rank MPI_Finalize MPI_Abort MPI_Get_processor_name MPI_Get_version MPI_Wtime

MPI 几个基本函数初始化 MPI 系统 C: int MPI_Init(int *argc, char *argv[]) Fortran 77: MPI_INIT(IERROR) INTEGER IERROR 通常为第一个调用的 MPI 函数, 除 MPI_Initialized 外在 C 接口中,MPI 系统通过 argc 和 argv 得到命令行参数, 并且会把 MPI 系统专用的参数删除, 留下用户的解释参数

MPI 几个基本函数检测 MPI 系统是否已经初始化 C: int MPI_Initialized(int *flag) Fortran 77: MPI_INIT(FLAG,IERROR) LOGICAL FLAG INTEGER IERROR 唯一可在 MPI_Init 前使用的函数已经调用 MPI_Init, 返回 flag=true, 否则 flag=false

MPI 几个基本函数得到通信器的进程数和进程在通信器中的标号 C: int MPI_Comm_size(MPI_Comm comm, int *size) int MPI_Comm_rank(MPI_Comm comm, int *rank) Fortran 77: MPI_COMM_SIZE(COMM, SIZE, IERROR) INTEGER COMM, SIZE, IERROR MPI_COMM_RANK(COMM, RANK, IERROR) INTEGER COMM, RANK, IERROR

MPI 几个基本函数退出 MPI 系统 C: int MPI_Finalize(void) Fortran 77: MPI_FINALIZE(IERROR) 每个进程都必须调用, 使用后不准许调用任何 MPI 函数若不执行 MPI 退出函数, 进程可能被悬挂用户在调用该函数前, 应确保非阻塞通讯结束

MPI 几个基本函数异常终止 MPI 程序 C: int MPI_Abort(MPI_Comm comm, int errorcode) Fortran 77: MPI_ABORT(COMM, ERRORCODE, IERROR) INTEGER COMM, ERRORCODE, IERROR 在出现了致命错误而希望异常终止 MPI 程序时执行 MPI 系统会设法终止 comm 通信器中所有进程输入整型参数 errorcode, 将被作为进程的退出码返回给系统

MPI 几个基本函数获取处理器的名称 C: int MPI_Get_processor_name(char *name, int *resultlen) Fortran 77: MPI_GET_PROCESSOR_NAME(NAME, RESULTLEN, IERR) CHARACTER *(*) NAME INTEGER RESULTLEN, IERROR 在返回的 name 中存储所在处理器的名称 resultlen 存放返回名字所占字节应提供参数 name 不少于 MPI_MAX_PRCESSOR_NAME 个字节的存储空间

MPI 几个基本函数获取 MPI 版本号 C: int MPI_Get_version(int *version, int *subversion) Fortran 77: MPI_GET_VERSION(VERSION,SUBVERSION,IERR) INTEGER VERSION, SUBVERSION, IERROR 若 mpi 版本号为 2.0, 则返回的 version=2,subversion=0

MPI 几个基本函数获取墙上时间 C: double MPI_Wtime(void) Fortran 77: DOUBLE PRECISION MPI_WTIME() 返回调用时刻的墙上时间, 用浮点数表示秒数经常用来计算程序运行时间

Sample :Hello World - C C+MPI #include mpi.h #include <stdio.h> #include <math.h> void main(int argc, char *argv[ ]) { int myid, numprocs, namelen; char processor_name[mpi_max_processor_name]; MPI_Init(&argc,&argv); MPI_Comm_rank(MPI_COMM_WORLD,&myid); MPI_Comm_size(MPI_COMM_WORLD,&numprocs); MPI_Get_processor_name(processor_name,&namelen); printf("hello World! Process %d of %d on %s\n",myid, numprocs, processor_name); MPI_Finalize(); }

Sample :Hello World - Fortran Fortran+MPI program main include 'mpif.h' character * (MPI_MAX_PROCESSOR_NAME) processor_name integer myid, numprocs, namelen, rc, ierr call MPI_INIT( ierr ) call MPI_COMM_RANK( MPI_COMM_WORLD, myid, ierr ) call MPI_COMM_SIZE( MPI_COMM_WORLD, numprocs, ierr ) call MPI_GET_PROCESSOR_NAME(processor_name, namelen, ierr) write(*,*) 'Hello World! Process ',myid,' of ',numprocs,' on ', processor_name call MPI_FINALIZE(ierr) end

Sample :Hello World 单处理器 (tp5) 运行 4 个进程 4 个处理器 (tp1,tp2,tp3,tp4) 分别运行 4 个进程

Sample :Hello World

点对点通信定义阻塞式点对点通信编写安全的 MPI 程序其他阻塞式点对点通信函数阻塞式消息发送模式非阻塞式点对点通信持久通信

定义 communicator 1 2 5 destination 4 0 3 source 两个进程之间的通信源进程发送消息到目标进程目标进程接受消息通信发生在同一个通信器内进程通过其在通信器内的标号表示 MPI 系统的通信方式都建立在点对点通信之上

阻塞式点对点通信 Index MPI_Send MPI_Recv MPI_Get_count MPI_Sendrecv MPI_Sendrecv_replace

阻塞式点对点通信阻塞式消息发送 C: int MPI_Send(void *buf, int count, MPI_Datatype datatype, int dest, int tag, MPI_Comm comm) Fortran 77: MPI_SEND(BUF, COUNT, DATATYPE, DEST, TAG, COMM, IERROR) <type> BUF(*) INTEGER COUNT, DATATYPE, DEST, TAG, COMM, IERROR count 不是字节数, 而是指定数据类型的个数 datatype 可是原始数据类型, 或为用户自定义类型 dest 取值范围是 0~np-1, 或 MPI_PROC_NULL (np 是 comm 中的进程总数 ) tag 取值范围是 0~MPI_TAG_UB, 用来区分消息

阻塞式点对点通信阻塞式消息接收 C: int MPI_Recv(void *buf, int count, MPI_Datatype datatype, int source, int tag, MPI_Comm comm, MPI_Status *status) Fortran 77: MPI_RECV(BUF, COUNT, DATATYPE, SOURCE, TAG, COMM, STATUS, IERROR) <type> INTEGER INTEGER BUF(*) COUNT, DATATYPE, DEST, TAG, COMM, IERROR STATUS(MPI_STATUS_SIZE) count 是接受缓存区的大小, 表示接受上界, 具体接受长度可用 MPI_Get_count 获得 source 取值范围是 0~np-1, 或 MPI_PROC_NULL 和 MPI_ANY_SOURCE tag 取值范围是 0~MPI_TAG_UB, 或 MPI_ANY_TAG

消息 (message) 阻塞式点对点通信

status 的内容阻塞式点对点通信 C 中是一个数据结构为 MPI_status 的参数, 用户可以直接访问的三个域 ( 共 5 个域 ) Fortran 中是包含 MPI_STATUS_SIZE 个整型的数组 typedef struct {......int MPI_SOURCE; 消息源地址 int MPI_TAG; 消息标号 int MPI_ERROR;...... 接收操作的错误码 } MPI_Status; STATUS(MPI_SOURCE) STATUS(MPI_TAG) STATUS(MPI_ERROR) 使用前需要用户为其申请存储空间 (MPI_Status status;) C 中引用时为 status.mpi_source

查询接受到的消息长度 C: int MPI_Get_count(MPI_Status status, MPI_Datatype datatype, int *count) Fortran 77: 阻塞式点对点通信 MPI_GET_COUNT(STATUS, DATATYPE, COUNT, IERR) INTEGER DATATYPE, COUNT, IERR, STATUS(MPI_STATUS_SIZE) 该函数在 count 中返回数据类型的个数, 即消息的长度 count 属于 MPI_Status 结构的一个域, 但不能被用户直接访问

定义标准阻塞式通信是否对发送数据进行缓存, 由 MPI 系统决定, 而非程序员阻塞 : 发送成功, 意味 (1) 消息成功发送 ;(2) 或者消息被缓存接收成功, 意味消息已被成功接收

消息传递成功阻塞式点对点通信发送进程需指定一个有效的目标接收进程接收进程需指定一个有效的源发送进程接收和发送消息的进程要在同一个通信器内接收和发送消息的 tag 要相同接收缓存区要足够大

阻塞式点对点通信任意源进程 ( 接收操作可以接受任意进程的消息 ) MPI_ANY_SOURCE 任意标号 ( 接收操作可以接受任意标号的消息 ) MPI_ANY_TAG 真实的源进程与消息标号可以访问接受函数中的 status 参数获得

捆绑发送和接收 C: 其他阻塞式点对点通信函数将一次发送调用和一次接收调用合并在一起, 执行无先后发送缓冲区和接收缓冲区须分开发送与接收使用同一个通信域由捆绑发送接收调用发出的消息可被普通接收操作接收 ; 一个捆绑发送接收调用可以接受一个普通的发送操作所发送的消息 int MPI_Sendrecv(void *sendbuff,int sendcount,mpi_datatype sendtype,int dest,int sendtag,void *recvbuff,int recvcount, MPI_Datatype recvtype, int source, int recvtag, MPI_Comm comm, MPI_Status *status)

其他阻塞式点对点通信函数捆绑发送和接收 Fortran 77: MPI_SENDRECV(SENDBUFF,SENDCOUNT,SENDTYPE,DEST,SENDTAG,RECVBUFF, RECVCOUNT, RECVTYPE, SOURCE, RECVTAG,COMM, STATUS, IERR) <type> SENDBUFF(*), RECVBUFF(*) INTEGER SENDCOUNT,SENDTYPE,DEST,SENDTAG,RECVCOUNT,RECVTYPE,SOURCE, RECVTAG,COMM,IERR INTEGER STATUS(MPI_STATUS_SIZE) 语义上等同于一个发送和一个接收操作结合, 但此函数可以有效避免在单独发送和接收操作过程中, 由于调用次序不当而造成的死锁 MPI 系统会优化通信次序, 从而最大限度避免错误发生

捆绑发送和接收, 收发使用同一缓存区 C: int MPI_Sendrecv_replace(void *buff,int count,mpi_datatype datatype, Fortran 77: int dest, int sendtag,int source, int recvtag,mpi_comm comm, MPI_Status *status) MPI_SENDRECV_REPLACE(BUFF,COUNT,DATATYPE,DEST,SENDTAG,SOURCE,RECVTAG, <type> BUFF(*) 其他阻塞式点对点通信函数 COMM, STATUS, IERR) INTEGER COUNT, DATATYPE, DEST, SENDTAG, SOURCE, RECVTAG, COMM, IERR INTEGER STATUS(MPI_STATUS_SIZE) MPI 系统保证其消息发出后再接收信息 MPI_Sendrecv 送收使用不同的缓存区 ; 该函数使用同一缓存区

Sample - Fortran MPI_SENDRECV 代替 MPI_SEND 和 MPI_RECV CALL MPI_COMM_RANK(comm, rank, ierr) IF(rank.EQ.0) THEN CALL MPI_SENDRECV(sendbuf, count, MPI_REAL, 1, tag, + recvbuf, count, MPI_REAL, 1, tag, comm, status, ierr) IF(rank.EQ.1) THEN CALL MPI_SENDRECV(sendbuf, count, MPI_REAL, 0, tag, + recvbuf, count, MPI_REAL, 0, tag, comm, status, ierr)

编写安全的 MPI 程序 Pro0 发送消息到 Pro1, 同时,Pro1 发送消息到 Pro0 A C B D 死锁

编写安全的 MPI 程序 A C B D 不安全

编写安全的 MPI 程序 A C D B 正确

阻塞式消息发送模式按着发送方式和接收方状态要求的不同分类四个函数拥有完全一样的入口参数共用一个标准的消息接收函数

标准消息发送函数 (MPI_Send) 发送操作不管接收操作是否启动, 都可以开始发送返回的条件发送数据被 MPI 系统存入系统缓存, 此时不要求接收操作收到发送数据不缓存, 则数据被接收到接收缓冲区

缓存消息发送函数 (MPI_Bsend) 发送操作不管接收操作是否启动, 都可以开始直接对缓冲区进行控制, 用户直接对通信缓冲区进行申请使用释放发送消息前必须有足够的缓冲区可用, 否则发送失败缓存发送返回后, 不意味申请的缓存区可自由使用, 须等待消息发送出去方可使用优势 : 发送操作在缓存了发送数据后, 可以立刻返回

缓存消息发送函数 (MPI_Bsend) 缓冲区申请提交可调用 MPI_Type_size 来确定数据类型所占字节数缓冲区大小 = 数据长度 + 常数, 常数用于 MPI 系统管理提交的缓冲区, 是必须的同一时刻, 一个进程只能定义一个缓冲区缓冲区释放此函数为阻塞式调用, 等到该缓存消息发送后才释放返回

Sample - Fortran REAL * (*) BUF INTEGER SIZE, TOTALSIZE CALL MPI_TYPE_SIZE(MPI_REAL,SIZE,ierr) TOTALSIZE=count*SIZE + 2*MPI_BSEND_OVERHEAD! 必须如此 CALL MPI_BUFFER_ATTACH(BUF,TOTALSIZE,ierr) IF(rank.EQ.0) THEN CALL MPI_BSEND(sendbuf, count, MPI_REAL, 1, tag,comm,ierr) CALL MPI_RECV(recvbuf, count, MPI_REAL, 1, tag, comm, status, ierr) IF(rank.EQ.1) THEN CALL MPI_BSEND(sendbuf, count, MPI_REAL, 0, tag,comm,ierr) CALL MPI_RECV(recvbuf, count, MPI_REAL, 0, tag, comm, status, ierr)

同步消息发送函数 (MPI_Ssend) 同步通信模式的开始不依赖于接收进程相应的接收操作是否已经启动发送返回条件, 需在标准模式上确认接收方已经开始接收数优势 : 这种模式发送和接收最为安全

就绪消息发送函数 (MPI_Rsend) 发送操作必须要求接收操作启动, 才可以开始启动接受操作, 意味着接收进程正等待接收发送的消息若发送操作启动而相应接收操作没有启动, 发送操作将出错优势 : 减少消息发送时间开销, 可能获得好的计算性能

非阻塞式点对点通信阻塞式通信与非阻塞式通信通信类型函数返回对数据区操作特性阻塞式通信 1. 阻塞型函数需要等待指定操作完成返回函数返回后, 对数据区操作是安全的 1. 程序设计相对简单 2. 或所涉及操作的数据 2. 使用不当容易要被 MPI 系统缓存安全造成死锁备份后返回非阻塞式通信 1. 调用后立刻返回, 实际操作在 MPI 后台执行函数返回后, 即操作数据区不安全 1. 可以实现计算与通信的重叠 2. 需调用函数等待或查询操作的完成情况可能与后台正进行的操作冲突 2. 程序设计相对复杂

非阻塞式点对点通信

非阻塞式点对点通信 Index MPI_Isend/MPI_Irecv MPI_Wait/MPI_Waitany/MPI_Waitall/MPI_Waitsome MPI_Test/MPI_Testany/MPI_Testall/MPI_Testsome MPI_Request_free MPI_Cancel MPI_Test_cancelled MPI_Probe/MPI_Iprobe

非阻塞式发送非阻塞式点对点通信该函数仅提交了一个消息发送请求, 并立即返回 MPI 系统会在后台完成消息发送函数为该发送操作创建了一个请求, 通过 request 变量返回 request 可供之后 ( 查询和等待 ) 函数使用

非阻塞式接收非阻塞式点对点通信该函数仅提交了一个消息接收请求, 并立即返回 MPI 系统会在后台完成消息发送函数为该接收操作创建了一个请求, 通过 request 变量返回 request 可供之后查询和等待函数使用

非阻塞式点对点通信等待检测一个通信请求的完成 MPI_Wait 阻塞等待通信函数完成后返回 ;MPI_Test 检测某通信, 不论其是否完成, 都立刻返回如果通信完成, 则 flag=true 当等待或检测的通信完成时, 通信请求 request 被设置成 MPI_REQUEST_NULL 考察接收请求,status 返回与 MPI_Recv 一样 ; 发送请求, 则不确定 MPI_Test 返回时, 当 flag=false, status 不被赋值

Sample - Fortran IF(rank.EQ.0) THEN CALL MPI_ISEND(sendbuf, count, MPI_REAL, 1, tag,comm,request,ierr) CALL MPI_RECV(recvbuf, count, MPI_REAL, 1, tag, comm, status, ierr) CALL MPI_WAIT(request,status,ierr) IF(rank.EQ.1) THEN CALL MPI_ISEND(sendbuf, count, MPI_REAL, 0, tag,comm,request,ierr) CALL MPI_RECV(recvbuf, count, MPI_REAL, 0, tag, comm, status, ierr) CALL MPI_WAIT(request,status,ierr)

非阻塞式点对点通信等待检测一组通信请求中某一个的完成 count 表示通信请求的个数 array_of_requests 是一组非阻塞通信的请求 index 存储一个成功完成的通信在 array_of_requests 中的位置 flag 表示是否有任意一个通信请求完成, 若有 flag=true 完成的通信请求 request 被自动赋值 MPI_REQUEST_NULL MPI_Testany 返回时, 当 flag=false, status 不被赋值

非阻塞式点对点通信

非阻塞式点对点通信等待检测一组通信请求的全部完成 count 表示通信请求的个数 array_of_requests 是一组非阻塞通信的请求 array_of_statuses 返回该组通信完成的状态 flag 表示全部通信是否完成, 若完成 flag=true MPI_Testall 返回时, 当 flag=false, array_of_statuses 不被赋值

非阻塞式点对点通信

非阻塞式点对点通信等待检测一组通信请求的部分完成 MPI_Waitsome 等待至少一个通信完成才返回 outcount 表示通信成功完成的个数 array_of_indices 存储完成的通信在 array_of_requests 中的位置 array_of_statuses 返回完成通信的状态, 其他不被赋值 MPI_Testsome 返回时若没有一个通信完成, 则 outcount=0

非阻塞式点对点通信

非阻塞式点对点通信通信请求的释放 ( 阻塞型 ) 调用 MPI_Wait/Test 可间接释放完成的通信请求, 此函数则直接释放通信请求及所占内存空间如果通信尚未完成, 则阻塞等待完成后返回该函数返回, 通信请求 request 被设置成 MPI_REQUEST_NULL

非阻塞式点对点通信通信请求的取消 ( 非阻塞型 ) MPI_Cancel 取消已调用的非阻塞通信, 用此命令来释放非阻塞操作所占用的资源命令调用后立刻返回, 但调用并不意味相应的通信被取消该操作调用时, 若相应非阻塞通信已经开始, 它会正常完成, 不受影响 ; 若没有开始, 则释放通信占用资源, 该通信被取消即使调用取消操作, 也需等待查询函数来释放该非阻塞通信的请求, 并且在返回结果 status 中指明该通信已经被取消

非阻塞式点对点通信检测一个通信操作是否被取消 ( 非阻塞型 ) 函数调用后立即返回如果一个非阻塞通信已经被执行了取消操作, 则该通信的 MPI_Wait 和 MPI_Test 将释放相应的通信对象, 并且在返回结果 status 中指明该通信是否被取消如果 MPI_Test_cancelled 返回结果 flag=true, 则表明此通信已经被成功取消, 否则该通信还没有被取消

消息探测 ( 阻塞型 ) 非阻塞式点对点通信为接收消息前即可对接收消息进行探测, 进而决定如何接收该消息阻塞等待, 只有当探测到符合 source/tag 条件的消息时才返回返回的 status 与 MPI_Recv 的 status 完全相同 source/tag 可以取 MPI_ANY_SOURCE/MPI_ANY_TAG

消息探测 ( 非阻塞型 ) 非阻塞式点对点通信函数调用后即返回当探测到符合 source/tag 条件的消息时,flag=true; 若 flag=true, 返回的 status 与 MPI_Recv 的 status 完全相同 ; 若 flag=false, 则对 status 不作定义 source/tag 可以取 MPI_ANY_SOURCE/MPI_ANY_TAG

阻塞型与非阻塞型通信函数

持久通信持久通信通信初始化没有启动消息操作,MPI_Start 触发才开始真正通信调用消息完成操作 MPI_Wait, 并不释放持久通信对象, 只是将其设置为非活动状态当不需要再进行重复通信时, 必须用 MPI_Request_free 释放对象, 这是和普通非阻塞通信不同之处

创建持久消息发送请求持久通信创建持久消息发送请求, 但并非开始实际的消息发送,request 请求留待以后实际消息发送使用其对应标准模式的非阻塞发送,MPI_Bsend_init/MPI_Ssend_init/ MPI_Rsend_init 分别对应缓冲 / 同步 / 就绪模式的持久消息发送请求函数, 不作重点说明

创建持久消息接收请求持久通信创建持久消息接收请求, 但并非开始实际的消息接收,request 请求留待以后实际消息接收使用

持久通信开始基于持久通信请求的通信每次调用 MPI_Start 相当于调用一次 MPI_***_init 相对应的非阻塞型通信函数 ( 如 MPI_Isend,MPI_Irecv 等 ) 当创建了多个持久通信请求时, 可用一个 MPI_Startall 来一次性启动多个通信由上述函数调用开始的通信请求也要用 MPI_Wait/Test 函数来等待检测完成这些调用完成后, 持久通信对象并不释放, 等待激活