​​欢迎关注我的公众号 [极智视界],获取我的更多笔记分享​

  大家好,我是极智视界,本文讲解一下 OpenMP 多线程使用方法。

  OpenMP 是一种用于共享内存并行系统的多线程程序设计方案,其提供了对并行算法的高层抽象描述,特别适合在多核 CPU 机器上的并行程序设计。编译器根据程序中添加的 pragma 指令,自动将程序并行处理,使用 OpenMP 降低了并行编程的难度和复杂度。当编译器不支持 OpenMP 时,程序会退化成普通(串行)程序,程序中已有的 OpenMP 指令不会影响程序的正常编译运行。

文章目录

1 OpenMP 常用指令

  使用 OpenMP 时需要引入 ​​omp.h​​​ 头文件,然后在编译时添加参数 ​​-fopenmp​​​ 即可。在具体需要进行并行运算的部分,使用 ​​#pragma omp​​ 指令[子句] 来告诉编译器如何并行执行对应的语句。

  常用的指令如下:

  • parallel:即​​#pragma omp parallel​​​ 后面需要有一个代码片段,使用​​{}​​ 括起来,表示会被并行执行;
  • parallel for:这里后面接​​for​​ 语句即可,不需要有额外的代码块;
  • sections;
  • parallel sections;
  • single:表示只能单线程执行;
  • critical:临界区,表示每次只能有一个 openmp 线程进入;
  • barrier:用于并行域内代码的线程同步,线程执行到 barrier 时停下来,直到所有线程都执行到barrier时才继续;

  常用的子句如下:

  • num_threads:指定并行域内线程的数目;
  • shared:指定一个或者多个变量为多个线程的共享变量;
  • private:指定一个变量或者多个变量在每个线程中都有它的副本;

  另外,openmp 还提供了一些列的 API 函数来获取并行线程的状态或控制并行线程的行为,常用 API 如下:

  • omp_in_parallel:判断当前是否在并行域中;
  • omp_get_thread_num:获取线程号;
  • omp_set_num_threads:设置并行域中线程格式;
  • omp_get_num_threads:返回并行域中线程数;
  • omp_get_dynamic:判断是否支持动态改变线程数目;
  • omp_get_max_threads: 获取并行域中可用的最大的并行线程数目;
  • omp_get_num_procs:返回系统中处理器的个数;


2 OpenMP 使用示例

  这里介绍一个计算圆周率的示例:

#include <stdio.h>
#include <omp.h>

#define MAX_THREADS 4

static long num_steps = 100000000;
double step;

int spmd(){
int i,j;
double pi, full_sum = 0.0;
double start_time, run_time;
double sum[MAX_THREADS];
step = 1.0/(double) num_steps;

for(j=1;j<=MAX_THREADS ;j++){
omp_set_num_threads(j);
full_sum = 0.0;
start_time = omp_get_wtime();

#pragma omp parallel private(i)
{
int id = omp_get_thread_num();
int numthreads = omp_get_num_threads();
double x;
double partial_sum = 0;
#pragma omp single
printf(" num_threads = %d",numthreads);
for (i=id;i< num_steps; i+=numthreads){
x = (i+0.5)*step;
partial_sum += + 4.0/(1.0+x*x);
}
#pragma omp critical
full_sum += partial_sum;
}

pi = step * full_sum;
run_time = omp_get_wtime() - start_time;
printf("\n pi is %f in %f seconds %d threds \n ",pi,run_time,j);
}
}

int openMP(){
int i;
double x, pi, sum = 0.0;
double start_time, run_time;

step = 1.0/(double) num_steps;
for (i=1;i<=4;i++){
sum = 0.0;
omp_set_num_threads(i);
start_time = omp_get_wtime();
#pragma omp parallel
{
#pragma omp single
printf(" num_threads = %d",omp_get_num_threads());
#pragma omp for reduction(+:sum)
for (i=1;i<= num_steps; i++){
x = (i-0.5)*step;
sum = sum + 4.0/(1.0+x*x);
}
}
pi = step * sum;
run_time = omp_get_wtime() - start_time;
printf("\n pi is %f in %f seconds and %d threads\n",pi,run_time,i);
}
}

int main() {
spmd();
printf("openMP Loop Paralelism:\n");
openMP();
return 0;
}

  运行结果如下:

极智Coding | OpenMP 多线程使用_多线程



  好了,以上分享了 OpenMP 多线程使用方法。希望我的分享能对你的学习有一点帮助。





极智Coding | OpenMP 多线程使用_并行_02

微信公众号【极智视界】,获取我的更多经验分享,让我们用极致+极客的心态来迎接AI !

极智Coding | OpenMP 多线程使用_并行_03