Page 102 - 《应用声学》2023年第1期
P. 102
98 2023 年 1 月
表 2 弱可扩展性测试
Table 2 Weak scalability test
输入 Nbeta 输入 Nalpha 进程数 并行时间/s 串行时间/s 加速比 并行效率
32 32 1 16.8 16 0.9524 0.9524
64 32 2 14.5 27.5 1.8966 0.9483
128 32 4 13.5 50.9 3.7704 0.9426
256 32 8 13.2 97.4 7.3788 0.9223
512 32 16 13.2 191 14.4697 0.9044
1024 32 32 13.5 386 28.5926 0.8935
3.3.2 弱可扩展性 本文的模型既可在单台多核计算机上运行,也可
设 置 每 个 节 点 的 问 题 规 模 为 Nbeta = 32, 以在大规模计算机集群上运行,因此本文的并行方
Nalpha = 32,测试结果如表 2 和图 5 所示。可以 法可扩展性更强;且本文对BELLHOP3D进行并行
看到,随着进程数的增加,并行效率不断降低,但是 优化,适用范围更广,可以求解一般的三维声传播
降低的速度十分缓慢。 问题。
因此,对 BELLHOP3D 进行并行优化,并行效 当前版本的并行 BELLHOP3D 存在一些局限
率主要取决于每个节点分配的任务的规模。通过寻 性,仅将声源发射的不同方位角进行了并行,当进程
找对应机器上最优的并行效率,问题增加时保持每 数大于方位角的数量时,并行效率会有明显的下降。
个节点的计算规模不变,然后增加节点数,以保持最 因此可以考虑同时对俯仰角进行并行,或者使用其
优的并行效率。 他并行方法,充分利用计算资源。
并行 BELLHOP3D 的加速比主要取决于进程
35
数,当进程数不超过方位角的数量时,可以实现较
30 ࣳᛡBELLHOP3D
ေਇҫᤴඋ 高的加速比和并行效率。因此,并行后的 BELL-
25
ҫᤴඋ 20 HOP3D 非常适合用于计算对实时性要求很高的问
题,或者在平时的计算中节约计算时间。
15
10
5
0 参 考 文 献
0 5 10 15 20 25 30 35
ᤉሮ
[1] Jensen F B, Kuperman W A, Porter M B, et al. Compu-
图 5 弱可扩展性
tational ocean acoustics[M]. New York: Springer, 2011.
Fig. 5 Weak scalability [2] Porter M B, Bucker H P. Gaussian beam tracing for com-
puting ocean acoustic fields[J]. The Journal of the Acous-
4 结论 tical Society of America, 1987, 82(4): 1349–1359.
[3] Dushaw B D, Colosi J A. Ray tracing for ocean acoustic
tomography[R]. Washington Univ Seattle Applied Physics
本文使用 MPI 对射线模型 BELLHOP3D 进行
Lab, 1998.
并行优化,将不同方位角的计算分配给不同的进程 [4] Zabotin N A, Godin O A, Sava P C, et al. Tracing three-
分别计算声场,然后通过归约求和计算总声场,从 dimensional acoustic wavefronts in inhomogeneous, mov-
ing media[J]. Journal of Computational Acoustics, 2014,
而提升了计算效率。数值计算结果表明,并行后的
22(2): 1450002.
BELLHOP3D仅在归约求和部分引入误差,精度非 [5] Rodríguez O C. The TRACEO ray tracing program[Z].
常高,且对于粗粒度的问题并行效率较高。 Universidade do Algarve-Signal Processing Laboratory,
2010.
本文的方法与其他方法相比,具有显著优势与
[6] 王鲁军, 彭朝晖. 基于 OpenMP 的抛物方程 (PE) 声场并行
创新性。本文将射线模型的并行优化扩展到三维; 计算方法 [J]. 声学技术, 2009, 28(3): 227–231.