Page 102 - 《应用声学》2023年第1期
P. 102

98                                                                                   2023 年 1 月


                                                   表 2   弱可扩展性测试
                                               Table 2 Weak scalability test

                             输入 Nbeta   输入 Nalpha  进程数    并行时间/s    串行时间/s     加速比    并行效率
                                32         32        1      16.8       16      0.9524  0.9524
                                64         32        2      14.5       27.5    1.8966  0.9483
                                128        32        4      13.5       50.9    3.7704  0.9426
                                256        32        8      13.2       97.4    7.3788  0.9223
                                512        32       16      13.2       191     14.4697  0.9044
                                1024       32       32      13.5       386     28.5926  0.8935



             3.3.2 弱可扩展性                                       本文的模型既可在单台多核计算机上运行,也可

                 设 置 每 个 节 点 的 问 题 规 模 为 Nbeta = 32,           以在大规模计算机集群上运行,因此本文的并行方
             Nalpha = 32,测试结果如表 2 和图 5 所示。可以                   法可扩展性更强;且本文对BELLHOP3D进行并行
             看到,随着进程数的增加,并行效率不断降低,但是                           优化,适用范围更广,可以求解一般的三维声传播
             降低的速度十分缓慢。                                        问题。
                 因此,对 BELLHOP3D 进行并行优化,并行效                         当前版本的并行 BELLHOP3D 存在一些局限
             率主要取决于每个节点分配的任务的规模。通过寻                            性,仅将声源发射的不同方位角进行了并行,当进程
             找对应机器上最优的并行效率,问题增加时保持每                            数大于方位角的数量时,并行效率会有明显的下降。
             个节点的计算规模不变,然后增加节点数,以保持最                           因此可以考虑同时对俯仰角进行并行,或者使用其
             优的并行效率。                                           他并行方法,充分利用计算资源。
                                                                   并行 BELLHOP3D 的加速比主要取决于进程
                  35
                                                               数,当进程数不超过方位角的数量时,可以实现较
                  30     ࣳᛡBELLHOP3D
                         ေਇҫᤴඋ                                 高的加速比和并行效率。因此,并行后的 BELL-
                  25
                 ҫᤴඋ  20                                       HOP3D 非常适合用于计算对实时性要求很高的问
                                                               题,或者在平时的计算中节约计算时间。
                  15
                  10
                   5
                   0                                                          参 考 文        献
                    0    5   10   15   20  25   30   35
                                   ᤉሮ஝
                                                                 [1] Jensen F B, Kuperman W A, Porter M B, et al. Compu-
                             图 5  弱可扩展性
                                                                   tational ocean acoustics[M]. New York: Springer, 2011.
                          Fig. 5 Weak scalability                [2] Porter M B, Bucker H P. Gaussian beam tracing for com-
                                                                   puting ocean acoustic fields[J]. The Journal of the Acous-
             4 结论                                                  tical Society of America, 1987, 82(4): 1349–1359.
                                                                 [3] Dushaw B D, Colosi J A. Ray tracing for ocean acoustic
                                                                   tomography[R]. Washington Univ Seattle Applied Physics
                 本文使用 MPI 对射线模型 BELLHOP3D 进行
                                                                   Lab, 1998.
             并行优化,将不同方位角的计算分配给不同的进程                              [4] Zabotin N A, Godin O A, Sava P C, et al. Tracing three-
             分别计算声场,然后通过归约求和计算总声场,从                                dimensional acoustic wavefronts in inhomogeneous, mov-
                                                                   ing media[J]. Journal of Computational Acoustics, 2014,
             而提升了计算效率。数值计算结果表明,并行后的
                                                                   22(2): 1450002.
             BELLHOP3D仅在归约求和部分引入误差,精度非                           [5] Rodríguez O C. The TRACEO ray tracing program[Z].
             常高,且对于粗粒度的问题并行效率较高。                                   Universidade do Algarve-Signal Processing Laboratory,
                                                                   2010.
                 本文的方法与其他方法相比,具有显著优势与
                                                                 [6] 王鲁军, 彭朝晖. 基于 OpenMP 的抛物方程 (PE) 声场并行
             创新性。本文将射线模型的并行优化扩展到三维;                                计算方法 [J]. 声学技术, 2009, 28(3): 227–231.
   97   98   99   100   101   102   103   104   105   106   107