Page 60 - 《应用声学》2019年第6期
P. 60

962                                                                                 2019 年 11 月


                                                               流形学习算法。线性流形学习算法有主成分分析
             0 引言
                                                               (Principle component analysis, PCA) [9]  和多维尺
                 运动声源研究主要集中在运动声源的定位识                           度变换 (Multidimensional scaling, MDS)  [10] ,计算
             别、声源运动以及流场作用所产生的多普勒效应、                            简单、理解容易,能够很好地提取到线性数据的有
             运动声源的声场重构等方面             [1−6] 。上述研究都需提           用的信息,应用十分广泛。但高维数据在空间中具
             取运动声源的声特征。在进行运动声源的声特征提                            有高度非线性结构,即呈流形分布。由于线性流形
             取时, 由于声特征与运动状态高度耦合,且由多个                           学习算法力求保持数据的全局线性结构,所以该
             声源 (如行驶车辆发声源: 车身、底盘、发动机等) 的                       线性算法对非线性数据进行特征提取时,得到的结
             声辐射叠加,呈现出宽频带、非稳态、非线性等特                            果则不能真实反映数据的本质结构,无法提取到原
             点  [7] 。行驶中车辆噪声声辐射问题是一个复杂的动                       始数据的有效信息,使得难以完成后续分类识别等
             态过程,辐射噪声不仅与自身各噪声源的噪声特性                            任务。典型的非线性流形学习算法有等距映射算
             有关,还与车辆运动参量:距离、速度、加速度、方                           法 [11]  (Isometric mapping, Isomap)、局部线性嵌入
             位和方向等紧密相关,其辐射强度、频率及声传播                            算法  [12]  (Locally linear embedding, LLE)和局部切
             模式也与车辆运动状态高度耦合。运动声源的声特                            空间排列算法       [13]  (Local tangent space alignment,
             征提取主要采用传统理论的数值分析方法研究。数                            LTSA)。LLE 算法最显著特点,一是权重具有平移、
             值分析方法已很好地应用于实际问题,特别对飞机、                           旋转、缩放不变性;二是最优解无迭代,求解过程
             叶轮机械的气动噪声研究。但车辆噪声源及噪声特                            为稀疏矩阵特征分解。从各算法优缺点以及复杂度
             性的复杂性、时变性突出,呈现高维数及非线性特                            上来看:Isomap 相比于 LLE 及 LTSA,由于要寻找
             征,使得此类运动声信号的特征提取困难,数据本质                           最短路径使得时间复杂度较高,算法处理效率降低;
             特征表示不清,且数据运算量大。因此,寻找一种能                           LLE 则考虑局部线性重构误差,计算的时间代价较
             够有效提取声特征且降低数据计算量的方法尤为                             小,求解容易,其步骤中不产生迭代                 [14] 。在对人造
             重要。流形学习是流形与机器学习相结合的方法,                            数据集 (Punctured sphere、Swiss roll) 进行降维方
             属于机器学习领域中的一种数据降维方法,涉及到                            面,LLE 算法基于数据的局部线性假设来逼近非线
             几何学、代数学及拓扑学等学科,已成功应用于图
                                                               性结构    [15] ,通过局部线性重构误差最小化获得低维
             像处理、人脸识别、语音识别及故障诊断等应用领
                                                               流形特征,适合处理非平稳的时变信号,而且 LLE
             域  [8] 。流形学习算法能够通过保持数据间的某种关
                                                               算法的计算速度快、求解简单等优点也适用于高维
             系来发掘藏匿于高维数据中的内在低维流形结构,
                                                               数、非线性的运动声信号的处理与分析。因此选取
             用低维流形结构表征数据的本质特征,并将低维流
                                                               LLE算法。
             形特征坐标化,以实现维数约简及数据可视化,从而
             完成特征提取。流形学习方法能够对高维数据进行                            1.1  高维特征矩阵构建
             维数约简并提取其本质流形特征,是一种高效提取                                在信号处理领域,对于流形学习算法中高维
             声信号特征的新方法,同时该方法又隶属于机器学                            特征矩阵的构建,有多样本信号重组                   [16] 、相空间
             习的范畴,因此利用该方法进行声特征提取研究能                            重构   [17] 、多元统计分析     [18]  和时频分析四种方法。
             够为声源智能识别奠定基础。但是,从国内外研究                            本文选用时频分析即 STFT 作为声特征初步提取
             现状来看,该方法应用于车辆噪声这类运动声信号                            方法。
             的分析处理直接相关研究甚少。为此,将流形学习                                离散短时傅里叶变换的数学表达式如下:
             这种高效降维算法应用于运动声特征提取,将声特                                          ∑                      2πk
                                                                             ∞
                                                                 S x (n, k) =    x (m) w (m − n) e −j  N  m  (1)
             征从时域、频域或时频域转化到流形域上表征不仅                                                                     ,
                                                                           m=−∞
             能够提高后期模式识别的准确性及快速性,而且是
                                                               式 (1) 中,k = 0, 1, 2, · · · , N − 1,x (n) 是原始信号,
             一种时变声信号特征提取的新思路、新途径。
                                                               w (n) 是分析窗函数,n 值为离散的而 N 值为连续
             1 基本理论                                            的,即STFT在时间上离散、在频率上连续。窗函数
                                                               w (n)会在时域中随着N 值的改变来截取信号x (n)
                 流形学习算法分为线性流形学算法和非线性                           某一时段信号,并将截取的近似平稳信号进行傅里
   55   56   57   58   59   60   61   62   63   64   65