Page 68 - 《应用声学》2020年第3期
P. 68

388                                                                                  2020 年 5 月


             小的图像块。对图像进行下采样的过程可表示为                             每个图像块具有恒定的长度 L。设 r 为声呐图像的
                                                             平均分辨率,约束条件可表达为
                                         ˆ      ˆ
                                        I 11 · · · I 1n
                                       .
                                                                                  ⌈    aL  ⌉
               ˆ
                                                 . 
               I = downsample(g(I)) =  . .  · · ·  . .  ,  (1)               S = 2  log 2 Ar  ,         (3)
                                                  
                                        ˆ       ˆ
                                        I m1 · · · I mn        这里,为便于DCT的计算,强制S 为2的整数幂。
                                          ˆ
             其中,I ∈ R A×B 表示原始图像,I ∈ R a×b 表示下采                    接下来,算法将预测每个图像块中是否存在目
             样图像,I ij ∈ R S×S 为m × n图像块,g(·) 是自适应              标,这时面临的主要问题就是特征描述子和分类器
             相干斑抑制器。                                           的选择。本文采用的特征描述子基于 DCT 和链码
                 图像块的网格划分将保留一定的重叠范围 (通                         (chain coding),如图 2 所示。DCT 生成一个图像块
             常为 50%),以减少边界效应的影响。为了使图像                          的频谱能量图,其纹理类似于人类指纹,可作为图
             块具有相同的尺寸,对图像的最后一行或一列一般                            像块的唯一标识。主成分位于能量图的左上角,代
             会采用更高的重叠量。换言之,m、n 可通过式 (2)                        表了稳定的低频区域。因此,从能量图中取出一个
             计算:                                               4×4矩阵,并用特定的链码对其进行排序,以保留纹
                                          ⌈ ⌉
                           ⌈ ⌉
                            a               b                  理图案:
                     m = 2     − 1, n = 2      − 1.     (2)
                            S              S                                            [     (   )]
                                                                                                ˆ         (4)
                                                                       v ij = ω · chaincode DCT I ij  ,
                 在声呐图像中,每个像素在物理上有固定的距
             离和方位分辨率。考虑到这一特点,图像块尺寸 S                           这里,DCT(·) 代表图像块的离散余弦变换,chain-
             的确定需要参考整幅图像的尺寸以及分辨率,满足                            code(·)代表链码,亦是DCT矩阵的查找表。

                                                                        1  4  5  16               1
                                                                                                  2
                                                                        2  3  6  15
                                                                                                  3
                                                                        9  8  7  14
                                       DCT                       ᩗᆊ                       Ք᧚ӑ
                                                                        10 11 12 13
                                                                                                  ...
                                                                                                  16
                       Ԕݽܦጪڏϸڱ                 ሏங͸ऺԫ૱۫ڏϸ                   ʷመᩗᆊ᛫ᇨ               ྲढ़Ք᧚

                                                  图 2  图像块指纹生成示例
                                  Fig. 2 An example of the generation of image block fingerprints

                 同时,除 DCT 指纹外,算法还将计算每个图像                       找到 k 个最近的训练样本,并以多数的标签作为测
             块的标准差、动态范围和熵,以生成显著图,作为下                           试样本的标签。由于算法直接采用向量化的图像指
             一步图像指纹分类的正则项。                                     纹作为分类器的输入,在没有在特征空间中进行更
                    v                                         高级别的抽象,因此在处理小样本问题和含有错误
                     u      2
                    u     S (        (  )) 2
                       1  ∑
                              ˆ k     ˆ
              σ ij =  t       I − E I ij    ,                 标签数据问题时保留了很好的稳健性。然而,这种
              
                                ij
                      S 2
              
                         k=1
                                                              简化也导致了一些潜在的问题:(1) 计算量将随着
              
                         2
                       S (
                     1  ∑        (  )       (   )) 2    (5)
                d
               ij =  2     max I ˆ k  − min I ˆ k  ,          数据集的扩充而增加;(2) 当特征维数增加时,距离
                                   ij
                                              ij
                    S
                       k=1                                    度量变得不再有效;(3) 算法不适用于类别不均衡
              
              
                         N
                       1  ∑        (    )
                             (ij)     (ij)
                                                              的数据集。
              h ij = −      p   log p     .
                             k        k
                       N
                          k=1                                      为适用于对较大数据集和类别不均衡数据集
             1.2 K近邻-高斯混合模型                                    的分类任务,对经典 KNN 模型进行改进,在算法框
                 将图像块的指纹输入基于 KN-GMM 的分类                        架中引入预处理 k 均值聚类和 GMM 以增强该模型
             器。经典的 K-近邻 (K-nearest neighbor, KNN) 模            对数据的概括能力。
             型通过在距离度量 (如欧几里得或曼哈顿距离) 下                              首先,假设某一特定类别的数据服从高斯混合
   63   64   65   66   67   68   69   70   71   72   73