Page 68 - 《应用声学》2020年第3期
P. 68
388 2020 年 5 月
小的图像块。对图像进行下采样的过程可表示为 每个图像块具有恒定的长度 L。设 r 为声呐图像的
平均分辨率,约束条件可表达为
ˆ ˆ
I 11 · · · I 1n
.
⌈ aL ⌉
ˆ
.
I = downsample(g(I)) = . . · · · . . , (1) S = 2 log 2 Ar , (3)
ˆ ˆ
I m1 · · · I mn 这里,为便于DCT的计算,强制S 为2的整数幂。
ˆ
其中,I ∈ R A×B 表示原始图像,I ∈ R a×b 表示下采 接下来,算法将预测每个图像块中是否存在目
样图像,I ij ∈ R S×S 为m × n图像块,g(·) 是自适应 标,这时面临的主要问题就是特征描述子和分类器
相干斑抑制器。 的选择。本文采用的特征描述子基于 DCT 和链码
图像块的网格划分将保留一定的重叠范围 (通 (chain coding),如图 2 所示。DCT 生成一个图像块
常为 50%),以减少边界效应的影响。为了使图像 的频谱能量图,其纹理类似于人类指纹,可作为图
块具有相同的尺寸,对图像的最后一行或一列一般 像块的唯一标识。主成分位于能量图的左上角,代
会采用更高的重叠量。换言之,m、n 可通过式 (2) 表了稳定的低频区域。因此,从能量图中取出一个
计算: 4×4矩阵,并用特定的链码对其进行排序,以保留纹
⌈ ⌉
⌈ ⌉
a b 理图案:
m = 2 − 1, n = 2 − 1. (2)
S S [ ( )]
ˆ (4)
v ij = ω · chaincode DCT I ij ,
在声呐图像中,每个像素在物理上有固定的距
离和方位分辨率。考虑到这一特点,图像块尺寸 S 这里,DCT(·) 代表图像块的离散余弦变换,chain-
的确定需要参考整幅图像的尺寸以及分辨率,满足 code(·)代表链码,亦是DCT矩阵的查找表。
1 4 5 16 1
2
2 3 6 15
3
9 8 7 14
DCT ᩗᆊ Ք᧚ӑ
10 11 12 13
...
16
Ԕݽܦጪڏϸڱ ሏஙऺԫ૱۫ڏϸ ʷመᩗᆊ᛫ᇨ ྲढ़Ք᧚
图 2 图像块指纹生成示例
Fig. 2 An example of the generation of image block fingerprints
同时,除 DCT 指纹外,算法还将计算每个图像 找到 k 个最近的训练样本,并以多数的标签作为测
块的标准差、动态范围和熵,以生成显著图,作为下 试样本的标签。由于算法直接采用向量化的图像指
一步图像指纹分类的正则项。 纹作为分类器的输入,在没有在特征空间中进行更
v 高级别的抽象,因此在处理小样本问题和含有错误
u 2
u S ( ( )) 2
1 ∑
ˆ k ˆ
σ ij = t I − E I ij , 标签数据问题时保留了很好的稳健性。然而,这种
ij
S 2
k=1
简化也导致了一些潜在的问题:(1) 计算量将随着
2
S (
1 ∑ ( ) ( )) 2 (5)
d
ij = 2 max I ˆ k − min I ˆ k , 数据集的扩充而增加;(2) 当特征维数增加时,距离
ij
ij
S
k=1 度量变得不再有效;(3) 算法不适用于类别不均衡
N
1 ∑ ( )
(ij) (ij)
的数据集。
h ij = − p log p .
k k
N
k=1 为适用于对较大数据集和类别不均衡数据集
1.2 K近邻-高斯混合模型 的分类任务,对经典 KNN 模型进行改进,在算法框
将图像块的指纹输入基于 KN-GMM 的分类 架中引入预处理 k 均值聚类和 GMM 以增强该模型
器。经典的 K-近邻 (K-nearest neighbor, KNN) 模 对数据的概括能力。
型通过在距离度量 (如欧几里得或曼哈顿距离) 下 首先,假设某一特定类别的数据服从高斯混合