Page 84 - 201903
P. 84
366 2019 年 5 月
I P
I P
I T
I T
t P t T t P
图 1 音节音强正负斜率计算示意图
Fig. 1 Calculation diagram of positive and negative slopes of syllable
计算每个音节音强的正斜率 (音节音强上升斜率), X = µ ± 1.45S. (9)
根据公式
这些等式确定的分布范围,正是不同置信度下音节
S − = (I P − I T )/(t T − t P ), (5) 音强斜率的个体变异范围。如果比较值落在这一区
计算每个音节音强的负斜率(音节音强下降斜率)。 域内,则表明二者之间没有明显差异;如果比较值落
在这一区域外,则表明二者之间存在明显差异。
1.4 统计分析
1.4.1 统计原理 1.4.2 统计步骤及内容
司法话者识别的基本前提是语音个体变异要 (1)单个音节音强斜率比较
小于其人间差异 [12] 。本文围绕这一前提对同卵双 对于利用公式 (4)、公式 (5) 分别计算出的每个
胞胎语音音节音强斜率的个体变异及人间差异分 音节音强的斜率,按表 1 分别统计每对双胞胎个体
别进行统计分析。 音强斜率的两类差异。表 1 中 “RT”、“RJ” 分别代
根据统计学理论,首先需要确定斜率数据的分 表一对双胞胎中的两个同胎个体;“S + ”、“S − ” 分
布类型。先前研究表明,同一人相同内容的多遍语 别代表音节音强的正斜率与负斜率;“S + A 类差
音,其音节音强与时长分布整体符合正态分布 [10] 。 异”、“S − A 类差异” 分别代表音节音强的正斜率、
根据两个相互独立正态分布的线性转化仍为正态
分布的原理可以推知,作为音强差与时长差之比的 表 1 双胞胎 RT&RJ 音节/ta/音强斜率统计
结果
音强斜率也符合正态分布。而在司法实践中,语音
Table 1 Statistical results of syllable/ta/
样本数量一般为 5 次左右,属小样本范畴。根据数
intensity slopes of twins RT&RJ
理统计规律,小样本正态分布数据的分布范围可以
在一定置信度下由式(6)求得 [13] 音节 S + S − S + A 类差异 S − A 类差异
√ ta1 287.32 196.49 0 0
X = µ ± t α,f × S/ n, (6)
ta2 233.36 238.50 0 1
其中,µ是样本均值,t α,f 为一定置信度(1 − α)100% ta3 282.26 196.03 0 0
与自由度 f = n − 1 下的置信系数,可由 t 分布表中 RT ta4 299.14 191.67 1 0
ta5 272.81 168.72 0 1
查出,S 为标准差,n为样本个数。式(6) 的概率意义
√ 均值 274.98 198.28
是它表明真值 X 落在置信区间 (µ ± t α,f × S/ n)
标准差 25.13 25.22
的置信度概率为P = 1 − α。 90% 分布 251.10 174.33
根据实验条件,实验中 f = 5 − 1 = 4;在 90%、 范围 298.85 222.24
95%、98% 置信度下,α 分别为 0.10、0.05、0.02;查 t 音节 S + S − S + B 类差异 S − B 类差异
分布表得 t α,f 分别为 2.13、2.78、3.75。于是在 90%、 ta1 283.02 133.91 0 1
95%、98%置信度下,式(6)又可以分别表示为 ta2 305.86 176.35 1 0
RJ ta3 310.60 157.90 1 1
X = µ ± 0.95S, (7) ta4 346.32 137.10 1 1
X = µ ± 1.24S, (8) ta5 334.85 167.66 1 1