Page 64 - 《应用声学》2024年第1期
P. 64
60 2024 年 1 月
若:f x = f min , 分,例如他在从音阶c到c 的12个半音的音高域中,
′
则:D = 1 + 0 × 4 = 1. 使音高每升高 2.4 半音,声调值增加 1 度。由此将表
若:f x = f max , 示为半音的不同音高转换为声调的五度值,如图 5
则:D = 1 + 1 × 4 = 5. 所示。
即 f x 在 f min ∼ f max 域中变化时,如果 D 取整
数,将得到1、2、3、4、5等5个单位为度的调值。
图3 为汉语语音合成声调模型 [4−5] 。它是由一
ࣱ ࣱ ʽܦ ԝܦ
位发音人,在嵌板句朗读汉语/a/、/o/、/e/、/i/、
图 4 白涤洲先生测得的北京话四声 [6]
/u/、/ü/六个单韵母得到不同声调的音高平均曲线,
Fig. 4 Mr. Bai Dizhou measured the four voices
通过公式(1)标调的结果。横坐标为归一化时长,左
of Beijing dialect [6]
纵坐标为五度标调值,右纵坐标表示对应的基频值。
5 183 25 24.4
c' 24
ࣱ b 23 23.2 23.4
22 22.2 21.8
4 149 a 21
20 ࣱ ࣱ
ʽܦ ԝܦ
19
̋एಖូូϙ 3 ࣱ ԝܦ ӧԝ 118 ۳ᮠ/Hz f e 18 16.2 12~14.4ʷए
g
Ѭ˞̋एὊࡃ௧
18
14.4~16.8̄ए
17
16.8~19.2ʼए
16
21.6~24.4̋ए
d 15 19.2~21.6پए
14
2 93
13 13.4
ԝܦ e 12 11.8
ӧʽ
11
1 74 [6]
0 0.2 0.4 0.6 0.8 1.0 图 5 白涤洲先生的声调调值 “归类” 法
ᄱࠫ᫂ Fig. 5 Mr. Bai Dizhou’s “classification” of tone [6]
图 3 汉语语音合成声调模型 [4−5]
由于这种确定声调五度值的方法简单直观、容
Fig. 3 Chinese speech synthesis tone model [4−5]
易实施,林焘和王理嘉 [7] ,以及曹剑芬 [8] 详细推荐
由图3 可见阴平的调值为5-5,阳平为 3-5,上声 了这个算法。该方法成为近一个世纪以来,汉语声
为2-1-4,半上为3-1,去声为5-1,半去为5-2。中国科
调实验研究中普遍采用的方法。文献 [7] 增订版 [9]
学院声学研究所研制的 KX-1 合成器合成的汉语声
引入了五度值的上述 D 计算公式 (1) 和下述 T 计算
调与传统调值符合。此外,这个标调计算准确到小
公式 (2),删除了某一方言最低频率为 100 Hz、最高
数点后两位,使其呈现为平滑的曲线,以满足言语工
为 300 Hz 的调域对数值五等分的五度归类方法的
程技术上的特殊需要。因此,公式(1)不仅完美地用
阐述。
数学语言表达了赵元任先生的汉语声调标调理论,
1986 年,石锋 [10] 提出了 T 值的汉语声调五度
也拓展了声调的五度标度法的内涵。
值新的计算方法,T 值的计算公式为
lg x − lg b
2 汉语普通话声调调值的五度“归类”法 T = × 5, (2)
lg a − lg b
20 世纪 30 年代,除了赵元任先生外,刘复和白 式(2) 中,a为调域的上限,b为调域的下限,x为a 和
涤洲先生也在研究声调。刘复先生制作了声调推断 b 之间的测量点。他还给出了天津话不同声调的音
尺,白涤洲先生利用它推断出字调不同时间的音高, 高曲线,例如阴平调如图6所示 [10] 。
获得北京话四声的音高曲线。如果用乐谱写下来, 图 6 中粗线表示单字音声调;细线表示阴平做
[6]
得到图4 。 前字时的声调,a、b、c、d、o 表示后字分别为阴、阳、
这项研究中的汉语四声,是与赵元任先生的观 上、去、轻声。由公式 (2) 和图 5 可以发现,T 有0、1、
点契合的,但在如何标定四声的理念上迥然不同。 2、3、4、5 六个调值,与赵元任先生的五度标调理论
白涤洲先生将说话人从最低到最高的音高域五等 迥然不同。因此在 1991 年,石锋 [11] 把 T 值改称为