Page 64 - 《应用声学》2024年第1期

P. 64

60 2024 年 1 月

若：f x = f min ，分，例如他在从音阶c到c 的12个半音的音高域中，
′
则：D = 1 + 0 × 4 = 1. 使音高每升高 2.4 半音，声调值增加 1 度。由此将表
若：f x = f max ，示为半音的不同音高转换为声调的五度值，如图 5
则：D = 1 + 1 × 4 = 5. 所示。
即 f x 在 f min ∼ f max 域中变化时，如果 D 取整
数，将得到1、2、3、4、5等5个单位为度的调值。
图3 为汉语语音合成声调模型 [4−5] 。它是由一
᫻ࣱ ᫺ࣱ ʽܦ ԝܦ
位发音人，在嵌板句朗读汉语/a/、/o/、/e/、/i/、
图 4 白涤洲先生测得的北京话四声 [6]
/u/、/ü/六个单韵母得到不同声调的音高平均曲线，
Fig. 4 Mr. Bai Dizhou measured the four voices
通过公式(1)标调的结果。横坐标为归一化时长，左
of Beijing dialect [6]
纵坐标为五度标调值，右纵坐标表示对应的基频值。
5 183 25 24.4
c' 24
᫻ࣱ b 23 23.2 23.4
22 22.2 21.8
4 149 a 21

20 ᫺ࣱ ᫻ࣱ
ʽܦ ԝܦ
19
̋एಖូូϙ 3 ᫺ࣱ ԝܦ ӧԝ 118 ۳ᮠ/Hz f e 18 16.2 12~14.4὘ʷए
g
Ѭ˞̋एὊࡃ௧὘
18
14.4~16.8὘̄ए
17
16.8~19.2὘ʼए
16
21.6~24.4὘̋ए
d 15 19.2~21.6὘پए
14
2 93
13 13.4
ԝܦ e 12 11.8
ӧʽ
11
1 74 [6]
0 0.2 0.4 0.6 0.8 1.0 图 5 白涤洲先生的声调调值 “归类” 法
ᄱࠫ௑᫂ Fig. 5 Mr. Bai Dizhou’s “classiﬁcation” of tone [6]
图 3 汉语语音合成声调模型 [4−5]
由于这种确定声调五度值的方法简单直观、容
Fig. 3 Chinese speech synthesis tone model [4−5]
易实施，林焘和王理嘉 [7] ，以及曹剑芬 [8] 详细推荐
由图3 可见阴平的调值为5-5，阳平为 3-5，上声了这个算法。该方法成为近一个世纪以来，汉语声
为2-1-4，半上为3-1，去声为5-1，半去为5-2。中国科
调实验研究中普遍采用的方法。文献 [7] 增订版 [9]
学院声学研究所研制的 KX-1 合成器合成的汉语声
引入了五度值的上述 D 计算公式 (1) 和下述 T 计算
调与传统调值符合。此外，这个标调计算准确到小
公式 (2)，删除了某一方言最低频率为 100 Hz、最高
数点后两位，使其呈现为平滑的曲线，以满足言语工
为 300 Hz 的调域对数值五等分的五度归类方法的
程技术上的特殊需要。因此，公式(1)不仅完美地用
阐述。
数学语言表达了赵元任先生的汉语声调标调理论，
1986 年，石锋 [10] 提出了 T 值的汉语声调五度
也拓展了声调的五度标度法的内涵。
值新的计算方法，T 值的计算公式为
lg x − lg b
2 汉语普通话声调调值的五度“归类”法 T = × 5, (2)
lg a − lg b
20 世纪 30 年代，除了赵元任先生外，刘复和白式(2) 中，a为调域的上限，b为调域的下限，x为a 和
涤洲先生也在研究声调。刘复先生制作了声调推断 b 之间的测量点。他还给出了天津话不同声调的音
尺，白涤洲先生利用它推断出字调不同时间的音高，高曲线，例如阴平调如图6所示 [10] 。
获得北京话四声的音高曲线。如果用乐谱写下来，图 6 中粗线表示单字音声调；细线表示阴平做
[6]
得到图4 。前字时的声调，a、b、c、d、o 表示后字分别为阴、阳、
这项研究中的汉语四声，是与赵元任先生的观上、去、轻声。由公式 (2) 和图 5 可以发现，T 有0、1、
点契合的，但在如何标定四声的理念上迥然不同。 2、3、4、5 六个调值，与赵元任先生的五度标调理论
白涤洲先生将说话人从最低到最高的音高域五等迥然不同。因此在 1991 年，石锋 [11] 把 T 值改称为

59 60 61 62 63 64 65 66 67 68 69