李烱乐 - 语音合成 × 语言保育|数码.人文

2023-08-01 17:32

当一个语言使用的人口越来越少,它可能会被列为「濒危」;而当它再无人使用,便算是「语言灭亡」了。现实中,由使用者只剩一人、再无交谈对象那天起,该语言其实也跟死亡无异。


语言灭亡和香港

常常听到有人说:「如果所有人说一样的语言那该多好?」是的,省了翻译成本,办事效率可能会提高。然而,语言是文化的载体,少了一种语言就等于少了一个认识人类文化的途径。有说爱斯基摩人有50种方式表达雪的概念,而粤语则有「叔」、「伯」、「舅」表达英语里的「uncle」,由此可见语言与社会文化息息相关。一个地方的文化里总有很多不能轻易翻译的概念,让一个语言死亡的话,我们将会错过不知多少前人的经验和智慧。

跟香港很多人一样,我对自己祖先的语言只是「识听两句但唔识讲」。我祖籍广东鹤山,看过文章说现在家乡有很多家庭是祖辈说鹤山话,而孙辈只讲标准广州话和普通话。有一次,我问嫁到香港来的表姐能不能教我说鹤山话,她却反问我:「识乡下话有咩用?」研究语言的我自然觉得很可惜。

香港原居民的情况很相近,长辈常常不愿把祖宗的语言教给子弟。香港本土语言保育协会的刘镇发教授指出原居民语言有围头话、客家话、平婆话、大鹏话等,而其「濒危程度可以算是相当危急」。刘教授指出新界围村里有不少长辈不愿看到子弟学习祖宗留下的语言,认为说这些本土语言会被标签为「乡下佬」。因此,很多年轻围村人都只会说香港粤语。


拯救濒危语言

要拯救濒危语言,我们可以把它们记录、保育、再活化。清楚的记录可以成为学习资源,对下一步的保育和活化相当重要。但濒危语言往往不易记录:村落的环境可能有鸟鸣兽吼影响录音质量,且仅存的使用者多已年迈且声音沙哑,或无法长时间配合研究工作,这些情况往往使难得收集回来的数据质量参差,难以分析甚至无法使用。由于年长使用者的人数只会不断减少,记录工作刻不容缓,但上述的局限却是语言保育日常面对的挑战。

其实即使数据不足、录音质量不理想,语言学家还是可以用语音合成等方法确保分析可靠。我们可以先分析手上可用的录音,再用电脑合成目标语言的句子让说话人判断。合成的句子反映研究员对目标语言的理解,如果说话人也认为它们正确,就表示分析无误。由于合成的语音清晰不含杂音,因此能确保判断的可靠度,提高田野研究的质量。


相关保育工作

香港教育大学人文学院和语言学及现代语言系近年开始涉猎语言保育工作。其中刘择明博士获卫奕信勋爵文物信托资助,为客家话及围头话出版有声故事书,为本土语言保育出一分力。笔者获教育资助委员会优配研究金拨款,将语音建模和合成推广至田野语言学,让语言保育的同侪轻易掌握最新的语音研究方法,以应对田野的实际挑战,与时间竞赛。我们的英语研究及数码传讯荣誉文学士课程,亦有教授相关科目,如社会语言学和于毕业论文学习使用语音合成,让保育从认识做起。


文:香港教育大学英语研究及数码传讯荣誉文学士课程主任及语言学及现代语言系助理教授李烱乐博士

本栏欢迎院校学者投稿,分享个人学术见解及研究成果,1400字为限,查询及投稿请电邮︰[email protected]

文章刊于《星岛日报》2023年8月1日教育版专栏「大学之道」。


延伸阅读:

何志恒 - 「生生不息」的中文课|数码.人文

叶倬玮 - 地方感何处寻|数码.人文

数码‧人文|The Digital Paper-Knife数码化的裁纸刀

数码‧人文|从资讯科技到数码人文

数码人文|电子游戏对三国文学经典的解构与重构


《星岛头条》APP经已推出最新版本,请立即更新,浏览更精彩内容:https://bit.ly/3yLrgYZ
 

關鍵字

最新回应

關鍵字

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad