李烱樂 - 語音合成 × 語言保育|數碼.人文
2023-08-01 17:32
當一個語言使用的人口越來越少,它可能會被列為「瀕危」;而當它再無人使用,便算是「語言滅亡」了。現實中,由使用者只剩一人、再無交談對象那天起,該語言其實也跟死亡無異。
語言滅亡和香港
常常聽到有人說:「如果所有人說一樣的語言那該多好?」是的,省了翻譯成本,辦事效率可能會提高。然而,語言是文化的載體,少了一種語言就等於少了一個認識人類文化的途徑。有說愛斯基摩人有50種方式表達雪的概念,而粵語則有「叔」、「伯」、「舅」表達英語里的「uncle」,由此可見語言與社會文化息息相關。一個地方的文化里總有很多不能輕易翻譯的概念,讓一個語言死亡的話,我們將會錯過不知多少前人的經驗和智慧。
跟香港很多人一樣,我對自己祖先的語言只是「識聽兩句但唔識講」。我祖籍廣東鶴山,看過文章說現在家鄉有很多家庭是祖輩說鶴山話,而孫輩只講標準廣州話和普通話。有一次,我問嫁到香港來的表姐能不能教我說鶴山話,她卻反問我:「識鄉下話有咩用?」研究語言的我自然覺得很可惜。
香港原居民的情況很相近,長輩常常不願把祖宗的語言教給子弟。香港本土語言保育協會的劉鎮發教授指出原居民語言有圍頭話、客家話、平婆話、大鵬話等,而其「瀕危程度可以算是相當危急」。劉教授指出新界圍村里有不少長輩不願看到子弟學習祖宗留下的語言,認為說這些本土語言會被標籤為「鄉下佬」。因此,很多年輕圍村人都只會說香港粵語。
拯救瀕危語言
要拯救瀕危語言,我們可以把它們記錄、保育、再活化。清楚的記錄可以成為學習資源,對下一步的保育和活化相當重要。但瀕危語言往往不易記錄:村落的環境可能有鳥鳴獸吼影響錄音質量,且僅存的使用者多已年邁且聲音沙啞,或無法長時間配合研究工作,這些情況往往使難得收集回來的數據質量參差,難以分析甚至無法使用。由於年長使用者的人數只會不斷減少,記錄工作刻不容緩,但上述的局限卻是語言保育日常面對的挑戰。
其實即使數據不足、錄音質量不理想,語言學家還是可以用語音合成等方法確保分析可靠。我們可以先分析手上可用的錄音,再用電腦合成目標語言的句子讓說話人判斷。合成的句子反映研究員對目標語言的理解,如果說話人也認為它們正確,就表示分析無誤。由於合成的語音清晰不含雜音,因此能確保判斷的可靠度,提高田野研究的質量。
相關保育工作
香港教育大學人文學院和語言學及現代語言系近年開始涉獵語言保育工作。其中劉擇明博士獲衛奕信勳爵文物信託資助,為客家話及圍頭話出版有聲故事書,為本土語言保育出一分力。筆者獲教育資助委員會優配研究金撥款,將語音建模和合成推廣至田野語言學,讓語言保育的同儕輕易掌握最新的語音研究方法,以應對田野的實際挑戰,與時間競賽。我們的英語研究及數碼傳訊榮譽文學士課程,亦有教授相關科目,如社會語言學和於畢業論文學習使用語音合成,讓保育從認識做起。
文:香港教育大學英語研究及數碼傳訊榮譽文學士課程主任及語言學及現代語言系助理教授李烱樂博士
本欄歡迎院校學者投稿,分享個人學術見解及研究成果,1400字為限,查詢及投稿請電郵︰[email protected]。
文章刊於《星島日報》2023年8月1日教育版專欄「大學之道」。
延伸閱讀:
數碼‧人文|The Digital Paper-Knife數碼化的裁紙刀
《星島頭條》APP經已推出最新版本,請立即更新,瀏覽更精彩內容:https://bit.ly/3yLrgYZ
最新回應