语音识别的奥秘｜星岛教室

2023-06-08 12:42

语音识别已融入我们的日常生活中，可能大家也习以为常，随手拿起平板或手机，按个按钮就会发出语音指令。Siri、Bixby、小爱同学等手机的职能语音助手，已发展到各有个性，当然这下子涉及人工智能。透过语音输入指令，然后操作打电话、发短讯、设置提醒，甚至搜寻手机内的资讯或档案等，令我们的使用变得更为方便。细心回想，不难发现日常生活中运用了相关原理的各种工具遍布方方面面，例如语音翻译软体。当中语音识别功能背后的运作原理，你又知道吗？

语音识别操作原理

手机或其他智能装置的语音识别功能，都是要经过语音转化为文本（Speech To Text）的过程，才能让机器接收到能够理解的执行指令，作出相应的操作或反应。语音识别具体操作原理，简单来说可以分为5个步骤：

1接收语音讯号
使用麦克风或其他录音设备收集人的语音讯号。

2预处理语音讯号
对收集到的语音讯号进行数码化、去噪等处理操作，使语音讯号能够更容易被计算机解析。

3特徵提取
将处理后的语音讯号转换为特徵向量，用来描述语音讯号的声音频率、强度、节奏等资讯。

4进行语音辨识
使用已训练好的模型将特徵向量，对照转换为最符合预设的文本或指令。

5输出结果执行指令
将语音讯号转化为文本或命令后，执行机器上相应的应用程式。

总括而言，语音辨识的操作原理是通过将语音讯号转换为特徵向量，然后使用已训练好的模型将其转换为文本或者命令。通过这个过程，让我们实现语音和文本翻译及指令控制等功能，带来人和机器的互动。

做个小创客制作个人化语音翻译工具

由以上学习、探究和思考，我们理解到要创作语音识别工具，关键是须运用有输入语音的麦克风器材，同时要借助已训练好的语音转换模型。当有这两方面的配合，我们再运用程式创作一个个人化的语音翻译工具便不太困难了。

手机内置麦克风的设备，同时可以上网连结已训练好的语音转换模型，是理想的产出创作装置。而安卓手机为一个开放研发的平台，学生可以更容易运用App Inventor创造小工具，然后将应用程式安装到安卓手机上，测试实际效能。

大家可以按以下步骤，或扫描二维码观看影片，尝试运用App Inventor创作个人化语音翻译工具：

1. 从网页浏览器进入App Inventor网站︰https://appinventor.mit.edu/

2. 按Create Apps登入。

3. 在编辑器中选择New Project并命名，点击OK进入应用程式编辑画面。

4. 在工具栏点选User Interface选项，选择Label，加入在模拟器内的适当位置。

5. 再点选User Interface选项，选择Button，加入在模拟器内的适当位置（Button用作连结和启动网络上的语音转换模型。）

6. 最后点选Media选项，加入SpeechRecognizer组件。（版本整体设计如下，同学熟习后还可设计得更精美。）

7. 设计好版面后，便可到Blocks内制作对应的执行程式。

i) 未有语音输入前，Label显示为空白。

ii) 按下Button连结网络上的语音转换模型。

iii) 输入语音之后，运用网络上的语音转换模型，将语音翻译为最适切的文本。

8. 版面和程式亦制作完成，我们可以检查一遍，如有错误就除错。最后按Build保存并下载你创作的应用程式.apk档案。

完成以上步骤，就可以在安卓手机上安装.apk档案，使用自己创作的个人化语音翻译工具了。

有兴趣的同学，来一起试试吧！希望你们亦可在探究和创作中，找到乐趣和满足感！

文：中华基督教会蒙黄花沃纪念小学校长、教育评议会副主席郑家宝、中华基督教会蒙黄花沃纪念小学电脑科主任郭权兴

本栏逢周四刊登，由教育评议会邀请资深中小学老师、校长及大学讲师撰稿，旨在为学生提供多元化的STEAM学习材料，引发学生探求知识的兴趣，将学习融入生活，培养学生的世界观、敏锐的触觉、积极学习的态度。

语音识别的奥秘｜星岛教室

最新回应

相關新聞

磁浮陀螺 — 乐与学｜星岛教室

加密，究竟有几秘密？｜星岛教室

〈天问〉｜星岛教室

〈星岛教室〉开课校长老师学者执笔趣学STEAM知识

订阅星岛日报

联络我们

广告表格及价目表