语音识别的奥秘|星岛教室

2023-06-08 12:42

语音识别已融入我们的日常生活中,可能大家也习以为常,随手拿起平板或手机,按个按钮就会发出语音指令。Siri、Bixby、小爱同学等手机的职能语音助手,已发展到各有个性,当然这下子涉及人工智能。透过语音输入指令,然后操作打电话、发短讯、设置提醒,甚至搜寻手机内的资讯或档案等,令我们的使用变得更为方便。细心回想,不难发现日常生活中运用了相关原理的各种工具遍布方方面面,例如语音翻译软体。当中语音识别功能背后的运作原理,你又知道吗?


语音识别 操作原理

手机或其他智能装置的语音识别功能,都是要经过语音转化为文本(Speech To Text)的过程,才能让机器接收到能够理解的执行指令,作出相应的操作或反应。语音识别具体操作原理,简单来说可以分为5个步骤:

1接收语音讯号
使用麦克风或其他录音设备收集人的语音讯号。

2预处理语音讯号
对收集到的语音讯号进行数码化、去噪等处理操作,使语音讯号能够更容易被计算机解析。

3特徵提取
将处理后的语音讯号转换为特徵向量,用来描述语音讯号的声音频率、强度、节奏等资讯。

4进行语音辨识
使用已训练好的模型将特徵向量,对照转换为最符合预设的文本或指令。

5输出结果 执行指令
将语音讯号转化为文本或命令后,执行机器上相应的应用程式。

总括而言,语音辨识的操作原理是通过将语音讯号转换为特徵向量,然后使用已训练好的模型将其转换为文本或者命令。通过这个过程,让我们实现语音和文本翻译及指令控制等功能,带来人和机器的互动。


做个小创客 制作个人化语音翻译工具

由以上学习、探究和思考,我们理解到要创作语音识别工具,关键是须运用有输入语音的麦克风器材,同时要借助已训练好的语音转换模型。当有这两方面的配合,我们再运用程式创作一个个人化的语音翻译工具便不太困难了。

手机内置麦克风的设备,同时可以上网连结已训练好的语音转换模型,是理想的产出创作装置。而安卓手机为一个开放研发的平台,学生可以更容易运用App Inventor创造小工具,然后将应用程式安装到安卓手机上,测试实际效能。

大家可以按以下步骤,或扫描二维码观看影片,尝试运用App Inventor创作个人化语音翻译工具:

1. 从网页浏览器进入App Inventor网站︰https://appinventor.mit.edu/

2. 按Create Apps登入。

3. 在编辑器中选择New Project并命名,点击OK进入应用程式编辑画面。

4. 在工具栏点选User Interface选项,选择Label,加入在模拟器内的适当位置。

5. 再点选User Interface选项,选择Button,加入在模拟器内的适当位置(Button用作连结和启动网络上的语音转换模型。)

6. 最后点选Media选项,加入SpeechRecognizer组件。(版本整体设计如下,同学熟习后还可设计得更精美。)

 

7. 设计好版面后,便可到Blocks内制作对应的执行程式。

i) 未有语音输入前,Label显示为空白。
i) 未有语音输入前,Label显示为空白。

 

ii) 按下Button连结网络上的语音转换模型。
ii) 按下Button连结网络上的语音转换模型。

 

iii) 输入语音之后,运用网络上的语音转换模型,将语音翻译为最适切的文本。
iii) 输入语音之后,运用网络上的语音转换模型,将语音翻译为最适切的文本。

 

8. 版面和程式亦制作完成,我们可以检查一遍,如有错误就除错。最后按Build保存并下载你创作的应用程式.apk档案。

完成以上步骤,就可以在安卓手机上安装.apk档案,使用自己创作的个人化语音翻译工具了。

有兴趣的同学,来一起试试吧!希望你们亦可在探究和创作中,找到乐趣和满足感!

文:中华基督教会蒙黄花沃纪念小学校长、教育评议会副主席郑家宝、中华基督教会蒙黄花沃纪念小学电脑科主任郭权兴

本栏逢周四刊登,由教育评议会邀请资深中小学老师、校长及大学讲师撰稿,旨在为学生提供多元化的STEAM学习材料,引发学生探求知识的兴趣,将学习融入生活,培养学生的世界观、敏锐的触觉、积极学习的态度。


延伸阅读:

Hello Motor!探索STEAM道路|星岛教室

磁浮陀螺 — 乐与学|星岛教室

加密,究竟有几秘密?|星岛教室

〈天问〉|星岛教室


《星岛头条》APP经已推出最新版本,请立即更新,浏览更精彩内容:https://bit.ly/3yLrgYZ

關鍵字

最新回应

關鍵字

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad