语音识别的奥秘|星岛教室
2023-06-08 12:42
语音识别已融入我们的日常生活中,可能大家也习以为常,随手拿起平板或手机,按个按钮就会发出语音指令。Siri、Bixby、小爱同学等手机的职能语音助手,已发展到各有个性,当然这下子涉及人工智能。透过语音输入指令,然后操作打电话、发短讯、设置提醒,甚至搜寻手机内的资讯或档案等,令我们的使用变得更为方便。细心回想,不难发现日常生活中运用了相关原理的各种工具遍布方方面面,例如语音翻译软体。当中语音识别功能背后的运作原理,你又知道吗?
语音识别 操作原理
手机或其他智能装置的语音识别功能,都是要经过语音转化为文本(Speech To Text)的过程,才能让机器接收到能够理解的执行指令,作出相应的操作或反应。语音识别具体操作原理,简单来说可以分为5个步骤:
1接收语音讯号
使用麦克风或其他录音设备收集人的语音讯号。
2预处理语音讯号
对收集到的语音讯号进行数码化、去噪等处理操作,使语音讯号能够更容易被计算机解析。
3特徵提取
将处理后的语音讯号转换为特徵向量,用来描述语音讯号的声音频率、强度、节奏等资讯。
4进行语音辨识
使用已训练好的模型将特徵向量,对照转换为最符合预设的文本或指令。
5输出结果 执行指令
将语音讯号转化为文本或命令后,执行机器上相应的应用程式。
总括而言,语音辨识的操作原理是通过将语音讯号转换为特徵向量,然后使用已训练好的模型将其转换为文本或者命令。通过这个过程,让我们实现语音和文本翻译及指令控制等功能,带来人和机器的互动。
做个小创客 制作个人化语音翻译工具
由以上学习、探究和思考,我们理解到要创作语音识别工具,关键是须运用有输入语音的麦克风器材,同时要借助已训练好的语音转换模型。当有这两方面的配合,我们再运用程式创作一个个人化的语音翻译工具便不太困难了。
手机内置麦克风的设备,同时可以上网连结已训练好的语音转换模型,是理想的产出创作装置。而安卓手机为一个开放研发的平台,学生可以更容易运用App Inventor创造小工具,然后将应用程式安装到安卓手机上,测试实际效能。
大家可以按以下步骤,或扫描二维码观看影片,尝试运用App Inventor创作个人化语音翻译工具:
1. 从网页浏览器进入App Inventor网站︰https://appinventor.mit.edu/
2. 按Create Apps登入。
3. 在编辑器中选择New Project并命名,点击OK进入应用程式编辑画面。
4. 在工具栏点选User Interface选项,选择Label,加入在模拟器内的适当位置。
5. 再点选User Interface选项,选择Button,加入在模拟器内的适当位置(Button用作连结和启动网络上的语音转换模型。)
6. 最后点选Media选项,加入SpeechRecognizer组件。(版本整体设计如下,同学熟习后还可设计得更精美。)
7. 设计好版面后,便可到Blocks内制作对应的执行程式。
8. 版面和程式亦制作完成,我们可以检查一遍,如有错误就除错。最后按Build保存并下载你创作的应用程式.apk档案。
完成以上步骤,就可以在安卓手机上安装.apk档案,使用自己创作的个人化语音翻译工具了。
有兴趣的同学,来一起试试吧!希望你们亦可在探究和创作中,找到乐趣和满足感!
文:中华基督教会蒙黄花沃纪念小学校长、教育评议会副主席郑家宝、中华基督教会蒙黄花沃纪念小学电脑科主任郭权兴
本栏逢周四刊登,由教育评议会邀请资深中小学老师、校长及大学讲师撰稿,旨在为学生提供多元化的STEAM学习材料,引发学生探求知识的兴趣,将学习融入生活,培养学生的世界观、敏锐的触觉、积极学习的态度。
延伸阅读:
《星岛头条》APP经已推出最新版本,请立即更新,浏览更精彩内容:https://bit.ly/3yLrgYZ
最新回应