ChatGPT「升呢」 支援图片和语音输入

2023-09-27 00:00

用户输入单车照片,请教ChatGPT如何降低座位。
用户输入单车照片,请教ChatGPT如何降低座位。

研发聊天机械人ChatGPT的美国公司OpenAI宣布,长期以来仅限于输入文字提示的生成式人工智能(AI)平台,将新增语音互动和影像传送功能,让付费用户能和ChatGPT进行语音对话;用户也可输入图片,让ChatGPT基于自己的理解而作出回应。
5种不同语音供用户选择

根据OpenAI说法,付费服务版本中将新增功能,将在未来两周内对ChatGPT Plus和企业用户推出。语音功能方面,ChatGPT可以用语音来回答问题和命令,挑战苹果的Siri等个人助理。

据了解,ChatGPT有5种不同的语音供用户选择,同时支援语音音讯生成文本、将Podcast语音翻译成其他语言等功能。例如,OpenAI正与Spotify合作,将Podcast翻译成其他语言,同时保持Podcast的声音。值得注意的是,合成语音有很多有趣的用途,OpenAI可能会成为这一行业的重要组成部分。

图片功能方面,用户能向ChatGPT传送图片并询问相关问题,ChatGPT可以根据图片回答或给出建议。

据悉,语音功能将在iOS和Android平台推出,图片功能则将登陆所有平台。例如,用户可以上传一张粉色太阳镜的图片,要求聊天机械人推荐与之配搭的服装;或者拍下雪柜内部的照片,就可取得餐点食谱建议;又或者提交一张数学问题的图片,并请求说明解决。

OpenAI在一篇文章中表示:「语音和影像为大家提供更多在生活中使用ChatGPT的方式。在旅行时拍下一张地标的照片,就能即时讨论当中有趣的地方。」 

根据OpenAI说法,语音和影像功能向ChatGPT Plus和Enterprise用户推出后,最终会进入苹果和Google智能手机作业系统。
 

關鍵字

最新回应

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad