ChatGPT「升呢」 支援圖片和語音輸入

2023-09-27 00:00

用戶輸入單車照片,請教ChatGPT如何降低座位。
用戶輸入單車照片,請教ChatGPT如何降低座位。

研發聊天機械人ChatGPT的美國公司OpenAI宣布,長期以來僅限於輸入文字提示的生成式人工智能(AI)平台,將新增語音互動和影像傳送功能,讓付費用戶能和ChatGPT進行語音對話;用戶也可輸入圖片,讓ChatGPT基於自己的理解而作出回應。
5種不同語音供用戶選擇

根據OpenAI說法,付費服務版本中將新增功能,將在未來兩周內對ChatGPT Plus和企業用戶推出。語音功能方面,ChatGPT可以用語音來回答問題和命令,挑戰蘋果的Siri等個人助理。

據了解,ChatGPT有5種不同的語音供用戶選擇,同時支援語音音訊生成文本、將Podcast語音翻譯成其他語言等功能。例如,OpenAI正與Spotify合作,將Podcast翻譯成其他語言,同時保持Podcast的聲音。值得注意的是,合成語音有很多有趣的用途,OpenAI可能會成為這一行業的重要組成部分。

圖片功能方面,用戶能向ChatGPT傳送圖片並詢問相關問題,ChatGPT可以根據圖片回答或給出建議。

據悉,語音功能將在iOS和Android平台推出,圖片功能則將登陸所有平台。例如,用戶可以上傳一張粉色太陽鏡的圖片,要求聊天機械人推薦與之配搭的服裝;或者拍下雪櫃內部的照片,就可取得餐點食譜建議;又或者提交一張數學問題的圖片,並請求說明解決。

OpenAI在一篇文章中表示:「語音和影像為大家提供更多在生活中使用ChatGPT的方式。在旅行時拍下一張地標的照片,就能即時討論當中有趣的地方。」 

根據OpenAI說法,語音和影像功能向ChatGPT Plus和Enterprise用戶推出後,最終會進入蘋果和Google智能手機作業系統。
 

關鍵字

最新回應

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad