GPT-4大躍進 能解讀分析圖像

2023-03-16 00:00

GPT-4被問到圖中的繩子若被剪掉,會發生甚麼事?它回答說那些氣球會飛走,顯示它可進行邏輯推理。
GPT-4被問到圖中的繩子若被剪掉,會發生甚麼事?它回答說那些氣球會飛走,顯示它可進行邏輯推理。

(星島日報報道)美國人工智能(AI)聊天機械人ChatGPT風靡全球。開發商OpenAI周二宣布推出ChatGPT的升級版GPT-4,稱其性能表現比之前版本大幅躍進,更強大、準確。新版GPT-4能夠解讀、分析圖像。OpenAI表示,GPT-4在某些專業考試中表現比舊版更突出,例如在美國律師資格模擬考試中能取得相當於前10%應試者的分數,即勝過9成考生。
美國科網初創公司OpenAI去年11月底首度發布ChatGPT,原理為人工智能(AI)驅動的大型語言數據庫模型,能夠模擬人類的語言行為,以文字流暢地與用戶對話,還能編寫代碼、寫論文等,迅即引爆熱潮。OpenAI周二又推出「更強大」語言模型系統GPT-4。該公司稱,最新版GPT-4除了文字外還能接收圖像輸入,輸出文本,且「因其具備更廣泛的常識和解決問題的能力,可以更準確地解決難題」。

GPT-4會以文字來解釋圖片內容。輸入的圖片可以是照片、圖表或熒幕解圖。舉例來說,若用戶發送一張冰箱內部的圖片,GPT-4不僅會正確辨識圖上的食材,還可以寫出用這些食材能做出的食物。
ChatGPT升級版

OpenAI總裁兼聯合創始人布羅克曼(Greg Brockman)在演示時說,GPT-4比其前身GP-T3.5版本犯的錯誤更少,但要達到最佳效果仍需輔以人工檢查。布羅克曼還花了不少篇幅解說新版系統如何細緻描述來自哈勃太空望遠鏡的圖像。未來,GPT-4還將持續強化解圖能力。OpenAI也透過網誌表示,新模型產生更少的錯誤答案、減少偏離軌道和談論禁忌話題的頻率。

OpenAI表示GPT-4花了6個月測試,儘管「離完美還很遙遠」,在真實世界的情境表現不如人類,但此在不同的專業和學術水準上的成果,比前一代系統有顯著提升。OpenAI稱,新系統可以在美國41個州和地區的律師資格考試中,獲得相當於約前10%學生的分數,即可勝過9成考生。而上一代ChatGPT語言模型則只能拿到相當於最尾10%學生組別的分數。

此外,在美國大學入學測驗SAT的閱讀和數學考試,GPT-4亦比上一代進化。據該公司的測試,該系統可以在SAT試中獲得1300分(滿分為1600分)。而高級先修高中(AP,又稱大學先修課程)考試中的生物、微積分、宏觀經濟學、心理學、統計學和歷史等科目,可獲得優等的5分。
英文答題正確率80.5%

OpenAI宣稱,GPT-4英文答題的正確率達到80.5%,高於3.5版的70.1%,甚至也高於Google日前的PaLM模型英文答題的69.3%正確率。不過,PaLM答題正確率是OpenAI自行實測的結果,而非Google官方數據。值得注意的是,GPT-4對翻譯成中文版的MMLU答題正確率也達到了80.1%,日語和韓語版也都有70至80%的正確率。

OpenAI表示,在日常對話情境中,GPT-4和上一代語言模型的差異不明顯,但當任務的複雜程度到達一定門檻後,GPT-4較富創意並能執行較多細微的指令。由於GPT-4訓練的資料量更為龐大,因此與前幾代系統相較準確度有再提升。微軟也證實,旗下新版的Bing聊天機械人就是使用GPT-4。
 

關鍵字

最新回應

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad