GPT-4大跃进 能解读分析图像

2023-03-16 00:00

GPT-4被问到图中的绳子若被剪掉,会发生甚么事?它回答说那些气球会飞走,显示它可进行逻辑推理。
GPT-4被问到图中的绳子若被剪掉,会发生甚么事?它回答说那些气球会飞走,显示它可进行逻辑推理。

(星岛日报报道)美国人工智能(AI)聊天机械人ChatGPT风靡全球。开发商OpenAI周二宣布推出ChatGPT的升级版GPT-4,称其性能表现比之前版本大幅跃进,更强大、准确。新版GPT-4能够解读、分析图像。OpenAI表示,GPT-4在某些专业考试中表现比旧版更突出,例如在美国律师资格模拟考试中能取得相当于前10%应试者的分数,即胜过9成考生。
美国科网初创公司OpenAI去年11月底首度发布ChatGPT,原理为人工智能(AI)驱动的大型语言数据库模型,能够模拟人类的语言行为,以文字流畅地与用户对话,还能编写代码、写论文等,迅即引爆热潮。OpenAI周二又推出「更强大」语言模型系统GPT-4。该公司称,最新版GPT-4除了文字外还能接收图像输入,输出文本,且「因其具备更广泛的常识和解决问题的能力,可以更准确地解决难题」。

GPT-4会以文字来解释图片内容。输入的图片可以是照片、图表或荧幕解图。举例来说,若用户发送一张冰箱内部的图片,GPT-4不仅会正确辨识图上的食材,还可以写出用这些食材能做出的食物。
ChatGPT升级版

OpenAI总裁兼联合创始人布罗克曼(Greg Brockman)在演示时说,GPT-4比其前身GP-T3.5版本犯的错误更少,但要达到最佳效果仍需辅以人工检查。布罗克曼还花了不少篇幅解说新版系统如何细致描述来自哈勃太空望远镜的图像。未来,GPT-4还将持续强化解图能力。OpenAI也透过网志表示,新模型产生更少的错误答案、减少偏离轨道和谈论禁忌话题的频率。

OpenAI表示GPT-4花了6个月测试,尽管「离完美还很遥远」,在真实世界的情境表现不如人类,但此在不同的专业和学术水准上的成果,比前一代系统有显著提升。OpenAI称,新系统可以在美国41个州和地区的律师资格考试中,获得相当于约前10%学生的分数,即可胜过9成考生。而上一代ChatGPT语言模型则只能拿到相当于最尾10%学生组别的分数。

此外,在美国大学入学测验SAT的阅读和数学考试,GPT-4亦比上一代进化。据该公司的测试,该系统可以在SAT试中获得1300分(满分为1600分)。而高级先修高中(AP,又称大学先修课程)考试中的生物、微积分、宏观经济学、心理学、统计学和历史等科目,可获得优等的5分。
英文答题正确率80.5%

OpenAI宣称,GPT-4英文答题的正确率达到80.5%,高于3.5版的70.1%,甚至也高于Google日前的PaLM模型英文答题的69.3%正确率。不过,PaLM答题正确率是OpenAI自行实测的结果,而非Google官方数据。值得注意的是,GPT-4对翻译成中文版的MMLU答题正确率也达到了80.1%,日语和韩语版也都有70至80%的正确率。

OpenAI表示,在日常对话情境中,GPT-4和上一代语言模型的差异不明显,但当任务的复杂程度到达一定门槛后,GPT-4较富创意并能执行较多细微的指令。由于GPT-4训练的资料量更为庞大,因此与前几代系统相较准确度有再提升。微软也证实,旗下新版的Bing聊天机械人就是使用GPT-4。
 

關鍵字

最新回应

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad