中大研新通用视觉技术「书生」

2021-11-26 03:50

中大联同上海人工智能实验室、商汤科技及上海交通大学 共同发布新通用视觉技术体系「书生」。受访者提供
中大联同上海人工智能实验室、商汤科技及上海交通大学 共同发布新通用视觉技术体系「书生」。受访者提供

人工智能(AI)应用层面愈来愈广泛。中文大学联同人工智能实验室、商汤科技及上海交通大学,研发名为「书生」(INTERN)的新一代通用视觉技术系统,可改善现时人工智能视觉领域中,AI模型在任务和场景通用性、数据学习效率方面的瓶颈问题,业界可以极低成本获取下游资料,快速验证多个新场景等。有关技术已于论文发布平台arXiv发布。

可同时完成多项任务

新系统名为「书生」,寓意系统拥有如书生般的特质,通过持续学习,举一反三。目前的AI模型只擅长处理一项任务,在新场景、数据学习、新任务的通用性有限,面对不同任务需求,须独立开发模型。但「书生」系统则可同时完成多项任务,应用于多样化的场景,包括自动驾驶、智慧制造、智慧城市等。技术测试结果显示,一个「书生」基础模型可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。

相比现时最先进的开源模型CLIP,「书生」在准确性和数据使用效率方面均大幅提升。例如应用同样的下游场景,「书生」在上述四大任务的平均错误率,降低9.4%至47.3%不等;另外,在数据使用效率方面的提升尤为突出,例如只需要十分之一的下游资料,便能准确识别花卉的种类,比CLIP以完整下游资料进行分析的准确度更高。中大指,利用这个新系统,业界可以极低成本获取下游资料,快速验证多个新场景,体现了产学研合作在通用视觉领域的全新探索,为走向通用人工智能迈出坚实一步。

原文刊《星岛日报》教育版

關鍵字

最新回应

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad