创科广场|内地研视觉运算平台 促进AI生态构建

2022-03-01 15:33

商汤科技在全球视觉运算研究最尖端的人工智能(AI)初创,2018年香港中文大学-商汤科技联合实验室(MMLab)推出了开源计画OpenMMLab,而2020年商汤再宣布OpenMMLab升级。

开源有助创新,中国成立上海人工智能实验室,并由商汤创办人汤晓鸥担任主任,推动上海的AI产业。

最近,上海人工智能实验室与商汤科技、中文大学、上海交通大学,再共同发布通用的视觉开源平台OpenGVLab,向学术界和产业界开放超高效预训练模型,以及千万级精标注、十万级标签量的公开数据集,有助开发人员改善各类下游视觉运算模型的训练。

OpenGVLab开放业内首个针对通用视觉模型评测基准,以便开发人员对不同通用视觉模型的性能,进行横向评估和优化。

OpenGVLab开源平台已在网上公开,供研究人员使用,以后将开放网上推理功能,供感兴趣人士体验。

解决只完成单一任务的难题

「开源是一项意义非凡的工作,人工智能发展离不开全球研究人员十馀年来开源共建。」上海人工智能实验室负责人表示:「希望通过发布OpenGVLab开源平台,帮助业界更好地探索和应用通用视觉AI技术,促进体系化解决AI发展中数据、泛化、认知和安全等瓶颈。」

上述通用视觉开源平台OpenGVLab,基于通用视觉技术体系「书生」(INTERN)建立,去年11月「书生」由上海人工智能实验室与商汤、中文大学、上海交通大学共同推出,以解决目前大部分的AI模型,只能完成单一任务的难题。

上述技术的论文《INTERN︰A New Learning Paradigm Towards General Vision》亦在arXiv平台上发表。

OpenGVLab可助开发人员降低通用视觉模型的开发门槛,用更低成本开发用于成百上千种视觉任务、视觉场景的算法模型,并解决长尾需求,推动AI的大规模应用。

上海人工智能实验室表示,OpenGVLab开源预训练模型,性能极高,覆盖分类、目标检测、语义分割、深度估计等四大视觉运算,准确率和数据使用效率,有大幅提升。研究人员可降低下游数据的采集成本,以极少的数据量,就可训练多场景、多任务AI模型。

OpenGVLab还提供多种不同参数量、不同计算量的预训练模型,以满足不同场景的应用需求。模型库中列出的多个模型,ImageNet微调结果和推理资源、速度等方面,相比之前的公开模型,均有不同程度的性能提升。

去年7月,上海人工智能实验室发布开源平台体系OpenXLab,涵盖新一代OpenMMLab和决策AI平台OpenDILab。

此次与商汤科技及各大学联合发布通用视觉开源平台OpenGVLab,为推动通用的视觉运算发展再奠定基础,完善了OpenXLab开源体系,促进人工智能基础研究和生态构建。

關鍵字

最新回应

關鍵字
You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad