創科廣場|內地研視覺運算平台 促進AI生態構建

2022-03-01 15:33

商湯科技在全球視覺運算研究最尖端的人工智能(AI)初創,2018年香港中文大學-商湯科技聯合實驗室(MMLab)推出了開源計畫OpenMMLab,而2020年商湯再宣布OpenMMLab升級。

開源有助創新,中國成立上海人工智能實驗室,並由商湯創辦人湯曉鷗擔任主任,推動上海的AI產業。

最近,上海人工智能實驗室與商湯科技、中文大學、上海交通大學,再共同發布通用的視覺開源平台OpenGVLab,向學術界和產業界開放超高效預訓練模型,以及千萬級精標注、十萬級標籤量的公開數據集,有助開發人員改善各類下游視覺運算模型的訓練。

OpenGVLab開放業內首個針對通用視覺模型評測基準,以便開發人員對不同通用視覺模型的性能,進行橫向評估和優化。

OpenGVLab開源平台已在網上公開,供研究人員使用,以後將開放網上推理功能,供感興趣人士體驗。

解決只完成單一任務的難題

「開源是一項意義非凡的工作,人工智能發展離不開全球研究人員十餘年來開源共建。」上海人工智能實驗室負責人表示:「希望通過發布OpenGVLab開源平台,幫助業界更好地探索和應用通用視覺AI技術,促進體系化解決AI發展中數據、泛化、認知和安全等瓶頸。」

上述通用視覺開源平台OpenGVLab,基於通用視覺技術體系「書生」(INTERN)建立,去年11月「書生」由上海人工智能實驗室與商湯、中文大學、上海交通大學共同推出,以解決目前大部分的AI模型,只能完成單一任務的難題。

上述技術的論文《INTERN︰A New Learning Paradigm Towards General Vision》亦在arXiv平台上發表。

OpenGVLab可助開發人員降低通用視覺模型的開發門檻,用更低成本開發用於成百上千種視覺任務、視覺場景的算法模型,並解決長尾需求,推動AI的大規模應用。

上海人工智能實驗室表示,OpenGVLab開源預訓練模型,性能極高,覆蓋分類、目標檢測、語義分割、深度估計等四大視覺運算,準確率和數據使用效率,有大幅提升。研究人員可降低下游數據的採集成本,以極少的數據量,就可訓練多場景、多任務AI模型。

OpenGVLab還提供多種不同參數量、不同計算量的預訓練模型,以滿足不同場景的應用需求。模型庫中列出的多個模型,ImageNet微調結果和推理資源、速度等方面,相比之前的公開模型,均有不同程度的性能提升。

去年7月,上海人工智能實驗室發布開源平台體系OpenXLab,涵蓋新一代OpenMMLab和決策AI平台OpenDILab。

此次與商湯科技及各大學聯合發布通用視覺開源平台OpenGVLab,為推動通用的視覺運算發展再奠定基礎,完善了OpenXLab開源體系,促進人工智能基礎研究和生態構建。

關鍵字

最新回應

關鍵字
You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad