創科廣場｜內地研視覺運算平台促進AI生態構建

2022-03-01 15:33

商湯科技在全球視覺運算研究最尖端的人工智能（AI）初創，2018年香港中文大學-商湯科技聯合實驗室（MMLab）推出了開源計畫OpenMMLab，而2020年商湯再宣布OpenMMLab升級。

開源有助創新，中國成立上海人工智能實驗室，並由商湯創辦人湯曉鷗擔任主任，推動上海的AI產業。

最近，上海人工智能實驗室與商湯科技、中文大學、上海交通大學，再共同發布通用的視覺開源平台OpenGVLab，向學術界和產業界開放超高效預訓練模型，以及千萬級精標注、十萬級標籤量的公開數據集，有助開發人員改善各類下游視覺運算模型的訓練。

OpenGVLab開放業內首個針對通用視覺模型評測基準，以便開發人員對不同通用視覺模型的性能，進行橫向評估和優化。

OpenGVLab開源平台已在網上公開，供研究人員使用，以後將開放網上推理功能，供感興趣人士體驗。

解決只完成單一任務的難題

「開源是一項意義非凡的工作，人工智能發展離不開全球研究人員十餘年來開源共建。」上海人工智能實驗室負責人表示：「希望通過發布OpenGVLab開源平台，幫助業界更好地探索和應用通用視覺AI技術，促進體系化解決AI發展中數據、泛化、認知和安全等瓶頸。」

上述通用視覺開源平台OpenGVLab，基於通用視覺技術體系「書生」（INTERN）建立，去年11月「書生」由上海人工智能實驗室與商湯、中文大學、上海交通大學共同推出，以解決目前大部分的AI模型，只能完成單一任務的難題。

上述技術的論文《INTERN︰A New Learning Paradigm Towards General Vision》亦在arXiv平台上發表。

OpenGVLab可助開發人員降低通用視覺模型的開發門檻，用更低成本開發用於成百上千種視覺任務、視覺場景的算法模型，並解決長尾需求，推動AI的大規模應用。

上海人工智能實驗室表示，OpenGVLab開源預訓練模型，性能極高，覆蓋分類、目標檢測、語義分割、深度估計等四大視覺運算，準確率和數據使用效率，有大幅提升。研究人員可降低下游數據的採集成本，以極少的數據量，就可訓練多場景、多任務AI模型。

OpenGVLab還提供多種不同參數量、不同計算量的預訓練模型，以滿足不同場景的應用需求。模型庫中列出的多個模型，ImageNet微調結果和推理資源、速度等方面，相比之前的公開模型，均有不同程度的性能提升。

去年7月，上海人工智能實驗室發布開源平台體系OpenXLab，涵蓋新一代OpenMMLab和決策AI平台OpenDILab。

此次與商湯科技及各大學聯合發布通用視覺開源平台OpenGVLab，為推動通用的視覺運算發展再奠定基礎，完善了OpenXLab開源體系，促進人工智能基礎研究和生態構建。

關鍵字

創科廣場｜NFT題材百花齊放活動結合綫上綫下

創科廣場｜亞太區初創潛力驚人業務多元備受注目

創科廣場｜內地研視覺運算平台促進AI生態構建

最新回應

訂閱星島日報

聯絡我們

廣告表格及價目表