商汤版ChatGPT应用平台亮相

2023-04-11 00:00

商汤董事长兼首席执行官徐立。
商汤董事长兼首席执行官徐立。

(星岛日报报道)继百度(9888)推出「文心一言」后,商汤(020)也推出了自家的类ChatGPT应用——「商量 (SenseChat)」,其为基于商汤大模型体系「日日新(SenseNova)」的中文语言大模型应用平台。而在昨日的发布会现场,董事长兼首席执行官徐立展示「商量 」对话和超长文本的理解能力,并展示了其在编写邮件、文本创作、中英文编程等方面的能力。此外,徐立指出公司未来会继续深化多模态大模型体系在2B市场的应用,预期其为公司带来的收入占比会逐渐提升,他同时透露公司未来会开发万亿级大模型。 
商汤推出的「日日新」大模型体系,可用于自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。此外商汤亦于昨日展示了基于「日日新SenseNova」大模型的中文语言大模型应用平台「商量」。「商量」有1800亿参数中文大语言模型,支持例如编程助手、健康谘询助手、PDF文件阅读助手等创新应用。徐立在发布会现场展示了其对多轮对话和超长文本的理解能力,以及在文本创作、编写邮件方面的能力。
大模型体系为企业提供服务

此外,徐立也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括讯息。
未来开发万亿级大模型

徐立表示,Openai推出ChatGPT为AI行业带来范式上的转变,推动整个行业发生转型。在此背景下商汤于2019年开始大模型的研发,他表示去年大模型业务占公司总收入的20%,相信今年该比例会进一步提升。他强调公司的商业化变现思路清晰,将主要利用多模态大模型体系为其他企业提供服务以实现收入增长。他解释公司的业务目前之所以主要以2B端为主,因为公司在下游市场已累计了很多服务需求,如代码和医疗等。他又提到相比其他科技公司,公司的优势在于能够将多模态模型融合在一起,为客户提供服务,如公司多模型业务包括其他同行较少涉猎的3D模型业务,而公司亦在视觉行业内有领先优势。

此外,徐立透露,公司未来会开发万亿大模型的项目生产,但他直言目前行业里面很多大模型,包括千亿以上参数的模型,都存在数据量及算力配比不足的问题,而公司未来不会刻意追求参数的数量,而是会寻求数据和算力的精着配比,控制参数总量,提高其效能。

關鍵字

最新回应

相關新聞

You are currently at: std.stheadline.com
Skip This Ads
close ad
close ad