通义千问发布超大规模MoE模型号称优于DeepSeek V3 阿里美股升7%

2025-01-29 11:03

中国国产人工智能（AI）大模型DeepSeek横空出世，因其超高性能和极低训练成本震惊市场之际，阿里巴巴（9988）旗下阿里云宣布通义千问Qwen 2.5-Max超大规模MoE模型，号称优于DeepSeek V3，阿里美股（BABA）周二升6.7%，今日夜盘再升1.2%

阿里云公布了其全新通义千问 Qwen 2.5-Max 超大规模MoE模型，声称可以通过API的方式进行访问，也可以登录Qwen Chat进行体验，例如直接与模型对话，或者使用 artifacts及搜索等功能。

据介绍，通义千问 Qwen 2.5-Max 使用超过20万亿token的预训练数据，以及精心设计的后训练方案进行训练。阿里云更直接对比了指令模型的性能表现，比较对象包括 DeepSeek V3、OpenAI旗下的GPT-4o 和 Claude-3.5-Sonnet，

阿里云指，在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了DeepSeek V3，同时在MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩，相信随着后训练技术的不断进步，下一个版本的Qwen2.5-Max将会达到更高的水平。

DeepSeek引爆AI产业大洗牌黄国英吁减持Nvidia 「有排返唔到转头」何启聪看好一类赢家

DeepSeek未能击溃护城河 Nvidia被忽略的本质｜晋佳

關鍵字

蔡崇信等投资公司蓝池传入股「小脏鞋」Golden Goose 天后Taylor Swift都穿过

特朗普品牌授权网站接受迷因币「$TRUMP」支付可购买手表及运动鞋

通义千问发布超大规模MoE模型号称优于DeepSeek V3 阿里美股升7%

最新回应

相關新聞

DeepSeek︱方保侨称一个范畴可强于ChatGPT 「蔗渣价钱烧鹅味道」或深远影响AI界发展

《黑天鹅》作者吁投资者别盲目追逐AI热潮「Nvidia下跌只属浅尝损失」

DeepSeek｜「广东AI三杰」备受热议除了梁文峰还有......

DeepSeek｜外媒实测「这点」大胜ChatGPT

DeepSeek是甚么？与ChatGPT有何分别？一文睇清DeepSeek爆红原因、创办人梁文锋来头

DeepSeek︱始创人梁文锋「AI大神」之路中学阿sir爆独特读书方法

DeepSeek引爆AI产业大洗牌黄国英吁减持Nvidia 「有排返唔到转头」何启聪看好一类赢家

DeepSeek员工年薪最多154万偏好校园招募「95后天才少女」遭小米挖角

DeepSeek｜进军文字生成图像发布多模态模型Janus-Pro并全部开源

DeepSeek AI模型爆红开源设计「双面刃」？学者忧KK园不法分子用作犯罪

订阅星岛日报

联络我们

广告表格及价目表