AI教母︱李飞飞花20美金26分钟造出新模型效果媲美DeepSeek、OpenAI

2025-02-11 21:57

美籍华裔科学家李飞飞，仅用20美元和26分钟，便创出新的AI模型，效能媲美Deepseek、OpenAI。路透社

内地低成本高效的AI模型DeepSeek，推出后震撼科技界后，有AI教母之称的美籍华裔科学家李飞飞，率领其团队仅花了20美元及26分钟，便创造出一个「s1」的AI推理模型，表现媲美OpenAI o1和DeepSeek R1等尖端推理模型。

仅用16块H100 GPU训练

综合外媒报道，李飞飞是史丹福大学首位红杉讲席教授，美国国家工程院院士。她与史丹福大学和华盛顿大学的研究团队，在一个月内便研发出s1模型，因像DeepSeek一样并非从零开始。s1是以阿里巴巴的通义千问Qwen2.5 -32B-Instruct开源模型为底座，在16块辉达(NVIDIA)H100 GPU上监督微调26分钟，训练出新模型。

美籍华裔科学家李飞飞有「AI教母」之称。@drfeifei

李飞飞及其团队只用了20美元，便创出效能媲美DeepSeek R1的新AI模型。路透社

李飞飞是史丹福大学首位红杉讲席教授。Stanford University

DeepSeek的估值存在巨大分歧，估值区间在10亿美元到1550亿美元之间。路透社

DeepSeek近期崛起成为全世界热话。

表现媲美OpenAI o1及DeepSeek R1

报道指，李飞飞团队在研究中提出了「预算控制」策略，透过加入「wait指令」等方式，强制延长模型推理过程、思考时间，以此促使模型自我检查并修正错误的推理步骤，提升推理品质。

根据李飞飞等人的研究论文《s1：Simple test- time scaling》，该模型在数学和编码能力测试中的表现，可媲美OpenAI的o1，以及DeepSeek的R1等尖端推理模型，在竞赛数学问题上更较o1-preview高出27%。

相关新闻：DeepSeek︱专家估算梁文锋身家最高近万亿　超越黄仁勋

内媒每日经济新闻报道，复旦大学计算机学院副教授郑骁庆受访时表示：「像DeepSeek或类似的公司，在寻找有效的整合解决方案时，需要进行大量的前期研究与消融实验。」这意味著前期是需要大量「烧钱」的。

由于s1是基于现成模型进行监督微调，而微调一个模型和从零开始训练一个模型的成本是无法相提并论的。其次50美元是否包含了其他数据、设备和消融实验等费用，如DeepSeek-V3不到600万美元的训练成本，其实也只包含了训练时的GPU算力费用。

關鍵字

乐山大佛集团董事长被查原总经理5个月前被双开

日方称中方移除台湾岛东北部海域浮标外交部：根据实际需要

AI教母︱李飞飞花20美金26分钟造出新模型效果媲美DeepSeek、OpenAI

仅用16块H100 GPU训练

表现媲美OpenAI o1及DeepSeek R1

最新回应

相關新聞

DeepSeek︱专家估算梁文锋身家最高近万亿　超越黄仁勋

港企千帆科技联手百度智能云推DeepSeek AI大模型金融数据分析快40%

DeepSeek｜梁文锋前往巴黎参加AI峰会？知情人士辟谣

美对冲基金大佬Tepper加大中概股投资押注京东及阿里占投资组合近四成

百度李彦宏料AI大模型开源加速技术成熟未来将现超级应用「如Facebook微信诞生」

马斯克拟近7600亿购OpenAI 奥尔特曼秒速拒绝反讽要购Twitter

晶片限制促成DeepSeek崛起｜张湖月

DeepSeek引爆中资股AI潜力外资重新审视估值云产业链最受惠阿里今月累升近20%

DeepSeek︱江苏官媒发文评南京「为何发展不出『杭州六小龙』」

三大中资电信商全面接入DeepSeek大模型实现在多场景多产品应用

订阅星岛日报

联络我们

广告表格及价目表