DeepSeek性能震惊矽谷 美国打压难阻华企突围
2025-01-28 00:00
总部位于杭州的人工智能公司「深度求索」DeepSeek,近日发布推理模型DeepSeek-R1。论性能,它比肩美国AI龙头OpenAI的ChatGPT,却不须太过依赖高端晶片,难怪令矽谷科技精英惊叹不已,据报Meta甚至成立4个专门小组研究其成功秘诀。不难看出,DeepSeek的成绩是实实在在的,所带来的冲击也是巨大的。说它发动了一场AI界的「偷袭珍珠港」,相信并不夸张。
2022年OpenAI发布ChatGPT以来,科技界形成一个看似颠扑不破的共识:其他科企假如不动用数以亿计美元研发资金和购买大量尖端晶片,那就难以匹敌ChatGPT。就职不久的美国总统特朗普近日亦推出所谓「星际之门」计划,协调OpenAI、软银和甲骨文等科企,在未来4年投资5000亿美元,以美国为中心建造AI基础设施。
似乎大家都深信,若不大洒金钱便难以做出科研成绩。一般而言,也许是这样。但2023年才成立的DeepSeek却是一个异数——它投放了不足600万美元就成功训练新模型,成本只是Meta的10分之1;仅用了2000枚Nvidia生产的专用晶片,而非业界人士认定的需要1.6万枚。更令人赞叹的是,有别于OpenAI的闭源,DeepSeek-R1完全开放源码,任凭大家免费使用,甚至连技术细节都可以公开。
仅以600万美元训练新模型
DeepSeek-R1面世后,Google、微软与Meta等主要科企高层,均承认其功能极其强大,令人印象深刻。连竞争对手都对你的表现感到惊讶,那就代表你的成绩是「硬净」的。与此同时,DeepSeek的冒起亦充分证明,近年屡屡打击中国科企的美国政府枉作小人。
华府的思维很简单,即当我发现你的技术发展迅速,为了维护自身科技霸权,那就必须「卡脖子」,针对中国科企的晶片出口限制就是这样出台的。但从DeepSeek在美国禁令下仍可研发出功能强大的产品这一事实可见,即使欠缺最先进的硬件,也可推出在数学、程式码和推理测试领域表现优异的模型。近日DeepSeek-R1取代ChatGPT成为苹果应用商店内最受欢迎免费应用程式,绝非偶然。
比ChatGPT更受欢迎
许多人受到意识形态偏见影响,认定中国科企取得成就,必有官方在背后发功。但事实上,DeepSeek不是一个国家项目,而是一个市场行为。现年40岁的创办人梁文锋早年成立对冲基金「幻方量化」,一度将其发展至逾1000亿元人民币的规模,随后毅然在2023年「换跑道」,由金融转为科研,驱使他的只是好奇心和进取心。根据内媒报道,梁文锋并不满意别人创新、自己拿来应用的现状,这种心态和乔布斯、盖茨、朱克伯格、马斯克等科技精英的想法如出一辙,有一种朴素的理想主义在内,不能说他们是受到政府鼓励才投身科研。
DeepSeek在不依赖最先进晶片的情况下做出很大的成绩,引发美期特别是纳指下挫,人工智能晶片大厂Nvidia昨开市前交易股价甚至大跌13%,证明DeepSeek不但震撼矽谷,某程度也震撼华尔街。
无可否认,在中美AI博弈的长途赛中,这间初创企业之冒起确是一个不小的亮点。但与此同时,亦有人批评它只是制造了一个与ChatGPT功能相仿的模型,并未取得真正的超越和突破。DeepSeek究竟是昙花一现抑或陆续有来,只有时间才可证明。但有一点是肯定的:美国晶片禁令并未打垮中国科企,反倒逼使它们自力更生,华为的先例便是明证。
最新回应