DeepSeek性能震驚矽谷美國打壓難阻華企突圍

2025-01-28 00:00

總部位於杭州的人工智能公司「深度求索」DeepSeek，近日發布推理模型DeepSeek-R1。論性能，它比肩美國AI龍頭OpenAI的ChatGPT，卻不須太過依賴高端晶片，難怪令矽谷科技精英驚歎不已，據報Meta甚至成立4個專門小組研究其成功秘訣。不難看出，DeepSeek的成績是實實在在的，所帶來的衝擊也是巨大的。說它發動了一場AI界的「偷襲珍珠港」，相信並不誇張。

2022年OpenAI發布ChatGPT以來，科技界形成一個看似顛撲不破的共識：其他科企假如不動用數以億計美元研發資金和購買大量尖端晶片，那就難以匹敵ChatGPT。就職不久的美國總統特朗普近日亦推出所謂「星際之門」計劃，協調OpenAI、軟銀和甲骨文等科企，在未來4年投資5000億美元，以美國為中心建造AI基礎設施。

似乎大家都深信，若不大灑金錢便難以做出科研成績。一般而言，也許是這樣。但2023年才成立的DeepSeek卻是一個異數——它投放了不足600萬美元就成功訓練新模型，成本只是Meta的10分之1；僅用了2000枚Nvidia生產的專用晶片，而非業界人士認定的需要1.6萬枚。更令人讚歎的是，有別於OpenAI的閉源，DeepSeek-R1完全開放源碼，任憑大家免費使用，甚至連技術細節都可以公開。
僅以600萬美元訓練新模型

DeepSeek-R1面世後，Google、微軟與Meta等主要科企高層，均承認其功能極其強大，令人印象深刻。連競爭對手都對你的表現感到驚訝，那就代表你的成績是「硬淨」的。與此同時，DeepSeek的冒起亦充分證明，近年屢屢打擊中國科企的美國政府枉作小人。

華府的思維很簡單，即當我發現你的技術發展迅速，為了維護自身科技霸權，那就必須「卡脖子」，針對中國科企的晶片出口限制就是這樣出台的。但從DeepSeek在美國禁令下仍可研發出功能強大的產品這一事實可見，即使欠缺最先進的硬件，也可推出在數學、程式碼和推理測試領域表現優異的模型。近日DeepSeek-R1取代ChatGPT成為蘋果應用商店內最受歡迎免費應用程式，絕非偶然。
比ChatGPT更受歡迎

許多人受到意識形態偏見影響，認定中國科企取得成就，必有官方在背後發功。但事實上，DeepSeek不是一個國家項目，而是一個市場行為。現年40歲的創辦人梁文鋒早年成立對沖基金「幻方量化」，一度將其發展至逾1000億元人民幣的規模，隨後毅然在2023年「換跑道」，由金融轉為科研，驅使他的只是好奇心和進取心。根據內媒報道，梁文鋒並不滿意別人創新、自己拿來應用的現狀，這種心態和喬布斯、蓋茨、朱克伯格、馬斯克等科技精英的想法如出一轍，有一種樸素的理想主義在內，不能說他們是受到政府鼓勵才投身科研。

DeepSeek在不依賴最先進晶片的情況下做出很大的成績，引發美期特別是納指下挫，人工智能晶片大廠Nvidia昨開市前交易股價甚至大跌13%，證明DeepSeek不但震撼矽谷，某程度也震撼華爾街。

無可否認，在中美AI博弈的長途賽中，這間初創企業之冒起確是一個不小的亮點。但與此同時，亦有人批評它只是製造了一個與ChatGPT功能相仿的模型，並未取得真正的超越和突破。DeepSeek究竟是曇花一現抑或陸續有來，只有時間才可證明。但有一點是肯定的：美國晶片禁令並未打垮中國科企，反倒逼使它們自力更生，華為的先例便是明證。

關鍵字

盡快規管網約車市場促公平競爭護乘客權益

提速解決基層住屋問題特首連訪「社區客廳」的啟示

DeepSeek性能震驚矽谷美國打壓難阻華企突圍

最新回應

相關新聞

寧德來港帶動IPO回暖金融創科踏上新台階

特朗普關稅遠近亂發炮效用成疑勢傷自身

關稅戰擾亂經濟秩序香港增長仍可審慎樂觀

內外挑戰加劇港須靈巧若蛇

訂閱星島日報

聯絡我們

廣告表格及價目表

最新回應

相關新聞

寧德來港帶動IPO回暖 金融創科踏上新台階

特朗普關稅遠近亂發炮 效用成疑勢傷自身

關稅戰擾亂經濟秩序 香港增長仍可審慎樂觀

內外挑戰加劇 港須靈巧若蛇