DeepSeek性能震驚矽谷 美國打壓難阻華企突圍

2025-01-28 00:00

總部位於杭州的人工智能公司「深度求索」DeepSeek,近日發布推理模型DeepSeek-R1。論性能,它比肩美國AI龍頭OpenAI的ChatGPT,卻不須太過依賴高端晶片,難怪令矽谷科技精英驚歎不已,據報Meta甚至成立4個專門小組研究其成功秘訣。不難看出,DeepSeek的成績是實實在在的,所帶來的衝擊也是巨大的。說它發動了一場AI界的「偷襲珍珠港」,相信並不誇張。

2022年OpenAI發布ChatGPT以來,科技界形成一個看似顛撲不破的共識:其他科企假如不動用數以億計美元研發資金和購買大量尖端晶片,那就難以匹敵ChatGPT。就職不久的美國總統特朗普近日亦推出所謂「星際之門」計劃,協調OpenAI、軟銀和甲骨文等科企,在未來4年投資5000億美元,以美國為中心建造AI基礎設施。

似乎大家都深信,若不大灑金錢便難以做出科研成績。一般而言,也許是這樣。但2023年才成立的DeepSeek卻是一個異數——它投放了不足600萬美元就成功訓練新模型,成本只是Meta的10分之1;僅用了2000枚Nvidia生產的專用晶片,而非業界人士認定的需要1.6萬枚。更令人讚歎的是,有別於OpenAI的閉源,DeepSeek-R1完全開放源碼,任憑大家免費使用,甚至連技術細節都可以公開。
僅以600萬美元訓練新模型

DeepSeek-R1面世後,Google、微軟與Meta等主要科企高層,均承認其功能極其強大,令人印象深刻。連競爭對手都對你的表現感到驚訝,那就代表你的成績是「硬淨」的。與此同時,DeepSeek的冒起亦充分證明,近年屢屢打擊中國科企的美國政府枉作小人。

華府的思維很簡單,即當我發現你的技術發展迅速,為了維護自身科技霸權,那就必須「卡脖子」,針對中國科企的晶片出口限制就是這樣出台的。但從DeepSeek在美國禁令下仍可研發出功能強大的產品這一事實可見,即使欠缺最先進的硬件,也可推出在數學、程式碼和推理測試領域表現優異的模型。近日DeepSeek-R1取代ChatGPT成為蘋果應用商店內最受歡迎免費應用程式,絕非偶然。
比ChatGPT更受歡迎

許多人受到意識形態偏見影響,認定中國科企取得成就,必有官方在背後發功。但事實上,DeepSeek不是一個國家項目,而是一個市場行為。現年40歲的創辦人梁文鋒早年成立對沖基金「幻方量化」,一度將其發展至逾1000億元人民幣的規模,隨後毅然在2023年「換跑道」,由金融轉為科研,驅使他的只是好奇心和進取心。根據內媒報道,梁文鋒並不滿意別人創新、自己拿來應用的現狀,這種心態和喬布斯、蓋茨、朱克伯格、馬斯克等科技精英的想法如出一轍,有一種樸素的理想主義在內,不能說他們是受到政府鼓勵才投身科研。

DeepSeek在不依賴最先進晶片的情況下做出很大的成績,引發美期特別是納指下挫,人工智能晶片大廠Nvidia昨開市前交易股價甚至大跌13%,證明DeepSeek不但震撼矽谷,某程度也震撼華爾街。

無可否認,在中美AI博弈的長途賽中,這間初創企業之冒起確是一個不小的亮點。但與此同時,亦有人批評它只是製造了一個與ChatGPT功能相仿的模型,並未取得真正的超越和突破。DeepSeek究竟是曇花一現抑或陸續有來,只有時間才可證明。但有一點是肯定的:美國晶片禁令並未打垮中國科企,反倒逼使它們自力更生,華為的先例便是明證。

關鍵字

最新回應

相關新聞

本網站正使用 Cookie

我們使用 Cookie 改善網站體驗。 繼續使用我們的網站即表示您同意我們的 Cookie 政策。 Cookie 政策