中國人工智慧(AI)新創公司深度求索(DeepSeek)打造出低成本AI模型,加速中國與美國之間的AI競爭白熱化。(圖片來源:Flickr)
中國人工智慧(AI)新創公司深度求索(DeepSeek)在春節期間橫空出世,加速中國與美國之間的AI軍備競爭白熱化,號稱不到600萬美元成功訓練AI模型,其開源模型甚至不輸給ChatGPT、Gemini的效果,這款新的AI是否意味過去產業界對於AI的電力需求誇大?《RECCESSARY》透過4大問答,解密DeepSeek與其對於能源需求的影響變化。
Q1:DeepSeek是什麼?
DeepSeek是一款AI聊天機器人,在1月27日超越ChatGPT、Gemini成為美國的蘋果App Store下載最高的免費應用程式,顯示其受歡迎的程度。
DeepSeek的成功,與背後的DeepSeek-R1模型有關聯。其採用開源模型,允許開發者免費使用與分享,有助於降低成本與加速創新,不同於ChatGPT、Gemini等封閉模型。
DeepSeek採用開源模型,允許開發者免費使用與分享,有助於降低成本與加速創新。(圖片來源:DeepSeek)
更令人驚豔的是,DeepSeek聲稱其訓練模型成本僅560萬美元(約新台幣1.84億元),而ChatGPT等系統花費高達數十億美元,凸顯R1模型品質好、價格低的優勢,在開發者社群引發了轟動。
DeepSeek能用於編寫軟體程式、解決數學問題、自然語言推理等任務上,性能可對標OpenAI o1正式版。
Q2:創辦人梁文鋒是誰?
DeepSeek的出現震撼矽谷,更造成輝達(NVIDIA)、台積電等AI概念股價下挫,也讓創辦人梁文峰一夜成名,他畢業於浙江大學資訊與通信工程研究所,是對沖基金「幻方量化」的聯合創始人,也是AI新創公司深度求索(DeepSeek)的創始人兼執行長。
DeepSeek創始人梁文鋒(前右)1月20日出席中國國務院總理李強主持召開的專家、企業家和教科文衛體等領域代表座談會並提出建言。 (圖片來源:截圖央視網頁CCTV)
梁文峰利用AI分析金融數據以作出投資決策,讓「幻方量化」迅速在中國金融界展露頭角,2019年成為中國首個募資超過人民幣1,000億元的量化對沖基金。
後來梁文峰在2023年創辦DeepSeek研究室,目標是打造通用型人工智慧,甚至在很早期就開始囤購輝達的GPU晶片,建構AI模型。
梁文峰還有一套獨特的用人哲學,偏愛沒有工作經驗的年輕人,梁文峰曾接受中國科技與財經媒體36氪旗下「暗湧」採訪時透露,「看能力,而不是看經驗。我們的核心技術職位,基本上以應屆和畢業一兩年的人為主。」
而且團隊的組成以中國國內名校畢業生為主,沒有海歸人才,年齡約在1998年出生,就連管理階層也不超過35歲。因為年輕沒包袱,才能激發創新,讓DeepSeek在短時間竄起成為AI界黑馬。
Q3:DeepSeek對能源產業的影響?
DeepSeek主打用較低成本來訓練AI模型,宣稱其AI模型僅使用2,000顆功能較低的輝達H800晶片,不同於西方的主要AI模型約使用1.6萬顆專用晶片,打破了市場對於AI產業「高成本等於高效能」的既有認知。
眾多能源公司股價因此應聲下跌,美國最大核電廠營運商星座能源(Constellation Energy)股價在單日下跌21%、美國獨立電力生產商Vistra則單日崩跌28%,原本因AI前景繁榮的電力產業蒙上一層陰影。
美國星座能源與微軟展開合作,將協助三哩島核電廠一個機組恢復運作,滿足AI的用電需求。(圖片來源:Wikimedia Commons)
不過有分析師認為,現在購買能源股低點的好時機。布里克萊金融集團(Bleakly Financial Group)首席投資官布克瓦(Peter Boockvar)認為,「無論AI競賽怎麼競爭,電力依然是保持需求的唯一領域。」
摩根大通(JPMorgan)分析師托内特(Jeremy Tonet)則認為,當前的拋售只是過渡期,透過採用低成本的AI,將促使生成式AI有更廣泛的使用,帶動電力的需求。
Q4:什麼是蒸餾技術?AI耗電量是否被誇大?
DeepSeek之所以能夠打造出兼具高性能與低成本的模型,屢屢被提到一個關鍵技術是「知識蒸餾」(knowledge distillation),知識蒸餾類似老師將自己的知識濃縮並傳授給學生的過程,讓規模較小、較新的AI模型,去學習受到充足訓練的大型、複雜模型,學生模型能夠受益於高品質的大型語言模型(LLM),同時降低推理的成本。
「知識蒸餾」(knowledge distillation)是一種訓練AI模型的技術,其具備降低規模、低成本、優化特定任務等優勢。(圖片來源:微軟)
如果說未來訓練AI模型不用消耗太多算力,是否意味科技巨頭不用蓋這麼多資料中心,以減少用電量?
對此專家認為,巨大的電力需求並未消失,但當AI的開發效率提升,有助減輕環境負擔。
其次AI耗電量大,但多數來自燃燒化石燃料,恐怕將加劇氣候變遷。美國智庫能源創新(Energy Innovation)資深研究員吉蒙(Eric Gimon)觀察,過去業者抱持著不惜一切投資化石燃料來推動AI發展的心態,現在正是適時踩煞車的時刻。
聯發科技(MediaTek)全球行銷及傳播總經理兼副總桑迪爾(Rahul Sandil)指出,若一般的AI查詢從資料中心轉移至手機端,將降低對算力的需求,並有更多時間拓展資料中心的再生能源使用。
DeepSeek的爆紅,連帶引發低成本真實性與技術抄襲的疑慮,卻也詮釋另一種更有效率開發AI的方式,推動AI技術的普及化。