集思廣宇|借鑒DeepSeek成功經驗 本港應加速引進創科人才

文/李廣宇

近日,中國新興人工智能公司DeepSeek推出最新版AI模型,其低成本、高效能的創新技術,不僅震撼了科技界,甚至引來美國總統特朗普的關注。DeepSeek的成功無疑標誌着中國科技企業在全球舞台上的強勁崛起,同時也為香港創科業界提供寶貴的借鑒。

DeepSeek由中國私募基金「幻方量化」於2023年創立,雖然成立時間不長,但其最新的DeepSeek-V3模型,以6710億個參數,在性能和成本的平衡上創造了新的標準。與OpenAI的GPT-4模型相比,DeepSeek-V3模型的開發成本僅為557萬美元,而GPT-4的訓練成本則高達6300萬美元,是V3模型約11倍,兩者的價格差異形成鮮明對比。

事實上,DeepSeek之所以能以如此低成本達成高性能,主要依賴兩大創新技術:首先是「混合專家架構」的設計,該技術允許模型在推理過程中僅啟動部分「腦細胞」,大幅降低運算資源的消耗。其次是數據處理的節能創新,DeepSeek採用了「FP8低精度數據格式」,顯著減少記憶體需求,進一步壓縮了模型的訓練成本。

更為重要的是,DeepSeek的模型能以低資源在手機、平板等消費性裝置上運行,這意味着未來AI技術不再是高性能伺服器的專利,普通用戶也能享受這些科技紅利。這一點尤其值得全球矚目,因為它真正實現了技術的平民化,為市場帶來全新的體驗。

DeepSeek的快速崛起更讓美國的科技巨頭們敲響了警鐘。過去,OpenAI、Google等公司在AI領域一度佔據領先地位,然而,DeepSeek的低成本模式證明,AI技術的門檻正在迅速降低,巨額資金不再是壟斷AI研發的唯一條件。這一點就連美國總統特朗普亦強調,美國科技企業必須進行變革,尋求更加靈活且具成本效益的創新策略。

DeepSeek的成功離不開其創辦人梁文鋒的「用人哲學」——「年輕」和「精英化」。雖然該公司僅有139名員工,但幾乎全數來自清華、北大等名校的年輕畢業生。梁文鋒曾直言:「我們只招1%的天才,做99%公司無法做到的事情。」這種精英化的用人策略,強調創新思維和快速適應能力,避免了過多業界陳規,為公司打下迅速崛起的基礎。

借鑒DeepSeek的經驗,通過培養和引進頂尖科技人才,加強技術創新和高效資源利用,即便在資源受限的情況下,仍然可以實現巨大的技術突破。香港作為國際金融中心,擁有豐富的資金和市場資源,但在科技創新領域,卻面臨人才短缺的挑戰、資源限制等挑戰。筆者曾經引入數十名海外創科專才,見證他們為企業帶來翻天覆地的積極變化。因此,筆者認為政府應加強與創科業界管理層合作,推動靈活的專才引進政策,包括簡化移民和工作簽證流程、給予針對性資助計劃,為科研人員與創業者提供財政支持,以吸引全球頂尖科技人才來港發展。

另一方面,香港高等教育機構具備培養頂尖創科人才的能力,但如何留住這些人才並吸引更多國際專才仍是問題核心。筆者認為政府應考慮為初創企業提供更多的資金支持,幫助它們進行技術研發,並降低企業面臨的創新風險。同時,應加強與國際市場的聯繫,為本地科技企業提供參與全球競爭的機會。

DeepSeek的成功故事告訴我們,未來的AI競爭不僅是技術的較量,更是在有限資源下如何實現最大效益的競爭。香港作為一個國際都市,應從中汲取經驗,重新審視自身在科技創新領域的發展策略。唯有引進創新人才、推動技術突破,香港方能在全球競爭中脫穎而出!

(作者為香港I.T.人協會會長、中華海外聯誼會理事)

收藏收藏
取消收藏取消收藏

集思廣宇|借鑒DeepSeek成功經驗 本港應加速引進創科人才

收藏收藏
取消收藏取消收藏