商傳媒|記者責任編輯/綜合外電報導
近來,中國新創企業DeepSeek推出輕量化大語言模型技術吸引全球目光。DeepSeek聲稱,其AI模型能在大幅降低算力需求的情況下,提供與OpenAI GPT-4相仿的效能,這使業界開始對是否仍需「大規模投資AI基礎設施」產生質疑。
中國科技巨頭百度(Baidu)執行長李彥宏週二(11日)在杜拜舉行的「世界政府峰會(World Government Summit)」中,對DeepSeek成功引爆話題發表看法,「雲端基礎設施的投資仍然非常必要,如果要打造比所有對手更聰明的AI模型,就必須使用更多計算資源」。
李彥宏認為,儘管DeepSeek能以創新技術降低算力消耗,但AI發展仍仰賴強大的基礎設施。李彥宏進一步強調,「你永遠無法預測『創新』會從哪裡出現,但擁有足夠的算力資源,仍是競爭力的核心」。
百度是中國最早推出AI大語言模型的企業之一,ChatGPT在2022年底問世後,百度迅速推出Ernie大模型。百度聲稱,Ernie的能力可媲美GPT-4,但該技術在全球市場的能見度仍有限,難以與OpenAI、Google旗下的Gemini等國際領先模型競爭。
在杜拜峰會上,李彥宏坦言,目前美國政府對中國企業的技術限制,使得中國企業難以獲取輝達A100、H100等高性能AI晶片,因此推動中國企業尋求低功耗高效能的解決方案。例如:DeepSeek的技術突破,便是一種在「有限算力」下實現AI大模型效能最大化的策略。
值得注意的是,李彥宏對於AI開源技術的立場有所軟化,透露「如果開放技術,會有很多人感興趣並嘗試,這將有助於技術更快地普及」,這與他過去主張封閉式AI模型發展的立場有所不同,顯示中國AI市場在技術趨勢與競爭壓力下,可能正朝向更開放的模式發展。