當(dāng)全世界還在爭(zhēng)論大模型是否只是一個(gè)昂貴的“泡沫”時(shí),金山云高級(jí)副總裁劉濤表示,這不是泡沫。
支持他論斷的,是正在發(fā)生的“Vibe Coding(沉浸式開(kāi)發(fā))”熱潮——當(dāng)Claude Code已經(jīng)可以熟練地用自己寫(xiě)的代碼來(lái)迭代自身時(shí),機(jī)器人造機(jī)器人、代碼寫(xiě)代碼的“奇點(diǎn)”已經(jīng)真實(shí)地觸碰到了產(chǎn)業(yè)界的脊梁。
面對(duì)這個(gè)變化,金山云出招了。1月21日,金山云宣布智算平臺(tái)“金山云星流”全面升級(jí),其不僅包含了覆蓋模型全生命周期的訓(xùn)推平臺(tái),還正式發(fā)布了機(jī)器人平臺(tái)和模型API服務(wù)。
這家老牌云服務(wù)商正試圖通過(guò)身份的自我重塑,積極投身這場(chǎng)關(guān)于未來(lái)生產(chǎn)力主導(dǎo)權(quán)的角逐。
過(guò)去一年,智算需求持續(xù)增長(zhǎng),主要推手已從頭部企業(yè)的訓(xùn)練需求,悄然轉(zhuǎn)向了推理側(cè)的爆發(fā)。
數(shù)據(jù)非常直觀,火山引擎日均Token調(diào)用量已沖上50萬(wàn)億大關(guān);豆包、千問(wèn)、元寶等模型的外溢需求正以不可思議的速度擴(kuò)張。這種爆發(fā)式的Token消耗,本質(zhì)上是AI落地現(xiàn)實(shí)場(chǎng)景的過(guò)程。對(duì)于企業(yè)而言,大模型不再是PPT里的點(diǎn)綴,而是實(shí)打?qū)嵉慕当驹鲂Чぞ摺?/p>
“我們一直在關(guān)注推理什么時(shí)候爆發(fā),這種增速超過(guò)了過(guò)去所有IT基礎(chǔ)設(shè)施的認(rèn)知?!苯鹕皆浦砜偛脤O曉感慨道。
在這種背景下,金山云將自己定位為工程化的陪伴者,其邏輯非常純粹:既然大模型正成為萬(wàn)物互聯(lián)的“大腦”,那么云廠商就需要提供配套的“循環(huán)系統(tǒng)”——穩(wěn)定、高效且具備超高性價(jià)比的Token服務(wù)。
金山云走的是一條“任務(wù)驅(qū)動(dòng)”的邏輯演進(jìn)路線。2023年,行業(yè)主題是“大規(guī)模智算網(wǎng)基礎(chǔ)設(shè)施建設(shè)”,比拼的是對(duì)底層異構(gòu)資源的管理能力。2024年,重點(diǎn)演進(jìn)為“平臺(tái)化和Serverless(無(wú)服務(wù)器計(jì)算)”,核心是將資源交付轉(zhuǎn)變?yōu)槿蝿?wù)交付。而到了2026年,升級(jí)后的“金山云星流平臺(tái)”則錨定了三個(gè)核心主題:追求效率提升、構(gòu)建行業(yè)平臺(tái)、加速推理落地。
這種轉(zhuǎn)變?cè)谟?,智算時(shí)代的訓(xùn)練任務(wù)極其脆弱,在大規(guī)模算力集群下,任何一點(diǎn)硬件波動(dòng)都可能導(dǎo)致整個(gè)訓(xùn)練任務(wù)的中斷。為了解決這個(gè)“釘子”,金山云自研了一套基于故障感知的自愈技術(shù)。
這套系統(tǒng)能針對(duì)硬件故障和軟硬結(jié)合故障進(jìn)行分級(jí)處理。有些故障重啟即可,有些則需立即啟動(dòng)替換策略。孫曉透露,這套機(jī)制可以實(shí)現(xiàn)“秒級(jí)感知”和快速處理。這意味著,即便底層硬件出現(xiàn)波動(dòng),客戶的一輪訓(xùn)練任務(wù)也能在不中斷的情況下平穩(wěn)度過(guò)。
具身智能,是金山云眼中智算云的“下半場(chǎng)”,也是金山云重點(diǎn)關(guān)注的未來(lái)。
無(wú)論是自動(dòng)駕駛還是人形機(jī)器人,行業(yè)目前仍處于一個(gè)“混沌場(chǎng)景”中,百花齊放但痛點(diǎn)固化。不同廠商有的關(guān)注大腦,有的關(guān)注小腦,有的則卡在數(shù)據(jù)仿真上。
金山云發(fā)布的“金山云星流機(jī)器人平臺(tái)”,試圖打通從數(shù)據(jù)采集、存儲(chǔ)、標(biāo)注到模型訓(xùn)練、部署與仿真的全鏈路閉環(huán)。孫曉認(rèn)為,機(jī)器人場(chǎng)景需要解決的是“從算法研發(fā)到真實(shí)場(chǎng)景部署”的落地難題。
以自動(dòng)駕駛為例,模型在車端,但訓(xùn)練在云端,這對(duì)算力密度的要求或許沒(méi)那么高,但對(duì)顯存和多模態(tài)點(diǎn)云數(shù)據(jù)的處理能力要求極高。金山云通過(guò)構(gòu)造閉環(huán)的數(shù)據(jù)平臺(tái),讓客戶能更便捷地接收、處理這些海量數(shù)據(jù)。
劉濤在展望未來(lái)時(shí)描繪了一個(gè)畫(huà)面:2026年起,家庭場(chǎng)景機(jī)器人將逐步落地。從最初幫老人撿襪子、撿毛巾,到最終輔助生活,這是一個(gè)跨度長(zhǎng)達(dá)5到10年的萬(wàn)億賽道。而金山云要做的,就是成為這個(gè)萬(wàn)億賽道的“底座”和“引擎”。
隨著傳統(tǒng)公有云市場(chǎng)進(jìn)入存量博弈,智算云正帶來(lái)全新的增長(zhǎng)機(jī)會(huì)。金山云能夠在去年三季度實(shí)現(xiàn)120%的同比增速,本質(zhì)上是因?yàn)樗プ×诉@一波生產(chǎn)力重構(gòu)的機(jī)會(huì)。
堅(jiān)持“不做大模型”的承諾,反而讓金山云在生態(tài)建設(shè)上變得極度開(kāi)放。孫曉坦言,他們的職責(zé)是基于開(kāi)源模型,依托自研技術(shù),提供最穩(wěn)定、最具性價(jià)比的Token服務(wù)。業(yè)內(nèi)熱門(mén)模型一發(fā)布,金山云當(dāng)天就能上線推理服務(wù),這種響應(yīng)速度在行業(yè)內(nèi)也處前列。
在智算時(shí)代,配套產(chǎn)品正在發(fā)生劇變。過(guò)去是計(jì)算、存儲(chǔ)、網(wǎng)絡(luò),現(xiàn)在則是以推理加速為核心的技術(shù)棧(包括引擎、算子優(yōu)化),以及圍繞Agent(智能體)構(gòu)建的生態(tài)。金山云正通過(guò)PD分離(預(yù)填充和解碼分離)以及量化技術(shù),壓低推理時(shí)延,提升吞吐性能。
甚至在某些爆款游戲的背后,金山云也在提供全棧云服務(wù)。在重負(fù)載、高并發(fā)的開(kāi)服階段,金山云通過(guò)平臺(tái)化+工程師重保的機(jī)制,平穩(wěn)支撐了海量玩家的涌入。這種從游戲重保中沉淀下來(lái)的極限壓測(cè)經(jīng)驗(yàn),正被移植到大模型推理的戰(zhàn)場(chǎng)上。
過(guò)去十年的云市場(chǎng),是一場(chǎng)關(guān)于資源規(guī)模的博弈,云廠商扮演的是類似水電煤的“公用事業(yè)”角色。到了2026年,技術(shù)端的“內(nèi)卷”仍將繼續(xù)。從更大的參數(shù)量到更先進(jìn)的計(jì)算方式(如MLA或線性Attention),國(guó)內(nèi)的大模型廠商依然在瘋狂追求效率的極限。
但真正的分水嶺在于“應(yīng)用”。視頻生成的實(shí)用化、VLA模型在車端與機(jī)器人端的泛化、以及Agent在老百姓日常生活中的滲透,將讓推理需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。
智算云的紅利期不會(huì)永遠(yuǎn)持續(xù),只有那些能解決極限工程難題、能打通行業(yè)數(shù)據(jù)閉環(huán)、能提供超高性價(jià)比Token的廠商,才能在潮水退去后依然立于潮頭。
“我們已經(jīng)打下了良好的客戶基礎(chǔ),未來(lái)3到5年,金山云會(huì)有一個(gè)顯著的變化。”劉濤信心滿滿。
當(dāng)智算的齒輪加速轉(zhuǎn)動(dòng),這場(chǎng)關(guān)乎生產(chǎn)力主導(dǎo)權(quán)的競(jìng)賽,才剛剛進(jìn)入最殘酷、也最精彩的深水區(qū)。