從訓練到推理:智算需求正在經歷一場結構性轉向。
過去一年,如果僅從“算力需求增長”來理解中國智算產業(yè)的變化,顯然是不夠的。
在 2026 年 1 月 21 日舉辦的金山云年度 Tech Talk 上,金山云對其過去一年智算業(yè)務的演進進行了系統性回顧。從公開財報數據到客戶側真實使用情況,這些信息拼湊出了一幅更清晰的圖景:智算需求并非簡單放量,而是在訓練、推理、應用形態(tài)和工程方式等多個層面同時發(fā)生結構性變化。
這場變化的核心,不再只是“誰擁有更大規(guī)模算力”,而是圍繞模型如何被使用、Token 如何被消耗、算力如何被組織展開。
變化首先體現在財務數據上。
根據金山云披露的公開財報,其智算云業(yè)務在過去一年實現了高速增長。以 2025 年第三季度為例,智算云賬單收入達到 7.8 億元人民幣,同比增長接近 120%。這一數據并非孤立,而是延續(xù)了此前多個季度的增長趨勢,顯示智算已成為金山云收入結構中的重要組成部分。
金山云高級副總裁劉濤在分享中提到了金山云對這一趨勢的判斷:智算需求的增長重心,正在從訓練側逐步向推理側轉移。
從訓練視角看,過去幾年國內智算需求的主要推動力,來自少數對算力高度敏感的行業(yè)。
自動駕駛與具身智能,是其中最典型的代表。這些行業(yè)往往需要長期訓練模型,并處理視頻、點云、傳感器等海量多模態(tài)數據。在早期階段,它們對算力的需求更多集中在訓練規(guī)模本身。
但與通用大模型不同,這類行業(yè)模型并不一味追求參數規(guī)模最大化。劉濤在分享中指出,自動駕駛和具身智能模型在訓練階段,對算力密度的要求并不極端,但對顯存容量和數據處理能力要求更高。
這意味著,它們對算力平臺的訴求,正在從“算力數量”轉向“系統能力”——包括數據接入、預處理、多模態(tài)調度以及訓練全流程的工程化效率。
推理側的變化更加顯著。
如果說訓練側的變化仍然是漸進的,那么推理側的變化則更為直接和激烈。
一個被反復引用的數據,來自火山引擎在其公開發(fā)布會上的披露:平臺每日 Token 調用量已達到 50 萬億級別。這是當前國內少數被明確對外公布的 Token 規(guī)模數據之一,也成為行業(yè)理解推理負載的重要參考。
與此同時,多個面向大眾或企業(yè)的模型產品正在持續(xù)擴大推理需求。例如豆包、通義千問以及近期加大投入的騰訊元寶,都在不同程度上推動 Token 消耗快速增長。
這些產品并不完全運行在同一云平臺上,但它們共同指向一個事實:推理階段正在成為智算需求增長的主要來源,且這種增長具備明顯的外溢性。
在所有推理場景中,編程類應用被反復強調。
劉濤指出,2025 年一個尤為顯著的變化在于:編程相關請求正在成為 Token 消耗的主力場景之一。這一判斷并非孤立,而是與海外模型使用結構的統計結果高度一致。
“Vibe Coding”成為一個關鍵詞。一個廣為流傳的事實是,Claude Code 的大量代碼本身,正是由 Claude Code 參與生成的。這意味著模型不再只是輔助工具,而是深度介入軟件生產過程。
從全球 Token 調用結構來看,編程類請求在多家模型服務商中長期占據超高比例。金山云也觀察到了同樣的趨勢:代碼生成、重構和理解能力的提升,正在顯著改變程序員的工作方式,并直接放大推理側算力需求。
在具體應用層面,互聯網客戶仍然是智算需求的重要來源,但其需求形態(tài)已經發(fā)生變化。劉濤提到,當前互聯網場景呈現出三個明顯特征:
其一,多模態(tài)需求顯著增長。視頻生成、視頻理解以及復雜推理任務,帶動了訓練與推理負載的持續(xù)上升;
其二,模型參數規(guī)模不再單向膨脹,而是圍繞具體任務進行結構性調整;
其三,Vibe Coding 在頭部互聯網公司中已較為普及,使用更強的商用模型進行代碼開發(fā),正在成為常態(tài)。
這些變化意味著,互聯網客戶對智算平臺的期待,已經從“算力服務”升級為對模型生命周期管理和工程體系的整體依賴。
為了滿足更多元化的需求,劉濤表示,2025 年,智算平臺金山云星流已完成從資源管理平臺向一站式 AI 訓推全流程平臺的戰(zhàn)略升級。從訓推平臺、機器人平臺到模型 API 服務,升級后的金山云星流平臺構建了從異構資源調度、訓練任務故障自愈到機器人行業(yè)應用支撐、模型 API 服務商業(yè)化落地的全鏈路閉環(huán)。
實現三維進階,智算云 AI 勢能全釋放
盡管各行各業(yè)大規(guī)模應用 AI 還處于早期探索階段,但定位行業(yè)助力者的金山云,多年來持續(xù)打磨全棧 AI 能力。從 2023 年的智算網基礎設施,到 2024 年智算云的平臺化和 Serverless 化,再到 2025 年的一站式 AI 訓推全流程平臺,通過提升平臺效率、突破行業(yè)邊界、加速推理布局,金山云為迎接 AI 應用爆發(fā)做好了充分準備。
在平臺效率方面,金山云星流訓推平臺提供從模型開發(fā)、訓練到推理的完整生命周期管理,具備開發(fā)、訓練、推理和數據處理四大模塊能力,通過降低多模塊協同復雜度,能實現“開箱即用”的 AI 開發(fā)體驗。自研的 GPU 故障自愈技術結合任務可觀測性設計,可實時監(jiān)控硬件健康狀態(tài)與任務進程,自動觸發(fā)故障遷移與任務重調度,降低算力中斷風險,保障長周期訓練任務穩(wěn)定運行。
作為面向機器人開發(fā)與落地的全鏈路云原生平臺,金山云星流機器人平臺深度融合數據采集、存儲、標注、模型開發(fā)、訓練、部署與仿真等核心環(huán)節(jié),打造具身場景專屬的數據、模型、仿真一體化引擎。平臺率先實現具身智能數據工程領域采集、標注、管理的全鏈路閉環(huán),可高效服務具身智能行業(yè)模型訓練、仿真應用場景分析等核心需求,助力客戶快速完成從算法研發(fā)到真實場景部署的全流程落地,最終推動機器人產業(yè)的智能化升級。
面向大模型應用開發(fā)者和企業(yè)用戶,金山云星流平臺模型 API 服務提供高可用、易集成的模型調用與管理能力,覆蓋模型調用的全生命周期。該服務支持高并發(fā)推理與多模型管理,能夠幫助用戶高效接入多種模型資源,助力大模型應用落地。目前,金山云星流平臺模型 API 服務已積累諸多行業(yè)客戶。
同時,金山云星流平臺的模型生態(tài)也在持續(xù)豐富。目前,平臺已支持近 40 種不同模型,包括 DeepSeek、Xiaomi MiMo、Qwen3、Kimi 等??蛻敉ㄟ^一站式訪問,即可高效接入多種模型,在暢享穩(wěn)定高效云服務的同時,更加聚焦 AI 業(yè)務創(chuàng)新和價值創(chuàng)造。