北京首家詞元工廠落地 適配各類複雜AI場景 一期日產能達1.4萬億 九成任務響應時間低於10秒

●早前,在北京國際科幻與未來產業博覽會上,諾亦騰機器人的工作人員演示通過動作捕捉技術控制的協作機器人。 資料圖片
●早前,在北京國際科幻與未來產業博覽會上,諾亦騰機器人的工作人員演示通過動作捕捉技術控制的協作機器人。 資料圖片


  北京建設「人工智能之城」再落一子,北京首家Token(即詞元,AI處理文字最小單位)工廠——北京壹號詞元工廠9日正式落地亦莊,並同步向全球開源「詞元工廠性能基準」,項目一期每日Token產能可達1.4萬億。詞元工廠對標電網穩定運行標準,能實現7×24小時不間斷運行,一半任務能在6秒內響應,九成任務響應時間低於10秒,全面適配各類複雜AI場景。 ●香港文匯報記者 馬曉芳 北京報道

  今年3月,中國日均詞元調用量已突破140萬億,兩年增長超千倍。據摩根大通預測,2025年至2030年,中國Token消耗量年複合增長率將高達330%,5年增長400倍。有機構測算,當前中國國產詞元定價約為海外的1/10,中國詞元價格優勢極為明顯。

  像用電一樣用Token

  Token算力是服務器運算的能力。在人工智能時代,算力已成為國家綜合實力的核心指標。數據顯示,目前國內單日Token消耗量在9個月內暴漲4倍,用量從萬億級躍升至千萬億級。從日常人機對話、專業科研分析,到高清視頻生成,不同場景對算力的要求天差地別,精細化服務成為剛需。算力越強,每秒能處理的Token就越多,使用成本隨之降低。大語言模型正從簡單的對話機器人加速演進為能夠自主規劃、推理並採取行動以達成複雜目標的長時運行系統。一個簡單的用戶指令背後可能是模型數十次推理循環、工具調用與自我反思的疊加。這意味着算力消耗不再是「一問一答」式的短時脈衝,而是長周期、多輪次、高不確定性的混沌負載。

  北京壹號詞元工廠是面向智能體時代的「新型電廠」,實現像用電一樣用Token。該工廠由軟通動力信息技術股份有限公司建設,由一台台服務器組成,項目一期每日Token產能可達1.4萬億。工廠遠期目標實現日產10萬億Token,未來還將聯動張家口、烏蘭察布等綠電基地,構建京津冀一體化算力集群,讓算力生產隨着規模持續擴大,大幅降低各行各業使用AI算力的門檻。

  大模型算力供給邁流水線時代

  軟通動力高級副總裁、軟通智算總裁劉怡表示,科研人員梳理25年以來的數千萬份文獻用來撰寫學術綜述,僅這一項任務就要消耗1億Token。詞元工廠對標電網穩定運行標準,能實現7×24小時不間斷運行,而且核心響應指標表現優異。一半的任務能在6秒內響應,九成的任務響應時間低於10秒,波動性控制在20%以內,全面適配各類複雜AI場景。詞元工廠不是簡單堆算力,而是把底層資源高效轉化為標準化的「數字燃料」Token,像電網一樣給出明確的服務質量承諾:服務可用性≥99.9%,對標電網供電可靠性≥99.9%;首字延遲P90<10秒、波動<20%,對標電網電壓合格率波動≤±5%;緩存命中率≥90%,對標電網功率因數,減少計算浪費。

  當前行業普遍缺少面向智能體場景的算力服務質量評測標準,導致「高分低能、參數虛標、用戶選擇困難」。香港文匯報記者獲悉,伴隨工廠落地,同步向全球開源「詞元工廠性能基準」,實現對算力集群真實服務能力的精準評估與公平對比。這是行業首次針對智能體長時運行特徵建立統一的性能度量標準,大模型算力供給從粗放式吞吐比拚進入標準化、工業化的Token流水線時代。

  將推實時監測等動態監控質量

  北京亦莊匯聚了大量AI模型企業與科創主體,天地一體化算力網絡持續完善,產業集聚優勢顯著,是此次詞元工廠選址亦莊的重要原因。據了解,目前軟通動力正深度參與平潭兩岸融合算力中心、韶關公共算力服務平台等國家一體化算力網絡重點項目建設,並依託睿動智能體平台,打造連接國際雲廠商與國產AI新勢力的全球化AI雙向樞紐。未來,軟通動力將持續推進「Token工廠」建設,從消費者視角出發推出「實時監測」等一系列質量監控方法,在運行端動態監控Token生成的幻覺率、語義一致性及毫秒級延遲波動。