【小知識】關於「詞元」


  Q:什麼是「詞元」?

  A:詞元即Token,是AI處理文本時的基本單位,是大模型處理信息的最小單元,具有智能時代可計量、可定價、可交易的特徵,讓AI服務擁有了清晰的「結算貨幣」。當用戶向AI工具提問的時候,工具裏的模型會先把用戶的話分解成一個個小的詞元,在算力「算」完後把結果的相應詞元拼回成答案。

  2026年3月,中國國家數據局正式確定其中文譯名。

  Q:什麼是「詞元出海」?

  A:海外用戶使用中國的AI大模型,將指令傳輸至部署於中國境內的數據中心,依託中國的電力供給與算力集群完成計算,再將結果返回海外用戶終端。

  Q:影響「詞元出海」的主要因素是什麼?

  A:調用詞元出海的成本,包括硬件技術能力、大模型性價比與電力成本。

  Q:「詞元」調用量水平是否能直接評估「詞元出海」水平?

  A:根據國家數據局今年3月發布:2024年初,中國日均詞元調用量為1,000億;至2025年底,躍升至100萬億;今年3月,已突破140萬億,兩年增長超千倍。

  但詞元調用量激增,跟詞元出海飆升,並不能直接畫等號。大模型聚合調用平台OpenRouter顯示中國大模型服務提供方,其數據中心實體多部署在海外,海外用戶實際使用的是部署在海外雲平台上的大模型服務。這意味着,有相當數量的詞元調用並未回流至中國的數據中心。這些情況下,「詞元出海」其實本質仍是「模型出海」。

  來源:綜合人民日報海外版、求是網