騰訊混元大模型亮相參數超千億

香港文匯報財經 2023-09-08

◆蔣傑表示，騰訊混元大模型從第一個token開始就從零開始訓練，掌握了從模型算法到機器學習框架，再到AI基礎設施的全鏈路自研技術。

　　全鏈路自研聯接50多個業務功能揮低GPT-4

　　在昨日的2023騰訊全球數字生態大會上，騰訊混元大模型正式亮相，並宣布通過騰訊雲對外開放。騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生表示，混元大模型是由騰訊全鏈路自研的通用大語言模型，擁有超千億參數規模，預訓練語料超2萬億tokens。騰訊集團副總裁蔣傑表示，目前混元大模型已經接入騰訊50多個業務，包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊會議、騰訊文檔、微信搜一搜和QQ瀏覽器等業務和產品，同時取得了不錯的效果。◆文/圖：香港文匯報記者郭若溪深圳報道

　　湯道生稱，混元大模型具有強大的中文理解與創作能力、邏輯推理能力，以及可靠的任務執行能力，在解決大模型常見的「幻覺」問題上取得了明顯進步。「未來它將作為騰訊雲MaaS服務的底座，客戶不僅可以直接通過API調用混元，也可以將混元作為基底模型，開發不同產業場景的應用。」

　　中文理解創作邏輯推理能力強

　　蔣傑說，騰訊混元大模型從第一個token開始就從零開始訓練，掌握了從模型算法到機器學習框架，再到AI基礎設施的全鏈路自研技術。他認為，目前業界大模型在場景中的應用依然有限，主要集中在容錯率高、任務簡單的休閒場景。騰訊在算法層面進行針對性研發，解決大模型目前存在的「幻覺」問題。

　　解決方案覆蓋逾百產業場景

　　根據騰訊的官方信息，騰訊已經和外部1萬1千家合作方推出了覆蓋100多個產業場景的行業解決方案。去年，生態夥伴收入佔到騰訊雲整體收入的三分之一，收入增速是騰訊雲增速的4倍。從2021年開始，騰訊先後推出千億和萬億參數的NLP稀疏大模型，打破CLUE三大榜單紀錄，實現在中文理解能力上的新突破。

　　現場體驗：「能減少胡言亂語」

　　在大會現場，有不少參觀者作了現場體驗。王先生提出寫一篇作文的要求，嘗試論證「關羽和秦瓊誰的戰鬥力更強」，他對比了GPT-4的結論後，認為騰訊混元大模型更可靠，「能減少胡言亂語」。這是因為騰訊優化了預訓練算法及策略，讓混元大模型的幻覺相比主流開源大模型降低了30%至50%。同時，混元大模型還能識別「陷阱」問題，譬如提出「怎麼超速最安全」時，混元大模型就能直接指出「要遵守交通規則」。

　　據現場工作人員介紹，通過強化學習的方法，混元大模型學會了識別陷阱問題，可以拒絕回答不恰當的用戶問題。通過位置編碼優化，還提高了超長文的處理效果和性能。此外，騰訊的研發團隊還提出了思維鏈的新策略，能夠讓大模型像人一樣結合實際的應用場景進行推理和決策。

　　能識別陷阱處理超長文高效

　　蔣傑表示，騰訊的自研機器學習框架Angel讓訓練速度相比業界主流框架提升1倍，推理速度比業界主流框架提升1.3倍。因此，騰訊混元大模型能夠理解上下文的含義，並且有長文記憶能力，可以流暢地進行專業領域的多輪對話。騰訊方面表示，它能進行文學創作、文本摘要、角色扮演等內容創作，做到充分理解用戶意圖，並高效、準確地給出有時效性的答覆。

　　在發布會上，蔣傑還以中國信通院《大規模預訓練模型技術和應用的評估方法》的標準符合性測試結果，來印證混元大模型的能力。在這項評測中，混元大模型共測評66個能力項，在「模型開發」和「模型能力」兩個重要領域的綜合評價均獲得了當前的最高分。在主流的評測集MMLU、CEval和AGI-eval上，混元大模型均有優異的表現。

　　上海財經大學校長劉元春認為，借助於全鏈路自研，中國將不斷積累大模型相關人才和技術，逐漸形成體系化的產業鏈、人才鏈、技術鏈和創新鏈，最終走出一條發展通用人工智能的中國路徑，助力數字技術的創新上取得突破性進展。

　　騰訊混元大模型特點及優勢

　　1 減少「胡言亂語」，幻覺相比主流開源大模型降低30%至50%

　　2 能識別「陷阱」，面對安全誘導類問題的拒答率提升20%

　　3 提高超長文本的處理效果，能一口氣生成千字長文

　　4 具備更強的邏輯推理能力，能結合實際場景推理決策

　　5 由騰訊從第一個token開始從零訓練，算法、框架、平台全鏈路自研

　　6 實用：已在騰訊會議、騰訊文檔等50多個產品和業務內測

　　整理：香港文匯報記者郭若溪

　　騰訊混元大模型實際應用場景

　　◆ 騰訊會議：助力打造AI小助手，指令理解、會中問答、會議摘要、會議待辦項、總結紀要盡在掌握。

　　◆ 騰訊文檔：智能助手功能，支持數十種文本創作場景；一鍵生成標準格式文本，自然語言生成函數，基於表格內容生成圖表等也在內測了。

　　◆ 騰訊廣告：智能化廣告素材創作，適應行業與地域特色，滿足千人千面，實現文、圖、視頻自然融合。

　　整理：香港文匯報記者郭若溪

讀香港文匯報PDF版面

騰訊混元大模型亮相 參數超千億

騰訊混元大模型亮相參數超千億