科技創新/中電信推AI語音大模型 識別30種方言
隨着人工智能(AI)高速發展,為傳承語言文化注入全新生命力。中國電信(00728)人工智能研究院(TeleAI)發布了業內首個支持30種方言自由混說的語音識別大模型,即「星辰超多方言語音識別大模型」,能識別理解粵語、上海話、四川話、溫州話等超過30種方言,為現時國內支持方言數量最多的語音識別大模型。中國電信董事長柯瑞文表示,未來將在雲、大數據、人工智能等領域開放超過300個新場景。/大公報記者 蔣去悄
中國電信介紹稱,星辰語音大模型是業內首個開源的、基於離散語音表徵的語音識別大模型,通過「從語音到token再到文本」的建模新範式,大幅降低推理時的語音傳輸比特率。
據了解,中國電信人工智能研究院已構建超30種、逾30萬小時的方言數據庫,研發團隊採取的「蒸餾+膨脹」聯合訓練算法,可以解決超大規模多場景數據集和大規模參數條件下預訓練坍縮的問題,實現1B參數80層模型穩定訓練。
實際應用方面,星辰語音大模型已在福建、江西、廣西、北京、內蒙古等地的中國電信萬號智能客服試點應用,協助客服理解30種方言,每日平均處理約200萬通電話;智能客服翼聲平台接入星辰大模型的語音理解和分析能力,每日能處理客服電話125萬通。該模型還在多個城市的12345平台落地,賦能客服秒懂30種方言,更自然流暢解答市民需求,協助提升溝通效率,助力政務工作智能化升級。
柯瑞文:新質生產力首重科技創新
此外,柯瑞文在第七屆數字中國建設峰會·智算雲生態大會上表示,發展新質生產力的核心要素在於科技創新,中國電信不斷加大科技創新力度,在雲和雲網融合領域,突破了雲操作系統等技術,雲底座平台擺脫開源限制,打造通智超一體化智算加速平台「雲驍」、一站式智算服務平台「慧聚」、算力調度平台「息壤」。
柯瑞文稱,中國電信接下來將在雲、大數據、人工智能三大戰略新興技術領域,以及新型工業化與智慧城市兩大重點領域,新開放超過300個新場景,與產業夥伴一同打造繁榮且具備活力的產業發展新態勢。
柯瑞文並指出,將升級國雲融數賦智新服務,以國雲核心技術為基礎,打造城市智能中樞共性底座,助推智慧城市全域數字化轉型,利用「自研翼雲控系統+工業大模型+工業互聯網『雙跨』平台」數據賦能新型工業化,服務工業設備國產化改造和效能的提升。
柯瑞文透露,未來將圍繞「數據要素X」行動,發揮數據中台能力,全面融合內部及行業數據,積極推動數據的多場景應用,充分釋放數據要素價值。
聯通推經濟大模型 輔助決策
另外,聯通智慧足跡數據科技公司總經理李振軍表示,旗下「中國聯通元景─經濟大模型」已在多省市政府等機關部門應用,賦能經濟運行調度日常工作,在人工智能輔助經濟決策的能力上得到很大的提升。
李振軍介紹,該模型在宏觀經濟分析、產業分析、企業服務等重點場景開發了多項功能,包括智慧問數、智慧分析等,通過人機對話互動的方式提供經濟利於知識整合、分析、輸出等服務,相信可以滿足政府、研究機構、企業、個人等不同用戶在經濟領域的業務需求,並提高經濟研究效率、專業性和智能化水平。