直通屏山|福建|時評|大學城|臺海|娛樂|體育|國內|國際|專題|網事|福州|廈門|莆田|泉州|漳州|龍巖|寧德|南平|三明
      您所在的位置:東南網 > 2020福建電信宣傳 > 新聞資訊 > 正文

      用AI守護方言 首個支持30種方言混說語音大模型發布!

      2024-05-25 17:02:29?作者:?來源:東南網  責任編輯:馮韻   我來說兩句

      東南網5月25日訊 (本網記者 肖月青)“唔該查嚇電話費吖”、“儂幫阿拉查下話費好伐?”粵語、上海話、四川話……中國電信萬號智能客服每天接到幾百萬通電話,其中很大比例用方言撥打,尤其是“老少邊窮”地區,一些老人習慣說方言,甚至只會說方言,智能客服及人工客服都難以理解,溝通效率難免大打折扣。據統計,全國仍有約20%人口未普及普通話,他們常常被隔絕在智能信息服務之外,難以享受到AI時代的便利。

      近日,中國電信人工智能研究院(TeleAI)發布業內首個支持30種方言自由混說的語音識別大模型——星辰超多方言語音識別大模型,打破單一模型只能識別特定單一方言的困境,可同時識別理解粵語、上海話、四川話、溫州話等30多種方言,是國內支持最多方言的語音識別大模型。中國電信人工智能研究院用最前沿的語音識別技術,讓溝通更加自然流暢,極大解決老年人及老少邊窮地區人們的信息服務無法觸達的問題,為人們搭建一條通往AI時代溝通的橋梁。

      “星辰”大模型展示

      用AI守護方言,讓語言文化煥發生命力

      方言是中國文化多樣性的瑰寶,傳承豐富的歷史文化內涵;方言也是不同區域文化的靈魂,凝聚人們鄉情的根源,具有豐富的人文價值。然而,很多方言卻在社會經濟快速發展中不斷消亡,保護方言傳承語言文化已迫在眉睫。

      AI正在為傳承語言文化注入全新生命力。方言語料采集、記錄和歸納后,需保證能被后人正確理解。中國幅員遼闊,“百里不同俗,十里不同音”各種方言語法語音特征各不相同,傳統的方言研究依賴于調查者主觀感知標注,人力工程量巨大且難以系統標注。而AI能夠更高效、系統地對方言進行整理歸納,對方言保護和傳承意義重大。

      構建高質量方言數據庫,是方言保護和研究的基礎。當前,中國電信人工智能研究院已構建超30種,超30萬小時的高質量方言數據庫,方言數據庫在豐富性和高質量等層面均居于業內前列。

      中國電信人工智能研究院(TeleAI)堅持自主研發創新,在中國電信CTO、人工智能研究院院長李學龍帶領下,推出了星辰語音大模型,通過超大規模語音預訓練和多方言聯合建模,率先實現單一模型支持30種方言自由混說語音識別,是國內支持最多方言、覆蓋人口最多的語音大模型;研發團隊首創“蒸餾+膨脹”聯合訓練算法,解決超大規模多場景數據集和大規模參數條件下,預訓練坍縮的問題,實現1B參數80層模型穩定訓練;星辰語音大模型也是業內首個開源的基于離散語音表征的語音識別大模型,通過“從語音到token再到文本”的建模新范式,將推理時語音傳輸比特率降低數十倍。

      星辰語音大模型以絕對領先的性能,斬獲多個國際權威賽事冠軍。在權威國際語音頂會INTERSPEECH2024離散語音單元建模挑戰賽上,憑借星辰語音識別大模型的領先技術,中國電信人工智能研究院語音團隊斬獲語音識別賽道冠軍。在業內知名的多方言語音識別數據集KeSpeech任務上,星辰語音大模型打破紀錄,領先之前最優結果20%,以高達92.97%的字準確率刷新最優結果。同時在NIST(美國國家標準與技術研究院)組織的Babel低資源語音識別項目電話粵語賽道上,刷新記錄取得目前業內最好結果。極佳的性能保證用戶與星辰語音大模型對話,無需刻意切換普通話,也無需提高音量放慢語速,可以像和家人講話一樣自然地暢所欲言。

      勇擔央企使命,中國電信搭建AI時代溝通橋梁

      隨著AI技術高速發展,人們享受著智能化、無人化服務的便利。然而,老少邊窮地區及很多老人,由于方言限制,正逐漸被AI時代拋棄。中國電信堅定地承擔央企責任,用AI搭建溝通的橋梁,讓每一個人都能享受AI時代便利。同時,中國電信有幾億用戶和豐富應用場景,天然具備數據飛輪飛速轉動的優勢,無疑將促進技術更快進步,更好地服務每一個人。

      據悉,星辰語音大模型已廣泛應用落地。星辰語音大模型已在福建、江西、廣西、北京、內蒙等地的中國電信萬號智能客服試點應用,接入星辰大模型以后,萬號智能客服秒懂30種方言,自然流暢地服務用戶,實現日均處理約200萬通電話;智能客服翼聲平臺接入星辰大模型的語音理解和分析能力,實現31省全覆蓋,每天處理125萬通客服電話。此外,星辰語音大模型還落地多地市的12345平臺,賦能客服人員秒懂30種方言,更自然流暢理解更多市民需求,提升溝通效率,助力政務工作智能化升級,更高效、便捷地為每一位市民提供服務。

      在中國國際大數據產業博覽會上,星辰語音大模型讓數字人“能聽會說”,數字人“數數”,聲音甜美生動、與康輝同臺主持,中英文隨意切換的,交流對話自然流暢,廣受好評。

      星辰語音大模型現已對外開源,攜手合作伙伴及個人開發者,開發面向更多場景的應用,共同守護方言、傳承語言文化,助力AI普惠。未來,中國電信人工智能研究院將持續深耕研發創新,不斷提高支持方言的數量和準確度,計劃建成首個覆蓋全國333個地市方言和主要少數民族語言的語音識別大模型,切實讓老少邊窮、老年人等每個人都能享受到AI時代的便利。

      相關閱讀:

      打印 | 收藏 | 發給好友 【字號
      今日熱詞
      更多>>福建今日重點
      更多>>國際國內熱點
      • 新聞圖片
      更多>>娛 樂
      • 點擊排行
      • 三天
      • 一周
      • 一月
      關于我們 | 廣告服務 | 網站地圖 | 網站公告 |
      國新辦發函[2001]232號 閩ICP備案號(閩ICP備05022042號) 互聯網新聞信息服務許可證 編號:35120170001 網絡文化經營許可證 閩網文〔2019〕3630-217號
      信息網絡傳播視聽節目許可(互聯網視聽節目服務/移動互聯網視聽節目服務)證號:1310572 廣播電視節目制作經營許可證(閩)字第085號
      網絡出版服務許可證 (署)網出證(閩)字第018號 增值電信業務經營許可證 閩B2-20100029 互聯網藥品信息服務(閩)-經營性-2015-0001
      福建日報報業集團擁有東南網采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播
      職業道德監督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327

      主站蜘蛛池模板: 美女扒了内裤让男人桶爽视频| 91麻豆国产福利在线观看| 日韩电影在线|中韩| 亚洲狠狠色丁香婷婷综合| 精品久久久无码人妻中文字幕| 国产亚洲一区二区三区在线观看 | 免费边摸边吃奶边叫床视频| 西西4444www大胆无码| 国产成人无码一区二区三区| 4408私人影院| 国精产品wnw2544a| a毛片免费观看| 好吊日视频在线| 三年片在线观看免费观看大全中国| 日本大片免a费观看在线| 久久精品日韩Av无码| 欧美va亚洲va国产综合| 亚洲天堂在线播放| 欧美色欧美亚洲另类二区| 人妻丰满熟妇av无码区| 精品一二三四区| 午夜aaaaaaaaa视频在线| 美女黄网站人色视频免费国产| 国产亚洲精品美女久久久| 黄瓜视频入口在线播放| 国产成人精品动图| 欧美色图亚洲激情| 国产真实乱子伦精品视手机观看| **肉体一级毛片| 国产精品无码久久av不卡| 91精品国产综合久久久久久| 在线观看你的意思我明白| a级国产乱理伦片在线观看| 女人洗澡一级毛片一级毛片| yellow字幕网在线| 小呦精品导航网站| 一本一本久久a久久精品综合| 小小的日本乱码在线观看免费| 一级做a毛片免费视频| 岳双腿间已经湿成一片视频| 一本一道波多野结衣大战黑人|