新聞源 財富源

2025年01月25日 星期六

財經(jīng) > 滾動新聞 > 正文

字號:  

科大訊飛獲國際語音合成大賽九連冠

  • 發(fā)布時間:2014-08-01 07:32:18  來源:科技日報  作者:佚名  責任編輯:羅伯特

  科技日報訊 (陳衛(wèi)民)在剛剛結束的“Blizzard Challenge 2014”國際語音合成大賽上,科大訊飛和語音及語言信息處理國家工程實驗室聯(lián)合報送的參賽系統(tǒng)在25項測試指標中的11項位列第一,取得了所有參賽系統(tǒng)中最好的綜合表現(xiàn)。這已是科大訊飛自2006年起第九次蟬聯(lián)該項賽事桂冠,持續(xù)鞏固了訊飛智能語音技術的全球領先地位。

  作為國際上規(guī)模最大、最具影響力的語音合成大賽,歷屆Blizzard Challenge吸引了美國卡耐基—梅隆大學、英國愛丁堡大學、國際電氣通信基礎技術研究所、IBM研究院、微軟亞洲研究院等語音技術領域的世界知名研究機構。

  與往屆相比,本次大賽首次將主要測試語種由英語轉(zhuǎn)換到了非英語語種,要求提交的合成系統(tǒng)包括印地語、阿薩姆語等六種印度語種,并增加了這些語種與英文混讀情況下的合成測試。在最終評測過程中,組織方選擇了5個語種基于統(tǒng)一測試平臺進行主觀測聽,每個語種的測試指標包括相似度、自然度、可懂度、英文混讀相似度和英文混讀可懂度共5項指標。

  科大訊飛和語音及語言信息處理國家工程實驗室的研究團隊克服了時間緊、語種多、小語種資源受限等困難,充分發(fā)揮公司在多語種語言處理以及語音合成核心技術上的優(yōu)勢,采用基于統(tǒng)計聲學模型的單元挑選與參數(shù)合成技術方案,并研發(fā)了基于深度神經(jīng)網(wǎng)絡的語音合成新方法,在不到兩個月的時間內(nèi)完成了所有語種高質(zhì)量語音合成系統(tǒng)的構建。最終提交的參賽系統(tǒng)獲得了印地語合成語音相似度與可懂度、印地語英語混讀合成語音相似度與自然度等共計11個指標的第一名。

科大訊飛(002230) 詳細

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價 漲跌幅