新聞源 財(cái)富源

2025年01月24日 星期五

財(cái)經(jīng) > 滾動新聞 > 正文

字號:  

多用途唇讀新技術(shù)可助聽講話內(nèi)容

  • 發(fā)布時(shí)間:2016-03-29 01:29:34  來源:科技日報(bào)  作者:佚名  責(zé)任編輯:羅伯特

  科技日報(bào)北京3月28日電 (記者常麗君)據(jù)英國東英吉利大學(xué)消息,該??茖W(xué)家開發(fā)出一種新的唇語閱讀技術(shù),不僅有助于解決犯罪調(diào)查問題,也給那些在聽力和講話方面有困難的人帶來幫助。研究人員在近日于上海召開的“國際聲學(xué)、語音和信號處理大會”(ICASSP)上介紹了這一成果。

  新的視覺語音識別技術(shù)由東英吉利大學(xué)計(jì)算科學(xué)學(xué)院海倫·L.拜爾博士和理查德·哈維教授開發(fā),可以用在“任何憑聲音難以確定人們在說什么的地方”。拜爾說,當(dāng)無法獲得聲音時(shí),如何確定人們的講話內(nèi)容是個(gè)獨(dú)特的問題,比如閉路電視的腳注,或者聲音不足又沒有對話語境的線索。但現(xiàn)在,通過機(jī)器唇讀分類技術(shù),能更精確地區(qū)分這些聲音。

  拜爾說,一種穩(wěn)定的唇讀系統(tǒng)能用于從犯罪調(diào)查到娛樂用途等多種情況。唇讀還可以用在運(yùn)動場上,比如足球運(yùn)動員在比賽激烈時(shí)大喊大叫的單詞是什么,但最可能的實(shí)際用途還是在那些噪音較大的地方,比如汽車中或飛機(jī)駕駛艙內(nèi)。

  研究人員使用了一種新的訓(xùn)練方法,使這種分類系統(tǒng)對以往的唇讀方法進(jìn)行了改進(jìn)。雖然目前這一系統(tǒng)還有需要改善的地方,但最重要的是,它可以通過調(diào)整來用于多種目的,比如給那些有聽力障礙或講話困難的人帶來幫助。此外,一個(gè)好的唇讀機(jī)可以作為整體視聽識別系統(tǒng)的一部分。

  哈維也指出,在人工智能領(lǐng)域,唇讀是最具挑戰(zhàn)性的難題之一,訓(xùn)練機(jī)器如何識別人類嘴唇的形狀和變化并非易事,所以這方面取得的進(jìn)步非常重要。

  相關(guān)論文將發(fā)表在電氣與電子工程師協(xié)會(IEEE)《2016年國際聲學(xué)、語音和信號處理大會會刊》上。

熱圖一覽

  • 股票名稱 最新價(jià) 漲跌幅