財(cái)經(jīng) > 滾動新聞 > 正文
字號:大 中 小
多用途唇讀新技術(shù)可助聽講話內(nèi)容
- 發(fā)布時(shí)間:2016-03-29 01:29:34 來源:科技日報(bào) 責(zé)任編輯:羅伯特
科技日報(bào)北京3月28日電 (記者常麗君)據(jù)英國東英吉利大學(xué)消息,該??茖W(xué)家開發(fā)出一種新的唇語閱讀技術(shù),不僅有助于解決犯罪調(diào)查問題,也給那些在聽力和講話方面有困難的人帶來幫助。研究人員在近日于上海召開的“國際聲學(xué)、語音和信號處理大會”(ICASSP)上介紹了這一成果。
新的視覺語音識別技術(shù)由東英吉利大學(xué)計(jì)算科學(xué)學(xué)院海倫·L.拜爾博士和理查德·哈維教授開發(fā),可以用在“任何憑聲音難以確定人們在說什么的地方”。拜爾說,當(dāng)無法獲得聲音時(shí),如何確定人們的講話內(nèi)容是個(gè)獨(dú)特的問題,比如閉路電視的腳注,或者聲音不足又沒有對話語境的線索。但現(xiàn)在,通過機(jī)器唇讀分類技術(shù),能更精確地區(qū)分這些聲音。
拜爾說,一種穩(wěn)定的唇讀系統(tǒng)能用于從犯罪調(diào)查到娛樂用途等多種情況。唇讀還可以用在運(yùn)動場上,比如足球運(yùn)動員在比賽激烈時(shí)大喊大叫的單詞是什么,但最可能的實(shí)際用途還是在那些噪音較大的地方,比如汽車中或飛機(jī)駕駛艙內(nèi)。
研究人員使用了一種新的訓(xùn)練方法,使這種分類系統(tǒng)對以往的唇讀方法進(jìn)行了改進(jìn)。雖然目前這一系統(tǒng)還有需要改善的地方,但最重要的是,它可以通過調(diào)整來用于多種目的,比如給那些有聽力障礙或講話困難的人帶來幫助。此外,一個(gè)好的唇讀機(jī)可以作為整體視聽識別系統(tǒng)的一部分。
哈維也指出,在人工智能領(lǐng)域,唇讀是最具挑戰(zhàn)性的難題之一,訓(xùn)練機(jī)器如何識別人類嘴唇的形狀和變化并非易事,所以這方面取得的進(jìn)步非常重要。
相關(guān)論文將發(fā)表在電氣與電子工程師協(xié)會(IEEE)《2016年國際聲學(xué)、語音和信號處理大會會刊》上。
熱圖一覽
- 股票名稱 最新價(jià) 漲跌幅
- 祥龍電業(yè) 6.77 10.08%
- 安彩高科 10.18 10.05%
- 傲農(nóng)生物 19.98 10.02%
- 振華股份 15.92 10.02%
- 東軟集團(tuán) 15.94 10.01%
- 世運(yùn)電路 18.15 10.00%
- 天鵝股份 23.65 10.00%
- 七一二 43.81 9.99%
- 愛嬰室 31.60 9.99%
- 西部黃金 21.48 9.98%
- 最嚴(yán)調(diào)控下滬深房價(jià)仍漲 人口老齡化影響三四線樓市
- 樂天大規(guī)模退出中國市場 供應(yīng)商趕赴北京總部催款
- 北京16家銀行上調(diào)首套房貸利率 封殺“過道學(xué)區(qū)房”
- 10萬輛共享單車僅50人管遭質(zhì)疑 摩拜ofo優(yōu)勢變劣勢
- 去年聯(lián)通、電信凈利潤均下滑 用戶爭奪漸趨白熱化
- 奧迪否認(rèn)“官民不等價(jià)”:優(yōu)惠政策并非只針對公務(wù)員
- 季末銀行考核在即 一日風(fēng)云難改“錢緊錢貴”現(xiàn)狀
- 美圖7小時(shí)暴跌四成 虧損業(yè)績?nèi)绾沃?00億市值受拷問
- 監(jiān)管重壓下P2P退出平臺增加 網(wǎng)貸行業(yè)進(jìn)入冷靜期
- 配資炒股虧損逾百萬 股民將信托公司告上法庭