財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào)：大 中 小

對(duì)人工智能多點(diǎn)耐心百度漢語語音識(shí)別獲重大突破

發(fā)布時(shí)間：2015-11-05 07:29:00 來源：中國經(jīng)濟(jì)網(wǎng) 作者：佚名責(zé)任編輯：羅伯特

　　近日舉行的中國人機(jī)語音交互領(lǐng)域權(quán)威的學(xué)術(shù)會(huì)議——全國人機(jī)語音通訊學(xué)術(shù)會(huì)議（NCMMSC2015）上，百度透露其在漢語語音識(shí)別方面獲得重大突破。據(jù)悉，百度研發(fā)出了基于多層單向LSTM（長短時(shí)記憶模型）的漢語聲韻母整體建模技術(shù)，并成功把連接時(shí)序分類（CTC）訓(xùn)練技術(shù)嵌入到語音識(shí)別傳統(tǒng)技術(shù)建?？蚣苤?。該技術(shù)能夠使機(jī)器的語音識(shí)別相對(duì)錯(cuò)誤率降低15%，使?jié)h語安靜環(huán)境普通話語音識(shí)別的準(zhǔn)確率接近97%，未來將大規(guī)模應(yīng)用在百度語音搜索等產(chǎn)品上。

　　日前，百度語音技術(shù)部負(fù)責(zé)人賈磊媒體專訪時(shí)稱，語音識(shí)別和大數(shù)據(jù)、機(jī)器學(xué)習(xí)、云計(jì)算等技術(shù)相輔相成，共同推進(jìn)人工智能發(fā)展。

　　他表示，機(jī)器成本、高效計(jì)算等問題，是阻礙語音識(shí)別技術(shù)發(fā)展的幾個(gè)重要因素。而百度研究的CTC模型在解碼部分的速度，比傳統(tǒng)模型快5倍到10倍。配合專業(yè)的深度學(xué)習(xí)計(jì)算硬件，使后臺(tái)消耗大大降低，有助于實(shí)現(xiàn)語音識(shí)別技術(shù)的大規(guī)模普及。

　　一次框架性創(chuàng)新

　　百度方面透露，該技術(shù)創(chuàng)新是一項(xiàng)框架性的創(chuàng)新。這一突破也標(biāo)志著，百度在世界范圍內(nèi)率先攻克了在漢語領(lǐng)域使用CTC技術(shù)訓(xùn)練單向多層LSTM的高精度建模難題。

　　據(jù)了解，2011年深度學(xué)習(xí)技術(shù)引入語音識(shí)別領(lǐng)域，推進(jìn)整個(gè)工業(yè)界的人工智能技術(shù)應(yīng)用進(jìn)入深度學(xué)習(xí)時(shí)代。隨后的幾年里，CNN（卷積神經(jīng)網(wǎng)絡(luò)）、LSTM（長短時(shí)記憶模型）、CNN混合LSTM的建模技術(shù)在語音識(shí)別工業(yè)產(chǎn)品中不停涌現(xiàn)，并持續(xù)提升語音識(shí)別產(chǎn)品效果。

　　眼下，百度把語音識(shí)別的相對(duì)錯(cuò)誤率降低15%，又會(huì)帶來何種變化？對(duì)用戶而言，是識(shí)別率更準(zhǔn)、識(shí)別速度更快。對(duì)語音服務(wù)提供者來說，成本會(huì)降低很多。

　　“語音識(shí)別正處于產(chǎn)業(yè)化爆發(fā)的邊緣，但機(jī)器計(jì)算成本是一個(gè)很大的瓶頸。如果線上50%的搜索都由語音完成，而計(jì)算成本還和過去一樣，那么沒有公司能承擔(dān)得起?！辟Z磊表示，語音服務(wù)要想大規(guī)模普及，必須降低后臺(tái)服務(wù)器開銷。

　　他隨即說，百度語音識(shí)別研究的CTC模型在解碼部分的速度比傳統(tǒng)模型快5倍到10倍。配合專業(yè)的深度學(xué)習(xí)計(jì)算硬件，當(dāng)未來語音服務(wù)大規(guī)模普及時(shí)，可以讓后臺(tái)計(jì)算成本大大降低。對(duì)新技術(shù)的追趕，需要大數(shù)據(jù)、大平臺(tái)、極致計(jì)算等結(jié)合做支撐，因此百度這樣的公司在未來有優(yōu)勢。

　　改善方言、口音和遠(yuǎn)場識(shí)別

　　媒體：既然將把此項(xiàng)技術(shù)用到百度語音搜索產(chǎn)品上，對(duì)應(yīng)用時(shí)間表、應(yīng)用前后的產(chǎn)品功能和用戶體驗(yàn)差別等，能否講講？

　　賈磊：我預(yù)計(jì)最早11月末、最遲12月末上線。因?yàn)槲覀冏龅臅r(shí)候都是比著工業(yè)產(chǎn)品的體量去做的，包括模型體積、計(jì)算量、訓(xùn)練速度，全部跟工業(yè)要求是一致的，所以可以很快應(yīng)用到產(chǎn)品中去。

　　用了之后，首先語音識(shí)別會(huì)更準(zhǔn)，其次由于它的計(jì)算量會(huì)很小，解碼速度更快，后臺(tái)成本就會(huì)很低。這個(gè)模型對(duì)方言和口音的識(shí)別效果都有一定的改善，而且對(duì)遠(yuǎn)場識(shí)別也有一定改善。因?yàn)樗窃谝粋€(gè)建模單元的十幾幀數(shù)據(jù)中提取出來一幀最本質(zhì)最有代表性的特征來描述這個(gè)建模單元，而這個(gè)本質(zhì)特征的描述不容易隨著時(shí)間、地點(diǎn)而改變，所以對(duì)語音識(shí)別的穩(wěn)定性有很大的提升。

　　媒體：就您研究觀察，未來語音識(shí)別技術(shù)的發(fā)展趨勢以及應(yīng)用場景如何？

　　賈磊：第一，想解決口音、噪音的問題，訓(xùn)練數(shù)據(jù)還會(huì)繼續(xù)加大，現(xiàn)在幾萬個(gè)小時(shí)訓(xùn)練數(shù)據(jù)是工業(yè)現(xiàn)狀，我相信在不久的未來一定是十萬小時(shí)。如果出現(xiàn)這么大的計(jì)算量，對(duì)計(jì)算能力的需求會(huì)更加強(qiáng)烈。所以大數(shù)據(jù)和高性能計(jì)算，是語音識(shí)別發(fā)展到目前最明顯和清晰的趨勢。

　　第二，是基于深度學(xué)習(xí)的個(gè)性化識(shí)別。人的口音千差萬別，不可能有一個(gè)語音識(shí)別器識(shí)別所有的聲音，一定要實(shí)現(xiàn)個(gè)性化。而這種基于深度學(xué)習(xí)的個(gè)性化識(shí)別，一定需要海量的存儲(chǔ)空間和很大的數(shù)據(jù)吞吐傳輸能力，這個(gè)也只有具有大數(shù)據(jù)和云計(jì)算這種服務(wù)能力的公司能夠提供。

　　第三個(gè)行業(yè)趨勢，語音識(shí)別技術(shù)會(huì)和語意理解、交互技術(shù)等形成一整套語音的解決方案。因?yàn)槿耸褂谜Z音的目的不是把語音轉(zhuǎn)成文字，而是使用語音去進(jìn)行交互，并獲得其所需的服務(wù)結(jié)果。這是未來的工業(yè)發(fā)展趨勢，單純的脫離了服務(wù)、脫離了平臺(tái)、脫離了計(jì)算能力去做語音技術(shù)的時(shí)代已經(jīng)過去了。百度有場景、有內(nèi)容、有需求，語音一定會(huì)做得越來越好。

　　媒體：語音識(shí)別技術(shù)要和其他技術(shù)，比如大數(shù)據(jù)、機(jī)器學(xué)習(xí)和云計(jì)算等一起應(yīng)用，結(jié)合技術(shù)層面來講，現(xiàn)在時(shí)機(jī)是否成熟？

　　賈磊：這些技術(shù)是相輔相成的。作為人工智能學(xué)科的同業(yè)者，我的感覺是，短期去看人們傾向于高估技術(shù)的價(jià)值，從長期去看人們傾向于低估技術(shù)的價(jià)值。

　　現(xiàn)在，人們可能傾向于覺得人工智能技術(shù)很牛，能夠解決一切問題。但是短期內(nèi)它沒有解決，因此人就會(huì)產(chǎn)生一個(gè)心理，這個(gè)技術(shù)沒用。但是，要對(duì)人工智能技術(shù)有信心，企業(yè)要敢于投入。當(dāng)然，初期商業(yè)上肯定會(huì)有一些損失，可能短時(shí)間里不會(huì)為公司帶來商業(yè)價(jià)值；但長遠(yuǎn)來看，有助于研發(fā)新技術(shù)，并獲得新的商業(yè)突破。(文/娜拉)

分享到 0

人工智能詳細(xì)

漲幅榜更多

排名	股票名稱	最新價(jià)	漲跌幅
1	藍(lán)英裝備	10.95	10.05%
2	振芯科技	19.11	10.02%
3	紫光股份	80.14	10.01%
4	賽為智能	18.52	9.98%
5	東杰智能	19.97	6.51%

跌幅榜更多

排名	股票名稱	最新價(jià)	漲跌幅
1	華昌達(dá)	10.89	-6.76%
2	韻達(dá)股份	47.84	-4.32%
3	雅化集團(tuán)	12.83	-4.25%
4	神思電子	21.68	-3.30%
5	浪潮信息	23.85	-3.17%

熱圖一覽

<div   id="lcu8lt2"   class="ConTwo_Tex01">
  <a href="http://www.zhonghuixigou.com/money/photo/20160713/13430.shtml" target="_blank"><img src="http://image.finance.china.cn/page/2012/0118/93_21019261_20160713094559.jpg" width="158" height="118" /></a>
  <p><a href="http://www.zhonghuixigou.com/money/photo/20160713/13430.shtml" target="_blank">老公簽證出問題女子獨(dú)自度蜜月 逗趣照片留念</a></p>
</div>

<div   id="lcu8lt2"   class="ConTwo_Tex01">
  <a href="http://www.zhonghuixigou.com/money/photo/20160711/13425.shtml" target="_blank"><img src="http://image.finance.china.cn/page/2012/0118/93_21019264_20160713094559.jpg" width="158" height="118" /></a>
  <p><a href="http://www.zhonghuixigou.com/money/photo/20160711/13425.shtml" target="_blank">暴雨中的婚禮：沒有賓客，有你就好</a></p>
</div>

<div   id="lcu8lt2"   class="ConTwo_Tex01">
  <a href="http://www.zhonghuixigou.com/money/photo/20160711/13426.shtml" target="_blank"><img src="http://image.finance.china.cn/page/2012/0118/93_21019267_20160713094559.jpg" width="158" height="118" /></a>
  <p><a href="http://www.zhonghuixigou.com/money/photo/20160711/13426.shtml" target="_blank">PS天才與明星“合照”以假亂真</a></p>
</div>

<div   id="lcu8lt2"   class="ConTwo_Tex01">
  <a href="http://www.zhonghuixigou.com/money/photo/20160712/13427.shtml" target="_blank"><img src="http://image.finance.china.cn/page/2012/0118/93_21019270_20160713094559.jpg" width="158" height="118" /></a>
  <p><a href="http://www.zhonghuixigou.com/money/photo/20160712/13427.shtml" target="_blank">紐約出現(xiàn)“曼哈頓懸日”景觀 民眾扎堆目睹</a></p>
</div>

<div   id="lcu8lt2"   class="ConTwo_Tex01">
  <a href="http://www.zhonghuixigou.com/money/photo/20160713/13429.shtml" target="_blank"><img src="http://image.finance.china.cn/page/2012/0118/93_21019273_20160713094559.jpg" width="158" height="118" /></a>
  <p><a href="http://www.zhonghuixigou.com/money/photo/20160713/13429.shtml" target="_blank">上海一高校280名男生為全系唯一女生慶生</a></p>
</div>

滾動(dòng)新聞

股票行情

股票名稱最新價(jià) 漲跌幅

祥龍電業(yè) 6.77 10.08%
安彩高科 10.18 10.05%
傲農(nóng)生物 19.98 10.02%
振華股份 15.92 10.02%
東軟集團(tuán) 15.94 10.01%
世運(yùn)電路 18.15 10.00%
天鵝股份 23.65 10.00%
七一二 43.81 9.99%
愛嬰室 31.60 9.99%
西部黃金 21.48 9.98%

獅頭股份 15.12 -10.00%
德新交運(yùn) 43.95 -9.99%
三星新材 32.62 -7.28%
國機(jī)汽車 10.53 -6.48%
天龍股份 27.69 -6.39%
華友鈷業(yè) 111.14 -6.24%
中視傳媒 14.51 -5.66%
上海三毛 13.47 -5.21%
恒通股份 20.01 -4.80%
能科股份 21.04 -4.80%

廣宇集團(tuán) 4.81 10.07%
雪萊特 5.58 10.06%
藍(lán)英裝備 10.95 10.05%
航天發(fā)展 11.72 10.05%
浙江世寶 7.01 10.05%
啟迪古漢 13.26 10.04%
新天科技 11.84 10.04%
華聯(lián)股份 3.51 10.03%
宏川智慧 16.35 10.03%
川恒股份 26.02 10.02%

堅(jiān)瑞沃能 6.86 -9.97%
千山藥機(jī) 12.35 -8.52%
國盛金控 15.62 -8.28%
富安娜 10.35 -7.51%
露天煤業(yè) 9.39 -6.94%
永安藥業(yè) 28.08 -6.93%
金風(fēng)科技 16.88 -6.84%
華昌達(dá) 10.89 -6.76%
英科醫(yī)療 68.08 -6.42%
爾康制藥 7.11 -6.08%

新聞源財(cái)富源

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào)：大 中 小

對(duì)人工智能多點(diǎn)耐心百度漢語語音識(shí)別獲重大突破

人工智能詳細(xì)

漲幅榜更多

跌幅榜更多

熱圖一覽

滾動(dòng)新聞

股票行情

熱點(diǎn)專題

新聞源 財(cái)富源

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào)：大 中 小

對(duì)人工智能多點(diǎn)耐心 百度漢語語音識(shí)別獲重大突破

相關(guān)文章:

人工智能 詳細(xì)

漲幅榜 更多

跌幅榜 更多

熱圖一覽

滾動(dòng)新聞

熱點(diǎn)專題

新聞源財(cái)富源

字號(hào)：大中小

對(duì)人工智能多點(diǎn)耐心百度漢語語音識(shí)別獲重大突破

人工智能詳細(xì)

漲幅榜更多

跌幅榜更多