人工智能領(lǐng)域新突破百度發(fā)布基于深度學(xué)習(xí)的在線翻譯系統(tǒng)
- 發(fā)布時間:2015-05-29 01:33:24 來源:北京晨報 責(zé)任編輯:羅伯特
日前,百度在機器翻譯技術(shù)上取得重大突破,發(fā)布了融合統(tǒng)計和深度學(xué)習(xí)方法的在線翻譯系統(tǒng)。該系統(tǒng)借助計算機模擬的海量神經(jīng)元,模仿人腦“理解語言,生成譯文”,同時結(jié)合百度已有的統(tǒng)計機器翻譯技術(shù),使得機器翻譯質(zhì)量實現(xiàn)了質(zhì)的飛躍。
此次百度發(fā)布的基于深度學(xué)習(xí)的在線翻譯系統(tǒng),實現(xiàn)了類似人腦的“理解語言,生成譯文”的翻譯方式。這種翻譯方法最大的優(yōu)勢在于譯文流暢,更加符合語法規(guī)范,容易理解。
據(jù)了解,百度利用自身得天獨厚的龐大網(wǎng)頁庫資源,挖掘了海量的雙語句對,作為系統(tǒng)的“學(xué)習(xí)教材”。由于深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)極其復(fù)雜,整個學(xué)習(xí)過程非常耗時,需要持續(xù)很長時間。百度機器翻譯團隊經(jīng)過技術(shù)攻堅,使得翻譯系統(tǒng)的學(xué)習(xí)效率提高了十幾倍,大大縮短了學(xué)習(xí)時間。
百度新發(fā)布的翻譯系統(tǒng)應(yīng)用了長短時記憶(LSTM, Long Short-Term Memory)的循環(huán)神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)。該模型擅長對自然語言建模,把任意長度的句子轉(zhuǎn)化為特定維度的浮點數(shù)向量,“記住”句子的全部語義。LSTM模型側(cè)重于“記憶”那些比較重要的單詞,讓“記憶”保存比較長的時間,對于那些不太重要的單詞,則會盡量早地“忘記”它,把寶貴的資源留給更重要的詞。該模型很好地解決了自然語言句子向量化的難題,對利用計算機來處理自然語言來說具有非常重要的意義,使得計算機對語言的處理不再停留在簡單的字面匹配層面,而是進一步深入到語義理解的層面。
一直以來,百度在機器翻譯領(lǐng)域堅持技術(shù)創(chuàng)新,不斷提升翻譯質(zhì)量和系統(tǒng)性能,致力于大規(guī)?;ヂ?lián)網(wǎng)應(yīng)用,為廣大用戶提供高質(zhì)量、方便快捷的翻譯服務(wù)。依托海量的互聯(lián)網(wǎng)資源和自然語言處理技術(shù)的優(yōu)勢,百度研發(fā)出高質(zhì)量翻譯知識獲取技術(shù),突破了傳統(tǒng)方法在翻譯知識獲取方面規(guī)模小、成本高的瓶頸;基于互聯(lián)網(wǎng)大數(shù)據(jù)的多策略翻譯模型,能夠?qū)崟r響應(yīng)用戶復(fù)雜多樣的包括網(wǎng)絡(luò)新詞、科技文獻(xiàn)、電子商務(wù)、古文、粵語等多領(lǐng)域、多文體的翻譯需求;基于樞軸語言的翻譯方法,使得資源有限的小語種翻譯成為可能。
百度機器翻譯團隊一直秉承讓所有人平等便捷地獲取信息、找到所求的使命,致力于消除用戶跨語言溝通交流的障礙。結(jié)合百度領(lǐng)先的圖像識別、語音識別等技術(shù),“百度翻譯”APP為用戶打造了一個全方位的隨身翻譯官。這位“翻譯官”不僅可以幫助用戶實時地與外國人進行面對面交流,根據(jù)用戶所處場景,智能推送實用口語例句,還可以通過攝像頭拍照對菜單、車站站牌等進行翻譯,解決用戶在海外學(xué)習(xí)和旅行時的語言難題。劉松
熱圖一覽
- 股票名稱 最新價 漲跌幅
- 最嚴(yán)調(diào)控下滬深房價仍漲 人口老齡化影響三四線樓市
- 樂天大規(guī)模退出中國市場 供應(yīng)商趕赴北京總部催款
- 北京16家銀行上調(diào)首套房貸利率 封殺“過道學(xué)區(qū)房”
- 10萬輛共享單車僅50人管遭質(zhì)疑 摩拜ofo優(yōu)勢變劣勢
- 去年聯(lián)通、電信凈利潤均下滑 用戶爭奪漸趨白熱化
- 奧迪否認(rèn)“官民不等價”:優(yōu)惠政策并非只針對公務(wù)員
- 季末銀行考核在即 一日風(fēng)云難改“錢緊錢貴”現(xiàn)狀
- 美圖7小時暴跌四成 虧損業(yè)績?nèi)绾沃?00億市值受拷問
- 監(jiān)管重壓下P2P退出平臺增加 網(wǎng)貸行業(yè)進入冷靜期
- 配資炒股虧損逾百萬 股民將信托公司告上法庭