新聞源 財(cái)富源

2025年01月10日 星期五

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào):  

百度DuLight 盲人的科技之眼

  • 發(fā)布時(shí)間:2015-10-15 01:54:38  來源:京華時(shí)報(bào)  作者:佚名  責(zé)任編輯:羅伯特

  今天是“國際盲人節(jié)”,自1984年設(shè)立至今,包括我國在內(nèi)的世界各國都會(huì)為盲人群體舉辦各種活動(dòng),以體現(xiàn)對他們的關(guān)懷。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改變盲人生活的創(chuàng)想:在一片黑暗中,只有靠觸摸才能感知世界的日子或?qū)⑦^去,“一個(gè)24歲面帶微笑的女性”“一把漂亮的紅色椅子”“100%純果汁”……借助這雙科技的眼睛,生活中的物品、場景從圖像轉(zhuǎn)變?yōu)檎Z音,幫助盲人朋友越來越清晰地“看見”這個(gè)世界。

  >>背景 將盲人生活需求轉(zhuǎn)化為推動(dòng)力

  早在2007年,百度公司便推出百度盲道:一個(gè)為方便視障人士上網(wǎng)閱讀信息、參與社區(qū)互動(dòng)、聽歌、訪問互聯(lián)網(wǎng)上其他相關(guān)網(wǎng)站的特殊入口。在這項(xiàng)功能中,百度新聞搜索、百度網(wǎng)頁搜索、百度MP3搜索、百度貼吧、百度知道、百度百科、Hao123網(wǎng)址導(dǎo)航這7項(xiàng)主要搜索服務(wù)升級(jí)為盲道版,在頁面設(shè)計(jì)等方面充分考慮視障人士的需求,方便他們使用。

  2013年,盲人開發(fā)團(tuán)隊(duì)的負(fù)責(zé)人曹軍致信百度CEO李彥宏,希望得到百度的資金和技術(shù)支持,開發(fā)一款盲人讀屏軟件。在百度團(tuán)隊(duì)的幫助下,曹軍的公司成功研發(fā)出了幫助盲人使用手機(jī)的讀屏軟件。

  在和盲人的接觸中,百度公益的工作人員發(fā)現(xiàn)了譬如人民幣不容易通過盲文識(shí)別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問題,希望通過科技和人工智能得以解決。因此百度公益聯(lián)合百度研究院、IDL深度學(xué)習(xí)實(shí)驗(yàn)室,將這些盲人實(shí)實(shí)在在的生活需求轉(zhuǎn)化為推動(dòng)力,試圖通過圖像識(shí)別、大數(shù)據(jù)等技術(shù),打造出一款專門服務(wù)于盲人的硬件。

  努力沒有白費(fèi),今年9月8日,百度推出了DuLight,展示了百度用科技改變盲人生活的創(chuàng)想。技術(shù)的進(jìn)步為DuLight的誕生提供了基礎(chǔ),除了原有的獨(dú)立手機(jī)端應(yīng)用,DuLight加入了輕量級(jí)的新型硬件,成功完成向全系列盲人個(gè)人助理操作系統(tǒng)的轉(zhuǎn)變。至此,它將作為盲人新的生活助理和新的搜索服務(wù)的發(fā)起入口。

  >>功能 打造盲人的日常生活私人助理

  依托“百度大腦”的圖像識(shí)別、人臉識(shí)別、語音識(shí)別以及深度學(xué)習(xí)等相關(guān)核心技術(shù),DuLight被打造成盲人的日常生活私人助理,幫助盲人朋友了解身邊的環(huán)境、進(jìn)行物品識(shí)別、人物辨別,以及錢幣識(shí)別等。除此之外,它還可以協(xié)助盲人在緊急或特殊情況下發(fā)起實(shí)時(shí)的遠(yuǎn)程視頻協(xié)助。

  面對純牛奶和果汁等無法通過觸摸辨別的商品,通過DuLight的圖像識(shí)別功能,只需對準(zhǔn)物品、進(jìn)行拍照操作,DuLight便能夠準(zhǔn)確快速地將物品信息傳遞給盲人;紙幣大小差別不大,盲文又不夠清晰,弄不清手里到底是多少錢,通過圖像識(shí)別功能,即使只掃到錢幣的一角,DuLight也能準(zhǔn)確地報(bào)出錢幣的面值,幫助盲人朋友購物付款;老朋友已經(jīng)走到面前卻不知道是誰,很難通過聲音辨別對面的陌生人的大致年齡和身份,這些困擾在DuLight的幫助下都可以順利解決。

  而在一些復(fù)雜的場景中,例如獨(dú)自在家時(shí)需要找到特定的藥品或需要在路況復(fù)雜的地段過馬路時(shí),盲人朋友總是無所適從,而今,通過DuLight,可以一鍵發(fā)起遠(yuǎn)程視頻協(xié)助,尋求朋友的幫助,提供幫助者在接受求助后,將獲得盲人朋友同樣的視角,實(shí)時(shí)語音協(xié)助解決問題。

  除此之外,在產(chǎn)品設(shè)計(jì)上,通用型界面設(shè)計(jì)與界面輔助工具相互配合,便于視弱群體更好地辨識(shí)屏幕上的文字與圖像。DuLight還實(shí)現(xiàn)了盲人友好性語音的交互命令與對話,根據(jù)用戶需求和語言命令執(zhí)行對應(yīng)的功能,為用戶提供可調(diào)節(jié)的語音播報(bào)速度,人性化十足。觸摸式硬件功能識(shí)別的工業(yè)設(shè)計(jì)也使得硬件外觀的紋理設(shè)計(jì)更加合理,便于盲人通過觸摸調(diào)整取景角度。

  據(jù)百度企業(yè)社會(huì)責(zé)任經(jīng)理盧健介紹稱,DuLight目前仍處于初期研發(fā)階段,后期將通過不斷的迭代加入更多先進(jìn)的技術(shù)和功能,以便更好地為盲人群體服務(wù)。

  >>揭秘

  1.圖像識(shí)別

  圖像識(shí)別技術(shù)是指,通過電腦辨識(shí)圖像內(nèi)容并提取語義信息的過程,典型的任務(wù)包括物體識(shí)別、物體檢測、圖像分類標(biāo)注等。它在圖像類數(shù)據(jù)的智能化分析管理中扮演著至關(guān)重要的角色。

  百度通過長期的努力,已經(jīng)構(gòu)筑了一套比較完整的圖像識(shí)別系統(tǒng),除了能夠有效地處理特定物體的檢測識(shí)別(如人臉、文字或是商品),還實(shí)現(xiàn)了圖像的分類標(biāo)注、圖文綜合理解的對話型識(shí)別,以及主觀圖像質(zhì)量評(píng)估等應(yīng)用。

  2.人臉識(shí)別

  人與人之間大量的互動(dòng)讓人臉識(shí)別成了最為實(shí)用的圖像識(shí)別細(xì)分領(lǐng)域。相比于無領(lǐng)域限制的圖像識(shí)別,聚焦在人臉上的識(shí)別技術(shù)顯然能夠做到更加精準(zhǔn)與高效。

  百度現(xiàn)有的人臉識(shí)別技術(shù)已經(jīng)具備了很強(qiáng)的識(shí)別用戶的能力,這項(xiàng)技術(shù)可以對用戶的性別、年齡、面部表情等特征進(jìn)行辨識(shí),還可以區(qū)分不同的用戶。

  3.語音識(shí)別

  Dulight采用領(lǐng)先的DNN聲學(xué)模型,使得語音識(shí)別更加精準(zhǔn)?;诖罅空Z言模型建立起來的語音識(shí)別系統(tǒng),能夠?qū)崿F(xiàn)更好的人機(jī)互動(dòng)。海量文本語料做基礎(chǔ),同時(shí)對文本庫進(jìn)行實(shí)時(shí)更新,提升語音識(shí)別的效率和質(zhì)量。 (于文)

熱圖一覽

  • 股票名稱 最新價(jià) 漲跌幅