新聞源 財富源

2025年04月22日 星期二

財經(jīng) > 滾動新聞 > 正文

字號:  

未來5年語音、圖像搜索將超文字

  • 發(fā)布時間:2014-09-04 14:32:15  來源:深圳特區(qū)報  作者:佚名  責(zé)任編輯:羅伯特

  深圳特區(qū)報訊(記者 王曉晴)中國最有技術(shù)范的互聯(lián)網(wǎng)公司百度昨天舉行世界大會,不僅展示了筷搜、BAIDUEYE等讓人“腦洞大開”的酷炫智能產(chǎn)品,百度CEO李彥宏更在主題演講中大膽預(yù)測移動互聯(lián)網(wǎng)的發(fā)展趨勢,稱移動時代消費(fèi)者表達(dá)需求的方式正在發(fā)生質(zhì)的變化,從文字輸入轉(zhuǎn)向語音和圖像, 他說:“未來5年,消費(fèi)者使用語音和圖像表達(dá)需求的比例將超過50%,成為消費(fèi)者需求表達(dá)的主要方式,科技將更加回歸自然、貼近人性?!?/p>

  作為中國互聯(lián)網(wǎng)界技術(shù)背景最為深厚的CEO,李彥宏在每年的百度世界大會都會分享他對業(yè)界的最新看法和趨勢研判,那今年,李彥宏的洞見是什么呢?

  在主題演講中,李彥宏強(qiáng)調(diào),技術(shù)的價值是改變?nèi)祟惖纳嫔a(chǎn)方式,語音、圖像技術(shù)的發(fā)展,是回歸自然,符合人性本質(zhì)的印證。這一點(diǎn),無疑把握住了最符合移動互聯(lián)網(wǎng)用戶需求的特征。李彥宏透露:目前百度10%的搜索請求來自語音搜索,使用該形式的搜索次數(shù)一天可以最高達(dá)到500次,更多是兒童進(jìn)行該種形式的搜索。“語音的歷史有二十萬年,是自然而低門檻的表達(dá)方式,今天語音搜索已經(jīng)可以用來向PC和移動端表達(dá)需求。”李彥宏之所以有此預(yù)判,其底氣來自于百度全球領(lǐng)先的語音識別實(shí)力。此前,有研究稱,百度語音識別準(zhǔn)確率再過兩三年能達(dá)到98%,在百度看來,提高語音識別準(zhǔn)確率的目標(biāo)只有一個,即使人機(jī)之間的交流完全就像正常人之間對話一樣流暢。

  不僅是語音,在圖片搜索上百度一樣強(qiáng)大。百度目前可以支持通過拍照方式進(jìn)行圖片內(nèi)容搜索,比如拍下家具、工藝品、花等來了解該物件的具體信息,圖片搜索的更高級境界是通過像素進(jìn)行搜索,而不是對整幅圖進(jìn)行搜索。目前,除了IBM,百度、谷歌都在這方面有所投入。

  昨天的百度世界大會,使業(yè)界對未來生活場景有了更多暢想:當(dāng)你在街上看到一個商標(biāo),用攝像頭對其進(jìn)行拍照,后臺可以先進(jìn)行提取,再進(jìn)行模板匹配的方法進(jìn)行圖像結(jié)算——與其特征進(jìn)行匹配,給出用戶最想要的結(jié)果——包括價格、購買信息甚至一鍵下單;對手機(jī)說“中午我想吃漢堡”,12點(diǎn)準(zhǔn)時外賣在敲門,這樣的行為真正地回歸了自然的方式,更方便、更人性地傳遞著互聯(lián)網(wǎng)技術(shù)改變?nèi)藗兩畹闹卮笠饬x。李彥宏說:“這些場景在不遠(yuǎn)的將來會實(shí)現(xiàn),我們正在積極地努力,在技術(shù)上進(jìn)行研發(fā),不斷提升我們的語音識別和圖像識別能力,更好地滿足用戶的需求?!?/p>

  李彥宏指出,移動用戶正在逐漸脫離傳統(tǒng)鍵盤輸入習(xí)慣,通過語音、圖像等方式表達(dá)搜索請求,是最自然的、本能的表達(dá)需求方式。它所帶來用戶行為的轉(zhuǎn)變,也注定會成為移動互聯(lián)網(wǎng)最重要入口。當(dāng)用戶需求隨著技術(shù)自由實(shí)現(xiàn)急劇增長,未來將足夠引起一個劃時代的變革。而百度,憑借不斷完善的“百度大腦”,語音識別技術(shù)正在移動互聯(lián)網(wǎng)大潮中不斷閃耀出更亮眼的技術(shù)神采,并推動百度的技術(shù)創(chuàng)新朝著回歸自然、貼近人性的方向不斷邁進(jìn),而百度在語音圖像搜索上率先發(fā)力,無疑搶占了未來競爭的制高點(diǎn)。

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價 漲跌幅