新聞源 財(cái)富源

2025年01月08日 星期三

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào):  

計(jì)算機(jī)視覺,站在風(fēng)起之前

  • 發(fā)布時(shí)間:2015-12-11 06:32:42  來源:科技日?qǐng)?bào)  作者:佚名  責(zé)任編輯:羅伯特

  12月13日,計(jì)算機(jī)視覺方向的三大頂級(jí)會(huì)議之一ICCV(國(guó)際計(jì)算機(jī)視覺大會(huì))就要在智利圣地亞哥拉開帷幕了。

  對(duì)業(yè)內(nèi)人士來說,這是盛會(huì)。當(dāng)然,非專業(yè)人士大概會(huì)問:這和我有什么關(guān)系?

  其實(shí),逐漸從學(xué)術(shù)界走向工業(yè)界的計(jì)算機(jī)視覺,已經(jīng)在人們生活中存在很長(zhǎng)時(shí)間了。

  日前,科技日?qǐng)?bào)采訪了計(jì)算機(jī)視覺底層技術(shù)領(lǐng)域?qū)<掖饔顦s教授。他此前在韓國(guó)科學(xué)技術(shù)院獲得終身教職,曾多次擔(dān)任ICCV領(lǐng)域主席。如今,戴宇榮離開學(xué)術(shù)界,加入專注計(jì)算機(jī)視覺的創(chuàng)業(yè)公司“商湯科技”。

  難點(diǎn):在一堆數(shù)字里找出一個(gè)人

  戴宇榮教授一直在做的,就是教計(jì)算機(jī)學(xué)會(huì)怎么看?!坝?jì)算機(jī)看到的,永遠(yuǎn)只有0和1的數(shù)字。即使是圖像,在它們看來,照樣是0和1?!彼蛴浾呓忉?,要理解研究者在計(jì)算機(jī)視覺上遇到的麻煩,就要先了解計(jì)算機(jī)處理訊息的方法。

  想象一下,你現(xiàn)在面對(duì)一堆看似毫無規(guī)律可循的數(shù)字,然后你接到了任務(wù)——數(shù)字中間藏著一個(gè)人,來,把他找出來。這就是計(jì)算機(jī)要干的事情,它得在數(shù)字里找到規(guī)律,發(fā)現(xiàn)這個(gè)藏在數(shù)字當(dāng)中的人,或者一只貓、一朵花。哦,對(duì)了,你還得先告訴計(jì)算機(jī),長(zhǎng)成這樣的是人,長(zhǎng)成那樣的是貓,有著花瓣的這株植物叫“花”,也是夠費(fèi)勁了。

  在日常生活的真實(shí)場(chǎng)景中,這堆數(shù)字經(jīng)常有缺陷:比如有待識(shí)別的物體被遮住了,光照條件不同了,拍攝角度變了……所有這些,都能改變數(shù)字的規(guī)律。

  美圖秀秀、人臉識(shí)別,都是計(jì)算機(jī)視覺

  那么,計(jì)算機(jī)的底層和高層視覺技術(shù),又是什么呢?

  底層視覺,可以幫計(jì)算機(jī)進(jìn)行邊緣提取,進(jìn)行區(qū)塊分隔,讓它看清圖像。其實(shí),只要你曾用過Photoshop或者美圖秀秀,那么你已經(jīng)感受過計(jì)算機(jī)底層視覺技術(shù)的魅力了——這些應(yīng)用都采用了圖像增強(qiáng)和圖像處理技術(shù)。

  而且,如果計(jì)算機(jī)遇到了不那么清晰的畫面,底層視覺技術(shù)就會(huì)對(duì)它進(jìn)行預(yù)處理,豐富細(xì)節(jié),提高清晰度;然后高層視覺技術(shù)就能對(duì)畫面進(jìn)行更充分的特點(diǎn)提取,把圖像上的物體“認(rèn)出來”。

  至于高層視覺技術(shù),目前最為人所知的應(yīng)用,當(dāng)屬人臉識(shí)別。

  隨著人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的發(fā)展,人臉識(shí)別也從實(shí)驗(yàn)室走向了工業(yè)界。2015年,人臉識(shí)別的熱度一路高歌猛進(jìn):年初,馬云展示了一次“刷臉”支付技術(shù);年末,人臉識(shí)別攪動(dòng)娛樂圈,趙薇老公因司機(jī)騙過人臉識(shí)別“被賣房”……

  不過,很多業(yè)內(nèi)人士仍有疑問:計(jì)算機(jī)視覺在許多應(yīng)用領(lǐng)域還是只充當(dāng)輔助角色——有它挺好,沒它也無妨。而且,識(shí)別的穩(wěn)定性仍有待提升。

  戴宇榮覺得,這并不意味著計(jì)算機(jī)視覺應(yīng)用的普及依然遙遠(yuǎn)?!耙杂?jì)算機(jī)為例,上世紀(jì)八十年代之前,它笨重、巨大,使用復(fù)雜,處在一種不溫不火的狀態(tài)。然而,僅僅20年過去,計(jì)算機(jī)就成為家庭標(biāo)配?!?/p>

  到了大學(xué)教授去工業(yè)界發(fā)展的時(shí)候?

  “深度學(xué)習(xí)技術(shù)將為計(jì)算機(jī)視覺帶來更大的突破。只要我們能夠找到合適的深度學(xué)習(xí)方法,計(jì)算機(jī)視覺在日常生活中的應(yīng)用會(huì)更普及?!贝饔顦s對(duì)自己傾心研究的技術(shù)很樂觀。

  但是,如何找到這個(gè)方法?一些人的選擇是,離開高校,到公司去?!爱?dāng)研究成果到了比較成熟、可以在工業(yè)界產(chǎn)生應(yīng)用的時(shí)候,便是大學(xué)教授到工業(yè)界發(fā)展的時(shí)候?!?/p>

  戴宇榮覺得,現(xiàn)在到了這個(gè)時(shí)候。其實(shí),許多計(jì)算機(jī)視覺領(lǐng)域的學(xué)界明星也已經(jīng)“縱身一躍”,加入工業(yè)界:紐約大學(xué)的Yann LeCun去了Facebook 的人工智能研究院并擔(dān)任院長(zhǎng);NEC 資深科學(xué)家余凱進(jìn)入百度的深度學(xué)習(xí)研究院……

  “公司的產(chǎn)品可以獲得大量數(shù)據(jù)以便訓(xùn)練更好的深度學(xué)習(xí)模型;它更大的計(jì)算機(jī)集群還可以加速深度學(xué)習(xí)模型的訓(xùn)練?!贝饔顦s強(qiáng)調(diào),要將研究成果帶入工業(yè)界,需要多個(gè)部門通力合作,這不是簡(jiǎn)單的申請(qǐng)專利或開放源代碼就能做到的。而且,公司的人才招聘著眼長(zhǎng)遠(yuǎn),研究團(tuán)隊(duì)彼此之間能夠長(zhǎng)期合作。他認(rèn)為,比起大學(xué),一所科技類公司確實(shí)更能給科研人員提供資源和人才上的助力。

  如今,計(jì)算機(jī)視覺技術(shù)已被廣泛應(yīng)用到圖像搜索領(lǐng)域;它還可以在智能安防和智能家居上一展身手;再遠(yuǎn)一些,計(jì)算機(jī)視覺將成為無人車和無人機(jī)的眼睛,助推無人貨運(yùn)的普及……戴宇榮覺得,未來正在加速前來。

 ?。萍既?qǐng)?bào)北京12月10日電)

熱圖一覽

  • 股票名稱 最新價(jià) 漲跌幅