新聞源 財(cái)富源

2025年01月10日 星期五

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào):  

新搜索引擎能助使用者理解論文內(nèi)容

  • 發(fā)布時(shí)間:2015-11-05 01:30:34  來(lái)源:科技日?qǐng)?bào)  作者:佚名  責(zé)任編輯:羅伯特

  科技日?qǐng)?bào)北京11月4日電 (記者陳丹)美國(guó)非盈利機(jī)構(gòu)艾倫人工智能研究所(AI2)2日發(fā)布了一款新的免費(fèi)學(xué)術(shù)搜索引擎——語(yǔ)義學(xué)者(Semantic Scholar),它能夠幫助科學(xué)家理解論文的內(nèi)容。雖然目前僅限于搜索計(jì)算機(jī)科學(xué)領(lǐng)域的大約300萬(wàn)篇開放獲取論文,但研究團(tuán)隊(duì)計(jì)劃在一年之內(nèi)將其搜索范圍擴(kuò)大到醫(yī)學(xué)等其他領(lǐng)域。

  據(jù)《自然》網(wǎng)站2日?qǐng)?bào)道,語(yǔ)義學(xué)者提供了一些創(chuàng)新的功能,包括從文本中挑選出最重要的關(guān)鍵詞和短語(yǔ),而不依賴于作者或出版商的鍵入。AI2首席執(zhí)行官奧倫·埃齊奧尼說(shuō),一個(gè)系統(tǒng)要做到這一點(diǎn)是相當(dāng)困難的。該搜索引擎使用類似“機(jī)讀”的技術(shù)來(lái)確定哪些文章是與某個(gè)主題相關(guān)的概述。

  該系統(tǒng)還可以找出論文所引用的真正具有影響力的參考文獻(xiàn)。同樣在開發(fā)搜索引擎的專家系統(tǒng)軟件公司研發(fā)部負(fù)責(zé)人何塞·曼紐爾·戈麥斯-佩雷斯認(rèn)為,這是一個(gè)非常好的功能。此外,語(yǔ)義學(xué)者還會(huì)將論文中的數(shù)據(jù)呈現(xiàn)在搜索結(jié)果中。

  目前可供使用的免費(fèi)學(xué)術(shù)檢索平臺(tái)中,谷歌學(xué)術(shù)搜索的規(guī)模最大,涵蓋了大約1億份文檔。但夏威夷大學(xué)馬諾阿分校研究搜索引擎的信息科學(xué)家彼得·賈科索表示,其中有很大一部分文檔在任何人看來(lái)都是非學(xué)術(shù)性的,甚至還出現(xiàn)了很多可笑的錯(cuò)誤。戈麥斯-佩雷斯也說(shuō),谷歌的搜索引擎在理解文章內(nèi)容方面,還有很大的進(jìn)步空間。

  而另一個(gè)免費(fèi)平臺(tái)微軟學(xué)術(shù)搜索,雖有超過(guò)3000萬(wàn)份文檔的“庫(kù)存”,但早已停止更新,其數(shù)據(jù)正被整合到必應(yīng)(Bing)搜索引擎中。還有一個(gè)由多名學(xué)者創(chuàng)建的CiteSeer搜索引擎,擁有530萬(wàn)條記錄,其負(fù)責(zé)人、賓夕法尼亞州立大學(xué)的李·賈爾斯正與語(yǔ)義學(xué)者開展合作。

  不過(guò)賈科索說(shuō),語(yǔ)義學(xué)者也有不足之處,包括很多時(shí)候不能篩選出版物的標(biāo)題。埃齊奧尼說(shuō),語(yǔ)義學(xué)者能檢索到約80%的免費(fèi)獲取論文,但與谷歌學(xué)術(shù)搜索相比,無(wú)法越過(guò)“付費(fèi)墻”則是它的一個(gè)短板。

熱圖一覽

  • 股票名稱 最新價(jià) 漲跌幅