新聞源 財(cái)富源

2025年01月24日 星期五

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào):  

驗(yàn)證碼,本意是安全不是麻煩

  • 發(fā)布時(shí)間:2015-12-22 01:30:58  來(lái)源:科技日?qǐng)?bào)  作者:佚名  責(zé)任編輯:羅伯特

  ■將新聞進(jìn)行到底

  文·本報(bào)記者 付麗麗

  隨著一年一度的春運(yùn)遷徙潮即將到來(lái),鐵路部門和廣大旅客同胞們都在摩拳擦掌緊張著同一件事——購(gòu)票。近日,購(gòu)票網(wǎng)站12306再次被拋向輿論的風(fēng)口浪尖。這一次,其飽受詬病的不是令人崩潰的網(wǎng)站,而是驗(yàn)證碼。一方面人們紛紛吐槽12306網(wǎng)站的圖形驗(yàn)證碼不易辨認(rèn),另一方面,人們也開始對(duì)驗(yàn)證碼本身產(chǎn)生了質(zhì)疑,究竟驗(yàn)證碼有沒有存在的必要,是不是有些多此一舉呢?

  ——新聞緣起——

  12306購(gòu)票驗(yàn)證碼遭吐槽

  “請(qǐng)點(diǎn)擊下圖中所有的瑪瑙”“請(qǐng)點(diǎn)擊下圖中所有的博斯普魯斯海峽”“請(qǐng)點(diǎn)擊下圖中所有的蜥蜴”……這些都是人們?cè)?2306網(wǎng)站購(gòu)票時(shí)遭遇的驗(yàn)證碼問題。

  由于設(shè)置了圖形驗(yàn)證碼,用戶需要根據(jù)提示,從8張圖片中找到提示中提到的相關(guān)物品,看不清或者沒把握的可以刷新更換。如此確認(rèn)無(wú)誤后,才能在12306網(wǎng)站登錄或者提交訂單。據(jù)統(tǒng)計(jì),目前12306的圖形碼數(shù)量已多達(dá)581種,可細(xì)分為12個(gè)品類。

  然而本用來(lái)防止黃牛倒票的圖形驗(yàn)證碼,卻因畫質(zhì)模糊、辨識(shí)度低,幾乎成了消費(fèi)者和火車票之間最大的攔路虎。

  深受驗(yàn)證碼困擾的小劉說(shuō):“12306所提供的圖形碼畫質(zhì)一般,而且一些‘老古董’,比如煤油燈、縫紉機(jī),我們90后很多人都沒見過?!?/p>

  “搶過票,才知道自己見識(shí)有多少”“驗(yàn)證碼要猜半天,等到猜對(duì)了票就沒了”“12306的驗(yàn)證碼,已經(jīng)擊敗了全國(guó)99%的購(gòu)票者,我已經(jīng)找不到回家的路了”對(duì)于12306的驗(yàn)證碼網(wǎng)友紛紛吐槽。

  ——核心關(guān)注——

  驗(yàn)證碼驗(yàn)的到底是啥?

  早期,網(wǎng)站登錄都是依據(jù)用戶名與密碼,但黑客程序有可能針對(duì)某一個(gè)特定用戶賬號(hào)采用窮舉破解的方法,不斷進(jìn)行登錄嘗試,造成潛在威脅,于是驗(yàn)證碼應(yīng)運(yùn)而生。它出自美國(guó)卡內(nèi)基梅隆大學(xué)研究人員的設(shè)計(jì),用來(lái)防范那些可能對(duì)在線服務(wù)造成威脅的自動(dòng)執(zhí)行程序,例如:惡意破解登錄密碼、刷票、論壇灌水、刷網(wǎng)頁(yè)等。

  “驗(yàn)證碼為驗(yàn)證登錄的用戶是人還是計(jì)算機(jī)程序,提供了一種方便的辨別手段。”北京郵電大學(xué)信息與通信工程學(xué)院教授牛凱說(shuō),理論上,只有真人才能通過推理分析驗(yàn)證碼圖片中的字符。隱蔽在雜亂背景中的扭曲字母,通過細(xì)致觀察,人眼可以較準(zhǔn)確辨識(shí),而采用計(jì)算機(jī)識(shí)別準(zhǔn)確率較低。

  牛凱介紹,一般而言,驗(yàn)證碼包括3類:文本驗(yàn)證碼、語(yǔ)音驗(yàn)證碼和圖像驗(yàn)證碼。其中,文本驗(yàn)證碼又可以細(xì)分為在線識(shí)別文本與線下識(shí)別文本。在線識(shí)別文本是指,用戶根據(jù)網(wǎng)頁(yè)提供的文本內(nèi)容,進(jìn)行識(shí)別,這些文本可能有扭曲變形,可能被背景圖片遮擋。而線下識(shí)別文本是指,識(shí)別碼通過其他通信方式,例如手機(jī)、email等,傳輸?shù)接脩舳?,需要用戶識(shí)別后填寫到網(wǎng)頁(yè)中。

  語(yǔ)音驗(yàn)證碼主要以語(yǔ)音播報(bào)的形式將識(shí)別碼播送給用戶,可能有背景雜音或干擾,這種驗(yàn)證方式尤其適合盲人或弱視人群。

  圖像驗(yàn)證碼又可以細(xì)分為靜止圖像或視頻驗(yàn)證碼。前者主要是需要用戶對(duì)一幅靜止圖像中的物體進(jìn)行辨識(shí),而后者需要用戶對(duì)視頻中動(dòng)態(tài)出現(xiàn)的物體進(jìn)行區(qū)分與辨別。動(dòng)態(tài)視頻驗(yàn)證碼技術(shù)上具有先進(jìn)性,但網(wǎng)站投入成本較高,目前還未普及。

  為什么一定要用圖形驗(yàn)證碼?

  “黃牛不可能人工去買票,必然是使用搶票軟件。”牛凱說(shuō),黃牛可能手中囤積大量的身份證號(hào)碼,刷票軟件可以自動(dòng)登錄,用真實(shí)的身份證信息進(jìn)行自動(dòng)下單交易,由于整個(gè)過程由軟件自動(dòng)完成,執(zhí)行速度比正常用戶的手工操作快幾十倍乃至上百倍,因此可以搶得先機(jī),大量刷票。

  在牛凱看來(lái),12306網(wǎng)站采用驗(yàn)證碼后,每一次下單購(gòu)買車票,都需要判斷驗(yàn)證碼中的內(nèi)容并選擇。理論上這種推理識(shí)別能力,只有真人才具有,目前的人工智能在推理識(shí)別方面無(wú)法與人類相比,因此可以有效阻擋自動(dòng)登錄刷票。

  中國(guó)鐵道科學(xué)研究院電子計(jì)算技術(shù)研究所副所長(zhǎng)朱建生此前也表示,不用圖形驗(yàn)證碼,機(jī)器搶票時(shí)間為0.1秒/張,人工搶票則為2秒/張,而使用圖形驗(yàn)證碼,由于機(jī)器無(wú)法自動(dòng)識(shí)別,令票販子無(wú)法再利用刷票軟件囤票倒票。

  那么,驗(yàn)證碼為什么不能用簡(jiǎn)單的數(shù)字呢?對(duì)此,牛凱介紹說(shuō),對(duì)于驗(yàn)證碼,目前刷票軟件大多采用OCR文本識(shí)別技術(shù)。如果僅采用數(shù)字驗(yàn)證碼,對(duì)于正常的數(shù)字顯示,現(xiàn)有技術(shù)的識(shí)別準(zhǔn)確率已經(jīng)很高,很容易突破技術(shù)壁壘,這樣驗(yàn)證碼就會(huì)形同虛設(shè)了。另一方面,如果顯示數(shù)字時(shí),增加變形扭曲等操作,雖然能夠提高機(jī)器識(shí)別的難度,但對(duì)于真人而言,識(shí)別準(zhǔn)確率也會(huì)大幅度下降,同樣會(huì)導(dǎo)致用戶抱怨。

  “采用圖形驗(yàn)證碼,真人能夠識(shí)別,而對(duì)于刷票軟件來(lái)說(shuō),OCR技術(shù)無(wú)法直接應(yīng)用,增加了識(shí)別難度。”牛凱說(shuō),目前有些刷票軟件號(hào)稱能夠破解圖形驗(yàn)證碼,所采用的技術(shù)實(shí)際上是大量的數(shù)據(jù)樣本累計(jì)與人工辨識(shí)結(jié)合。由于12306的圖形驗(yàn)證碼數(shù)量是有限的,一旦刷票軟件能夠存儲(chǔ)充分多的圖片驗(yàn)證碼樣本并進(jìn)行人工標(biāo)識(shí),當(dāng)新的驗(yàn)證碼出現(xiàn)時(shí),軟件就可以通過與數(shù)據(jù)庫(kù)中所存儲(chǔ)的圖片匹配來(lái)進(jìn)行識(shí)別。

  “這就類似于考試命題時(shí),從題庫(kù)中抽取題目。只要事先對(duì)題庫(kù)中的題目進(jìn)行充分練習(xí),就可以提高考試成績(jī)一樣。但是,如果沒有驗(yàn)證碼或驗(yàn)證碼很簡(jiǎn)單,火車票被黃牛搶走的概率會(huì)遠(yuǎn)比現(xiàn)在高,普通人買票只會(huì)更難?!迸P補(bǔ)充道。

  ——專家建言——

  驗(yàn)證碼最好是自動(dòng)生成的文本或圖片

  如今驗(yàn)證碼遭到詬病,那么有沒有一種方法可以替代驗(yàn)證碼呢?對(duì)此,有專家指出,目前有些網(wǎng)站已經(jīng)不使用驗(yàn)證碼進(jìn)行人類和計(jì)算機(jī)程序的區(qū)分,而是使用SMS 短信驗(yàn)證的方式,這可以說(shuō)是一種很好的替代方式。但是這種方式也不是無(wú)懈可擊,黃牛同樣可以通過注冊(cè)一堆手機(jī)號(hào)來(lái)實(shí)現(xiàn)破解。所以驗(yàn)證碼還會(huì)在較長(zhǎng)一段時(shí)間內(nèi)存在,而圍繞驗(yàn)證碼的設(shè)計(jì)和破解的較量也會(huì)繼續(xù)下去。

  牛凱表示,對(duì)于12306而言,定期更新圖片數(shù)據(jù)庫(kù),并不斷增加圖片識(shí)別碼數(shù)量才能有效對(duì)抗刷票軟件。但由于12306的圖片識(shí)別碼也都是人工標(biāo)識(shí)產(chǎn)生的,最終,雙方對(duì)抗實(shí)際上歸結(jié)于哪一方所付出的人工更多,哪一方的投入更大,這不是一個(gè)終極解決方案。

  他認(rèn)為,較好的方案是,驗(yàn)證碼是自動(dòng)生成的文本或圖片,例如從掃描古書、古畫或者百科全書得到的各種局部文本或圖片,由于數(shù)據(jù)充分,較少重復(fù),刷票軟件難以形成大的數(shù)據(jù)庫(kù),因此可以降低其識(shí)別概率。

  “還可以考慮將圖片驗(yàn)證碼替換成各種答題與推理,增加驗(yàn)證的智能性?!迸P說(shuō),例如,在線四則運(yùn)算答題,在線常識(shí)答題、在線邏輯推理,這些方法需要用戶有基本的數(shù)學(xué)、邏輯、常識(shí)等文化與科學(xué)素養(yǎng),顯然刷票軟件很難具備相應(yīng)的能力。

  此外,也可以考慮用戶的特殊身份標(biāo)識(shí)進(jìn)行驗(yàn)證,例如:聲紋、指紋、DNA等生理特征。“但這些方案也存在各種技術(shù)挑戰(zhàn)并且會(huì)增加運(yùn)營(yíng)成本?!迸P說(shuō)。

  ■相關(guān)鏈接

  官方表示將優(yōu)化圖形驗(yàn)證碼

  目前,12306網(wǎng)站和手機(jī)APP在旅客登陸和購(gòu)票提交訂單兩個(gè)環(huán)節(jié)設(shè)置了圖形驗(yàn)證碼。據(jù)介紹,后臺(tái)對(duì)12306圖形驗(yàn)證碼的正確識(shí)別率進(jìn)行了統(tǒng)計(jì),每分鐘的正確識(shí)讀率在70%左右。

  中國(guó)鐵道科學(xué)研究院電子計(jì)算技術(shù)研究所副所長(zhǎng)朱建生表示,12306的圖庫(kù)共有幾萬(wàn)張圖片,圖形驗(yàn)證碼選入的基本原則是“常用物品”,并沒有網(wǎng)上所謂“識(shí)別明星臉”之類的“奇葩”驗(yàn)證碼。在12月15日前,已對(duì)驗(yàn)證碼中數(shù)萬(wàn)張圖片進(jìn)行了優(yōu)化,剔除一些辨識(shí)度不高的圖片,提高了圖片的清晰度,方便旅客購(gòu)票?!拔磥?lái)努力的方向是讓驗(yàn)證碼變得越來(lái)越簡(jiǎn)單。但是現(xiàn)階段需要在可應(yīng)用性和防止自動(dòng)軟件惡意搶票中取得平衡?!敝旖ㄉf(shuō)。

熱圖一覽

  • 股票名稱 最新價(jià) 漲跌幅