新聞源 財富源

2025年01月23日 星期四

12306將剔除辨識率低圖形驗證碼 保持監(jiān)控刷票軟件

  • 發(fā)布時間:2015-12-11 07:43:26  來源:新京報  作者:佚名  責(zé)任編輯:吳起龍

  昨日,中國鐵道科學(xué)研究院,研發(fā)12306票務(wù)系統(tǒng)的技術(shù)人員正在測試手機(jī)端的圖片驗證碼的運行狀況。

12306票務(wù)系統(tǒng)的研發(fā)中心內(nèi),一位技術(shù)人員正在實時檢測網(wǎng)站數(shù)據(jù)。

12306購票網(wǎng)站上一些驗證碼引爭議。

12306購票網(wǎng)站上一些驗證碼引爭議。

  12306驗證碼變遷

  簡單數(shù)字→數(shù)字加字母→加減法算式→閃爍變形字母(動態(tài)碼)→中間添加干擾線的變形字母→圖形驗證碼

  目前正值春運購票高峰,網(wǎng)絡(luò)上流傳一些調(diào)侃鐵路購票網(wǎng)站12306圖形驗證碼的帖子,稱圖形驗證碼難辨識、一些物品名稱沒有聽說過等。對此,12306相關(guān)負(fù)責(zé)人昨日向記者表示,為防止搶票軟件自動識別,相關(guān)圖形做了技術(shù)處理,但未來將會剔除一些辨識度低的圖片。

  圖片技術(shù)處理為防搶票軟件

  “12306的驗證碼,已經(jīng)擊敗了全國99%的購票者,我已經(jīng)找不到回家的路了?!苯眨哼\購買火車票期間,不少網(wǎng)友發(fā)帖吐槽12306的圖形驗證碼。網(wǎng)上甚至還流傳一些“奇葩”驗證碼的帖子,列舉出識別明星臉、罕見物品等刁鉆問題。

  昨日,中國鐵道科學(xué)研究院電子計算技術(shù)研究所副所長朱建生表示,12306購票系統(tǒng)沒有所謂“識別明星臉”的“奇葩”驗證碼,網(wǎng)上流傳的刁鉆問題大多子虛烏有?!拔覀儧Q不會讓旅客分辨‘橘子’和‘橙子’。”朱建生說。

  不過,也有一些網(wǎng)友表示,驗證碼清晰度不高,導(dǎo)致放票時間連續(xù)選錯,從而錯過了購票。朱建生表示,在春運返程訂票高峰12月15日前,還將對驗證碼中數(shù)萬張圖片進(jìn)行優(yōu)化,剔除一些辨識度不高的圖片,提高圖片的清晰度。

  “為了防范搶票軟件的自動識別,我們會對圖片做出微調(diào)、旋轉(zhuǎn)、切割的處理。這樣做主要是為了在方便旅客購票和打擊搶票軟件中尋找平衡?!敝旖ㄉf。

  部分網(wǎng)友吐槽一些圖形驗證碼因為生活環(huán)境和習(xí)慣問題,“南方人不認(rèn)得北方人的物品,北方人也不認(rèn)得南方人的物品”。朱建生解釋稱,12306圖形驗證碼選擇的都是生活中常見的物品,由于地域原因,“南方人沒見過或北方人沒見過的,或各地叫法不同的,未來在優(yōu)化時都將進(jìn)行篩除?!?/p>

  “圖形驗證碼有利于普通人訂票”

  朱建生介紹,后臺數(shù)據(jù)顯示,今年網(wǎng)站購票的平均排隊等待時間僅為1.8秒,系統(tǒng)運行穩(wěn)定,運行效率大幅提升。同時,對于驗證碼的正確識別率,朱建生表示,正確填寫圖形驗證碼的幾率在70%左右。

  12月9日10時的相關(guān)分析圖顯示,該時段,共有44萬人輸入圖形驗證碼,其中有33萬人輸入正確,正確率在75%。今年春運購票最高峰的12月8日,當(dāng)日11時,旅客驗證碼輸入的正確率是69%。

  “登錄的人少了,成功出售的票數(shù)增加了,這說明無效地、重復(fù)地登錄網(wǎng)站的少了?!敝旖ㄉ硎?,過去的數(shù)字字母識別碼,一些搶票軟件和公司開發(fā)的瀏覽器很容易進(jìn)行分析,并自動跳過驗證步驟。在人眼識別需要2秒的情況下,機(jī)器僅用0.1秒就能識別?!霸诟叻鍟r段,相隔這樣的時間,也會造成旅客買不到票?!?/p>

  朱建生說,圖片識別對普通人而言更加便利,人腦更容易建立問題和圖片間的聯(lián)系,而機(jī)器則有一定困難。

  購票時間縮短至開車前半小時

  據(jù)中國鐵路總公司統(tǒng)計,自11月26日發(fā)售春運第一天車票起,截至12月9日,鐵路部門共發(fā)售車票1.3億張,同比增長9%。近九成通過網(wǎng)絡(luò)訂票成功。

  今年,鐵路部門還將采取多項新舉措方便學(xué)生、務(wù)工人員等群體購票。目前,鐵路部門已累計發(fā)售節(jié)前學(xué)生票804.8萬張,同時已兌現(xiàn)各院校通過互聯(lián)網(wǎng)提報的學(xué)生團(tuán)體往返票計劃。

  “從今日起,未購買到車票,也未參加院校統(tǒng)一辦票的學(xué)生仍可通過鐵路各渠道零散購買明年1月10日至2月29日期間的學(xué)生往返車票?!敝袊F路總公司運輸局營運部副主任黃欣表示。

  為方便務(wù)工人員購票,鐵路部門今年取消了5人成團(tuán)的限制,單個旅客也可申報購票計劃,目前鐵路部門正在受理用工企業(yè)和零散務(wù)工人員提報的春運期間往返購票計劃,將于12月15日完成計劃兌現(xiàn)。

  12月16日-25日,用工企業(yè)可登錄務(wù)工人員團(tuán)體票辦理網(wǎng)站查詢結(jié)果,零散務(wù)工人員可根據(jù)手機(jī)短信提示,到鐵路任意窗口憑乘車人二代身份證原件辦理支付并取票。

  此外,鐵路部門今年還將互聯(lián)網(wǎng)購票時間由不晚于開車前2小時調(diào)整為不晚于開車前30分鐘,同時推出了變更到站服務(wù),在列車上提供了聯(lián)網(wǎng)升座服務(wù)等。

  - 焦點

  驗證碼技術(shù)公司否認(rèn)準(zhǔn)確率8%

  公司負(fù)責(zé)人回應(yīng)質(zhì)疑,稱圖形驗證碼能抵御大部分黃牛;圖庫會不斷增替

  正值春運搶票潮,12306購票系統(tǒng)推出的圖形驗證碼飽受吐槽,部分網(wǎng)友將矛頭指向為該系統(tǒng)提供驗證碼服務(wù)的企業(yè),質(zhì)疑“圖形驗證碼”方式未完全阻擋黃牛,還貼出黃牛黨購票的訂單圖。另有網(wǎng)友跟帖稱,這一技術(shù)并非原創(chuàng)而是抄襲谷歌。此外,還有網(wǎng)友稱官方未披露相關(guān)招標(biāo)項目和費用等細(xì)節(jié)。

  對此,記者了解到,為12306系統(tǒng)提供圖形驗證碼服務(wù)的是杭州微觸科技有限公司。該公司官網(wǎng)顯示,除鐵路12306外,其用戶一欄中還包括“中國郵政”、“金山快盤”等圖標(biāo)。

  該企業(yè)的工商信息資料顯示,杭州微觸科技有限公司自2012年9月成立并開始營業(yè),注冊資本為30萬元人民幣,法定代表人為宋超。新京報記者檢索發(fā)現(xiàn),宋超名下還有一家名為北京點觸互聯(lián)科技有限公司的企業(yè),于12月3日剛剛成立,注冊資本為100萬元。

  對于網(wǎng)友的質(zhì)疑,昨日宋超表示,除偶爾有較難識別的圖片外,圖形驗證碼能夠抵御大部分的黃牛。

  1 圖形驗證碼數(shù)據(jù)庫泄露?

  圖片數(shù)量并非固定,為動態(tài)增替

  據(jù)知情人透露,12306官網(wǎng)推出圖形驗證碼,原本是為了攔截技術(shù)黃牛,“但實際上只是攔截了一部分?!?/p>

  據(jù)其透露,圖形驗證碼推出沒多久后,就有人將圖形驗證碼后臺數(shù)據(jù)庫竊取,并建立了“打碼平臺”。黃牛購票時,只需通過打碼平臺打碼,即可繞過圖形驗證碼這一關(guān)卡。其稱目前打碼平臺的打碼識別率已超過90%。

  他介紹,黃牛每打碼一次,就需要付1分至5分不等費用給打碼平臺,而黃牛每購買一張票,通常需要打碼十幾二十次,多的時候打碼上百次。

  同時,近日360瀏覽器也宣布,已全面攻破了12306圖形驗證碼,實現(xiàn)了全自動識別技術(shù),并首次公布了581種12306圖形驗證碼大數(shù)據(jù)

  對此,杭州微觸科技有限公司負(fù)責(zé)人宋超表示,圖片的數(shù)量不是一個固定的數(shù)字,是不斷動態(tài)增替的過程,會“自己不斷通過用戶的使用數(shù)據(jù)來更新?!彼榻B,系統(tǒng)每天都會抓取大量的圖片,“通過用戶的選擇,用戶驗證的過程,會自動幫助系統(tǒng)通過機(jī)器學(xué)習(xí)獲得新的圖庫,安全性會隨著驗證量的提高而自主提升。目前我們已經(jīng)通過驗證系統(tǒng)自動標(biāo)示了近千萬的精準(zhǔn)圖片,用戶的每一次驗證都在幫助人工智能在圖像識別領(lǐng)域添磚加瓦,訓(xùn)練機(jī)器學(xué)習(xí)?!?/p>

  2 一次性準(zhǔn)確識別率僅8%?

  網(wǎng)傳“奇葩”驗證碼為PS合成;后端數(shù)據(jù)顯示成功率非常高

  按照360瀏覽器提供的大數(shù)據(jù),12306網(wǎng)站的購票驗證碼一次性輸入準(zhǔn)確的比例為8%,兩次輸入準(zhǔn)確的比例為27%,三次甚至4次以上輸入準(zhǔn)確的比例為65%。

  360技術(shù)人士稱,在12306推出復(fù)雜驗證碼時,他們通過技術(shù)手段對其進(jìn)行集中統(tǒng)計后發(fā)現(xiàn),其一次識別通過率處于不穩(wěn)定的狀態(tài)。部分生僻圖片難以辨認(rèn)和12306進(jìn)行的不合適的圖片處理,造成整體識別率降低,在一些時段上,識別率甚至不足5%。

  技術(shù)人士表示,從技術(shù)上講,這種方式具有一定的創(chuàng)新性,復(fù)雜的圖形驗證碼,提升了自動識別的技術(shù)門檻,但其圖片質(zhì)量較差,再加上有一些生僻且容易混淆的圖片以及不合適的圖片處理,造成用戶體驗較差??陀^來說,12306復(fù)雜驗證碼確實對打擊黃牛起到了一定的作用,例如其對部分驗證碼進(jìn)行模糊顆?;幚?,可以防止黃牛采用專用搶票軟件來刷票。

  針對部分網(wǎng)絡(luò)公司提出的驗證碼成功率低的情況,宋超稱,公司點觸驗證碼的產(chǎn)品相對成熟,后端數(shù)據(jù)顯示成功率非常高,除部分特別難識別的圖片外,網(wǎng)傳的一些“奇葩”驗證碼圖片幾乎均為PS合成制作。

  3 與鐵道部門合作前后股權(quán)變動?

  創(chuàng)業(yè)公司有人離開有人加入很正常

  有網(wǎng)友指出,鐵路系統(tǒng)開始使用圖形驗證碼是在今年3月份左右,而該公司作為技術(shù)提供方,在鐵道部門開始使用圖形驗證碼前后,公司股權(quán)立即發(fā)生變動,“大致為刪除一人,增加一人?!?/p>

  宋超在今年5月份接受媒體采訪稱,每個創(chuàng)業(yè)公司都會經(jīng)歷瓶頸,之前有一段時間公司發(fā)展困難,資金流出現(xiàn)緊張。一名同學(xué)看不到希望,跳槽走了。

  “創(chuàng)業(yè)公司很苦,有的因此離開,也有因為愿意一起朝著目標(biāo)努力而加入,是很正常的事,”他稱,現(xiàn)在后臺可以支持起每天3億以上的請求,“系統(tǒng)比往年一定要增強(qiáng),”他們目前還在吸納更多的技術(shù)人才加入,在驗證安全、賬戶安全、密碼安全和行為安全方面,完成用戶信息安全保護(hù)的全面保障。

  4 圖形驗證碼技術(shù)是否抄襲谷歌?

  自稱2012年提出圖標(biāo)式驗證碼,谷歌2015年提出

  有網(wǎng)友稱,這種圖形驗證碼技術(shù)并非原創(chuàng),而是抄襲谷歌。

  據(jù)多家媒體此前報道,2011年,宋超在哈爾濱工程大學(xué)念研究生時發(fā)現(xiàn)了驗證碼的“BUG”,此后,宋超與其他幾名學(xué)技術(shù)的同伴憑借自主研發(fā)的“點觸驗證碼”和“點觸云安全系統(tǒng)”參加新媒體創(chuàng)業(yè)大賽獲獎,得到數(shù)百萬元的天使投資,此后他休學(xué)并成立了杭州微觸科技有限公司。

  據(jù)報道,“點觸驗證碼”是將傳統(tǒng)驗證碼中模糊的背景換成清晰圖片,上面是隨機(jī)排列的標(biāo)識(漢字、數(shù)字、英文字母、有意義的圖標(biāo)等),用戶通過按照要求點擊(或者觸摸)圖片上指定的位置,完成驗證。該項目已經(jīng)擁有3項專利。

  “我們在2012年提出了圖標(biāo)式驗證碼、圖文驗證碼和滑動驗證碼和旋轉(zhuǎn)式驗證碼,結(jié)合行為安全控制,并一直在優(yōu)化演進(jìn),目前有5萬多家網(wǎng)站在使用點觸的服務(wù),谷歌是2015年初才提出的圖標(biāo)驗證,說我們抄他們的不是冤枉嗎?”宋超稱,微觸很早即開始進(jìn)行點觸驗證碼的開發(fā)工作,自2012年開始公司化運營,現(xiàn)在已經(jīng)在北京建立了公司,專注于用戶信息安全和隱私安全。

  - 聲音

  如樣本足夠存破解可能

  互聯(lián)網(wǎng)專家史文勇認(rèn)為,圖形驗證碼技術(shù)確實比平時的文字驗證更加復(fù)雜,但他并不認(rèn)為圖形驗證能夠起到實在的作用,“有些軟件能夠自動將所有出現(xiàn)的圖片配對好,很難說能夠防止黃牛刷票。”

  他稱,在利用相關(guān)軟件刷票能夠比常規(guī)買票速度更快的情況下,一些購票者也會尋求軟件的幫助。

  “人多票少,有一些技術(shù)人員刷票能比個人更早買到票,任何工具都無法百分百防止?!卑鸢鸢踩珓?chuàng)始人兼CEO闞志剛稱,實際測試表明,借助于谷歌等巨頭的智能識圖技術(shù),能夠識別大部分圖片的涵義,準(zhǔn)確率達(dá)85%,如果采集樣本數(shù)據(jù)足夠大,確實有破解圖形驗證碼的可能性,一旦圖形驗證碼被黃牛破解,他們就可以繼續(xù)刷票。

  他表示,確實圖形驗證碼在識別上增加了難度,但破解難度上面并沒有革命性的改變,應(yīng)該建立多種聯(lián)合機(jī)制抵制黃牛刷票行為。

  - 追訪

  訂票高峰會“癱瘓”嗎?

  每秒可承載上萬訪問,高峰期運行順暢

  昨日,記者隨中國鐵道科學(xué)研究院相關(guān)人員參觀了12306購票系統(tǒng)的后臺。監(jiān)控大廳的顯示屏上,顯示了鐵路總公司和鐵科院兩個生產(chǎn)中心的實時運行數(shù)據(jù)。這些數(shù)據(jù)包括網(wǎng)站、手機(jī)APP的實時登錄人數(shù),購票支付情況、車站取票情況等。

  “春運期間,購票數(shù)據(jù)每半小時就會出現(xiàn)一個尖峰,這顯示了我們每天21個放票時間段的高峰購票情況?!敝袊F道科學(xué)研究院電子計算技術(shù)研究所副所長朱建生告訴記者,系統(tǒng)從每天7點開始運行,一直持續(xù)到24點停止支付。

  朱建生介紹,12306網(wǎng)站每秒鐘可承受上萬次訪問并保持系統(tǒng)平穩(wěn)運行?!?2月8日高峰期,全天16個小時訪問量是3600萬,到每秒鐘不到1000次訪問,這完全在網(wǎng)站設(shè)計的承受范圍內(nèi)?!?/p>

  同時,據(jù)12306后臺系統(tǒng)相關(guān)數(shù)據(jù),今年12306網(wǎng)站在12月8日最高峰當(dāng)天登錄用戶達(dá)3600萬,旅客成功購票數(shù)是608.7萬張。而去年在購票高峰期,登錄用戶有5600萬,售票僅為563萬張。

  為何仍“一票難求”?

  增開列車調(diào)整運行解決供需矛盾

  昨日,記者詢問12306相關(guān)負(fù)責(zé)人,對于此前媒體報道的“記者買不到票,而黃牛仍然能買到票”的事情,相關(guān)負(fù)責(zé)人表示,圖形驗證碼在一定程度上阻止了黃牛搶票、囤票,但黃??赡芾酶蟮膸挕⒏斓木W(wǎng)速專業(yè)從事?lián)屍薄?/p>

  “一些第三方平臺和軟件還利用未注冊的實名旅客信息進(jìn)行搶票、囤票,鐵路部門將對此事采取相關(guān)措施?!秉S欣也提示旅客,不要使用這些平臺買票,以免個人信息泄露。

  朱建生表示,后臺仍然從技術(shù)上監(jiān)測到一些試圖破譯12306圖形驗證碼的情況,未來不排除對驗證碼系統(tǒng)進(jìn)行再次改進(jìn)升級。

  鐵路部門介紹,提高鐵路運力是最終化解供需矛盾的重要方向。今年春運,鐵路部門每天開行旅客列車3488對,比2015年春運增長14.5%。其中,圖定旅客列車3048對,春運增開旅客列車440對。

  “12月16日增開的列車投入后,以及一些運行圖調(diào)整,再加上一定的退票,現(xiàn)在沒買到票的旅客到時還會有票。”朱建生說。

熱圖一覽

  • 股票名稱 最新價 漲跌幅