新聞源 財富源

2025年01月25日 星期六

財經(jīng) > 滾動新聞 > 正文

字號:  

eBay如何猜出你的購買欲?

  • 發(fā)布時間:2014-09-12 03:32:08  來源:科技日報  作者:佚名  責(zé)任編輯:羅伯特

  在網(wǎng)絡(luò)世界,數(shù)據(jù)就是金錢。作為全球最大的拍賣網(wǎng)站,eBay對這一點深有體會。眼下,eBay對各種在線數(shù)據(jù)的分析無所不至,就像在每個顧客前面安裝了攝像頭一般。

  毫無疑問,eBay擁有的數(shù)據(jù)量是驚人的。其每天都要處理100PB的數(shù)據(jù),其中包括50TB的機(jī)器數(shù)據(jù)??梢哉f,eBay每天都面臨著天文數(shù)字般的大數(shù)據(jù)挑戰(zhàn)。

  早在2006年,eBay就成立了大數(shù)據(jù)分析平臺。為了準(zhǔn)確分析用戶的購物行為,eBay定義了成百上千種類型的數(shù)據(jù),并以此對顧客的行為進(jìn)行跟蹤分析。然而,這同時也為eBay帶來了新的挑戰(zhàn)。要知道,公司的數(shù)據(jù)量多到難以想象,沒有人能分析消化這么多的數(shù)據(jù),也沒有人能基于所有數(shù)據(jù)建立起模型。

  事實上,eBay真正應(yīng)用到的,只是其收集的數(shù)據(jù)中的一小部分。“剩余的數(shù)據(jù),eBay或是將其丟棄,或是將其存儲起來。因為說不定哪天,科技實現(xiàn)了突破,這些數(shù)據(jù)就會變得有用?!眅Bay大中華區(qū)CEO林奕彰指出。

  那么目前,eBay是如何利用這些數(shù)據(jù),來促進(jìn)業(yè)務(wù)創(chuàng)新和利潤增長的呢?

  為用戶“畫像”:搜索引擎更加“直覺化”

  基于大數(shù)據(jù)分析,eBay每天要回答的問題有很多,比如,“昨天最熱門的搜索商品是什么?”而即便是這樣的簡單問題,都需要涉及處理五十億的頁面瀏覽量。從這個角度看,任何一個基本的業(yè)務(wù)問題,對公司來說都是一個相當(dāng)巨大的問題。

  就eBay如何利用大數(shù)據(jù)來增加在線交易,林奕彰舉了一個典型的例子。譬如,一位年輕的女性早上10點在星巴克瀏覽eBay網(wǎng)站,eBay應(yīng)該推送給她什么樣的商品呢?

  “就這幾個信息點,我們其實已經(jīng)做了不少研究?!绷洲日谜f,“事實上,用戶早晨10點、中午12點,或是晚上7點,她瀏覽的商品是不同的;在餐廳或是在家里,同樣會對瀏覽和搜索產(chǎn)生影響;此外,還有用戶的年齡、當(dāng)時的天氣等等,都會對購物產(chǎn)生影響。eBay要做的,就是學(xué)習(xí)不同情景下的不同購物模式,并推送給用戶最想要的商品?!?/p>

  據(jù)悉,eBay可以從用戶以往的瀏覽記錄里“猜”她想要什么樣的商品,也可以從設(shè)定的成百上千種情景模型中計算出用戶可能的需求;或是對照另一位有著相似特點的女性用戶,看她當(dāng)時買過什么樣的商品,從而推斷出這位用戶潛在的需求。在綜合各種考量因素后,eBay的后臺需要在短短幾秒內(nèi)將商品頁面推送給用戶。這意味著,eBay的系統(tǒng)需要有非??斓倪\算速度。

  這種運算模型,有相當(dāng)一部分人為的因素。比如,機(jī)器可以搜集用戶的上萬個數(shù)據(jù),但eBay的工程師可以定義其中的100個數(shù)據(jù)為有效數(shù)據(jù),而模型則建立在這些有效數(shù)據(jù)之上。此外,當(dāng)計算機(jī)自動“學(xué)習(xí)”分析各種數(shù)據(jù)形成的趨勢時,eBay需要將機(jī)器學(xué)習(xí)的邏輯設(shè)定在與商品交易相關(guān)的行為上。

  除了通過大數(shù)據(jù)為用戶“畫像”而向其推送有針對性的商品,eBay此前還嘗試?yán)么髷?shù)據(jù)進(jìn)行搜索引擎的優(yōu)化。

  具體說來,eBay可以把握用戶的行為模式,使搜索引擎更加“直覺化”。如果時間倒退幾年,用戶在使用eBay的搜索引擎時,會發(fā)現(xiàn)它只能理解字面的意思,并按照字面意思尋找。很多時候,搜索引擎并不能理解用戶的真實意圖。但現(xiàn)在,eBay正試著改變或重寫用戶的搜索請求,增加同義詞或替換語句,從而給出更相關(guān)性的內(nèi)容,并由此增加在線交易量。而這背后,統(tǒng)統(tǒng)離不開大數(shù)據(jù)的支持。

  測算商家邏輯:為商家提供“情報”

  基于用戶購物的數(shù)據(jù),eBay同樣會給商家提供各式各樣的“情報”。

  很多時候,eBay會根據(jù)自身或其他電商網(wǎng)站的交易情況,向商家建議其應(yīng)該銷售的品類。在此基礎(chǔ)上,eBay還試圖算出商家的補(bǔ)貨頻率。事實上,海外倉儲是商家非常頭痛的問題,一旦計算失誤,便可能造成庫存積壓或缺貨。而在eBay,一旦用戶下單后發(fā)現(xiàn)商家缺貨,將是非常嚴(yán)重的問題。這種情況下,eBay可以通過過往的數(shù)據(jù)分析,得出商家第一批貨的大概銷量,以及按照過去銷貨的速度什么時候應(yīng)該補(bǔ)貨,物流的時間又是多久。通過這些數(shù)據(jù)的計算,eBay可以測算出商家補(bǔ)貨的邏輯。

  這些數(shù)據(jù)分析,對于商家開拓新的銷售品類非常管用。因為通常情況下,商家需要四五個月,才能摸清楚一種貨物的淡旺季銷量,及其在各個地區(qū)的受歡迎程度。

  當(dāng)然,eBay所做的只是為商家提供各種潛在的商機(jī),至于賣家是否愿意投入生產(chǎn),或能否找到合適的供應(yīng)商進(jìn)貨,仍需要他們自己去完成。很多時候,eBay推薦商家銷售200個新品類,而最終商家只能找到50種新產(chǎn)品的供應(yīng)商。

  除此之外,憑借平臺上產(chǎn)生的各種信息,eBay還可以扮演“品管(品質(zhì)管理)”的角色。舉例來說,一個賣家要在eBay上賣1000個產(chǎn)品,當(dāng)它賣到50個產(chǎn)品的時候,有5個產(chǎn)品出了問題;賣到200個產(chǎn)品的時候,有20個產(chǎn)品出了問題;賣到400個產(chǎn)品的時候,有40個產(chǎn)品出現(xiàn)質(zhì)量問題,以此類推。而eBay要做的,就是在其早期出現(xiàn)問題的時候,就及時提醒賣家。

  進(jìn)一步說,當(dāng)賣家賣掉10個、20個產(chǎn)品的時候,eBay就要根據(jù)退貨率、買家評論等把可能的問題檢測出來。與此同時,eBay會提醒賣家,讓其監(jiān)督供應(yīng)商改進(jìn)品質(zhì),或選擇將商品下架,或是修改物品的描述。

  在理想狀態(tài)下,這種品管系統(tǒng)會形成一個大數(shù)據(jù)的循環(huán),并幫助賣家減少退貨,銷售更多的商品。假如賣家在收到這樣的通知后依舊我行我素,eBay就會認(rèn)為這樣的賣家并不重視品管,到了一定階段,eBay會對其實施交易“配額”,限制其交易量。

  試錯與挑戰(zhàn):大數(shù)據(jù)系統(tǒng)“智能”識別假貨

  和其他在線交易平臺一樣,eBay對假貨亦十分敏感。眼下,公司試圖通過大數(shù)據(jù)技術(shù),讓系統(tǒng)“智能”地識別出假貨。

  實際上,“網(wǎng)絡(luò)打假”工作并不容易。要知道,假貨常常以各種形態(tài)出現(xiàn)在網(wǎng)絡(luò)上,且屢禁不止。以Rolex為例,假貨商家可能在單詞中增加一個空格,也可能將其中兩個字母互換位置,甚至名稱里根本不出現(xiàn)Rolex,只是圖片展示出Rolex手表的樣子。eBay上有如此多的品牌,自然有形形色色的假貨充斥其中。這種情況下,單是靠在商品名稱或描述里抓關(guān)鍵詞,根本抓不住假貨。

  而eBay眼下做的,就是通過數(shù)據(jù)分析建立起一種模型或規(guī)則,假如商家的交易符合這種規(guī)則或特征,便有可能是在賣假貨。

  打個比方,當(dāng)一個賣家的商品賣的很便宜,賣得很快,但后面的抱怨和退貨很多,系統(tǒng)就會把這個“可疑”的模式識別出來,然后再由工作人員去判斷,這個賣家是否在賣假貨。換言之,“即便數(shù)據(jù)的量再大,賣假貨的人都有相對固定的模式?!绷洲日梅Q。而通過這種方式,eBay有效地鑒別出不少假貨商家。

  不過,林奕彰并不諱言,這種大數(shù)據(jù)分析方法亦有其弊端?!熬图儇泦栴}來說,這種方式只能在事后將問題查出來,而無法事先預(yù)測?!彼硎?,“這不是那么容易解決的問題,因為無論用什么樣的模型去套,假貨交易總是能先騙你一陣子?!?/p>

  除了分析的滯后性,eBay的大數(shù)據(jù)挑戰(zhàn)還體現(xiàn)在龐大的數(shù)據(jù)處理上。盡管企業(yè)數(shù)據(jù)倉庫為查詢提供了巨大性能,但它仍無法滿足eBay存儲和靈活處理的需要。要知道,這些系統(tǒng)的造價相當(dāng)昂貴,當(dāng)eBay每天增加50TB的數(shù)據(jù)時,其成本是相當(dāng)高昂的。

  在此基礎(chǔ)上,eBay收集的相當(dāng)一部分?jǐn)?shù)據(jù),在目前看來是無用的數(shù)據(jù)。畢竟,數(shù)據(jù)采集得越多,變量越多,而由此帶來的“數(shù)據(jù)噪音”也越多,模型越失真。從這個角度看,eBay要做的是記錄那些有意義的數(shù)據(jù),并銷毀那些不需要的信息。問題在于,eBay要分析的85%的問題都是新的或未知的,“eBay并不知道哪些信息未來或許會有用,”林奕彰坦言,“那些現(xiàn)在看起來無效的數(shù)據(jù),明后年可能就會隨著科技進(jìn)步被消化,我們現(xiàn)在只能先把這些數(shù)據(jù)儲存起來。”

  但另一廂,假如將所有信息都儲存起來,那么eBay每個月都會新增數(shù)以億計的數(shù)據(jù)信息。在如此浩瀚的數(shù)據(jù)海洋中,分析工作根本無從下手。因此對eBay來說,這是一個必須平衡的難題。

  需要指出的是,eBay當(dāng)下的分析模型也還不夠完美。無論是“猜”用戶,還是分析商家在eBay上的生意,eBay猜錯的情況非常非常多。對于這一點,林奕彰舉了信用卡的例子。在他看來,“銀行其實是運用大數(shù)據(jù)最厲害的,但無論風(fēng)控模型怎么完美,全球依然有2%左右的信用卡賠率?!睕r且,eBay用的并不是成熟機(jī)構(gòu)認(rèn)證過的模型,很多時候要靠自己去猜,那么誤差也就不足為奇。

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價 漲跌幅