新聞源 財(cái)富源

2025年01月09日 星期四

財(cái)經(jīng) > 滾動(dòng)新聞 > 正文

字號(hào):  

捕捉投資情緒,預(yù)測(cè)市場(chǎng)走勢(shì)。“未卜先知”的

  • 發(fā)布時(shí)間:2015-03-14 04:29:24  來源:文匯報(bào)  作者:佚名  責(zé)任編輯:羅伯特

  克托·邁爾-舍恩伯格在《大數(shù)據(jù)時(shí)代》一書中寫到,大“數(shù)據(jù)”的核心就是預(yù)測(cè),即只要數(shù)據(jù)豐富到一定程度,就可預(yù)測(cè)事情發(fā)生的可能性。眼下,大數(shù)據(jù)正穿越至理財(cái)界,把“未卜先知”的觸角伸向股票投資領(lǐng)域

  ■本報(bào)記者唐瑋婕

  “大數(shù)據(jù)投資”賺足眼球

  國(guó)內(nèi)目前的“大數(shù)據(jù)投資”運(yùn)作模式大同小異,一般是由互聯(lián)網(wǎng)公司提供海量的信息數(shù)據(jù),券商、基金等金融機(jī)構(gòu)負(fù)責(zé)搭建專業(yè)的數(shù)學(xué)分析模型。

  在國(guó)內(nèi)互聯(lián)網(wǎng)圈,試圖借助手中的大數(shù)據(jù)跨界進(jìn)軍金融界的公司不在少數(shù)。目前,市場(chǎng)上可見的例子有新浪與南方證券合作的大數(shù)據(jù)100、大數(shù)據(jù)300指數(shù),中證指數(shù)與騰訊濟(jì)安金信推出的中證騰安指數(shù),阿里旗下螞蟻金服推出的淘金100指數(shù)等。而國(guó)內(nèi)首只互聯(lián)網(wǎng)指數(shù)基金出現(xiàn)在去年10月,百度聯(lián)合廣發(fā)基金推出了廣發(fā)百發(fā)100指數(shù)基金,首募第一天認(rèn)購(gòu)超13億,第二天上午就達(dá)到18億元的首募上限。

  盡管這些打著“大數(shù)據(jù)”旗號(hào)的各式指數(shù)令人眼花繚亂,但背后的模式大同小異——由互聯(lián)網(wǎng)公司提供海量的信息數(shù)據(jù),券商、基金等金融機(jī)構(gòu)負(fù)責(zé)搭建專業(yè)的數(shù)學(xué)分析模型。南方-新浪I100和I300是由南方基金、新浪財(cái)經(jīng)和深圳證券信息公司三方聯(lián)合編制的,數(shù)據(jù)來源主要是新浪微博以及新浪財(cái)經(jīng),包括用戶在新浪財(cái)經(jīng)對(duì)行情的訪問熱度、對(duì)股票的搜索熱度,用戶在新浪財(cái)經(jīng)對(duì)股票相關(guān)新聞的瀏覽熱度,股票相關(guān)微博的多空分析數(shù)據(jù)等等。通過一套分析技術(shù),定期追蹤用戶關(guān)注度最高的50只股票,再根據(jù)相關(guān)模型篩選,結(jié)合財(cái)務(wù)因子和市場(chǎng)驅(qū)動(dòng)因子,最終選出成份股。

  百度百發(fā)同樣是根據(jù)“綜合情緒模型融合三層數(shù)據(jù)”,選取排名前100的股票作為百發(fā)100指數(shù)的成分樣本股。百度金融中心相關(guān)負(fù)責(zé)人表示,“與同期滬深300指數(shù)的表現(xiàn)相較,百發(fā)100更能在股票市場(chǎng)振蕩時(shí)期、行業(yè)輪動(dòng)劇烈時(shí)期、基本面不明朗時(shí)期抓住市場(chǎng)熱點(diǎn)、了解投資者情緒、抗擊投資波動(dòng)風(fēng)險(xiǎn)?!?/p>

  此外,阿里巴巴旗下的天弘基金也有意在大數(shù)據(jù)策略上做文章。天弘基金機(jī)構(gòu)產(chǎn)品部總經(jīng)理劉燕曾對(duì)媒體表示,“在傳統(tǒng)的調(diào)研上,大數(shù)據(jù)將貢獻(xiàn)于基礎(chǔ)資產(chǎn)的研究,而以往過度依賴線下研究報(bào)告。大數(shù)據(jù)將視野拓展至線上的數(shù)據(jù)分析,給基金經(jīng)理選股帶來新的邏輯?!?/p>

  及時(shí)應(yīng)變是大數(shù)據(jù)指數(shù)基金不同于傳統(tǒng)基金的另一大賣點(diǎn)。無論是百度百發(fā),還是新浪大數(shù)據(jù)系列產(chǎn)品,他們的成分股調(diào)倉(cāng)周期均為一個(gè)月,在開發(fā)者看來,與傳統(tǒng)基金半年的節(jié)奏相比,這樣更有助于把握市場(chǎng)節(jié)奏,不錯(cuò)失捕捉超額收益的機(jī)會(huì)。從記者查到的公開數(shù)據(jù)看,廣發(fā)百發(fā)100指數(shù)的投資范圍是保持不低于90%的股票,截至去年年末,其股票倉(cāng)位為94.52%,成立以來回報(bào)率為17.30%,最新基金規(guī)模為29.97億元,基金份額為11.27億份,和上季度相比,變化率為6.55%。

  “捕捉市場(chǎng)情緒”是強(qiáng)項(xiàng)

  回顧股票投資的歷史,其實(shí)就是把影響股價(jià)的因子不斷量化的過程。計(jì)算機(jī)通過分析新聞、研究報(bào)告、社交信息、搜索行為等,借助自然語言處理方法,提取有用的信息;而借助機(jī)器學(xué)習(xí)智能分析,過去量化投資只能覆蓋幾十個(gè)策略,大數(shù)據(jù)投資則可以覆蓋成千上萬個(gè)策略。

  眼下,基于互聯(lián)網(wǎng)搜索數(shù)據(jù)和社交行為的經(jīng)濟(jì)預(yù)測(cè)研究,已逐漸成為一個(gè)新的學(xué)術(shù)熱點(diǎn),在經(jīng)濟(jì)、社會(huì)以及健康等領(lǐng)域的研究中取得了一定成果,而應(yīng)用到資本市場(chǎng)應(yīng)用上,研究發(fā)現(xiàn)搜索數(shù)據(jù)可有效預(yù)測(cè)未來股市活躍度(以交易量指標(biāo)衡量)及股價(jià)走勢(shì)的變化。不過,在大數(shù)據(jù)技術(shù)嶄露頭角前,市場(chǎng)情緒始終很難準(zhǔn)確量化。業(yè)內(nèi)人士指出,包括百發(fā)100在內(nèi)的大數(shù)據(jù)理財(cái)產(chǎn)品其實(shí)是在傳統(tǒng)量化投資技術(shù)上,融合了基于互聯(lián)網(wǎng)大數(shù)據(jù)的市場(chǎng)走勢(shì)和投資情緒判斷。

  眾所周知,傳統(tǒng)的量化投資主要著眼點(diǎn)于對(duì)專業(yè)化金融市場(chǎng)基本面和交易數(shù)據(jù)的應(yīng)用。和傳統(tǒng)量化投資類似,百發(fā)100對(duì)樣本股的甄選要考慮財(cái)務(wù)因子、基本面因子和動(dòng)量因子,包括凈資產(chǎn)收益率、資產(chǎn)收益率、每股收益增長(zhǎng)率、流動(dòng)負(fù)債比率、凈利潤(rùn)同比增長(zhǎng)率、股權(quán)集中度、自由流通市值以及最近一個(gè)月的個(gè)股價(jià)格收益率和波動(dòng)率等等。

  當(dāng)然,在百發(fā)100的策略里,無論是來源于專業(yè)金融市場(chǎng)的結(jié)構(gòu)化數(shù)據(jù),還是來源于互聯(lián)網(wǎng)的非結(jié)構(gòu)化數(shù)據(jù)都是可以利用的數(shù)據(jù)資源,通過大數(shù)據(jù)捕捉市場(chǎng)情緒,包括來源于互聯(lián)網(wǎng)的用戶行為、搜索量、市場(chǎng)輿情、宏觀基本面預(yù)期等等,成為了百發(fā)等互聯(lián)網(wǎng)公司的技術(shù)“利器”。事實(shí)上,時(shí)至今日大數(shù)據(jù)已經(jīng)展現(xiàn)出強(qiáng)大的“未卜先知”的能力。在2014年巴西世界杯,谷歌的云計(jì)算平臺(tái)通過大數(shù)據(jù)分析準(zhǔn)確地預(yù)測(cè)了16強(qiáng)和8強(qiáng),比“章魚哥”更強(qiáng)。百度金融中心相關(guān)負(fù)責(zé)人表示,與歐美等成熟資本市場(chǎng)主要由理性機(jī)構(gòu)投資者構(gòu)成相比,東亞尤其是中國(guó)的股票類證券投資市場(chǎng)仍以散戶為主,因此市場(chǎng)受投資者情緒和宏觀政策性因素影響很大。而個(gè)人投資者行為可以更多地反映在互聯(lián)網(wǎng)用戶行為大數(shù)據(jù)上,從而為有效地預(yù)測(cè)市場(chǎng)情緒和趨勢(shì)提供了可能。

  記者了解到,單靠互聯(lián)網(wǎng)大數(shù)據(jù)也很難獲得超額收益。在百發(fā)100誕生前,研究團(tuán)隊(duì)曾經(jīng)試著單純用大數(shù)據(jù)做了一個(gè)類似的指數(shù)產(chǎn)品,但這只指數(shù)表現(xiàn)并不好,歷史模擬收益跟滬深300指數(shù)的收益基本持平。要真正獲得超額收益,還需要加入其他兩類量化產(chǎn)品常用的數(shù)據(jù)。該模型除了運(yùn)用百度提供的用戶搜索和行為數(shù)據(jù)指標(biāo)之外,還融入了8個(gè)財(cái)務(wù)指標(biāo)的財(cái)務(wù)因子、動(dòng)量因子和動(dòng)量反轉(zhuǎn)策略兩大數(shù)據(jù),將這三大數(shù)據(jù)輸入到BFS模型,篩選出100只基本面好、成長(zhǎng)空間良好,能反映未來一個(gè)月內(nèi)市場(chǎng)行業(yè)輪動(dòng)熱點(diǎn)的股票。

  還有不少短板

  在投資領(lǐng)域,即使是在美國(guó)這樣的成熟金融市場(chǎng),大數(shù)據(jù)策略投資的應(yīng)用目前還僅限于中小型對(duì)沖基金和創(chuàng)業(yè)平臺(tái)公司。

  畢竟尚屬新興事物,大數(shù)據(jù)的預(yù)測(cè)能力依舊存在不少的缺陷。就拿鼎鼎大名的谷歌來說,網(wǎng)站在2008年推出的流感趨勢(shì)系統(tǒng)監(jiān)測(cè)全美的網(wǎng)絡(luò)搜索,尋找與流感相關(guān)的詞語,比如“咳嗽”和“發(fā)燒”等。它利用這些搜索來提前9個(gè)星期預(yù)測(cè)可能與流感相關(guān)的就醫(yī)量。但在過去幾年中,該系統(tǒng)一直高估與流感相關(guān)的就醫(yī)量,在這類數(shù)據(jù)最有用的流感季節(jié)高峰期尤其預(yù)測(cè)不準(zhǔn)確。在2012/2013流感季節(jié),它預(yù)測(cè)的就醫(yī)量是美國(guó)疾控中心(CDC)最終記錄結(jié)果的兩倍;在2011/2012流感季節(jié),它高估了超50%。

  在投資領(lǐng)域,即使是在美國(guó)這樣的成熟金融市場(chǎng),大數(shù)據(jù)策略投資的應(yīng)用目前還僅限于中小型對(duì)沖基金和創(chuàng)業(yè)平臺(tái)公司。相關(guān)分析師指出,在大數(shù)據(jù)指數(shù)基金推出前期,投資者獲取超額收益的可能性會(huì)高一些。但隨著日后市場(chǎng)模仿此策略的產(chǎn)品增加,也可能導(dǎo)致超額收益下降,這跟市場(chǎng)上量化基金同質(zhì)化的風(fēng)險(xiǎn)類似。

  當(dāng)然,大數(shù)據(jù)金融仍是未來的主流方向,這一點(diǎn)沒有人會(huì)懷疑。上海財(cái)經(jīng)大學(xué)現(xiàn)代金融研究中心副主任奚君羊表示,以大數(shù)據(jù)為特征的百度百發(fā)面世,具有必然性。一方面,隨著國(guó)內(nèi)股市行情的向好,股民及用戶的關(guān)注度提升,成為互聯(lián)網(wǎng)公司進(jìn)入證券業(yè)的較好機(jī)遇和時(shí)機(jī)。另一方面,互聯(lián)網(wǎng)金融在基金、銀行等領(lǐng)域已經(jīng)有一定的發(fā)展,但在證券業(yè)幾乎還是空白點(diǎn),也使得互聯(lián)網(wǎng)公司進(jìn)入證券業(yè)成為“圈地式”必然。從嚴(yán)格意義上來說,互聯(lián)網(wǎng)金融是指互聯(lián)網(wǎng)企業(yè)向金融業(yè)的滲透,不是簡(jiǎn)單的利用互聯(lián)網(wǎng)渠道來做金融業(yè)務(wù),包括證券業(yè)務(wù),而是找到互聯(lián)網(wǎng)與證券業(yè)的一個(gè)“結(jié)合點(diǎn)”,將互聯(lián)網(wǎng)基因真正植入到產(chǎn)品設(shè)計(jì)與服務(wù)中去。從這點(diǎn)來看,百度股市通中的大數(shù)據(jù)運(yùn)用,是具有開創(chuàng)性意義的。

  ■鏈接“大數(shù)據(jù)投資”怎么玩

  隨著互聯(lián)網(wǎng)、云計(jì)算等各式前沿技術(shù)的迅速發(fā)展,國(guó)外已經(jīng)涌現(xiàn)出不少運(yùn)用“大數(shù)據(jù)”玩轉(zhuǎn)投資的互聯(lián)網(wǎng)公司,盡管它們的先鋒做派尚未贏得傳統(tǒng)金融界的完全認(rèn)可,但卻已經(jīng)日益嶄露頭角。

  Kensho

  Kensho推出的全新數(shù)據(jù)分析工具——Warren類似于投資版的“Siri”,可以快速整合海量數(shù)據(jù)進(jìn)行分析,回答投資者提出的各種金融問題,例如“下月有颶風(fēng),將對(duì)美國(guó)建材板塊造成什么影響?”

  Kensho的系統(tǒng)由幾位來自谷歌和蘋果的資深軟件工程師開發(fā),如同天氣預(yù)報(bào)那樣,Warren會(huì)不斷優(yōu)化模型、灌入海量信息,然后給出結(jié)果。在其處理的信息中,有80%是“非結(jié)構(gòu)化”數(shù)據(jù),例如政策文件、自然事件、地理環(huán)境、科技創(chuàng)新等,這類信息通常是電腦和模型難以消化的。就在去年底,美國(guó)高盛向Kensho公司投資1500萬美元,以支持該公司的大數(shù)據(jù)平臺(tái)建設(shè)。

  Market Prophit

  金融大數(shù)據(jù)分析公司Market Prophit的做法是從社交網(wǎng)絡(luò)中的“噪音”分析出市場(chǎng)“信號(hào)”。Market Prophit認(rèn)為,市場(chǎng)情緒及氛圍可以對(duì)金融市場(chǎng)產(chǎn)生一定的影響,推出一個(gè)社交情緒分析平臺(tái),可以幫助投資者準(zhǔn)確把握市場(chǎng)的脈搏。由于采用了先進(jìn)的語義分析法,MarketProphit可以將Twitter(推特)里的金融對(duì)話量化為“-1(極度看空)”到“1(極度看多)”之間的投資建議。網(wǎng)站根據(jù)語義量化,每天公布前十名和后十名的股票熱度榜單;還設(shè)計(jì)了“熱度地圖”功能,根據(jù)投資者情緒和意見,按照不同板塊,將板塊內(nèi)的個(gè)股按照顏色深淺進(jìn)行標(biāo)注,誰漲誰跌一目了然。

  Derwent

  對(duì)沖基金Derwent的投資策略是通過實(shí)時(shí)跟蹤推特用戶的情緒,以此感知市場(chǎng)參與者的“貪婪與恐懼”,從而判斷市場(chǎng)漲跌來獲利。在Derwent的網(wǎng)頁(yè)上可以看到這樣一句話:“用實(shí)時(shí)的社交媒體解碼暗藏的交易機(jī)會(huì)。”

  在美國(guó)市場(chǎng)上,目前有多家私募對(duì)沖基金利用推特和Facebook(臉書)的社交數(shù)據(jù)作為反映投資者情緒和市場(chǎng)趨勢(shì)的因子,構(gòu)建對(duì)沖投資策略。比如,一家位于美國(guó)加州的對(duì)沖基金MarketPsych與湯森路透合作提供了分布在119個(gè)國(guó)家不低于18864項(xiàng)獨(dú)立指數(shù),比如每分鐘更新的心情狀態(tài)(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創(chuàng)新、訴訟及沖突情況等),而這些指數(shù)都是通過分析推特的數(shù)據(jù)文本,作為股市投資的信號(hào)。

  StockTwits

  利用社交媒體信息做投資的公司還有StockTwits。打開這家網(wǎng)站,首先映入眼簾的宣傳語是“看看投資者和交易員此刻正如何討論你的股票”。這家網(wǎng)站相當(dāng)于“股票界的推特”,主要面向分析師、媒體和投資者。它通過機(jī)器和人工相結(jié)合的手段,將關(guān)于股票和市場(chǎng)的信息整理為140字以內(nèi)的短消息供用戶參考。此外,StockTwits還整合了社交功能,作為插件可以嵌入推特、臉書和LinkedIn等主要社交平臺(tái),讓人們可以輕易分享投資信息。

熱圖一覽

高清圖集賞析

  • 股票名稱 最新價(jià) 漲跌幅