【史慶盛】互聯(lián)網(wǎng)財經(jīng)頻道文本挖掘策略_第1頁
已閱讀1頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、,那些年,我們一起追過的財經(jīng)小編 ——互聯(lián)網(wǎng)財經(jīng)頻道選股策略,史慶盛 廣發(fā)證券金融工程 2014年8月,,一 、財經(jīng)頻道選股策略簡介二、 財經(jīng)頻道選股策略框

2、架流程三、 單個財經(jīng)頻道選股策略對比四、 多財經(jīng)頻道智能選股策略五、 總結,目 錄,一 、財經(jīng)頻道選股策略簡介,,走進你生活的互聯(lián)網(wǎng)財經(jīng)頻道,互聯(lián)網(wǎng)在過去10年里,經(jīng)歷了快速發(fā)展階段,信息的爆炸性增長也使得人們獲取的信息量迅速地增加。目前,人類已進入了互聯(lián)網(wǎng)大數(shù)據(jù)時代,人們獲取信息的途徑也越來越豐富。 財經(jīng)媒體作為報道金融行業(yè)信息的渠道,也經(jīng)歷了翻天覆地的變化,傳統(tǒng)的財經(jīng)信息傳播渠道已慢慢地被互聯(lián)網(wǎng)財經(jīng)媒體所代替,人們獲

3、取金融相關信息也越來越傾向于從互聯(lián)網(wǎng)財經(jīng)頻道獲取,互聯(lián)網(wǎng)財經(jīng)頻道報告的政策、行業(yè)、個股、信息已潛移默化地對人們的生活、投資決策等產(chǎn)生影響。,一 、財經(jīng)頻道選股策略簡介,經(jīng)典案例--史上“最貴微博”:兩個交易日浮盈2.56億元,經(jīng)典案例--潘石屹微博“拉漲”杭蕭鋼構,一 、財經(jīng)頻道選股策略簡介,一 、財經(jīng)頻道選股策略簡介,經(jīng)典案例--熱門微博主:股市科學家,一 、財經(jīng)頻道選股策略簡介,經(jīng)典案例—熱門財經(jīng)網(wǎng)站推薦個股,騰訊財經(jīng),中國證券網(wǎng),

4、,一 、財經(jīng)頻道選股策略簡介,財經(jīng)小編。。。,,,一 、財經(jīng)頻道選股策略簡介,,一 、財經(jīng)頻道選股策略簡介二、 財經(jīng)頻道選股策略框架流程三、 單個財經(jīng)頻道選股策略對比四、 多財經(jīng)頻道智能選股策略五、 總結,目 錄,,,二、 財經(jīng)頻道選股策略框架流程,,財經(jīng)頻道選股策略框架:,,文本預處理,,,文本信息提取,個股,推薦時間順序,網(wǎng)站區(qū)分標簽,個股推薦計數(shù),,,單網(wǎng)站選股能力,單網(wǎng)站行業(yè)內(nèi)選股能力,網(wǎng)站最新推薦個股表現(xiàn),考慮推薦日

5、個股表現(xiàn),單策略,,多策略,,,數(shù)據(jù)抓取平臺組件框架,分配調(diào)度服務器,二、 財經(jīng)頻道選股策略框架流程,2,1,3,,二、 財經(jīng)頻道選股策略框架流程,財經(jīng)頻道數(shù)據(jù)獲取案例:以鳳凰網(wǎng)_黑馬集中營欄目為例,網(wǎng)頁信息:,網(wǎng)頁源代碼:,,,二、 財經(jīng)頻道選股策略框架流程,財經(jīng)頻道數(shù)據(jù)獲取案例:以鳳凰網(wǎng)_黑馬集中營欄目為例,需要爬取字段:,,對應爬取網(wǎng)頁源代碼:,,,,二、 財經(jīng)頻道選股策略框架流程,財經(jīng)頻道數(shù)據(jù)存儲案例:以鳳凰網(wǎng)_黑馬集中營欄目為

6、例,存儲格式:薦股日期_區(qū)分薦股先后順序標識_薦股標題_薦股具體內(nèi)容,二、 財經(jīng)頻道選股策略框架流程,財經(jīng)頻道文本信息提取案例:以鳳凰網(wǎng)_黑馬集中營欄目為例,,一 、財經(jīng)頻道選股策略簡介二、 財經(jīng)頻道選股策略框架流程三、 單個財經(jīng)頻道選股策略對比四、 多財經(jīng)頻道智能選股策略五、 總結,目 錄,,三、 單個財經(jīng)頻道選股策略對比,數(shù)據(jù)來源:熱門財經(jīng)網(wǎng)站薦股欄目,數(shù)據(jù)開始時間為2006年,三、 單個財經(jīng)頻道選股策略對比,熱門財經(jīng)網(wǎng)站

7、薦股信息統(tǒng)計:考慮全樣本情況,各大熱門財經(jīng)網(wǎng)站_每日推薦個股數(shù)量均值,三、 單個財經(jīng)頻道選股策略對比,熱門財經(jīng)網(wǎng)站薦股信息統(tǒng)計:考慮申萬一級行業(yè)指數(shù)成分,鳳凰網(wǎng)_每日行業(yè)推股數(shù)量,新浪財經(jīng)_每日行業(yè)推股數(shù)量,搜狐網(wǎng)_每日行業(yè)推股數(shù)量,三、 單個財經(jīng)頻道選股策略對比,熱門財經(jīng)網(wǎng)站薦股信息統(tǒng)計:創(chuàng)業(yè)板股票、滬深300指數(shù)成分,三、 單個財經(jīng)頻道選股策略對比,小結:,華訊財經(jīng)_機構薦股欄目:日均薦股數(shù)量最多,平均每日薦股344只;搜狐網(wǎng)_金

8、羅盤欄目:日均薦股數(shù)量最少,平均每日薦股數(shù)量只有5只;鳳凰網(wǎng)_黑馬集中營:每日傾向于推薦SW醫(yī)藥生物、SW機械設備、SW化工三個行業(yè)的個股,分別占每日薦股數(shù)量的7%,7%和8%;中國證券網(wǎng)_熱點研究:每日傾向于推薦SW醫(yī)藥生物、SW計算機、SW電子三個行業(yè)的個股,分別占每日推薦個股數(shù)量的9%,8%,7%;在創(chuàng)業(yè)板上:華訊財經(jīng)_機構薦股日均薦股數(shù)量最多,為47只,而搜狐網(wǎng)_金羅盤薦股欄目日均薦股數(shù)量最少,只有2只,在滬深300指數(shù)

9、成分中:也是同樣的結論。,整體上來看,各大財經(jīng)網(wǎng)站薦股欄目每日推薦的個股在行業(yè)和規(guī)模的分布上都各具特點,分化較大!,三、 單個財經(jīng)頻道選股策略對比,財經(jīng)小編選股策略,策略原理:(1)初始資金:1(2)在每個交易日,考慮每個財經(jīng)網(wǎng)站推薦的個股,在推薦后的第一個交易日以開盤價買進該個股;(3)如果買入股票停牌,則該只個股不進行買入操作,持有一段時間,在持有期末以收盤價賣出該個股,交易費用為千分之二,在賣出個股時計算。如果個股在持有期末

10、停牌則延遲賣出,直至可以賣出。,三、 單個財經(jīng)頻道選股策略對比,全樣本(不區(qū)分行業(yè)、當日表現(xiàn)等因素),各網(wǎng)站不同持有期下策略表現(xiàn)一覽,三、 單個財經(jīng)頻道選股策略對比,全樣本(不區(qū)分行業(yè)、當日表現(xiàn)等因素),同花順_選股策略(策略短期效應顯著),三、 單個財經(jīng)頻道選股策略對比,全樣本(不區(qū)分行業(yè)、當日表現(xiàn)等因素),中國證券網(wǎng)_選股策略(策略短期效應顯著),三、 單個財經(jīng)頻道選股策略對比,小結:,在不區(qū)分行業(yè)以及當日表現(xiàn)等因素的影響下,財經(jīng)小

11、編選股策略在短期內(nèi)的效應明顯,持有期為2個交易日的策略在回測期內(nèi)的表現(xiàn)最為優(yōu)異,其中新浪財經(jīng)的薦股表現(xiàn)在歷史回測期內(nèi)表現(xiàn)最好。,三、 單個財經(jīng)頻道選股策略對比,考慮滬深300指數(shù)成分選股策略,考慮推薦的滬深300指數(shù)成分股,持有期分別為2、5個交易日,三、 單個財經(jīng)頻道選股策略對比,考慮創(chuàng)業(yè)板選股策略,考慮推薦的創(chuàng)業(yè)板個股,持有期分別為2、5個交易日,三、 單個財經(jīng)頻道選股策略對比,考慮申萬一級行業(yè)指數(shù)成分選股策略,行業(yè)薦股優(yōu)異網(wǎng)站,三

12、、 單個財經(jīng)頻道選股策略對比,考慮申萬一級行業(yè)指數(shù)成分選股策略,部分財經(jīng)網(wǎng)站策略表現(xiàn):(鳳凰網(wǎng)),,一 、財經(jīng)頻道選股策略簡介二、 財經(jīng)頻道選股策略框架流程三、 單個財經(jīng)頻道選股策略對比四、 多財經(jīng)頻道智能選股策略五、 總結,目 錄,,策略原理:(1)初始資金:1(2)在每個交易日,考慮各個網(wǎng)站在過去一段時間內(nèi)的單個策略下的表現(xiàn),選擇過去一段時間內(nèi)相對上證指數(shù)超額收益大于零的前N個網(wǎng)站,合并當前交易日推薦的個股形成超配組合

13、,在推薦后的第一個交易日以開盤價買進該個股;(3)如果買入股票停牌,則該只個股不進行買入操作,持有一段時間,在持有期末以收盤價賣出該個股,交易費用為千分之3,在賣出個股時計算。如果個股在持有期末停牌則延遲賣出,直至可以賣出。,四、 多財經(jīng)頻道智能選股策略,不區(qū)分行業(yè)的多網(wǎng)站動態(tài)選股策略,,不區(qū)分行業(yè)的多網(wǎng)站動態(tài)選股策略,四、 多財經(jīng)頻道智能選股策略,考慮各個網(wǎng)站前5個交易日表現(xiàn),選擇前50%網(wǎng)站推薦個股形成超配組合策略,四、 多財經(jīng)頻

14、道智能選股策略,不區(qū)分行業(yè)、個股當日表現(xiàn)等因素的多策略驅動下的動態(tài)策略,,各個網(wǎng)站前5個交易日表現(xiàn),選擇前50%網(wǎng)站推薦個股,持有期分別為2個交易日,,策略原理:(1)初始資金:1(2)在每個交易日,考慮各個網(wǎng)站在過去一段時間內(nèi)的針對當個行業(yè)選股策略的表現(xiàn),選擇過去一段時間內(nèi)相對行業(yè)指數(shù)超額收益;靠前網(wǎng)站,合并當前交易日推薦的個股形成超配組合,在推薦后的第一個交易日以開盤價買進該個股;(3)如果買入股票停牌,則該只個股不進行買入操

15、作,持有一段時間,在持有期末以收盤價賣出該個股,交易費用為千分之3,在賣出個股時計算。如果個股在持有期末停牌則延遲賣出,直至可以賣出。,四、 多財經(jīng)頻道智能選股策略,區(qū)分行業(yè)的多網(wǎng)站動態(tài)選股策略,四、 多財經(jīng)頻道智能選股策略,區(qū)分申萬一級行業(yè)的多策略驅動下的動態(tài)策略,考慮各個網(wǎng)站對應申萬一級行業(yè)策略前5個交易日表現(xiàn),選擇前50%網(wǎng)站推薦個股形成超配組合策略,持有期2個交易日,四、 多財經(jīng)頻道智能選股策略,區(qū)分申萬一級行業(yè)的多策略驅動下的

16、動態(tài)策略,考慮各個網(wǎng)站對應申萬一級行業(yè)策略前5個交易日表現(xiàn),選擇前50%網(wǎng)站推薦個股形成超配組合策略,持有期2個交易日,小結:,四、 多財經(jīng)頻道智能選股策略,持有期:考慮多策略驅動下的財經(jīng)頻道動態(tài)策略,短期效應明顯。不區(qū)分行業(yè):考慮各個網(wǎng)站單策略下前30個交易日表現(xiàn),選擇前50%網(wǎng)站當前交易日推薦的個股形成的超配組合的在持有期為2個交易日的策略在回測期內(nèi)表現(xiàn)最為優(yōu)異,除2008年回撤較大外,其他年度回撤較小,各年度無論絕對收益還是相

17、對收益都顯著;區(qū)分行業(yè):考慮各個網(wǎng)站單策略下前30個交易日,選擇前50%網(wǎng)站當前交易日推薦的個股形成的超配組合的在持有期為2個交易日的策略在回測期內(nèi)表現(xiàn)仍最為優(yōu)異。,,一 、財經(jīng)頻道選股策略簡介二、 財經(jīng)頻道選股策略框架流程三、 單個財經(jīng)頻道選股策略對比四、 多財經(jīng)頻道智能選股策略五、 總結,目 錄,,五、 總結,,五、 總結,本專題對熱門財經(jīng)網(wǎng)站的薦股文本信息進行了量化處理,建立了量化策略;對于熱門財經(jīng)網(wǎng)站的薦股信息,存

18、在明顯的短期效應,所構建的量化策略在短期內(nèi)獲得的超額回報顯著,尤其以持有期為2個交易日的最為顯著;不同熱門財經(jīng)網(wǎng)站薦股信息存在不同的優(yōu)勢,在各行業(yè)的策略表現(xiàn)各異;通過單個網(wǎng)站的單策略建立了多策略驅動下的動態(tài)策略,動態(tài)策略存在明顯的短期超額收益效應;考慮多策略驅動下的動態(tài)策略對沖方案多策略驅動下的動態(tài)策略實時更新多策略驅動下的動態(tài)策略平臺開發(fā),每日推送策略跟蹤個股以及行業(yè)動態(tài),目前研究成果:,接下來方向:,,Thanks!

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論