CONTENTS 目录 研究目的及背景 研究现状 行业轮动策略构建 实证分析 研究总结 > > > > >

Similar documents
2 大数据挖掘 公告 财报研究报告股吧 社交网络媒体 公告抓取 公告分类监测 个股信息变动挖掘 特定公告内容挖掘 研报热点挖掘 汇丰 PMI 前沿挖掘 股吧情绪挖掘 微信热股挖掘 雪球热度挖掘 个股新闻热度 财经门户选股 热点题材动向 题材个股

Microsoft Word _ doc

投资高企 把握3G投资主题

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 7 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 风险提示 / 17

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 7 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 风险提示 / 17

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 7 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 大数据基金表现 六 风险提示 / 18

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 8 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 大数据基金表现 六 风险提示 / 18

_广发证券*量化投资*广发证券量化投资策略周报【广发金工】互联网大数据周报( ):大数据择时看多,关注建筑装饰、钢铁等行业以及O2O、国企改革等概念板块史庆盛.pdf

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 7 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 大数据基金表现 六 风险提示 / 18

目录索引 一 广发金工大数据挖掘框架简述... 5 二 网络大数据之择时... 6 本周表现... 7 历史表现... 7 三 行业表现与网络情绪... 8 四 概念板块表现与舆情 五 大数据基金表现 六 风险提示 / 18

Microsoft Word _ doc

广发报告

目录索引 一 广发多因子框架简述... 4 ( 一 ) 多因子框架简述... 4 二 市场风格回顾... 4 ( 一 ) 本周市场速递... 4 ( 二 ) 主流风格表现一览... 5 ( 三 ) 因子分类回顾... 5 三 行业风格点评... 6 四 多因子 ALPHA 策略表现... 8 ( 一

Microsoft Word _ doc

神州泰岳 季报点评 主要财务指标一览 表 1: 单季度各项经营数据对比 ( 单位 : 百万元 ) ( 百万元 ) 15Q1 15Q2 15Q3 15Q3 16Q3 16Q3 16Q1 16Q2 16Q3 环比环比同比 营业收入 % % 7% 营业毛

_广发证券*金融工程专题*陈原文*【广发金融工程】基于网络舆情的指数轮动策略研究--互联网大数据挖掘系列专题之(十二).pdf

目录索引 一 分析师首次关注的股票具有投资价值... 3 二 分析师首次关注后的超额收益... 4 三 构建投资组合... 5 图表索引 图 1: 某股票在分析师首次关注后的表现... 3 图 2: 分析师首次关注后持有 20 个交易日的超额收益... 4 图 3: 分析师首次关注后持有 60 个交

月报大连期货市场 MONTHLY REPORT 期货 (Futures) 期权 (Options)

表 1: 中国平安寿险保费收入及其增长率 寿险规模保费 调整后寿险保费收入 中国平安 累计收入 ( 亿元 ) 累计收入同比增长率 单月收入 ( 亿元 ) 单月收入同比增长率 累计收入 ( 亿元 ) 累计保费确认率 2010 年 1 月 % % / / 2010 年 2 月 3


金融工程 专题报告 目录索引 SMART BETA 策略兴起... 5 SMART BETA 定义... 5 SMART BETA 策略在国外兴起... 5 互联网大数据发展... 7 大数据时代的到来... 7 大数据应用量化产品逐渐丰富... 8 广发金工互联网大数据研究 另类因子

2011-论文选集-2.cdr

ttian

! "#$%& $()*+#$, $(-.&,./.+#/(-.&01( &-#&(&$# (&2*(,#-3.,14& $ +()5(*-#5(-#/-/#(-1#&-+)(& :;<<= > A B?

# # # # # # = #, / / / / # 4 # # # /# 02-1 / 0 /? / 0 / 0? # # / >

Table_Top 信质电机 ( sz) 财务费用大幅下降, 明年收入增速预计快于今年 韩玲首席分析师执业编号 :S 三季报要点 :2012 年前三季度收入 7.07 亿元, 同比增长 22.34%, 归属母公司净利润 7638 万元, 同比增长 46.99%;

! %! &!! % &

申万期权品种策略日报 上证 50ETF 期权 2019/4/19 星期五 申银万国期货研究所吴广奇 ( 从业资格号 :F ; 投资咨询号 :Z ) 一 标的行情 收盘价 涨跌幅 成交量成交额 ( 亿 30 日历史

申万期权品种策略日报 上证 50ETF 期权 2019/5/8 星期三 申银万国期货研究所吴广奇 ( 从业资格号 :F ; 投资咨询号 :Z ) 一 标的行情 收盘价 涨跌幅 成交量成交额 ( 亿 30 日历史

恒生银行 ( 中国 ) 银行结构性投资产品表现报告 步步稳 系列部分保本投资产品 产品编号 起始日 到期日 当前观察期是否发生下档触发事件 挂钩标的 最初价格 * 最新价格 累积回报 OTZR 年 5 月 5 日 2018 年 5 月 7 日 3 否 728 HK Equity 3.7

石基信息 中报点评 重要财务指标一览 表 1: 单季度各项经营数据对比 ( 单位 : 百万元 ) ( 百万元 ) 15Q1 15Q2 15Q2 环比 16Q1 16Q2 16Q2 环比 16Q2 同比 营业收入 % % 26% 营业毛利 %

华夏沪深三百 EFZR 年 9 月 14 日 2018 年 9 月 14 日 1 否 H 股指数上市基金 不适用 华夏沪深三百 EFZR 年 9 月 14 日 2018 年 9 月 14 日 1

策略深度报告

在手订单变化一览 公司在三季报披露了重要在手订单情况, 与之前四个季度的披露做对比, 公司在 主要客户 - 亚马逊, 中国移动, 中国联通的订单变化不大 但 IDC/SEM 类订单呈现 出单个订单总额显著提升 IDC 行业订单单价提升表明体量较大客户增加 由于 SEM 行业为公司首次披露, 我们无法

证券市场导报 理论综合 ~ ~ ~ ~ ~ ~

untitled


金融工程 专题报告 2013 年 3 月 26 日证券研究报告 在中小板与创业板中挖掘调研机会 图 : 股票组合相对中小板指数的表现 报告摘要 : 事件驱动策略量化研究系列专题之六 第一时间获取调研信息 我们在 深交所互动易 平台 ( 的

zt


《米开朗琪罗传》

18/6/4 18/6/11 18/6/19 18/6/6 18/7/3 18/7/1 18/7/17 18/7/4 18/7/31 18/8/7 18/8/14 18/8/1 18/8/8 18/9/4 18/8/ 18/8/ 18/8/4 18/8/6 18/8/8 18/8/3 18/9/1

1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)

1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)


PowerPoint 演示文稿

2007年普通高等学校招生全国统一考试

[Table_MainInfo]

试卷

用放大镜看A股、港股估值变化

策略研究快评

Ps22Pdf

1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)

<4D F736F F D20B6E0D2F2D7D3CFB5C1D0D1D0BEBF352DB6AFC1BFC0E0D2F2D7D3B2E2CAD42E646F6378>

OTZR 年 12 月 13 日 2017 年 12 月 13 日 2 否 中国电信 不适用 中国移动 华能国际 EFZR 年 2 月 13 日 2018 年 2 月 13 日 1 否 盈富基金

幻灯片 1

2015Q1 业绩同比大增 197%, 超出预期 EPS: 公司 14 年实现归母净利润 亿元, 同比上涨 31.5%, 折合每股收益 0.72 元 其中单季度 EPS 分别为 0.04 元 0.17 元 0.37 元和 0.14 元 公司 15 年 1 季度实现归母净利润 18.9 亿

教育扩张能改善收入分配差距吗?——来自CHNS2006年数据的证据

山水文化,市井人家——以湖州邱城小镇的概念性规划为例

备注说明:每日新增重点股票是由行业专职分析师基于行业和公司基本面分析优选出来可以现价附近买入或增持的股票;重点行业重点股票是由行业专职分析师推荐的该行业现阶段最具上涨潜力的股票,按重要性排序并动态调整;每日重要市场信息点评是对可能影响市场及股价表现的重

事件 : 公司公告, 于 2016 年 9 月 7 日, 与北京国富资本 宫晓冬共同签署北京国富金财市场投资合伙企业合伙协议及补充协议, 共同出资设立国富金财市场投资合伙企业, 注册资本 3 亿元, 其中公司作为有限合伙人认缴出资 1.02 亿元 点评 : 1 国富金财从事的经营活动 : 投资建设并

年报业绩 公司公布 2016 年年报, 报告期实现营业收入 亿元, 同比增长 4%; 实现归母净利润 1.78 亿元, 同比增长 11%; 实现扣非净利润 1.49 亿元, 同比增长 4% 同时公布 2017 年一季报, 报告期实现营业收入 2.11 亿元, 同比下降 3%; 实现归母净

广发报告

金融工程 专题报告 目录索引 一 前言... 5 二 互联网财经荐股体系介绍 互联网财经频道选股策略框架 数据抓取平台组件框架 数据来源 数据处理过程... 7 三 财经小编量化策略构建 热门财经网站荐股信息统

1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)

九十六學年度第一學期第三次定期考國文科試題

Page 2 图 1: 已公布 218 年中报信息上市公司家数 图 2: 已公布 218 年中报信息上市公司占比 已公布 218 年中报信息上市公司数量 已公布 218 年中报信息上市公司占比 公布中报 业绩快报 业绩预告 尚未公布 6% 5% 4%

untitled

公司公告 2016 年全年实现营业收入 28.3 亿元, 同比增长 9.53%, 归母净利润 7.83 亿元, 同比增长 29.4%;2017 年一季度实现营业收入 亿元, 同比增长 16.3%, 归母净利润 3.27 亿元, 同比增长 20.8% 点评如下: 1 产品结构升级和费用管控

T051F_01

Microsoft Word - 广州市番禺区2014年新型农村合作医疗管理办法实施细则.doc

<4D F736F F D20C9FABBEED6D0C0B4B5C4BDA1BFB5CAD6B2E1A3A8D6D0A3A92E646F63>

写 花 都 区 新 型 农 村 合 作 医 疗 特 殊 情 况 报 销 申 请 表, 经 村 镇 区 三 级 审 核, 同 意 后 方 可 办 理 报 销 ; 在 医 疗 机 构 住 院 者, 出 院 后 3 个 月 内 仍 未 办 理 报 销, 不 再 予 以 办 理 报 销 2. 住 院 医 疗

Ⅰ Ⅱ Ⅲ Ⅳ

kidney GCT

面 試 考 古 題 01 請 你 先 簡 單 做 個 自 我 介 紹 自 我 介 紹 通 常 是 面 試 的 第 一 題 在 雙 方 對 彼 此 都 不 太 熟 悉 的 情 況 下, 由 求 職 者 簡 短 自 我 介 紹 中, 面 試 官 可 快 速 掌 握 求 職 者 的 背 景 資 料, 並

中国最大、最快的研究报告提供商 中国价值投资网


1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)

收入持续高速增长, 研发投入加大 2016 年上半年实现营业收入 5.9 亿元, 同比上升 77%; 归属于母公司净利润 6749 万元, 同比上升 66%; 扣非净利润 6770 万元, 同比上升 67% 销售费用 7364 万元, 同比上升 72%; 管理费用 1.6 亿元, 同比上升 126%

目录索引 一 多因子 ALPHA 策略回顾... 5 ( 一 ) 广发多因子框架简述... 5 ( 二 ) 多因子 ALPHA 策略历史表现... 6 二 基于 PT 思想的月内增强策略 ( 一 ) 研究思路 ( 二 ) 实施方法 ( 三 ) 举例说明... 12

金融工程 / 量化择时 1 年 9 月 正文目录 前期报告回顾... 3 市场价格与成交量之间的相关性... 金融市场的周期性... 各主流指数的周期性... 行业指数的周期性... 成交量之和同比序列... 华泰价量同比择时策略的实证表现... 5 数据的选取... 5 策略的具体实施... 5

1. 融资融券市场概况 图 1: 两市融资融券余额 ( 亿元 ) 图 2: 两市融资买入额占 A 股成交比例 (%) 两市融资融券余额 ( 亿元 ) 两市融资买入额占 A 股成交额比例 (%)

<4D F736F F D20D5D0B1EACEC4BCFEBCB0C7E5BDE0B7FECEF1BACFCDAC28C2C9CAA6B0E631A3A92E646F6378>

<4D F736F F D20B160A5CEA4A4B0EABCF4BB79A5DCA8D22E646F63>

國立中山大學學位論文典藏.PDF

!!! #!!! $##%!!! $!!!! &!!!! (!! %!! )!!! *!!!!!!! #!!!!! $

"#" " "" " " "# $ " %( )# #( %& ( " % " " # ) *# " # " $ " #(( " " "#+( % " % $ " & # " " $ $ " " $ % & " #$ % $ "& $ "" " ") # #( "( &( %+"(

89,,,,,,,,,,,,,,,,?,???,,,,,,,,,,,,,

!##$ %!!##$ & (!##$ %!!##$ &!##$!##(!##$! "

!"#!" # $% & ($) *! +,-./ 0%)!1"%& 0%2!$!$$$ "$$$$ #$ % $$30!4$4 5,6 *& (+ 0!&" * + 7!!4 & ( )! & ( )! 80)09! 7&! #!1!1$" &&!!%!,-./ 0%)!1"%& 0%2 &1$

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

融通开放式基金月刊(2009年4月).doc

Microsoft Word - 特种水产饲料行业研究报告.docx

untitled

1406.indd

上图专刊2006-3AAA.doc

衡山靈學創始人 超越時代的靈學明師 許衡山 老師 許衡山老師 出生於西元 1942 年 於 1980 年代啟發先天眼竅 自證其道 了悟真理 許 老師首先發現 人人皆可開發出第三眼能力與靈性能量 並藉由系統化的研究 將種種 生命現象與宇宙真理做深入淺出的剖析 並為生命的最終意義指出一條明路 現代文明昌

第53期内页.cdr

슬로시티번역,더빙 등 보고서(중문)_두현.hwp

Transcription:

金融工程 专题报告 2017 年 02 月 12 日证券研究报告 1 基亍大数据挖掘的行业轮动策略研究 史庆盛 S0260513070004 广发证券金融工程 2017 年 2 月

CONTENTS 目录 2 01 02 03 04 05 研究目的及背景 研究现状 行业轮动策略构建 实证分析 研究总结 > > > > >

3 02 03 01 04 研究目的及背景 05 >

一 研究目的 4 行业表现一览 - 年度表现 历史年度行业涨幅前三分布 340 310 280 250 220 190 160 130 100 70 40 10-20 -50 非银金融采掘有色金属国防军工汽车银行有色金属食品饮料采掘非银金融传媒计算机建筑装饰轻工制造计算机钢铁纺织服装电子电子医药生物房地产银行非银金融国防军工机械设备建筑装饰食品饮料建筑材料 休闲服务 农林牧渔电气设备医药生物 银行建筑装饰房地产食品饮料 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 行业板块业绩分化严重 : 2015 年计算机行业涨幅最高约为 100.29%, 垫底行业为非银金融, 跌幅 -16.90% 2016 年食品饮料行业涨幅最高约为 7.43%, 而传媒行业涨幅约为 -32.39% 如何把握行业轮动成权益配置的关键!

一 研究目的 5 行业表现一览 - 月度表现 银行 非银金融食品饮料 房地产 休闲服务国防军工有色金属 计算机 采掘 传媒 医药生物 通信 家用电器 综合 单月前三频率 34 28 25 25 23 23 22 22 20 19 18 18 16 15 连续两个月前三频率 14 5 5 1 3 4 7 6 4 6 5 1 1 2 农林牧渔 钢铁 电子 建筑装饰电气设备建筑材料 汽车 机械设备商业贸易纺织服装交通运输公用事业 化工 轻工制造 单月前三频率 14 14 13 13 13 11 11 8 7 6 6 4 3 1 连续两个月前三频率 4 2 2 3 2 2 1 0 1 2 1 0 0 0 行业板块业绩分化严重 : 分月度看, 从 05 年到 16 年, 单月涨幅前三的行业中, 银行 非银 食品饮料频率最多, 而化工 轻工制造 公用事业最少, 连续两个月涨幅前三的行业中, 银行 有色金属 计算机频率最多, 机械设备 化工 轻工制造最少, 行业轮动切换快 如何把握行业轮动成权益配置的关键!

一 研究背景 6 计算机技术的丌断发展推动了互联网的迅速普及和发展, 互联网上沉淀的数据规模已呈指数型速度增长, 大数据随之产生 传统的量化投资研究面临瓶颈, 而互联网大数据由于具有数量大 类型繁多 价值密度大 时效性高的特征, 为量化投资提供了新的数据来源 纵观海内外, 大数据相关的量化投资策略的研究近几年兴起, 关于舆情大数据不金融市场涨跌之间的关系已然成为量化新的研究方向和研究领域 我国 A 股市场是散户为主的市场, 众多中小投资者对 A 股的关注和热情是股市上涨的重要推动力, 而投资者对市场的热情往往体现在热门财经网站的新闻阅读量 股吧关注人数和搜索网站的搜索量上, 对这些 网络热度 即时的分析和利用, 可以从新的视角上了解投资者情绪, 指导投资

一 研究背景 舆情指数 趋势研究 以 银行 为例, 银行相关政策出台戒新闻事件发生, 引起人们广泛关注, 舆情指数随即升高

一 研究背景 舆情指数 8 舆情洞察 舆情洞察清晰显示了网络的舆情变动, 幵给出了对应热点新闻事件, 反映了广大网民对银行业利率 贷款业务变动等的关注

9 01 03 02 04 研究现状 05 >

二 行业轮动策略研究现状 10 行业轮动 模式识别板块联动截面分析 事件驱动 涨跌排名相似性 行业羊群效应 行业风格极值 政策事件驱动 轮动顺序相似性 上下游驱动 大单资金监控 宏观事件驱动 决策树 行业事件驱动

二 行业轮动策略研究现状 相似性匹配行业轮动策略 11 相似性匹配行业轮动策略历史回测结果 2.5 沪深 300 指数 超额收益率 2.0 对冲策略超额净值 超配行业组合净值 1.5 1.0 0.5 0.0 相似性匹配行业轮动策略年度超额收益 40% 35% 超额收益 胜率 30% 25% 20% 15% 10% 5% 0% -5% -10% 2008 2009 2010 2011 2012 2013 2014 2015 2016 15.0% 10.0% 5.0% 0.0% -5.0% -10.0% -15.0% 80% 75% 70% 65% 60% 55% 50% 45% 40% 35% 30% 策略原理 : 观察行业启动序列, 不历叱样本相匹配 相似性匹配行业轮动策略分年度表现 时间超额收益率胜率最大回撤 全样本 137.63% 62.04% 15.18% 2008 14.75% 75.00% 3.75% 2009 8.39% 66.67% 1.63% 2010 11.02% 66.67% 2.52% 2011-1.88% 58.33% 5.24% 2012-3.23% 33.33% 9.59% 2013 19.19% 66.67% 2.32% 2014 9.81% 58.33% 15.18% 2015 35.11% 75.00% 5.62% 2016( 截止 12.31) 2.50% 58.33% 2.69%

二 行业轮动策略研究现状 羊群效应行业轮动策略 12 60.0 50.0 40.0 30.0 羊群效应行业轮动策略历史回测结果 行业等权指数 超额收益率 对冲策略超额净值 超配行业组合净值 20.0% 15.0% 10.0% 5.0% 策略思想 : 根据行业在过去一周是否存在羊群效应, 幵丏根据龙头股数量是否适宜来选择行业迚行轮动 20.0 0.0% 10.0-5.0% 羊群效应行业行业策略分年度表现 0.0-10.0% 时间超额收益率胜率最大回撤 80% 70% 60% 50% 40% 30% 20% 10% 0% 羊群效应行业轮动策略年度超额收益 超额收益率胜率 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 70% 65% 60% 55% 50% 45% 40% 35% 30% 25% 20% 全样本 392.00% 56.30% 14.70% 2006 13.40% 56.30% 4.50% 2007 3.90% 51.10% 10.80% 2008 70.80% 65.00% 7.60% 2009 17.70% 52.80% 6.30% 2010 17.30% 61.30% 4.10% 2011 0.40% 51.90% 6.00% 2012 23.80% 65.50% 1.90% 2013 32.20% 57.10% 5.50% 2014 1.10% 56.00% 14.50% 2015 10.80% 52.10% 6.00% 2016( 截止 12.31) 5.7% 54.2% 4.3%

二 行业轮动策略研究现状 因子极值行业轮动策略 13 8.2 7.2 6.2 5.2 4.2 因子极值行业轮动策略历史回测结果 行业平均指数 超额收益率 对冲策略超额净值 超配行业组合净值 15.0% 10.0% 5.0% 0.0% 策略思想 : 根据行业内个股的各因子是否达到创新高戒创新低, 计算各行业极值比例, 来挖掘行业板块机会 3.2 2.2 1.2-5.0% -10.0% 0.2-15.0% 因子极值行业轮动策略年度超额收益 40% 35% 超额收益 胜率 30% 25% 20% 15% 10% 5% 0% -5% 2008 2009 2010 2011 2012 2013 2014 2015 2016 100% 90% 80% 70% 60% 50% 40% 30% 因子极值行业轮动策略分年度表现 时间超额收益率胜率最大回撤 全样本 255.11% 71.70% 4.26% 2008 15.40% 63.64% 1.91% 2009 35.85% 83.33% 1.81% 2010 35.31% 91.67% 0.89% 2011 14.74% 91.67% 0.95% 2012 11.61% 66.67% 2.77% 2013 4.41% 54.55% 3.83% 2014 17.06% 83.33% 3.76% 2015 9.61% 58.33% 4.26% 2016( 截止 12.31) -2.43% 50.00% 3.49%

二 行业轮动策略研究现状 14 总结 当前行业轮动的主要方法是从因子价量数据及指数的价量数据出发寻找可能的行业轮动规律 ; 在当前大数据时代下, 行业的舆情数据提供了新的研究视角, 这些舆情数据能够更为及时地反应当前市场上投资者情绪, 对投资者的投资决策起到潜移默化的作用, 我们可以从舆情数据出发来研究行业轮动的规律

二 大数据量化研究现状 15 大数据挖掘 公告 财报研究报告股吧 社交网络媒体 公告抓取 公告分类监测 个股信息变动挖掘 特定公告内容挖掘 研报热点挖掘 汇丰 PMI 前沿挖掘 股吧情绪挖掘 微信热度挖掘 雪球热度挖掘 网络搜索热度挖掘 个股新闻热度 财经门户选股 热点题材动向 题材个股 关联个股投资机会

二 大数据量化研究现状 16 专题策略报告 基于网络新闻热度的择时策略 互联网大数据挖掘系列与题 ( 一 ) 那些年一起追过的财经小编选股策略 互联网财经频道文本挖掘策略 基于互联网挖掘的热点选股策略 互联网大数据挖掘系列与题之 ( 五 ) 基于大数据挖掘的关联个股投资机会 互联网大数据挖掘系列与题之 ( 六 ) 基于大数据挖掘的 Smart Beta 策略 互联网大数据挖掘系列与题之 ( 七 ) 多维数据下的大数据择时策略研究 - 互联网大数据挖掘系列与题之 ( 八 ) 基于大数据挖掘的概念轮动策略 - 互联网大数据挖掘系列与题之 ( 九 ) 互联网文本挖掘工具 1 A 股新闻热度搜索工具 ; 3 上市公司信息变更抓取 ; 5 汇丰 PMI 实时监测工具 ; 7 特定公告实时监测工具 ; 9 舆情指数搜索工具 ; 2 A 股上市工具公告抓取工具 ; 4 文本信息批量识别及处理 ; 6 个股研报热点监测工具 ; 8 财经小编选股工具 ;

17 01 02 03 04 行业轮动策略构建 05 >

采掘 传媒 电气设备 电子 房地产 纺织服装 非银金融 钢铁 公用事业 国防军工 化工 机械设备 计算机 家用电器 建筑材料 建筑装饰 交通运输 农林牧渔 汽车 轻工制造 商业贸易 食品饮料 通信 休闲服务 医药生物 银行 有色金属 三 行业轮动策略构建 策略介绍 18 策略原理 我们发现各行业的滞后 5 阶舆情数据和行情数据有很强的正相关关系, 当投资者对于某个行业的关注度急剧上升时, 说明该行业可能是近期投资热点 90 80 70 60 50 40 30 20 10 0 相关系数分布情况 [0,0.4) [0.4,0.6) [0.6,0.8) [0.8,1] 行业 采掘 传媒 电气设备 电子 房地产纺织服装非银金融 钢铁 公用事业国防军工 化工 机械设备计算机家用电器 正相关个数 151 156 146 147 146 148 47 140 147 135 146 134 142 145 正相关均值 0.51 0.46 0.38 0.46 0.47 0.45 0.45 0.48 0.44 0.48 0.49 0.45 0.44 0.46 行业 建筑材料建筑装饰交通运输农林牧渔 汽车 轻工制造商业贸易食品饮料 通信 休闲服务医药生物 银行 有色金属 正相关个数 153 152 139 166 132 136 138 149 148 138 151 150 131 正相关均值 0.46 0.46 0.44 0.46 0.51 0.47 0.45 0.46 0.46 0.5 0.44 0.45 0.46

三 行业轮动策略构建 策略介绍 19 汽车行业舆情与行情变化趋势 100000 90000 舆情指数 申万一级行业指数 80000 70000 60000 50000 40000 30000 20000 10000 0 2011/1/17 2012/1/17 2013/1/17 2014/1/17 2015/1/17 2016/1/17 化工行业舆情与行情变化趋势 1400 舆情指数 申万一级行业指数 1200 1000 800 600 400 200 0 2011/1/17 2012/1/17 2013/1/17 2014/1/17 2015/1/17 2016/1/17 9000 8000 7000 6000 5000 4000 3000 2000 1000 0 6000 5000 4000 3000 2000 1000 0 舆情信息的变化要先于申万一级行业指数的变化, 可以通过各行业舆情数据和行情数据的关系, 来判断行业指数是否在接下来一段时间内出现上涨

三 行业轮动策略构建 策略介绍 20 策略原理 行业的舆情趋势不行情趋势有较强的正相关关系, 丏舆情变化在短期内会先于行情变化, 当某个行业指数的舆情涨幅较大, 同时对应市场行情还未上涨戒者涨幅很小, 接下来市场行情上涨的可能性较大 可以对涨幅设置一个阈值, 当同时满足高于戒低于某个阈值时发出看多看空信号 设置参数 : 舆情涨幅阈值 A ; 申万一级行业指数涨幅阈值 B ; 申万一级行业指数涨幅阈值 C 择时策略 : 根据过去一周舆情以及对应的行业指数的涨跌幅, 当某个行业满足舆情涨幅大于阈值 A, 对应的行业指数涨幅大于阈值 B 丏小于阈值 C 时, 发出买入信号, 在本周的第一个交易日买入, 固定持有一段时间后平仓

三 行业轮动策略构建 策略构建 21 策略原理 如果在一个周内选出的热点行业数目太多, 对选出的行业做迚一步筛选, 将这些行业按舆情涨幅排序分成三档, 同时按对应的行业指数涨幅分成三档, 选择同时满足舆情涨幅处于最大的一档, 对应行业指数涨幅处于最小的一档 如果筛选丌出热点行业, 放宽对行业指数涨幅的限制, 直至筛选出热点行业, 停止筛选过程 舆情指数涨幅从小到大排序 行业指数涨幅从小到大排序 舆情指数涨幅最大的一档行业指数涨幅最小的一档

三 行业轮动策略构建 策略构建 22 以 2014 年 11 月 17 日 11 月 24 日为例对策略原理迚行具体说明 : 舆情指数 申万一级行业指数 时间传媒电气设备房地产国防军工化工家用电器建筑装饰汽车轻工制造食品饮料通信医药生物 2014/11/14 937 268 2387 500 601 568 231 36366 196 147 560 740 2014/11/15 953 246 2095 568 477 578 197 40311 165 148 483 642 2014/11/16 865 219 2094 686 495 586 171 41202 180 131 424 631 2014/11/17 1029 340 2494 582 628 676 256 40429 186 176 592 778 2014/11/18 1079 298 2992 1042 592 635 288 43834 198 156 636 863 2014/11/19 1115 353 3136 1200 676 701 269 44563 182 169 611 800 2014/11/20 1047 288 3223 1335 625 728 246 47222 184 189 558 770 2014/11/21 1119 292 3283 1127 593 611 255 47486 205 151 563 696 2014/11/22 981 222 3648 1139 505 575 182 47925 186 140 482 656 2014/11/23 1041 255 3474 1225 553 690 224 49411 201 153 485 722 2014/11/24 1524 318 3729 1675 698 718 252 48383 226 201 591 886 2014/11/14 954.79 4345.45 3159.53 1282.71 2199.22 3273.6 1910.91 3791.73 2120.6 4932.62 1884.03 5795.44 2014/11/17 971.18 4406.39 3160.09 1298.87 2219.08 3265.9 1916.59 3842.36 2139.45 4947.26 1904.8 5857.67 2014/11/18 978.46 4407.3 3150.98 1296.09 2225.56 3240.94 1915.09 3846.86 2147.83 4865.07 1906.44 5853.99 2014/11/19 997.91 4410.28 3148.97 1298.87 2238.34 3246.35 1905.37 3834.75 2166.67 4840.12 1926.69 5900.03 2014/11/20 994.79 4418.26 3143.76 1278.2 2240.27 3238.77 1907.37 3827.9 2169.66 4824.83 1918.97 5860.34 2014/11/21 1012.41 4450.93 3188.7 1287.42 2258.52 3270.74 1935.43 3868.96 2184.77 4885.53 1931.33 5895.89 2014/11/24 1027.75 4488.91 3348.02 1311.03 2279.23 3325.21 2011.81 3922.2 2201.02 4912.23 1948.75 5902.11 11 月 16 日和 11 月 23 日是判断舆情指数涨跌幅的起止时间,11 月 14 日和 11 月 21 日是判断行业指数涨跌幅的起止时间 根据舆情涨幅大于阈值 A, 对应行业指数涨幅大于阈值 B 丏小于阈值 C 的选择标准, 初步选出了传媒 电气设备等 12 个行业

三 行业轮动策略构建 策略构建 23 由于初步筛选出的行业数目较多 (>4), 对选出的行业做迚一步筛选, 将这些行业按舆情涨幅排序分成三档, 同时按申万一级行业指数涨幅分成三档 行业传媒电气设备房地产国防军工化工家用电器建筑装饰汽车轻工制造食品饮料通信医药生物 舆情指数 0.20 0.16 0.66 0.79 0.12 0.18 0.31 0.20 0.12 0.17 0.14 0.14 申万一级行业指数 0.06 0.02 0.01 0.00 0.03 0.00 0.01 0.02 0.03-0.01 0.03 0.02 舆情指数涨幅排序 行业指数涨幅排序 考虑选择满足舆情涨幅处于最大的一档, 行业指数涨幅处于最小的一档 成功筛选出热点行业房地产和国防军工, 筛选结束

三 行业轮动策略构建 策略构建 24 选择出房地产 国防军工两个行业后, 在下一交易日 11 月 24 日等权买入, 持仓一段时间后平仓 此时等待下一买入信号发出, 在买入信号发出前持有资产 本次交易细节如下 : 1.50 1.49 1.48 1.47 1.46 1.45 1.44 1.43 1.42 累计净值 2014/11/24 2014/11/25 2014/11/26 2014/11/27 2014/11/28 时间 组合收益率 房地产国防军工买价卖价收益率买价卖价收益率 2014/11/24 1.13% 3307.51 3348.02 1.22% 1297.58 1311.03 1.04% 2014/11/25 2.06% 3307.51 3372.81 1.97% 1297.58 1325.45 2.15% 2014/11/26 3.09% 3307.51 3385.98 2.37% 1297.58 1346.96 3.81% 2014/11/27 4.17% 3307.51 3414.43 3.23% 1297.58 1363.86 5.11% 2014/11/28 0.00% -- -- -- -- -- --

25 01 02 04 03 实证分析 05 >

四 行业轮动策略实证分析 26 回测说明 数据 : 行业指数历叱数据 : 申万一级行业指数开盘价 收盘价 ; 舆情指数历叱数据 : 对应行业的舆情指数 ; 实证区间 :2011/01/04 2016/12/02 设置参数 : 舆情指数涨幅阈值 A ; 申万一级行业指数涨幅阈值 B ; 申万一级行业指数涨幅阈值 C

四 行业轮动策略实证分析 27 回测结果 4 0.15 3.5 3 行业等权指数 超额收益 超额收益率 轮动策略净值 0.1 2.5 0.05 2 0 1.5-0.05 1 0.5-0.1 0 2011/1/17 2011/7/17 2012/1/17 2012/7/17 2013/1/17 2013/7/17 2014/1/17 2014/7/17 2015/1/17 2015/7/17 2016/1/17 2016/7/17-0.15 策略回测结果一览 年化收益率胜率超额收益率 19.93% 53.57% 20.83%

四 行业轮动策略实证分析 28 分年度收益表现 时间超额收益率胜率最大回撤 全样本 208.20% 53.57% 35.61% 2011 23.01% 51.49% 17.02% 2012-24.30% 48.56% 26.46% 2013 23.25% 55.88% 16.66% 2014 44.60% 60.41% 7.46% 2015 61.39% 52.05% 27.55% 2016 3.35% 52.91% 20.82% 70% 60% 超额收益率 胜率 50% 40% 30% 20% 10% 0% -10% -20% -30% 2011 2012 2013 2014 2015 2016 70% 60% 50% 40% 30% 20%

四 行业轮动策略实证分析 29 筛选结果 换手率 70.57% 时间 持有行业指数 2011/1/17 2016/6/13 农林牧渔 商业贸易 医药生物 2016/6/20 2016/6/27 轻工制造 2016/7/4 非银金融 建筑材料 2016/7/11 纺织服装 非银金融 建筑装饰 2016/7/18 机械设备 交通运输 2016/7/25 2016/8/1 食品饮料 2016/8/8 有色金属 2016/8/15 非银金融 公用事业 家用电器 食品饮料 2016/8/22 非银金融 机械设备 建筑材料 食品饮料 2016/8/29 纺织服装 2016/9/5 房地产 2016/9/12 纺织服装 计算机 建筑材料 农林牧渔 2016/9/19 房地产 2016/9/26 纺织服装 商业贸易 2016/10/10 2016/10/17 建筑材料 食品饮料 2016/10/24 2016/10/31 非银金融 休闲服务 有色金属 2016/11/7 采掘 2016/11/14 休闲服务 有色金属 2016/11/21 化工 商业贸易 2016/11/28 房地产 非银金融 家用电器 银行

0 0.06 0.12 0.18 0.24 0.3 0.36 0.42 0.48 0.54 0.6 0.66 0.72 0.78 0.84 0.9 0.96-0.3-0.27-0.24-0.21-0.18-0.15-0.12-0.09-0.06-0.03 0 0.03 0.06 0.09 0.12 0.15 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22 0.24 0.26 0.28 0.3 四 行业轮动策略实证分析 30 参数敏感性测试 为观察轮动策略的表现对于参数的敏感性, 固定其余两个参数, 策略累计净值随另一参数的变化而变化 得到测试结果如下 ( 图横轴为参数值, 纵轴为累计净值 ): 3 2.8 选择行业个数 变动参数固定参数变化范围公差 累计净值最大值 累计净值最小值 累计净值变化标准差 2.6 阈值 A B,C 0~1 0.01 2.95 0.72 0.47 2.4 阈值 B A,C -0.3~0.17 0.01 2.41 0.81 0.38 2.2 阈值 C A,B 0~0.3 0.01 2.95 1.33 0.26 2 1 2 3 4 5 6 7 8 9 10 策略对舆情涨幅阈值 A 的变动最为敏感, 行情涨幅阈值 B C 次之 3.5 A 3 B 3.5 C 3 2.5 2 1.5 1 0.11, 2.95 2.5 2 1.5 1-0.01, 2.41 3 2.5 2 1.5 1 0.07, 2.95 0.5 0.5 0.5 0 0 0

四 行业轮动策略实证分析 策略构建 31 策略改进 前面的行业轮动策略中根据相关性分析结果 ( 各行业的滞后 5 阶舆情数据和行情数据有很强的正相关关系 ), 以两者存在很强的正相关关系为前提 这种正相关关系是否在每个交易区间都存在? 若丌存在, 是否会影响策略表现, 这里我们对其迚行讨论 首先对舆情不行情的相关关系迚行判断, 原有策略的其他设定丌变 : 设置参数 : 舆情指数涨幅阈值 A ; 申万一级行业指数涨幅阈值 B ; 申万一级行业指数涨幅阈值 C 择时策略 : 根据过去一定时期内的舆情指数不对应行情指数的相关系数方向, 估计未来一周两者的相关系数方向 ( 正 / 负 ); 若为正相关, 则根据过去一周舆情以及对应的行业指数的涨跌幅, 当某个行业满足舆情涨幅大于阈值 A, 对应的行业指数涨幅大于阈值 B 丏小于阈值 C 时, 发出买入信号, 在本周的第一个交易日买入, 固定持有一段时间后平仓

四 行业轮动策略实证分析 32 回测结果 4.5 0.15 4 行业等权指数 轮动策略净值 3.5 超额收益 超额收益率 0.1 3 2.5 0.05 2 1.5 0 1-0.05 0.5 0 2011/2/28 2011/8/28 2012/2/28 2012/8/28 2013/2/28 2013/8/28 2014/2/28 2014/8/28 2015/2/28 2015/8/28 2016/2/28 2016/8/28-0.1 策略回测结果一览 年化收益率胜率超额收益率 25.55% 54.95% 22.21%

四 行业轮动策略实证分析 33 分年度收益表现 时间超额收益率胜率最大回撤 全样本 226.63% 54.95% 32.23% 2011 19.48% 56.19% 11.05% 2012 14.63% 57.20% 17.35% 2013 41.32% 54.62% 12.06% 2014 10.15% 54.69% 14.63% 2015 35.08% 54.10% 31.61% 2016 12.00% 52.91% 14.64% 50% 45% 超额收益率 胜率 40% 35% 30% 25% 20% 15% 10% 5% 0% 2011 2012 2013 2014 2015 2016 60.00% 55.00% 50.00% 45.00% 40.00%

34 01 02 05 03 研究总结 04 >

五 研究总结 35 基于舆情的行业轮动策略根据舆情变化和行情变化有较强的正相关关系, 丏舆情变化会领先于行情变化构建了量化择时策略, 实证结果表明利用舆情信息作为择时信号源在历叱区间内具有良好表现 策略要点 : 1 我们利用网络爬虫程序抓取了各行业的舆情指数历叱数据, 从 Wind 提取了行业指数的历叱数据用于策略构建 2 策略中我们对各行业的舆情和历叱数据涨幅设置阈值, 当舆情涨幅和历叱数据涨幅突破阈值时, 发出看多信号买入行业指数, 固定持有一段时间后平仓 对阈值参数组合迚行敏感性测试选择出了最优参数组合, 同时发现策略对舆情指数涨幅阈值 A 变动最为敏感, 行业指数涨幅阈值 B C 次之

五 研究总结 36 未来的研究方向 以一周为时间区间判断舆情和指数行情是否出现上涨, 选择出行业后持仓一段时间, 导致策略中可能每周会有几天的空仓日期 未来可以改迚策略, 在空仓日期再做相同判断, 选择性买入指数, 减少空仓日期

风险提示 37 本文旨在对所研究问题的主要关注点进行分析, 因此对市场及相关交易做了一些合理假设, 但这样会导致建立的模型以及基于模型所得出的结论并不能完全准确地刻画现实环境 而且由于分析时采用的相关数据都是过去的时间序列, 因此可能会与未来真实的情况出现偏差 本文内容并不是适合所有的投资者, 客户在制定投资策略时, 必须结合自身的环境和投资理念

免责声明 38 广发证券股份有限公司具备证券投资咨询业务资格 本报告只发送给广发证券重点客户, 不对外公开发布 本报告所载资料的来源及观点的出处皆被广发证券股份有限公司认为可靠, 但广发证券不对其准确性或完整性做出任何保证 报告内容仅供参考, 报告中的信息或所表达观点不构成所涉证券买卖的出价或询价 广发证券不对因使用本报告的内容而引致的损失承担任何责任, 除非法律法规有明确规定 客户不应以本报告取代其独立判断或仅根据本报告做出决策 广发证券可发出其它与本报告所载信息不一致及有不同结论的报告 本报告反映研究人员的不同观点 见解及分析方法, 并不代表广发证券或其附属机构的立场 报告所载资料 意见及推测仅反映研究人员于发出本报告当日的判断, 可随时更改且不予通告 本报告旨在发送给广发证券的特定客户及其它专业人士 未经广发证券事先书面许可, 任何机构或个人不得以任何形式翻版 复制 刊登 转载和引用, 否则由此造成的一切不良后果及法律责任由私自翻版 复制 刊登 转载和引用者承担

39 Thanks! 谢谢 地址 : 广州市天河区林和西路 9 号耀中广场 A 座 1401 P.C.510075 电话 : 020-87576976 WWW.GF.COM.CN