本报告仅供 : 新财富丁晓峰使用, 已记录日志请勿传阅 218 年 4 月 9 日证券研究报告 基于网络舆情的指数轮动策略研究 上证 5 与中证 5 轮动表现 互联网大数据挖掘系列专题之 ( 十二 ) 报告摘要 : 互联网大数据与量化投资身处大数据时代, 我们所面对的数据的维度在不断增加 传统的量化投资模型基于财务报表及市场价量信息构建因子, 信息来源相似性较高导致模型趋同 交易拥堵 在互联网中, 非传统金融数据 ( 如舆情 搜索量 语文文本 ) 不断积累, 这其中就包括许多对投资有用的信息 互联网舆情数据可预测性分析相较于传统的金融数据, 互联网舆情数据可以及时地描述投资者的情绪面 众多数据源中, 舆情搜索指数反映了众多投资者对某类信息的关注情况, 本文将众多投资者对大小盘的舆情搜索情绪作为投资者情绪的直接代理变量, 以此来研究大小盘风格轮动与舆情变化的强弱之间的关系 投资者情绪随着大小盘风格的变化而波动, 同时也反过来影响了大小盘风格的变化 基于网络舆情的指数轮动策略表现本报告基于网络舆情数据构建指数轮动策略 基于舆情变化的指数轮动策略根据舆情变化和行情变化有较强的正相关关系, 且舆情变化会领先于行情变化构建了量化择时策略, 实证结果表明利用舆情信息作为择时信号源在历史区间内具有良好表现 在上证 5 与中证 5 指数的轮动策略中, 在实证区间内, 策略的年化收益率为 29.35%, 信息比率为 1.8 沪深 3 与中证 5 轮动中, 在实证区间内 策略的年化收益率为 15.84%, 信息比率为 1.48 核心假设风险 : 本文所做的数据测算完全基于过去数据的推演, 市场未来环境可能发生变化 投资者制定投资策略时, 必须结合市场环境和自身投资理念 沪深 3 与中证 5 轮动表现分析师 : 陈原文,S2651783 755-8279757 chenyuanwen@gf.com.cn 相关研究 : 基于舆情的大类资产配置模 型 - 互联网大数据挖掘系列专题 217-6-3 之 ( 十一 ) 基于大数据挖掘的行业轮动 策略 - 互联网大数据挖掘系列专 217-3-15 题之 ( 十 ) 基于大数据挖掘的概念轮动 策略 - 互联网大数据挖掘系列专 216-5-17 题之 ( 九 ) 多维数据系的大数据择时策 略研究 - 互联网大数据挖掘系列 216-5-17 专题之 ( 八 ) 1 / 19
目录 一 互联网大数据挖掘体系介绍... 4 互联网大数据与量化投资... 4 互联网大数据抓取体系... 7 互联网大数据研究体系... 8 二 互联网舆情数据... 9 互联网舆情数据可预测性分析... 9 搜索引擎舆情指数... 9 三 指数轮动策略构建... 12 大小盘风格收益率变化与舆情变化... 12 基于舆情变化率的指数轮动策略... 13 四 总结... 18 五 风险提示... 18 2 / 19
图表索引 图 1:CAYMAN ATLANTIC 投资策略框架... 5 图 2:CAYMAN ATLANTIC 历史业绩表现... 5 图 3: 广发金工数据抓取体系... 7 图 4: 广发金工大数据挖掘策略框架... 8 图 5: 百度指数 : 某段时间 上证指数 的搜索热度... 1 图 6:36 趋势 : 某段时间 上证指数 的搜索热度... 1 图 7: 微指数 : 某段时间 上证 5 的搜索热度... 1 图 8: 谷歌趋势 : 某段时间 沪深 3 的搜索热度... 11 图 9: 上证 5 中证 5 指数收益率与舆情变化率趋势... 12 图 1: 沪深 3 中证 5 指数收益率与舆情变化率趋势... 12 图 11: 上证 5- 中证 5 前一日舆情变化率差与下一日收益率相关性走势... 13 图 12: 沪深 3- 中证 5 前一日舆情变化率差与下一日收益率相关性走势... 13 图 13: 基于舆情变化率的指数轮动策略框架... 14 图 14: 策略表现 --- 上证 5 与中证 5 轮动... 14 图 15: 策略表现 --- 上证 5 与中证 5 轮动 --- 策略整体表现分解... 15 图 16: 策略表现 --- 沪深 3 与中证 5 轮动... 16 图 17: 策略表现 --- 沪深 3 与中证 5 轮动 --- 策略整体表现分解... 17 表 1: 大数据指数一览... 5 表 2: 大数据基金一览... 6 表 3: 互联网挖掘小工具一览... 8 表 4: 舆情数据来源一览... 11 表 5: 上证 5 与中证 5 轮动分年度表现... 14 表 6: 上证 5 与中证 5 轮动策略整体表现分解... 15 表 7: 沪深 3 与中证 5 轮动分年度表现... 16 表 9: 沪深 3 与中证 5 轮动策略整体表现分解... 17 3 / 19
一 互联网大数据挖掘体系介绍 互联网大数据与量化投资 最早提出 大数据 时代到来的是全球知名咨询公司麦肯锡 麦肯锡称 : 数据, 已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素 人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈余浪潮的到来 身处大数据时代, 我们所面对的数据的维度在不断增加 除了传统新闻报道 日益火热的自媒体, 我们自身在与网络的交互活动, 也在不停的产生数据 浏览数据 点击数据 搜索数据 留言数据 这些原本零散的碎片数据, 综合起来就成为全新的数据源, 等待人们去挖掘其中的价值 以当当网购书活动为例, 用户接收到当当销售系统提供的书名 简介 价格 销售数量等信息, 与此同时, 当当网的系统也会记录下用户的身份信息 ( 如性别 年龄 学历 ) 以及用户的浏览记录, 进而基于这些数据向用户提供更加优质的服务 事实上, 大数据的应用范围常常超出人们的想象 例如, 针对手机信息的集体异常, 科学家可以立即推知某个地方正在发生地震 ; 通过微博上影迷的转发次数可以推知新电影未来的票房收入 那么, 互联网大数据与量化投资结合会擦出怎样的火花呢? 在投资领域中, 谁掌握的信息更快更准更全面, 谁就有竞争优势, 采用海量的大数据来指导投资将带来新的机遇 传统的量化投资模型基于财务报表及市场价量信息构建因子, 信息来源相似性较高导致模型趋同 交易拥堵 在互联网中, 非传统金融数据 ( 如舆情 搜索量 语文文本 ) 不断积累, 这其中就包括许多对投资有用的信息 21 年, 美国印弟安纳大学的计算机科学家 Johan Bollen 发现, 从海量 Twitter 信息中提取的情绪指标与道琼斯工业指数存在联运关系, 他的情绪分析包括六个维度 ( 冷静 警惕 确信 活力 友善 幸福 ), 其中, 滞后 3 天的 冷静 情绪指标与道琼斯工业指数显著一致, 即情绪指标对股市具备一定的预测能力 纵观海内外, 互联网大数据相关量化策略的研究已经成为量化投资的热门投资领域 211 年 5 月, 英国对冲基金 Derwent Capital Markets 建立了一个规模为 4 万美元的对冲基金, 通过即时关注分析 Twitter 上公众的情绪来指导投资 212 年, CAYMAN ATLANTIC 公司成立了一只基于网络社交媒体 Twitter 搜索引擎 Google 及其他新闻媒体数据指导交易的对冲基金 自 212 年 7 月至 215 年 12 月, CAYMAN ATLANTIC 的累计收益为 86.15%, 年化收益率达 19.43%, 在 42 个月中有 32 个月取得正收益, 月度胜率达 76.19%, 最大回撤仅为 1.49%, 该大数据基金在可控的风险下创造了较高的收益 最早的大数据指数产品是银河定投宝 (519677), 该基金成立于 214 年 3 月, 标的指数为中证腾安价值 1 指数 紧随其后的是广发 南方 博时三家基金公司 它们相继与百度 新浪 阿里巴巴合作开发大数据指数, 分别成立了广发百发 1 指数 A(826) 南方大数据 1 (1113) 南方大数据 3A(142) 和博时中证淘金大数据 1A (1242) 在国内, 首个大数据系列指数于 214 年 9 月 12 日诞生, 由南方基金 新浪财经和深圳证券信息公司三方联合编制的南方 - 新浪大数据 1 指数 大数据 3 指数在深交所挂牌上市 4 / 19
212/7/1 212/9/1 212/11/1 213/1/1 213/3/1 213/5/1 213/7/1 213/9/1 213/11/1 214/1/1 214/3/1 214/5/1 214/7/1 214/9/1 214/11/1 215/1/1 215/3/1 215/5/1 215/7/1 215/9/1 215/11/1 图 1:CAYMAN ATLANTIC 投资策略框架 抓取社交网络和新闻资讯数据 Keyword 过滤器 社交影响力过滤器 多人转发检测器与真实性检测器 指向多空的交易信号 数据来源 : 广发证券发展研究中心 图 2:CAYMAN ATLANTIC 历史业绩表现 6.% 5.% 4.% 3.% 2.% 1.%.% -1.% -2.% 月收益率净值 2. 1.8 1.6 1.4 1.2 1..8.6.4.2. 数据来源 : 广发证券发展研究中心,http://www.caymanatlantic.com/ 表 1: 大数据指数一览腾讯济安 I1 百发 1 淘金 1 银智 1 36 互联网 + 指数代码 847.SH 399415.SZ 851.SH H3537.CSI 93729.CSI 93734.CSI 指数基期 213/5/18 21/1/29 28/12/31 29/12/31 21/12/31 212/12/31 调整频率 半年 月度 月度 月度 月度 月度 指数基金 519677.OF 1113.OF 827.OF 1242.OF 2588.OF 2236.OF 成分股数量 1 1 1 1 1 1 股票权重 等权重 等权重 等权重 等权重 等权重 等权重 非 ST, 上市 1 年以 A 股样本空间上 中证全指 中证全指里的消费类 互联网 + 风格特点 价值风格 新浪大数据 百度大数据 淘宝, 偏消费 银联, 偏消费 36 大数据 5 / 19
表 2: 大数据基金一览基金名称 基金公司 基金成立日 基金类型 银河定投宝 银河基金 214-3-14 股票型基金 广发中证百发 1A 广发基金 214-1-3 股票型基金 广发中证百发 1E 广发基金 214-1-3 股票型基金 天弘云端生活优选 天弘基金 215-3-17 混合型基金 南方大数据 1A 南方基金 215-4-24 股票型基金 博时招财一号大数据 博时基金 215-4-29 混合型基金 博时淘金大数据 1I 博时基金 215-5-4 股票型基金 博时淘金大数据 1A 博时基金 215-5-4 股票型基金 南方大数据 3A 南方基金 215-6-24 股票型基金 南方大数据 3C 南方基金 215-6-24 股票型基金 东方红京东大数据 东方红资管 215-7-31 混合型基金 广发百发大数据 E 广发基金 215-9-14 混合型基金 广发百发大数据 A 广发基金 215-9-14 混合型基金 广发百发大数据策略成长 E 广发基金 215-11-18 混合型基金 广发百发大数据策略成长 A 广发基金 215-11-18 混合型基金 嘉实腾讯自选股大数据 嘉实基金 215-12-7 股票型基金 海富通东财大数据 海富通基金 216-1-29 混合型基金 大成互联网 + 大数据 A 大成基金 216-2-3 股票型基金 泰达宏利同顺大数据 A 泰达宏利基金 216-2-23 混合型基金 银华大数据 银华基金 216-4-7 混合型基金 博时银智大数据 1A 博时基金 216-5-2 股票型基金 东兴众智优选 东兴证券 216-6-13 混合型基金 博时招财二号大数据 博时基金 216-8-9 混合型基金 招商财经大数据策略 招商基金 216-11-2 股票型基金 浙商大数据智选消费 浙商基金 217-1-11 混合型基金 广发百发大数据策略价值 E 广发基金 217-6-16 混合型基金 广发百发大数据策略价值 A 广发基金 217-6-16 混合型基金 广发东财大数据精选 广发基金 217-12-11 混合型基金 易方达易百智能量化策略 A 易方达基金 218-1-24 混合型基金 易方达易百智能量化策略 C 易方达基金 218-1-24 混合型基金 6 / 19
互联网大数据抓取体系 图 3: 广发金工数据抓取体系 可视化配置 智能化配置 网页规则识别 获取网页抓取规则 获取反监控规则 异常规则 设置代理 IP 反监控管理 反监控规则 异常规则 恢复策略 分配调度服务器 抓取任务调度分发器 带优先级抓取消息 通用可扩展集群 抓取线程池 监控异常 调整反监控规则 常规抓取 临时抓取 连接池 监控系统 批量存储 数据来源 : 广发证券发展研究中心 在互联网数据挖掘方面, 广发金工搭建了完善的数据抓取平台 图 3 刻画了在大规模的互联网数据爬取过程中的整体框架, 对于单个网站的数据抓取框架可以简化成以下几个步骤 : 1) 首先对需要批量爬取信息的网页结构进行研究, 主要是研究需要提取的特定信息的网页格式进行研究, 这步骤可以借助在 IE 浏览器下打开需要提取信息的网页, 然后调用开发人员工具, 找到需要批量提取的特定信息的网页代码规则, 或者利用 Firefox 浏览器下的 XPATH 工具以及 View Source Chart 工具 ; 2) 找出不同个股的网页 url 之间的关系, 利用 url 之间的关系, 抓取所有个股的网页 url; 3) 由于网页抓取的数据量往往非常庞大, 出于效率的考虑, 往往采用分布式 多线程的方式进行, 若条件允许需要同时几十部甚至上百部电脑多个线程地抓取需要的内容 此时, 就需要一台主程序电脑控制其他电脑的程序运转 ; 在数据抓取过程中由于网络不稳定 电脑突然死机等问题, 需要对抓取的过程进行监控, 记录下每个进程运行的过程, 防止数据抓取的缺漏, 同时处于对网站安全的考虑, 需要实时监控程序的运行, 防止网络访问限制问题, 设置适当的断线重连机制,IP 切换机制等 ; 4) 对于抓取到的信息统一批量存储到指定的数据库中, 构成后续分析的底层的数据库 7 / 19
互联网大数据研究体系 图 4: 广发金工大数据挖掘策略框架 数据来源 : 广发证券发展研究中心在互联网数据研究方面, 广发金工研究了多个维度的互联网数据, 并取得了一系列的研究成果 对 A 股整个市场上历年上市公司公告进行挖掘, 具体可见 公告披露背后隐藏的投资机会 互联网大数据挖掘系列专题之二 ; 从股吧 个股的新闻热度 财经频道的荐股信息角度对文本信息进行挖掘, 具体可见 倾听股吧之声, 洞察大盘趋势 互联网大数据挖掘系列专题之三 基于网络新闻热度的择时策略 互联网大数据挖掘系列专题之一 那些年一起追过的财经小编选股策略 互联网财经频道文本挖掘策略 ; 从网络媒体角度对个股新闻信息进行挖掘, 具体可见 基于互联网挖掘的热点选股策略 互联网大数据挖掘系列专题之五 基于大数据挖掘的 Smart Beta 策略 互联网大数据挖掘系列专题之七 ; 从搜索引擎角度对网络舆情信息进行挖掘, 具体可见 基于舆情的资产配置模型 互联网大数据挖掘系列专题之十一 基于对大数据的研究积累, 广发金工也开发了一系列的互联网挖掘小工具, 包括上市公司公告抓取 研究报告抓取 搜索量抓取 关注度抓取等小工具 表 3: 互联网挖掘小工具一览 1 A 股新股热度搜索工具 2 A 股上市公司公告抓取工具 3 上市公司信息变更抓取 4 文本信息批量识别及处理 5 汇丰 PMI 实时监测工具 6 个股研报热点监测工具 7 特定公告实时监测工具 8 财经小编选股工具 9 舆情指数搜索工具数据来源 : 广发证券发展研究中心 8 / 19
二 互联网舆情数据 互联网舆情数据可预测性分析 现代金融市场理论通常假设市场上的每个投资者都是完全理性的, 然而, 现实中的金融市场并不支持这一强假设, 尤其在 A 股市场上, 个人投资者占比较高, 卖空存在限制, 股价异象繁生, 例如特殊时间段出现超额收益的日历效应 小市值股票更容易有超额收益的规模效应等 在这样的背景下, 行为金融学异军突起, 从人们的投资心理 行为特征等角度进行分析 如认知心理学认为投资者容易过度自信 盲目冲动 表现出 追逐热点的羊群效应 追涨杀跌 等现象, 可以看出, 投资者的情绪变化对股票价格有着不可忽视的影响 一般的基本面数据 宏观数据 资产行情数据在捕捉投资者的情绪变化方面显得力不从心 相比之下, 互联网舆情数据可以及时地描述投资者的情绪面 在信息技术和互联网平台日新月异的今天, 越来越多的投资者投入到互联网讨论的大军中, 尤其是中小投资者, 他们更加依赖于从网络来获取信息并做出投资决策, 并通过微博 股票论坛 股吧等网络社区来表达自己的投资观点 互联网舆情数据来源及范围非常广泛, 通过文本数据挖掘 情感分析 用户行为分析等方法可以得到不同维度的舆情数据, 如投资者对不同话题的关注度 投资者对不同事件的情感倾向 不同事件之间的相互关联等 在众多数据源中, 舆情搜索指数代表了人们对关键词的关注度情况, 本文将这种关注度作为投资者情绪的直接代理变量, 以此来研究大小盘风格轮动与舆情变化的强弱之间的关系 市场关注度舆情指数本身就是一种群体智慧, 携带了市场关注热点的信息 投资者情绪随着大小盘风格的变化而波动, 同时也反过来影响了大小盘风格的变化 当市场出现追逐大盘或者小盘风格时, 投资者关注度上升, 带来大盘或者小盘风格的上涨 上升的价格引来更多的关注度, 形成一种正反馈机制 而当投资者热度上升到一个高点时, 无法吸引更多的投资者, 之前的投资者开始撤出, 强势风格发生转向 所以通过对大小盘风格舆情相对强弱的变化趋势的分析, 可以去探究投资者关注度的变化情况, 从而对大小盘风格的变化进行预判 搜索引擎舆情指数 舆情指数是通过对网络中各种类型媒体所发布的信息进行独立的第三方观察, 形成量化统计和定性分析, 并结合算法推导 归纳总结而最终形成的一套网络舆情指数体系 其中, 以搜索引擎的搜索数据为基础构建的舆情指标包括百度指数 36 趋势 谷歌趋势等, 基于互联网信息平台的用户数据构建的舆情指标包括新浪微博微指数 微信指数等 据统计,218 年 2 月,Google 搜索以 91.63% 的全球市场份额遥遥领先于其他搜索引擎, 在国内, 百度搜索以 6.28% 的国内市场份额占据排行榜第一, 远远地超过排行榜第二的 36 搜索 (23.87%) 百度作为最大的中文搜索引擎, 在国内有着巨大的用户基数, 是数亿网民上网的流量入口 百度指数以网民在百度的搜索量作为数据基础, 以关键词为统计对象, 科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和 百度指数可以代表某段时间内, 人 9 / 19
们对某话题的关注程度, 即可以作为一个直接的舆情指标 图 5: 百度指数 : 某段时间 上证指数 的搜索热度 数据来源 : 广发证券发展研究中心 百度指数官网 图 6:36 趋势 : 某段时间 上证指数 的搜索热度 数据来源 : 广发证券发展研究中心 36 指数官网 图 7: 微指数 : 某段时间 上证 5 的搜索热度 数据来源 : 广发证券发展研究中心 微博指数官网 1 / 19
图 8: 谷歌趋势 : 某段时间 沪深 3 的搜索热度 数据来源 : 广发证券发展研究中心 表 4: 舆情数据来源一览指数 含义 功能模块 数据区间 上线时间 百度指数 以网民在百度的搜索量为数据基础, 以关键词趋势研究 需求图谱 为统计对象, 科学分析并计算出各个关键词在舆情洞察 人群画像百度网页搜索中搜索频次的加权和 211 至今 27.11 36 指数 以网民在 36 搜索的搜索量为数据基础, 计算走势分析 需求图谱 出各个关键词在 36 搜索网页搜索中搜索频次人群特征的加权和 213 至今 214.5 谷歌趋势 基于搜索日志分析的应用产品, 通过分析 Google 全球数以十亿计的搜索结果, 给出某一热度变化趋势 区域搜搜索关键词各个时间下在 Google 被搜索的频率索热度 相关主题查询 24 至今 26.5 和相关统计数据 微指数 新浪微博的数据分析工具, 通过关键词的热议热词趋势 实时趋势 度, 以及行业 / 类别的平均影响力, 来反映微博地域解读 属性分析舆情或账号的发展走势 216.3 至今 214.9 基于微信系统的大数据分析 可以帮助大家分 微信指数 析关键词在微信内的热度情况 数据分析情况限于微信搜素 公众号文章以及朋友圈的数据分析 热词趋势 最近 9 天 217.3 数据来源 : 广发证券发展研究中心 11 / 19
三 指数轮动策略构建 大小盘风格收益率变化与舆情变化 图 9: 上证 5 中证 5 指数收益率与舆情变化率趋势.1.8.6.4.2 -.2 -.4 -.6 -.8 -.1 上证 5- 中证 5 上证 5- 中证 5 舆情 ( 右轴 ) 8 7 6 5 4 3 2 1-1 -2 图 1: 沪深 3 中证 5 指数收益率与舆情变化率趋势.8.6.4.2 -.2 -.4 -.6 沪深 3- 中证 5 沪深 3- 中证 5 舆情 ( 右轴 ) 3 2 1-1 -2 通过比较指数舆情与指数收益率发现, 如图 9 图 1 所示, 舆情信息的变化要先于指数间收益率的变化, 可以通过大小盘风格的舆情数据和行情数据的关系, 来判断接下来一段时间内大小盘风格的强弱变化 本篇专题报告将指数间舆情变化率差与指数间收益率差做相关性分析, 如图 11 图 12 所示, 指数间舆情的变化率强弱变化与下一日指数收益率变化存在正相关关系 12 / 19
图 11: 上证 5- 中证 5 前一日舆情变化率差与下一日收益率相关性走势 1.8.6.4.2 -.2 -.4 -.6 -.8-1 上证 5 与中证 5 收益率变化与舆情变化相关性 相关性滚动平均 3 日 图 12: 沪深 3- 中证 5 前一日舆情变化率差与下一日收益率相关性走势 1.8.6.4.2 -.2 -.4 -.6 -.8-1 沪深 3 与中证 5 收益率变化与舆情变化相关性 相关性滚动平均 3 日 基于舆情变化率的指数轮动策略 大小盘风格指数舆情的相对强弱与对应的指数表现相对强弱存在正相关关系, 即, 当某个指数相对于另一指数的舆情热度上升时, 该指数可能在接下来的时间里可能跑赢另一指数 我们基于上述逻辑构建策略框架 选取沪深 3 指数, 上证 5 指数及中证 5 指数作为标的指数, 分别配对为 上证 5- 中证 5 与 沪深 3- 中证 5 以 上证 5- 中证 5 为例, 若当日上证 5 收益率大于中证 5 收益率, 且当日上证 5 情绪值相对前一日的变化率大于中证 5 情绪值相对前一日的变化率, 则在下一日开盘时做多上证 5, 做空中证 5; 若当日上证 5 收益率小于中证 5 收益率, 且当日上证 5 情绪值相对前一日的变化率小于中证 5 情绪值相对前一日的变化率, 则在下一日开盘时做空上证 5, 做多中证 5 13 / 19
图 13: 基于舆情变化率的指数轮动策略框架 数据来源 : 广发证券发展研究中心 接下来的部分将基于上述框架进行历史测算 回测区间为 211 年 1 月至 218 年 3 月, 每个交易日观察舆情的变化 在 上证 5- 中证 5 轮动中, 基于百度指数舆情的指数轮动策略表现如图 14 表 5 所示, 策略年化收益率达 29.35%, 信息比率为 1.8 在 211 至 217 年的 7 年中, 有 5 年的年化收益率超过 3%, 表现最差的年份的收益率为 1.9%, 回测期间的最大回撤为 -14.13% 策略整体表现分解如图 15 表 6 所示, 相对于动量策略, 舆情策略的年化收益率更高, 判断准确率更高, 最大回撤更小, 信息比率更高 图 14: 策略表现 --- 上证 5 与中证 5 轮动 7 6 5 4 3 2 1 表 5: 上证 5 与中证 5 轮动分年度表现累积收益率 最大回撤 年化波动率 年化收益率 信息比率 211 年 48.69% -7.67% 11.1% 5.66% 4.6 212 年 1.58% -7.15% 1.16% 1.9% 1.7 213 年 29.3% -8.78% 14.22% 3.99% 2.18 214 年 33.91% -11.26% 18.93% 34.71% 1.83 215 年 38.78% -14.13% 25.75% 39.9% 1.55 216 年 23.79% -6.82% 13.37% 24.44% 1.83 14 / 19
217 年 32.19% -8.5% 14.61% 33.1% 2.27 218 年 -5.42% -7.38% 17.82% -21.4% -1.18 All 511.5% -14.13% 16.31% 29.35% 1.8 图 15: 策略表现 --- 上证 5 与中证 5 轮动 --- 策略整体表现分解 8 动量策略 ( 单看收益率变化 ) 情绪策略 ( 单看舆情变化 ) 综合策略 ( 综合考虑舆情和行情变化 ) 7 6 5 4 3 2 1 表 6: 上证 5 与中证 5 轮动策略整体表现分解 指标 动量策略综合策略情绪策略 ( 单看收益率 ( 综合考虑舆情 ( 单看舆情变化 ) 变化 ) 与行情变化 ) 择时周期 211-1-3 至 218-3-3 累计收益率 475.4% 472.3% 511.5% 年化收益率 28.23% 28.13% 29.35% 波动率 21.17% 21.17% 16.31% 信息比率 1.33 1.33 1.8 单次平均收益率.24%.28%.3% 判断正确率 39.83% 51.96% 48.8% 平均盈利率 1.9% 1.65% 1.5% 平均亏损率 -.86% -1.21% -.82% 盈亏比 2.2 1.37 1.83 最大连续上涨天数 8 11 7 最大连续下跌天数 7 11 4 单次最大盈利 17.21% 12.19% 1.91% 单次最大亏损 -8.73% -11.27% -4.72% 最大回撤率 31.5% 23.91% 14.13% 15 / 19
在 沪深 3- 中证 5 轮动中, 基于百度指数舆情的指数轮动策略表现如图 16 表 7 所示, 策略年化收益率为 15.84%, 信息比率为 1.48 在 211 至 217 年的 7 年中仅有一年呈现负收益, 回测期间的最大回撤为 -13.77% 策略整体表现分解如图 17 表 8 所示, 相对于动量策略, 舆情策略的判断准确率更高, 但盈亏比大幅低于动量策略 图 16: 策略表现 --- 沪深 3 与中证 5 轮动 3.5 3 2.5 2 1.5 1.5 表 7: 沪深 3 与中证 5 轮动分年度表现 累积收益率 最大回撤 年化波动率 年化收益率 信息比率 211 年 18.26% -5.98% 6.82% 18.91% 2.77 212 年 24.28% -3.55% 7.57% 25.6% 3.31 213 年 2.76% -11.97% 9.48% 2.9%.31 214 年 53.4% -4.35% 11.42% 54.37% 4.76 215 年 -.14% -12.57% 17.1% -.14% -.1 216 年 5.79% -6.49% 9.46% 5.94%.63 217 年 13.74% -4.86% 9.2% 14.1% 4.53 218 年 1.33% -4.18% 11.74% 5.78%.49 All 181.42% -13.77% 1.69% 15.84% 1.48 16 / 19
图 17: 策略表现 --- 沪深 3 与中证 5 轮动 --- 策略整体表现分解动量策略 ( 单看收益率变化 ) 情绪策略 ( 单看舆情变化 ) 综合策略 ( 综合考虑舆情与行情变化 ) 6 5 4 3 2 1 表 8: 沪深 3 与中证 5 轮动策略整体表现分解 指标 动量策略综合策略情绪策略 ( 单看收益率 ( 综合考虑舆情 ( 单看舆情变化 ) 变化 ) 与行情变化 ) 择时周期 211-1-3 至 218-3-3 累计收益率 367.89% 59.11% 181.42% 年化收益率 24.52% 6.82% 15.84% 波动率 14.18% 14.25% 1.69% 信息比率 1.73.48 1.48 单次平均收益率.2%.8%.18% 判断正确率 39.28% 52.93% 48.78% 平均盈利率 1.41%.99% 1.% 平均亏损率 -.58% -.95% -.6% 盈亏比 2.44 1.5 1.65 最大连续上涨天数 14 11 5 最大连续下跌天数 9 1 5 单次最大盈利 16.47% 11.51% 8.52% 单次最大亏损 -5.21% -11.42% -5.21% 最大回撤率 16.42% 32.66% 13.77% 17 / 19
四 总结 A 股市场上, 股价异象繁生, 行为金融学理论指出, 投资者的情绪变化对股票价格有着不可忽视的影响 在 大数据 时代背景下, 非传统金融数据 ( 如舆情 搜索量 语文文本等 ) 能从多个维度捕捉市场情绪, 本报告以大小盘的百度搜索数据作为大小盘舆情的指标, 探究舆情数据在指数轮动中的应用 基于舆情变化的指数轮动策略根据舆情变化和行情变化有较强的正相关关系, 且舆情变化会领先于行情变化构建了量化择时策略, 实证结果表明利用舆情信息作为择时信号源在历史区间内具有良好表现 上证 5 与中证 5 轮动中, 策略的年化收益率为 29.35%, 信息比率为 1.8 沪深 3 与中证 5 轮动中, 策略的年化收益率为 15.84%, 信息比率为 1.48 五 风险提示 本报告旨在对所研究问题的主要关注点进行分析, 因此对市场及相关交易做了一些合理假设, 而且由于分析时采用的相关数据是过去的时间序列, 在此可能会与未来真实的情况出现偏差 本文内容并不是适合所有的投资者, 投资者在制定投资策略时, 必须结合自身的环境和投资理念 18 / 19
广发证券 行业投资评级说明 买入 : 预期未来 12 个月内, 股价表现强于大盘 1% 以上 持有 : 预期未来 12 个月内, 股价相对大盘的变动幅度介于 -1%~+1% 卖出 : 预期未来 12 个月内, 股价表现弱于大盘 1% 以上 广发证券 公司投资评级说明 买入 : 预期未来 12 个月内, 股价表现强于大盘 15% 以上 谨慎增持 : 预期未来 12 个月内, 股价表现强于大盘 5%-15% 持有 : 预期未来 12 个月内, 股价相对大盘的变动幅度介于 -5%~+5% 卖出 : 预期未来 12 个月内, 股价表现弱于大盘 5% 以上 Table_Address 联系我们 地址 广州市深圳市北京市上海市 广州市天河区林和西路 9 号耀中广场 A 座 141 深圳福田区益田路 61 号太平金融大厦 31 层 北京市西城区月坛北街 2 号月坛大厦 18 层 邮政编码 5162 518 145 212 客服邮箱 服务热线 gfyf@gf.com.cn IT 服务台 2-66317575 免责声明 上海浦东新区世纪大道 8 号 国金中心一期 16 层 广发证券股份有限公司 ( 以下简称 广发证券 ) 具备证券投资咨询业务资格 本报告只发送给广发证券重点客户, 不对外公开发 布, 只有接收客户才可以使用, 且对于接收客户而言具有相关保密义务 广发证券并不因相关人员通过其他途径收到或阅读本报告 而视其为广发证券的客户 本报告的内容 观点或建议并未考虑个别客户的特定状况, 不应被视为对特定客户关于特定证券或金融 工具的投资建议 本报告发送给某客户是基于该客户被认为有能力独立评估投资风险 独立行使投资决策并独立承担相应风险 本报告所载资料的来源及观点的出处皆被广发证券股份有限公司认为可靠, 但广发证券不对其准确性或完整性做出任何保证 报告 内容仅供参考, 报告中的信息或所表达观点不构成所涉证券买卖的出价或询价 广发证券不对因使用本报告的内容而引致的损失承 担任何责任, 除非法律法规有明确规定 客户不应以本报告取代其独立判断或仅根据本报告做出决策 广发证券可发出其它与本报告所载信息不一致及有不同结论的报告 本报告反映研究人员的不同观点 见解及分析方法, 并不代表 广发证券或其附属机构的立场 报告所载资料 意见及推测仅反映研究人员于发出本报告当日的判断, 可随时更改且不予通告 本报告旨在发送给广发证券的特定客户及其它专业人士 未经广发证券事先书面许可, 任何机构或个人不得以任何形式翻版 复 制 刊登 转载和引用, 否则由此造成的一切不良后果及法律责任由私自翻版 复制 刊登 转载和引用者承担 19 / 19