ChinaR2011_SH_Nov13_02_ypc [Compatibility Mode]



Similar documents
说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

《C语言基础入门》课程教学大纲

Microsoft Word - 第7章 图表反转形态.doc

!!!!!!!!!!

上证指数

采 取 行 动 的 机 会 90% 开 拓 成 功 的 道 路 2

 编号:

2006年顺德区高中阶段学校招生录取分数线

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )


!!

第 六 章 债 券 股 票 价 值 评 估 1 考 点 一 : 债 券 价 值 的 影 响 因 素 2

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

Microsoft Word - 资料分析练习题09.doc

深圳市新亚电子制程股份有限公司

<4D F736F F D DB9FAD5AEC6DABBF5B1A8B8E6CAAEC8FDA3BAB9FAD5AEC6DABBF5B5C4B6A8BCDBBBFAD6C6D3EBBBF9B2EEBDBBD2D7D1D0BEBF>

金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

<4D F736F F D C4EAB9A4B3CCCBB6CABFCAFDD1A7D7A8D2B5BFCEBFBCCAD4B4F3B8D9D3EBD2AAC7F3>

2014年中央财经大学研究生招生录取工作简报

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量

黄 金 原 油 总 持 仓 增 长, 同 比 增 幅 分 别 为 4.2% 和 4.1% 而 铜 白 银 以 及 玉 米 则 出 现 减 持, 减 持 同 比 减 少 分 别 为 9.4%,9.4% 以 及 6.5% 大 豆, 豆 粕 结 束 连 续 4 周 总 持 仓 量 增 长, 出 现 小 幅

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

<4D F736F F D20C6F3D2B5C5E0D1B5CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

评 委 : 李 炎 斌 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

一 开 放 性 的 政 策 与 法 规 二 两 岸 共 同 的 文 化 传 承 三 两 岸 高 校 各 自 具 有 专 业 优 势 远 见 杂 志 年 月 日

要 求 ( 三 ) 主 要 市 场 或 最 有 利 市 场 通 常 情 况 下, 如 果 不 存 在 相 反 的 证 据, 企 业 正 常 进 行 资 产 出 售 或 者 负 债 转 移 的 市 场 可 以 视 为 主 要 市 场 或 最 有 利 市 场 ( 六 ) 估 值 技 术 相 关 资 产

ETF、分级基金规模、份额变化统计

Template BR_Rec_2005.dot

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

D 加 权 平 均 资 本 8 某 公 司 普 通 股 目 前 的 股 价 为 10 元 / 股, 筹 资 费 率 为 6%, 预 计 第 一 年 每 股 股 利 为 2 元, 股 利 固 定 增 长 率 2%, 则 该 企 业 利 用 留 存 收 益 的 资 本 成 本 率 为 ( ) A 22.

Microsoft Word 国联安基金管理有限公司关于旗下部分基金增加深圳众禄基金销售有限公司为代销机构的公告.doc

课程类 别

<4D F736F F D20312E C6DAC8A8D2FEBAACB2A8B6AFC2CAB2EECCD7C0FBB2DFC2D42E646F6378>

3 复 试 如 何 准 备 4 复 试 成 绩 计 算 5 复 试 比 例 6 复 试 类 型 7 怎 么 样 面 对 各 种 复 试 04 05

证券代码: 证券简称:长城电脑 公告编号:

评 委 : 徐 岩 宇 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

际 联 考 的 非 美 术 类 本 科, 提 前 批 本 科 体 育 类 第 一 批 第 二 批 第 三 批 的 理 工 类 和 文 史 类 本 科 平 行 志 愿, 考 生 可 以 填 报 6 所 院 校 志 愿 符 合 贫 困 地 区 专 项 计 划 和 农 村 考 生 专 项 计 划 报 考

正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 二 级 可 编 程 师 ( 具 备 以 下 条 件 之 一 者 ) (1) 连 续 从 事 本 职 业 工 作 13 年 以 上 (2) 取 得 本 职 业 三 级 职 业 资 格 证 书 后, 连 续 从 事 本 职 业

名 称 生 命 科 学 学 院 环 境 科 学 1 生 物 学 仅 接 收 院 内 调 剂, 初 试 分 数 满 足 我 院 生 物 学 复 试 最 低 分 数 线 生 命 科 学 学 院 生 态 学 5 生 态 学 或 生 物 学 生 命 科 学 学 院

一 从 分 封 制 到 郡 县 制 一 从 打 虎 亭 汉 墓 说 起

<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

目 录 1 50ETF 波 动 依 旧 较 低, 隐 含 波 动 率 差 值 有 所 收 敛 成 交 热 度 出 现 回 升, 投 资 者 情 绪 维 持 中 性 两 节 期 间 市 场 成 交 低 迷, 建 议 买 入 日 历 价 差 组 合... 9 请 务 必 阅

导 数 和 微 分 的 概 念 导 数 的 几 何 意 义 和 物 理 意 义 函 数 的 可 导 性 与 连 续 性 之 间 的 关 系 平 面 曲 线 的 切 线 和 法 线 导 数 和 微 分 的 四 则 运 算 基 本 初 等 函 数 的 导 数 复 合 函 数 反 函 数 隐 函 数 以

珠江钢琴股东大会

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

Microsoft Word - 文件汇编.doc

2011/9/ /10/ /10/ /10/ /10/ /10/ /10/ /10/ /10/ /11/2 2011/11/4 2011/11/8 2011/11/ /11/14

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

中国银河证券股份有限公司研究所

中 国 软 科 学 年 第 期!!!

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

合 并 计 算 配 售 对 象 持 有 多 个 证 券 账 户 的, 多 个 证 券 账 户 市 值 合 并 计 算 确 认 多 个 证 券 账 户 为 同 一 配 售 对 象 持 有 的 原 则 为 证 券 账 户 注 册 资 料 中 的 账 户 持 有 人 名 称 有 效 身 份 证 明 文 件

全国建筑市场注册执业人员不良行为记录认定标准(试行).doc

数 学 标 准 不 练 习 1.1 理 解 问 题 并 坚 持 解 决 这 些 问 题 1.2 以 抽 象 和 定 量 方 式 推 理 1.3 建 构 可 行 参 数 和 评 判 他 人 的 推 理 1.4 使 用 数 学 方 法 建 模 1.5 策 略 性 地 使 用 合 适 的 工 具 1.6


第二讲 数列

世华财讯模拟操作手册

2009—2010级本科课程教学大纲与课程简介格式

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审

第 期 李 伟 等 用 方 法 对 中 国 历 史 气 温 数 据 插 值 可 行 性 讨 论

新, 各 地 各 部 门 ( 单 位 ) 各 文 化 事 业 单 位 要 高 度 重 视, 切 实 加 强 领 导, 精 心 组 织 实 施 要 根 据 事 业 单 位 岗 位 设 置 管 理 的 规 定 和 要 求, 在 深 入 调 查 研 究 广 泛 听 取 意 见 的 基 础 上, 研 究 提

东吴证券研究所


Transcription:

R 在 金 融 数 据 挖 掘 的 应 用 预 测 股 票 收 益 率 20 平 平 平 平 平 2

Why R? 1. 开 源, 免 费, 用 户 贡 献 自 己 的 包 2. 灵 活, 可 处 理 多 种 事 务 OOP 泛 型 函 数 3. 有 大 量 的 函 数 包, 不 用 再 重 新 发 明 轮 子 4. 先 用 R 实 现 算 法 原 型, 再 用 C++ C# 等 语 言 开 发 系 统

传 统 的 时 间 序 列 Box-Jenkins: AR MA ARMA ARIMA 异 方 差 模 型 :ARCH 类

以 交 易 为 目 的 的 预 测 预 测 是 为 决 策 提 供 支 持 的 预 测 模 型 与 交 易 系 统 整 合 评 价 标 准 是 交 易 系 统 的 收 益, 而 不 是 预 测 的 精 确 度

目 录 一 数 据 导 入 二 预 测 模 型 三 从 预 测 到 决 策 四 模 型 评 价 和 选 择

一 数 据 导 入 1. 数 据 的 结 构 : 交 易 的 日 期 开 盘 价 最 高 价 最 低 价 收 盘 价 交 易 量 调 整 的 收 盘 价 2. 为 简 单 起 见, 用 的 是 股 票 指 数 的 数 据 3. 处 理 时 间 序 列 的 包 zoo,xts, 后 者 是 前 者 的 拓 展 4. 表 示 的 处 理 时 间 的 类 : POSIXct/ POSIXlt,date Open High Low Close Volume AdjClose 1970-01-02 92.06 93.54 91.79 93.00 8050000 93.00 1970-01-05 93.00 94.25 92.53 93.46 11490000 93.46 1970-01-06 93.46 93.81 92.13 92.82 11460000 92.82 1970-01-07 92.82 93.38 91.93 92.63 10010000 92.63 1970-01-08 92.63 93.47 91.99 92.68 10670000 92.68 1970-01-09 92.68 93.25 91.82 92.40 9380000 92.40

5. 从 CSV 文 件 读 数 据 > GSPC <- as.xts(read.zoo("sp500.csv", header = T)) 6. 从 网 络 读 取 数 据 > library(tseries) > GSPC <- as.xts(get.hist.quote("^gspc",start="1970-01-02", quote=c("open", "High", "Low", "Close","Volume","AdjClose"))) 7. quantmod 包 里 的 getsymbols() > setsymbollookup(ibm=list(name='ibm',src='yahoo'), + USDEUR=list(name='USD/EUR',src='oanda)) > getsymbols(c('ibm','usdeur')) 8. 从 数 据 库 读 数 据 : 包 RODBC,RMySQL win myodbc RODBC linux RMySQL DBI

目 标 变 量 日 平 均 价 用 下 面 的 式 子 近 似 P i Ci + Hi + Li = 3 设 Vi 是 接 下 来 k 天 平 均 价 对 i 时 刻 的 变 动 百 分 比 ( 算 术 收 益 率 ) V i P C i + j i = 指 标 T 定 义 为 绝 对 值 大 于 p% 的 那 些 变 动 的 总 和 C i k j = 1 Ti = { v Vi : v > p% or v < p% } v T 为 正 且 较 大 说 明 未 来 有 若 干 天 股 价 高 于 今 天 的 收 盘 价, 买 入 信 号 T 为 负 且 绝 对 值 较 大 说 明 未 来 有 若 干 天 股 价 低 于 今 天 的 收 盘 价, 卖 出 信 号

T.ind <- function(quotes,tgt.margin=0.025,n.days=10) { v <- apply(hlc(quotes),1,mean) r <- matrix(na,ncol=n.days,nrow=nrow(quotes)) for(x in 1:n.days) r[,x] <- Next(Delt(v,k=x),x) x <- apply(r,1,function(x) sum(x[x > tgt.margin x < -tgt.margin])) if (is.xts(quotes)) xts(x,time(quotes)) else x }

用 什 么 变 量 预 测? 历 史 数 据 技 术 指 标 : 包 TTR 有 大 量 的 指 标, 如 何 选 择? 1. 特 征 过 滤 ( feature filters ), 不 依 赖 于 模 型 2. 特 征 封 装 ( feature wrappers ), 依 赖 于 模 型, 迭 代 的

候 选 特 征 R i h Ci C = C i h i h 变 动 h:1 10 TTR 的 技 术 指 标 : ATR(Average True Range), 衡 量 序 列 波 动 SMI(Stochastic Momentum Index), 动 量 指 标 Average Directional Movement Index(ADI) Aroon 指 标, 扑 捉 起 始 趋 势 的 ;Bollinger Bands, 比 较 一 段 时 期 的 波 动 率 Chaikin Volatility;EMV(Ease of Movement Value);MACD MFI(Money Flow Index ) 先 经 过 预 处 理, 产 生 单 指 标

myatr <- function(x) ATR(HLC(x))[,'atr'] mysmi <- function(x) SMI(HLC(x))[,'SMI'] myadx <- function(x) ADX(HLC(x))[,'ADX'] myaroon <- function(x) aroon(x[,c('high','low')])$oscillator mybb <- function(x) BBands(HLC(x))[,'pctB'] mychaikinvol <- function(x) Delt(chaikinVolatility(x[,c("High","Low")]))[,1] myclv <- function(x) EMA(CLV(HLC(x)))[,1] myemv <- function(x) EMV(x[,c('High','Low')],x[,'Volume'])[,2] mymacd <- function(x) MACD(Cl(x))[,2] mymfi <- function(x) MFI(x[,c("High","Low","Close")], x[,"volume"]) mysar <- function(x) SAR(x[,c('High','Close')]) [,1] myvolat <- function(x) volatility(ohlc(x),calc="garman")[,1]

特 征 选 择 随 机 森 林 library(randomforest) 把 数 据 分 两 部 分 (1) 构 建 交 易 系 统 (2) 测 试 library(randomforest) data.model <- specifymodel(t.ind(gspc) ~ Delt(Cl(GSPC),k=1:10) + myatr(gspc) + mysmi(gspc) + myadx(gspc) + myaroon(gspc) + mybb(gspc) + mychaikinvol(gspc) + myclv(gspc) + CMO(Cl(GSPC)) + EMA(Delt(Cl(GSPC))) + myemv(gspc) + myvolat(gspc) + mymacd(gspc) + mymfi(gspc) + RSI(Cl(GSPC)) + mysar(gspc) + runmean(cl(gspc)) + runsd(cl(gspc))) set.seed(1234) rf <- buildmodel(data.model,method='randomforest', training.per=c(start(gspc),index(gspc["1999-12-31"])), ntree=50, importance=t) ex.model <- specifymodel(t.ind(ibm) ~ Delt(Cl(IBM),k=1:3)) data <- modeldata(ex.model,data.window=c('2009-01-01','2009-08-10'))

预 测 问 题 1. 用 解 释 变 量 来 预 测 T( 回 归 问 题 ), 然 后 计 算 信 号 signal sell if T < 0.1 signal = hold if 0.1 T 0.1 buy if T > 0.1 2. 用 解 释 变 量 直 接 预 测 signal( 分 类 ) 问 题!!! sell 和 buy 是 少 数,hold 住 是 多 数 原 因 : 不 平 衡 数 据

评 估 准 则 N 1 error. rate = L ˆ 0/1( yi, yi ) N i = 1 Prec 和 Recall 通 常 合 并 到 一 起, 成 为 单 一 的 统 计 量,F- 测 度 ( Rijsbergen, 1979 )

负 责 的 金 融 时 间 序 列 通 常 会 出 现 区 域 转 移 (regime switch) 的 情 况 如 果 用 训 练 集 数 据 得 到 模 型 来 预 测 接 下 来 的 时 间 区 域, 可 能 会 发 现 区 域 转 移 用 较 近 的 数 据 来 扑 捉 最 近 区 域 (regime) 的 特 性

预 测 模 型 1. 人 工 神 经 网 络 set.seed(1234) library(nnet) norm.data <- scale(tdata.train) nn <- nnet(tform, norm.data[1:1000, ], size = 10, decay = 0.01, maxit = 1000, linout = T, trace = F) norm.preds <- predict(nn, norm.data[1001:2000, ]) preds <- unscale(norm.preds, norm.data)

2. 支 持 向 量 机 : 包 kernlab e1071 library(e1071) sv <- svm(tform, Tdata.train[1:1000, ], gamma = 0.001, cost = 100) s.preds <- predict(sv, Tdata.train[1001:2000, ]) library(kernlab) data <- cbind(signals = signals, Tdata.train[, -1]) ksv <- ksvm(signals ~., data[1:1000, ],C=10) ks.preds <- predict(ksv, data[1001:2000, ])

3. 多 变 量 自 适 应 回 归 样 条 Multivariate Adaptive Regression Splines 包 mda 的 mars(), 包 earth 里 的 earth() library(earth) e <- earth(tform, Tdata.train[1:1000, ]) e.preds <- predict(e, Tdata.train[1001:2000, ]) MARS 只 适 用 于 回 归 问 题, 不 可 用 于 分 类

三 从 预 测 到 决 策 策 略 1 (1)t 时 刻 卖 出 信 号 如 果 有 头 寸, 信 号 被 忽 略 如 果 没 有 头 寸, 开 一 个 空 头 头 寸 ( 价 格 pr), 然 后 两 个 限 价 指 令 一 个 买 入 指 令 pr-p%, 一 个 买 入 指 令 pr+l%, 用 来 止 损 (2) t 时 刻 买 入 信 号 一 个 卖 出 指 令 pr+p%, 一 个 卖 出 指 令 pr-l%, 用 来 止 损 策 略 2 只 开 一 个 头 寸, 等 待 收 益 达 到 预 期, 不 设 止 损

与 交 易 关 联 的 评 估 准 则 包 PerformanceAnalytics (1) 总 体 收 益 :Profit/Loss (2) 风 险 相 关 的 收 益 :Sharpe 比 率, 衡 量 单 位 风 险 的 收 益

四 模 型 评 估 和 选 择 1. Monte carlo 模 拟 2. 实 验 比 较 3. 原 因 分 析

参 考 文 献 1. DataMining with R: Learning with Case Studies 2. 邓 一 硕 整 理 的 关 于 quantmod 和 PerformanceAnalytics 的 手 册

Contact yanping.chen@cos.name http://ypchen.inwake.com

Thank you!