第4期 厚.indd

Size: px
Start display at page:

Download "第4期 厚.indd"

Transcription

1 关于大数据 数据科学家名言 A data scientist is someone who can obtain scrub explore model an d interpret data blending hacking statistics and machine learning. Data scient ists not only are adept at working with data but appreciate data itself as a firstclass product Hillary Mason Founder at Fast Forward Labs 数据科学家是懂得获取 清洗 探索 建模 解释数据的人 还要融合入侵技 术 统计学和机器学习 数据科学家不仅要处理数据 还要把数据本身作为一个五星 产品 Hillary Mason Fast Forward Labs的创始人

2 目录 贵州大数据产业发展大事记 ( ) (1) 2016 贵州高校大数据发展简介 (6) 贵州财经大学 (6) 贵州财经大学贵阳大数据金融学院揭牌 (6) 曹彤院长做客大数据金融大讲堂 (7) 贵州财经大学 大数据金融知识和技能培训班 ( 第一期 ) 开班 (8) 贵州日报 专版报道我校贵阳大数据金融学院 (8) 贵州财经大学举办大数据金融人才专场招聘会 (9) 贵阳大数据金融学院与南京大学互联网金融研究中心达成合作意向 (9) 贵阳云尚城市资产运营有限公司与贵阳大数据金融学院商讨合作事宜 (10) 贵阳大数据金融学院与世界著名大数据公司 Hortonworks 建立合作伙伴关系 (10) 第一届贵阳大数据金融实验班顺利开班 (11) 贵阳大数据金融学院 2016 年第 5 期 云岩讲堂 暨云岩区 数据白领 第一期培训班顺利开班 (11) 贵州财经大学贵阳大数据金融学院实践教学基地签约暨挂牌仪式在贵阳众筹金融交易所举行 (12) 贵州产业技术发展研究院与贵阳大数据金融学院 (12) 贵阳大数据金融学院与贵阳大数据交易所签订实践教学基地协议 (13) 伦敦大学亚非学院院长克里斯汀 奥顿教授访问贵阳大数据金融学院 (13) 中央民族大学法学院邓建鹏教授为大数据金融实验班学生开设讲座 (14) 上海贝格 数据宝和九州证券到贵阳大数据金融学院举行招聘宣讲会 (14) 贵阳大数据金融学院贵州翼云大数据服务有限公司实践教学基地挂牌成立 (15) 贵阳大数据金融学院承办的微金融 50 人论坛 2016 峰会云计算与大数据分论坛顺利举办 (15) 贵州大学 (16) 我校与北京邮电大学洽谈大数据合作事宜并签署本科生交流培养协议 (16) 贵州省公共大数据重点实验室研究人员参加 英国大数据代表团与科技厅科技创新合作研讨会 (16) 国家 86(0) 课题项目总体组研讨会暨贵州省公共大数据重点实验室建设专家咨询交流会在我校召开 (17)

3 贵州省公共大数据重点实验室召开动员大会 (17) 贵州省何力副省长主持会议研究公共大数据重点实验室建设 (17) 贵大教授谢泉 : 贵阳应建设国家级公共大数据中心 (18) 副省长何力一行来校调研指导公共大数据重点实验室筹备工作 (18) 我校大数据重点实验室筹建工作提速 (18) 贵州省大数据发展应用条例 ( 草案 ) 起草座谈会在我校举行 (19) 花溪区政府与大数据学院开展合作交流 (19) 千人计划专家与大数据创新创业论坛贵州大学举行 (19) 花溪区来校商谈千人计划大数据研究院入驻贵大科技园工作 (20) 贵州大学实施专业综合改革助推大数据产业发展 (20) 我校召开贵州省大数据产业发展应用研究院理事会筹备会 (21) 我校获贵州省大数据领域科技创新第一个重大专项 (22) 贵州省大数据产业研究院 贵州大学大数据与信息工程学院揭牌 (22) 我校进军大数据产业研究 (23) 我省将建大数据产业研究院 (23) 贵州师范大学 (24) 大数据专家苏建峰到我校开展 大数据背景下的体育产业发展 论坛 (24) 我校与贵阳大数据交易所签署战略合作协议 (24) 副校长谢晓尧为贵州省大数据产业发展与应用高级研修班授课 (25) 师大计划新增大数据专业 (25) 厦门大学林子雨教授来校讲解 大数据技术 (26) 花溪大学城大数据和科技创新发展座谈会在我校召开 (26) 我校举办的 贵州省大数据产业发展与应用高级研修班 圆满结业 (27) 学校大数据与计算机科学学院成立 (27) 贵安新区与贵州师范大学将共同培养大数据人才 (29) 大数据与计算机科学学院带领学生前往贵州 NIIT 大数据与软件服务外包实训基地开展实训 (29) 湄潭县 2016 年新入职公务员赴我校接受大数据素养教育 (30) 我校赴威宁草海国家级自然保护区进行大数据调研 (30) 贵州师范大学牵手 IBM 等企业重视大数据人才实用性 (31) 大数据与计算机科学学院组织学生前往贵阳大数据创新产业发展中心参加微软技术培训营 活动 (32) 我校思雅众创空间 福农宝 农业大数据产业项目受到人民网报道 (32)

4 贵安新区 贵州师范大学 IBM 大数据学院成功举办课程置换宣讲会 (33) 数学与计算机科学学院组织学生前往贵阳国际大数据产业博览会观展 (34) 副校长刘肇军出席南明大数据电商产业聚集区开园仪式 (34) 清华大学教授陈国青莅临我校解析大数据时代 (35) 副校长谢晓尧到大数据与计算机科学学院调研指导工作 (35) 我校组织参加贵州省赴省校合作高校大数据等重点产业人才专场招聘活动 (36) 我校组团赴浙江大学参加贵州省组织的大数据等重点产业高层次人才引聘工作 (36) 我校大学科技园思雅众创空间应邀参加云岩区大数据人才培养 三个一批 计划启动仪式 (37) 丁永强畅谈 云计算与大数据 (37) 大数据与计算机科学学院举办实习招聘会 (37) 副校长乙引带队到大数据与计算机科学学院进行科研工作调研与指导 (38) 大数据与计算机科学学院开展 零距离就职游戏公司 专题讲座 (38) 大数据与计算机科学学院开展职业生涯规划系列讲座 (39) 大数据与计算机科学学院阮方鸣教授参加中美合作静电防护与标准化国际研讨会并作大 报告 (39) 贵安新区社会事务管理局局长邓波莅临大数据与计算机科学学院调研 (40) 甲骨文公司高级技术专家张维亮莅临我校做学术讲座 (40) 副校长谢晓尧会见 NIIT 中国区教育业务总裁柯谋一行 (40) 省政协主席王富玉一行来校视察 (41) 校领导会见 IBM 大西区客户代表 (41) 大学科技园推进我校主题创客空间建设工作 (41) 省科技厅厅长廖飞一行莅临我校大学科技园思雅众创空间视察指导工作 (42) 我校和印度国家信息技术学院开展校企合作 (42) 印度国家信息学院 (NIIT) 全球 CEO 帕特瓦尔丹一行来校交流 (43) 我校受邀参加贵州省 十二五 科技创新成就展 (43) 大数据会议活动集锦 (44) 2016 中国大数据技术大会在北京盛大召开 (44) 2016 大数据博览会 : 大数据在金融领域的 10 大趋势 (49) 2016 贵阳大数据金融 互联网金融千人会高峰会今举办 (52) 2016 年大数据金融信用体系建设和风险控制系列活动贵阳共识 (53) 48 家单位共同发起 关于数据标准化和治理的倡议书 (54) 2016 年贵阳大数据金融信用系列活动论坛观点集锦 (56)

5 首届中欧大数据金融论坛开启大数据金融的思维碰撞 (61) 任正非回家领华为助推贵州大数据发展 (62) 大数据金融资讯 (64) 美国的数据交易产业是怎样发展的? (64) 从美国数据经纪产业窥探我国大数据交易的良性发展之路 (68) 金融大数据的机会 (80) 大数据是未来互联网金融的核心 (84) 大数据遇上金融科技, 开启金融风控新时代 (87) 实务 大数据技术在金融检察工作中的运用 (89) 大数据在金融 : 数据的价值 (93) 王玉祥 : 大数据金融时代的众筹解放 (95) 2016 大数据金融企业谁是王者?( 分类排行 ) (99) 数据可视化 :2016 信息之美 金奖作品全解析 (102) 大数据金融知识 (108) 一篇对大数据深度思考的文章, 让你认识并读懂大数据 (108) 找不到数据?21 个你应该知道的大数据资源 (120) 除 Hadoop 外你还需要知道的 9 个大数据技术 (122) 文献传递 (126) 中文期刊 (126) 大数据背景下互联网金融对中小企业融资影响研究 (126) 大数据 互联网金融与信用资本 : 破解小微企业融资悖论 (126) 建立产学研合作高端服务平台推动大数据金融产业创新发展 (127) 基于互联网金融平台的大数据挖掘研究 (128) 大数据金融对理财产品的几点重要影响 (128) 大数据背景下金融消费者信息权益保护浅析 (129) 大数据金融时代中个人信用评估模型优化设计 (129) 从哲学和管理角度探问大数据金融 (129) 互联网金融模式研究 以大数据金融为例 (130) 大数据时代我国平台金融的发展趋势研究 (130) 外文期刊 (131) Big Data Analytics and Revision of the Common Rule (131) Drug repositioning in SLE: crowd-sourcing, literature-mining and Big Data analysis (132)

6 How Does National Scientific Funding Support Emerging Interdisciplinary Research: A Comparison Study of Big Data Research in the US and China (133) Infrastructure planning and topology optimization for reliable mobile big data transmission under cloud radio access networks (134) 新书推荐 (135) 附件 1: 外文文献全文 (136) Big Data Analytics and Revision of the Common Rule (136) Drug repositioning in SLE_ crowd-sourcing, literature-mining and Big Data analysis. (140) How Does National Scientific Funding Support Emerging Interdisciplinary Research: A Comparison Study of Big Data Research in the US and China (162) Infrastructure planning and topology optimization for reliable mobile big data transmission under cloud radio access networks (183) 附件 2: 大数据产业政策 (195) 贵阳市发布 运用大数据管控 考核违法建筑的专项行动计划 (195) 关于贵阳国家高新区大数据 十百千万 培育工程的实施意见 (200) 贵安云谷三年会战方案 (209) 贵州省新经济统计试点工作方案 (213) 贵州省应急平台体系数据管理暂行办法 (215) 贵州省政务数据资源管理暂行办法 (220) 贵安新区大数据港三年会战方案 (226) 关于 贵阳市政府数据共享开放条例 ( 草案 ) 征求意见的公告 (229) 贵阳市政府数据共享开放条例 ( 草案 ) (230) 贵阳出台 十三五 互联网 + 行动计划 (235) 贵州发布 贵安新区关于推进大众创业万众创新若干政策措施 ( 试行 ) (237) 6

7 贵州大数据产业发展大事记 导读 大数据已成为席卷全球的热点, 在中国贵州这样一个欠发达省份, 俨然成为了 大数据 的代言人 贵阳市更是把大数据作为打造创新型中心城市的战略路径和主要抓手来推动, 在大数据发展特别是在大数据交易 大数据金融等 高大上 领域取得了一定优势 通过对近年来贵州发展大数据的大事记, 记录下贵州在发展大数据这条道路上迈进的步伐 贵州大数据产业发展大事记 ( ) 贵阳市发布 运用大数据管控 考核违法建筑的专项行动计划 根据 贵阳市依法严厉打击违法违章建设行为专项整治行动方案 和市委 市政府相关工作部署, 为继续深入持久地开展好控拆违工作, 运用大数据监测 分析 对比方法实现对违法建筑管控 考核的工作, 推进我市创新型中心城市建设, 确保全市控拆违工作目标任务的全面完成, 经研究, 特制订本专项行动计划 贵州省新经济统计试点工作方案 发布为认真贯彻落实省委 省政府关于开展新经济统计试点工作的安排部署, 加快推进我省新经济统计试点工作, 经省人民政府同意, 省政府办公厅近日印发 贵州省新经济统计试点工作方案 ( 以下简称方案 ), 要求各地各部门认真贯彻落实 贵州省获国家统计局批准开展新经济统计试点和实施大数据产业统计报表制度 根据省委 省政府的部署和要求, 经前期扎 实认真准备和后期积极请示沟通, 贵州省统计局先后向国家统计局报送了 关于报请审批贵州省大数据统计监测办法 ( 试行 ) 的请示 关于恳请国家统计局将贵州列为新经济统计试点省有关事宜的请示, 获得国家统计局批复 : 同意并支持贵州开展新经济统计试点工作, 批准实施大数据产业统计报表制度 11 月 2 日, 百家城市新闻网站 中国数谷 行之 大数据安全 互联网新闻出版和数字资产沙龙 在贵阳举行 来自全国的媒体人和专家学者, 对大数据安全为基础的知识产权等问题进行探讨 全国百家城市新闻网站代表观摩贵阳经开区大数据项目 让代表们深切感受到贵阳经开区产业发展的活力, 代表纷纷表示, 贵阳依靠大数据带动产业转型发展, 重要的经验是坚持创新驱动 11 月 3 日, 贵阳市政府大数据金融系列丛书 区块链金融 在贵阳首发 区块链金融 由瀚德创客金融投资有限公司下属的瀚德研究院撰 1

8 大数据金融信息剪辑 写, 中信出版社出版, 是供金融科技从业者研读的一部专著, 从专业角度对区块链这一炙手可热的现象级概念做了全面解读, 描绘出区块链潜能无限的蓝图 10 月 31 日, 贵阳市委副书记 贵阳市长刘文新会见普洛斯集团 CEO 梅志明一行 双方就深化合作, 发展现代物流等进行了交流 11 月 3 日, 贵阳市人民政府和华夏银行总行在贵阳国际生态会议中心举行大数据金融 第二银行战略合作签约仪式 双方将各自发挥政府组织和金融服务优势, 建立长期稳定的战略合作关系, 共同推动在大数据金融领域以及 第二银行 建设方面的深度合作 11 月 4 日下午, 为期 4 天的 2016 年贵阳大数据金融信用体系建设和风险控制系列活动正式落下了帷幕 经过推介, 共有包括乐活电商 新华金控集团 万惠集团等在内的 38 家企业 牵手 贵阳, 与贵阳市相关部门以及各区 ( 市 县 ) 签署了涉及大数据 金融等领域的各类合作项目, 为打造全国大数据金融新中心迈出重要一步 在日前举行的百家城市新闻网站 中国数谷 行活动中, 来自全国的近 100 家网络媒体, 先后踏访贵阳经开区货车帮 勤邦生物等企业, 以及大数据安全产业园, 与来自政 企 学界的代表, 围绕 大数据安全 互联网新闻版权和数字资产 主题展开了深入讨论 来自中国人民大学 同济大学 北京航空航天大学 苏州大学 南京解放军政治学院 贵州省委党校 贵州师范大学的专家学者及部分少数民族自治州纪委的相关负责同志齐聚都匀, 围绕 贯彻落实十八届六中全会精神, 运用大数据技术推进党风廉政建设 开展研讨, 探寻党内监督的新举措, 探索责任落实的新途径 11 月 5 日, 2016 贵阳 上海大数据金融发展交流暨贵州金融城高铁新城招商推介会 在上海中国金融信息中心隆重举行 11 月 8 日, 由英国剑桥基金董事长 剑桥大学贾奇商学院终身教授以及常驻企业家艾伦 巴若带队的英国访问团一行来到贵阳, 见证和签署了系列合作协议 据悉, 协议包括在贵阳筹建 贵阳众筹国际 ( 跨境 ) 交易中心 设立 大数据产业基金 等内容 11 月 8 日, 贵州省委常委 贵阳市委书记 国家大数据 ( 贵州 ) 综合试验区建设领导小组副组长陈刚会见了来筑考察的思科公司全球高级副总裁兼大中华区董事长陈仕炜一行, 深入探讨了教育医疗大数据应用 智慧城市等领域的合作事宜 贵阳市国税局 11 月 8 日公布, 通过大数据综合分析, 该局获取一起境外间接股权转让贵阳市企业避税案件信息 该局高度重视, 成立专项调查小组, 通过调查 取证和谈判, 并经国家税务总局批准,2016 年 10 月 31 日,AAA 发展 ( 中国 ) 有限公司 ( 简称 香港 AAA ) 在贵阳缴纳税款 元 该案件的成功办理, 实现了贵阳市反避税入库税额历史性的突破 11 月 8 日, 现代汽车与贵州省政府在贵阳市国际生态中心举行了大数据构建 战略合作协议 签约仪式 贵州省省委书记陈敏尔 现代汽车副会长郑义宣及双方相关人士出席了仪式 现代汽车将在贵州省内的 大数据产业国家级新区 贵安新区建设大数据中心, 意味着此后将向中国顾客提供更加适用的车联网服务 11 月 9 日, 第一届医学成像大数据国际高峰论坛在贵阳举行, 记者从论坛上获悉, 贵州省大数据精准医学实验室正在筹建中, 未来通过 数据 看病, 或将在贵州成为现实 2

9 贵州大数据产业发展大事记 2016 年中国 贵州内陆开放型经济试验区跨境投资贸易洽谈会将于 11 月 10 日在贵州贵安新区正式开幕 据主办方介绍, 此次洽谈会邀请了来自美国 澳大利亚等 24 个国家和地区的 100 多家境外企业, 以及 1000 多家国内企业参加, 预计签约总金额或超过 1400 亿元 11 月 11 日, 贵阳国家高新区正式印发了 关于贵阳国家高新区大数据 十百千万 培育工程的实施意见 根据 意见, 未来几年里, 贵阳高新区将进一步整合全区资源要素, 大力扶持和培育一批带动能力强的大企业 龙头企业和成长性高的中小企业, 力争到 2020 年底, 聚集的大数据企业超 家, 实现大数据产业营业收入 1000 亿元 11 月 11 日, 贵阳市委金融工委组织贵阳互联网金融特区入驻企业党组织相关负责人学习党的十八届六中全会精神, 并向新成立的贵阳互联网金融特区入驻企业党组织授牌 随着贵阳大数据产业的蓬勃发展, 贵阳互联网金融特区已集聚了 大数据金融 的非公有制金融企业和社会组织 30 余家, 从业人员达 600 余人 目前,16 家有党员的企业和社会组织共组建了 7 个党支部, 其中 5 个单独建支部 2 个联合建支部, 实现了应建尽建 11 月 8 日, 英国剑桥基金董事长 剑桥大学贾奇商学院终身教授以及常驻企业家艾伦 巴若率领英国考察团来到贵阳 考察团与贵阳有关企业签署了系列合作协议, 协议内容涉及筹建 贵阳众筹国际 ( 跨境 ) 交易中心 拟设立 中英大数据产业基金 等 11 月 12 日, 贵州省政府与华为技术有限公司在贵阳举行战略合作协议签字仪式 贵州省委书记 贵州省人大常委会主任陈敏尔, 贵州省委副书记 贵州省长孙志刚, 华为技术有限公司 总裁任正非, 华为技术有限公司副董事长 轮值 CEO 徐直军, 贵州省领导秦如培 陈刚 慕德贵出席签字仪式 11 月 11 日, 贵阳国家高新区大数据发展大会在贵阳国际人才城召开, 贵阳国家高新区大数据发展局 大数据发展办公室挂牌成立 会议发布了 关于贵阳国家高新区大数据 十百千万 培育工程的实施意见 意见 指出, 未来几年里, 贵阳高新区将进一步整合全区资源要素, 大力扶持和培育一批带动能力强的大企业 龙头企业和成长性高的中小企业, 力争到 2020 年底, 聚集的大数据企业超 家, 实现大数据产业营业收入 1000 亿元 11 月 8 日, 贵州省建设国家大数据战略综合实验区实践研究 课题研究大纲讨论会在贵州省社科院举行 本次会议特邀贵州省政协副主席 贵州省大数据发展领导小组副组长谢晓尧教授莅会指导 座谈会由吴大华院长主持, 贵州省社会科学院大数据政策法规创新研究中心和院级重点学科 ---- 大数据治理学 团队的科研人员 贵州财经大学的陈玉梅教授 曹务坤教授参加了研讨会 11 月 15 贵州省政府办公厅印发 贵州省政务数据资源管理暂行办法 结合贵州省实际, 制定本办法 11 月 16 日举行的上线新闻发布会上获悉, 目前, 贵阳改革网已完成建设并通过公测, 具备上线运行条件 网站将重点打造三大栏目 : 一是信息中心, 主要发布中央 省 市全面深化改革决策部署和政策措施 ; 二是改革专题, 围绕经济发展 城市规划 民主法治 文化体制 社会治理 生态文明 党的建设 纪律检查八大改革领域的各个改革专题, 跟踪记录全市改革工作动态 ; 三是政策解读, 发布国内主流媒体及业 3

10 大数据金融信息剪辑 界专家学者对相关改革形势任务的剖析 解读 评论 在网站服务上, 一方面突出公开性, 将及时发布中央 省 市各类改革政策文件 工作动态, 让市民群众获取信息更加方便快捷, 了解共享更多改革红利, 有改革获得感 一方面突出互动性, 积极搭建政民互动 咨询建议的交流平台, 设置改革信箱 在线访谈 在线评论等交互板块, 以互动式网络交流释疑解惑, 吸引更多市民群众监督 关注 支持 体验改革 11 月 16 日,2016 中国 修文创新创业发展论坛在贵阳创业小镇举行 本次论坛以 创新创业, 改变未来 为主题, 由中共修文县委 修文县人民政府主办, 中国电子商务产业园联盟等协会协办 200 余名大数据 电子商务行业专家及企业家代表齐聚贵阳创业小镇, 探讨经济新常态下修文县大数据产业创新发展之路 中国云计算应用联盟主席团主席汤兵勇 中国电子商务协会常务副会长卢建新 颐高集团董事长翁南道等发表演讲 11 月 16 日, 记者从贵州省大数据局获悉, 国家工信部批复同意设立贵阳 贵安国家级互联网骨干直联点 明年, 全国重要通信枢纽和网络信息 高速公路 将以风驰电掣的速度, 一直修到贵州大数据中心 家门口 国家级互联网骨干直联点主要用于汇聚 疏通区域和全国网间通信流量, 是我国互联网网间互 11 月 16 日, 贵州省委副书记 省长孙志刚主持召开省政府常务会议, 专题听取全省大扶贫 大数据两大战略行动推进情况汇报, 研究部署下步重点工作 他强调, 要深入学习贯彻习近平总书记系列重要讲话精神, 按照中央和省委决策部署, 全面落实五大新发展理念, 坚定不移强力推进大扶贫 大数据两大战略行动, 坚决打赢脱贫攻坚战, 坚决做强大数据长板, 为贵州守底 线 走新路 奔小康提供坚强保障 近日, 贵州省黔南州党风廉政建设与大数据技术运用研讨会在都匀召开, 来自中国人民大学 同济大学 省纪委 云南省德宏州纪委等专家学者共 200 余人参会 当天, 与会人员参观了黔南州 两个责任 落实与干部正风监督网络平台 11 月 16 日, 遵义市大数据应用示范城市建设总体规划 ( ) 评审会在遵义宾馆召开 贵州省大数据发展管理局副局长康克岩, 遵义市委常委 副市长王兴男及相关专家组成员, 各县 ( 区 市 ) 政府 部分企事业单位负责人参加评审会 11 月 18 日, 全国首期大数据能力成熟度评价模型 (DCMM) 专题培训会在高新区举行, 助推大数据企业对内挖掘数据价值 对外提升数据智能, 为企业数据管理能力插上腾飞的翅膀 此次培训邀请了全国信息技术标准化技术委员会大数据标准工作组首席数据专家宾军志 工程师李冰进行授课 培训以 能力提升 开放共享 价值创造 为主题, 讲解了大数据标准化的现状 痛点, 重点讲解了 DCMM 的评估过程及必要性 11 月 18 日, 贵阳市 大数据民生 工程上线试运行 以 筑民生 平台为项目品牌载体, 平台已完成初期 42 项民生服务接入, 涉及教育 卫计 公积金中心 民政等部门, 大数据民生 工程是贵阳市运用大数据改善民生服务的积极实践 该工程致力于通过开展民生领域的大数据应用示范, 深入发掘和释放贵阳市民生服务数据资源的潜在价值, 推进贵阳大数据民生领域在关键技术 安全保障 服务模式 政策体系等方面的探索和创新, 助力打造创新型中心城市 11 月 18 日, 国家大数据 ( 贵州 ) 综合试验区及中国国际大数据产业博览会亮相第三届世 4

11 贵州大数据产业发展大事记 界互联网大会, 成功举办了推介活动 为充分利用第三届世界互联网大会平台宣传 展示国家大数据 ( 贵州 ) 综合试验区及中国国际大数据产业博览会,11 月 15 日起, 数博会组委会在 互联网之光博览会 搭建了 30 平米的国家大数据 ( 贵州 ) 综合试验区及中国国际大数据产业博览会主题展位, 利用等离子大屏幕循环播放山水贵客 国家大数据 ( 贵州 ) 综合试验区宣传视频 ( 北美推介视频中文版 ) 数博会开幕式视频等宣传内容, 并向过往观众发放国家大数据 ( 贵州 ) 综合试验区宣传资料 2017 数博会招展手册 11 月 23 日, 贵州省政府办公厅印发 贵州省应急平台体系数据管理暂行办法, 并从即日起执行 11 月 23 日, 贵州省政府办公厅印发 贵州省应急平台体系数据管理暂行办法, 并从即日起执行 12 月 05 日, 贵州贵安新区出台了 贵安新区大数据港三年会战方案 ( 以下简称方案 ), 预计今年底将引进和培育大数据企业 50 家以上, 大数据产业规模达到 10 亿元以上, 从业人员 2000 人以上 根据 方案 发展目标规划, 到 2017 年底, 新区将引进和培育大数据企业 300 家以上, 大数据产业规模达到 50 亿元以上, 从业人员超过 5000 人以上 到 2018 年底, 新区将引进和培育大 数据企业 500 家以上, 大数据产业规模达到 300 亿元以上, 从业人员超过 人以上 12 月 5 日, 为加快大数据及关联产业集聚发展, 近日, 贵州贵安新区结合实际出台了 贵安云谷三年会战方案 12 月初, 贵阳市第十三届人大常委会第四十五次会议对 贵阳市政府数据共享开放条例 ( 草案 ) 进行了初次审议, 现将草案文本在贵阳日报 贵阳晚报 贵阳人大网 ( gov.cn) 中国. 贵阳 政府门户网站 (www. gygov.gov.cn) 公布, 公开征求社会公众的意见和建议 恳请提出宝贵意见和建议, 于 2017 年 1 月 8 日前通过来电 来信 传真 电子邮件或者登录贵阳人大网 中国 贵阳 政府门户网站提交 12 月初, 贵阳市 十三五 互联网 + 行动计划 出台 未来五年, 贵阳将重点围绕 13 个专项行动, 实施创新驱动战略, 推动互联网新技术 新模式 新理念与经济社会各领域全面融合, 打造创新型中心城市 12 月 23 日, 贵州发布 贵安新区关于推进大众创业万众创新若干政策措施 ( 试行 ) 来源 : 数据观 资源编辑整理 5

12 大数据金融信息剪辑 导读 人才培养 科学研究 服务社会是高校的三大职能作用 在大数据引领贵州飞 速发展的 2016 年, 贵州知名高校是如何发挥其重要职能作用的, 为贵州的大数据发展做了什 么贡献 2016 贵州高校大数据发展简介 贵州财经大学 数据来源 : 贵州财经大学大数据金融学院新闻网 贵州财经大学贵阳大数据金融学院揭牌 为全面深化贵阳大数据金融发展战略, 服务于地方经济,4 月 20 日下午, 我校与贵阳市政府合作的 贵州财经大学贵阳大数据金融学院 揭牌仪式在鹿冲关校区举行 省委常委 贵阳市委书记陈刚, 省政府办公厅副秘书长 省统计局局长任湘生, 省政府金融办主任李瑶, 省教育厅副厅长代其平, 贵阳市委秘书长聂 雪松, 贵阳市政府副市长王玉祥 钟汰勇, 贵阳市各区 ( 市 县 ) 市直相关部门负责人, 我校全体校领导和部分职能部门负责人出席了本次揭牌仪式 校党委书记褚光荣主持 褚光荣指出, 我校与贵阳市本着 优势互补 共谋发展 务实高效 互惠双赢 的原则签订战略合作协议, 将进 一步推动学校政产学研 校地合作新模式的探索, 进一步推动学校办学的内涵转型发展, 进一步提升学校办学核心竞争力和服务区域经济社会发展的能力和水平 开放式 创新型的贵州财经大学贵阳大数据金融学院的成立, 标志着我校按照 教育供给侧 改革的思路, 迎来了加快内涵转型 创新发展的进一步深入 6

13 2016 贵州高校大数据发展简介 陈刚书记 任湘生局长 代其平副厅长为 贵州财经大学贵阳大数据金融学院 揭牌 蔡绍洪校长为曹彤教授和王作功教授颁发院长聘书 陈刚发表重要讲话, 他指出, 贵阳市和贵州财经大学在很短的时间内达成共识, 并以极高的效率推动市校合作落地, 拉开了市校合作携手推动发展大数据, 特别是大数据金融发展的大幕, 使贵阳乃至贵州在大数据金融领域又迈出了坚实的一步 必须清楚的认识到在大数据发展特别是大数据交易 大数据金融等领域, 既要先发声, 更要快赶路 他强调, 大数据发展的关键突破口第一是 人才支撑, 要注重外部引进更要注重内部培养, 要加快打造人才高地 ; 其次是协同创新, 要搭建平台, 加快汇聚资源要素 他希望贵阳市与贵州财大的合作能够成为全省乃至全国市校合作的典范, 希望大数据金融学院将来能够成长为一所具有影响力的开放型创新型学院, 为全省大数据金融发展和大数据创新创业提供源源不断的 清泉活水, 为贵州 弯道取直, 后发赶超 持续不断地做出应有的贡献 代其平讲话, 他指出贵州财经大学与贵阳市人民政府签署战略合作协定, 这是贵州财经大学主动发展, 加速发展的举措, 也是贵 州财经大学扩大发展空间, 对外交流合作的重大举措, 更是贵州财经大学服务贵州经济社会发展的重要举措和积极体现 党中央 国务院 省委省政府 贵阳市委市政府以及学校高度重视大数据的发展, 这是最大的机遇 ; 大数据产业已经从后台走到了前台, 从以前的呼之欲出到现在的呼之已出, 是第二个机遇 ; 双方有激情有热情的合作, 是第三个机遇 代其平要求, 要紧紧抓住这个机遇, 乘胜而上, 发挥双方的优势, 加强协同创新 互补整合, 共同发展 要抓好落实, 使合作出思路, 出思想, 出成果, 出人才 曹彤院长做客大数据金融大讲堂 4 月 20 日下午, 贵阳大数据金融学院新聘院长曹彤在鹿冲关校区大数据金融大讲堂作题为 大数据金融的演绎趋向及自金融的内在逻辑 的讲座 省政府金融办 贵阳市相关领导和相关部门负责人, 我校全体校领导 处级干部及部 分师生聆听了讲座 曹彤院长结合自身的实践经验, 围绕互联网金融 大数据金融 自金融三个方面谈了它们之间的内在逻辑以及对现实生活的影响和意义 曹彤院长指出, 作为全球第一家 大数据金融学院, 必须抓住机 遇, 立足相关优势, 吸引社会各界力量, 加强与大数据金融相关产业的合作, 以包容的心态和开阔的视野将其推向全球, 办出国际化水平的 大数据金融学院 7

14 大数据金融信息剪辑 贵州财经大学 大数据金融知识和技能培训班 ( 第一期 ) 开班 5 月 23 日, 由贵州财经大学和贵阳市人民政府金融工作办公室联合主办, 贵阳大数据金融学院承办, 贵州财经大学招生就业处协办的 大数据金融知识和技能培训班 ( 第一期 ) 在鹿冲关校区贵阳大数据金融讲堂正式开班 贵阳市人民政府金融工作办公室主任罗佳玲主任, 贵阳大数据金融学院党支部书记张宁 贵阳大数据金融学院院长王作功教授 学校招就处处长王志亮等出席了开班典礼 开班典礼上, 王作功院长代表学校向贵阳市金融办的大力支持表示中心感谢, 对参加培训的学生提出了要求和期望 罗佳玲主任就贵阳市大数据金融发展的情况做了介绍, 激发了受训学生对大数据金融行业发展的兴趣 她鼓励受训学生努力学习, 密切关注贵阳市领先全国的大数据金融发展 的趋势, 积极投身到大数据金融发展的潮流之中, 将自身价值实现与地方经济发展结合起来 本期培训约有 330 人参加 主要包括已经在大数据金融行业签约的毕业生 学校与大数据金融相关的金融 保险 投资 电子商务 计算机等专业的毕业生 学校与大数据金融相关的专业讲师也出席了今天开班典礼 贵州日报 专版报道我校贵阳大数据金融学院 5 月 23 日, 贵州财经大学贵阳大数据金融学院 大数据金融知识与技能培训班 第一期培训, 在我校鹿冲关校区正式开班 从 4 月 20 日贵阳大数据金融学院揭牌, 到 5 月 23 日的培训班开班, 短短时间内, 引起了省内各大媒体的关注 5 月 25 日, 贵州日报 以 构建大数据金融人才培养基地 贵州财经大学联手贵阳市共建大数据金融学院观察 为题, 从 率先起步为先机 为什么是财经大学 和 为大数据注入 清泉活水 三方面专版介绍了我校大 数据金融学院的建成和发展 并采访了我校党委书记褚光荣和校长蔡绍洪 采访中, 褚光荣书记指出, 我校积极思考经济新常态下, 高等教育改革如何从 需求侧 管理为主过渡到聚焦 供给侧 改革, 由此理清并形成了高等教育 供给侧 改革的基本思路 : 适应当前经济转型的需要, 适应地方经济社会发展的需要, 培养与生产力发展水平相一致并适当超前的人才, 培养与经济结构相适应的高质量人才, 培养与市场需求紧密结合的专业人才 蔡绍洪校长谈到, 贵阳大数据金融学院是双方融入贵州大数据产业发展和对接贵阳大数据金融发展的有效途径和具体行为 我校将把该院建成国际知名 国内领先的大数据金融人才培养基地, 创新开放 包容共享的大数据金融发展的政产学研协同创新中心 贵州日报 在报道中指出, 短短一个月, 贵阳大数据金融学院就从 纸上 落到了 地上, 贵州财经大学以高效务实的行动, 迅速驶向大数据金融这片 新蓝海 8

15 2016 贵州高校大数据发展简介 贵州财经大学举办大数据金融人才专场招聘会 5 月 27 日, 由贵州财经大学与贵阳市人力资源与社会保障局主办, 学校招生就业处与贵阳市人才市场共同承办的大数据金融人才专场招聘会在鹿冲关校区贵阳大数据金融学院举行 本次招聘会有学校大数据金融相关专业毕业生和贵阳大数据金融学院首届大数据知识 与技能培训班学员共计 1500 人参加 贵州慧积地大数据平台服务有限公司 贵阳讯鸟云计算科技有限公司 招商银行 中国民生银行 贵州富盛电子商务有限公司等近 40 家大数据企业 金融企业和电商企业到场招聘, 提供了人力资源 行政管理 财务管理 市场营销 呼叫等各类岗位 1200 多个, 达成初步就业意向 412 人 此外, 贵阳市人才市场还在现场为求职者提供了大数据 金融以及电商企业等相关政策咨询和宣传服务 贵阳市人才市场 招生就业处领导以及嘉宾等到招聘会现场与用人单位进行广泛交流并推荐指导学生积极应聘 贵阳大数据金融学院与南京大学互联网金融研究中心达成合作意向 5 月 27 日上午, 贵州财经大学贵阳大数据金融学院与南京大学互联网金融研究中心代表团在鹿冲关校区学术交流中心举行以 我国大数据发展现状及其发展趋势 为主题的座谈会 葛建军副校长出席会议, 会议由王作功院长主持 葛建军副校长致欢迎辞 王作功院长代表我校就大数据金融学院的建设 发展规划 前景及与贵阳市政府合作项目等方面作了简要介绍 南京大学互联网金融研究中心主任裴平教授介绍了该校大数据金融研究的情况, 并表示希望能加强两校在大数据金融方面的合作 此次南京大学代表团一行由 4 个团队组成, 分别在师资 科研 市场 校企合作 ( 以苏宁集团为主 ) 及大数据产业发展 ( 以江苏盐城为主 ) 等几个方面与贵州财经大学贵阳大数据金融学院进行了深入细致的探讨, 双方初步达成两校关于大数据金融合作 MBA 学生交流互访 师资培养 科研课题互助等方面合作意向 最后, 葛建军副校长强调, 希望两校加强合作, 共享资源, 在大数据金融建设 发展的过程中, 互相学习, 加强交流 9

16 大数据金融信息剪辑 贵阳云尚城市资产运营有限公司与贵阳大数据金融学院商讨合作事宜 2016 年 6 月 21 日下午, 贵 阳云尚城市资产运营有限公司 副总经理赵振霄 街觅 ( 北 京 ) 科技有限公司董事长戴世 杰及其团队到访贵阳大数据金 融学院, 我院党委书记张宁 院长王作功 游宗君博士 谭 建博士及王丰阁博士与客人举 行了愉快的会谈 王作功院长首先表示热烈 欢迎赵总 戴总及其团队到访 大数据金融学院, 并向与会者 介绍了大数据金融学院的成立 背景 成立过程 发展定位, 并着重介绍了学院的人才结 构, 并表达了建立紧密合作关 系的愿望 云尚城市有限公司副总经 理赵振霄表示希望与贵阳大数 据学院共同探讨智慧城市的建 设方案, 并且希望在公司发展 战略 公司融资规划 智慧城 市建设, 特别是在公司大数据 业务板块方面的专题研究得到 贵阳大数据学院在专业上的理 论支持 游宗君 谭健 王凤 阁等三位博士就政府数据与商 业数据的联通 整合问题与客 人们进行了深入的学术交流 张宁书记就双方合作的关键问 题提出了建议, 并对实施细节 提出了明确要求 双方就具体 合作事宜达成了合作意向 贵阳大数据金融学院与世界著名大数据公司 Hortonworks 建立合作伙伴关系 2016 年 7 月 11 日上午, 贵阳大数据金融学院王作功院长 游宗君博士 王丰阁博士 贵州省经济仿真重点实验室张文专副主任与来访的 Hortonworks 公司亚太区技术支持总监 Cindy Liu 举行了友好座谈 王作功介绍了贵州财经大学的概况和办学特色 贵州省特别是贵阳市大数据和大数据金融的发展成就 贵阳大数据金融学院的成立背景和办学目标,Cindy Liu 介绍了 Hortonworks 公司的基本情况 与高校合作的模式 双方 在课程模块设计 教学内容共享 教育技术主持 合作交流机制等方面进行了友好交流, 达成了广泛共识, 并同意建立全面合作伙伴关系 Hortonworks 公司是世界著名的大数据公司, 总部设在美国硅谷, 专注于 Apache Hadoop 的开发和支持, 由雅虎公司为主导于 2011 年发起设立, 于 2014 年在纳斯达克交易所公开发行股票并上市 贵阳大数据金融经过前期沟通谈判, 于 2016 年 6 月 24 日注册成为 Hortonworks 公司 在中国大陆的第一家高校合作伙伴, 可以免费使用其以培养程序管理员 程序分析师和数据科学家为目标的课程体系 目前, 中国大陆成为其合作伙伴的高校还有华东师范大学, 据悉, 中山大学 清华大学与 Hortonworks 公司的合作沟通正在顺利进行之中 与 Hortonworks 公司建立全面合作伙伴关系将对贵阳大数据金融学院提升国际化办学水平 跟踪世界大数据产业发展前沿 培养高素质实用性专业人才发挥积极作用 10

17 2016 贵州高校大数据发展简介 第一届贵阳大数据金融实验班顺利开班 根据学校对大数据金融人才培养的总体部署, 在各有关部门和各学院的支持下, 本校 2013 级本科生与 2015 级研究生经过自愿报名 选拔考试 择优录取, 共有 123 名本科生和 14 名研究生进入大数据金融学院实验班学习 实验班于 2016 年 8 月 26 日下午在鹿冲关校区大数据金融大讲堂举行开班典礼, 学校党委委员 副校长缪坤和出席, 贵阳大数据金融学院全体教职员工及实验班学生参加 开班典礼由大数据金融学院执行院长赵子铱主持 缪坤和副校长代表学校在开班典礼上讲话, 他鼓励学 生要抓住大数据时代赋予的机遇, 不辱历史使命, 刻苦学习, 积极主动培养创新思维与创新能力 大数据金融学院院长王作功对学生在贵阳大数据金融学院的系统学习充满期待, 鼓励他们勇于担当, 迎接挑战, 学院也将全力以赴组织好学生的学习与生活, 让他们在实验班的学习学有所获 贵阳大数据金融学院直属党支部书记张宁对同学们提出殷切希望 : 高举大数据金融的旗帜, 作出表率 ; 谦虚谨慎, 砥砺前行 ; 志存高远, 树立远大理想 ; 拓展视野, 培养创新精神 ; 遵纪守法, 做合格大学生 侯浪同学作为实验班学生代表表达了对学校与学院的感谢和通过选拔考试的欣喜, 他代表全体同学表示会珍惜实验班学习的机会, 决心攻艰克难 学有所成 开办贵阳大数据金融学院实验班, 为我校融入贵州省大数据发展战略, 积极探索适应区域经济社会发展的大数据金融相关专业人才的培养, 不断满足区域经济社会对人才的迫切需求 贵阳大数据金融学院将创造条件, 以就业为导向, 为贵阳乃至全省培养具有大数据以及大数据金融类相关基础的专业型实操人才而努力 贵阳大数据金融学院 2016 年第 5 期 云岩讲堂 暨云岩区 数据白领 第一期培训班顺利开班 由云岩区人才办和贵阳大数据金融学院主办的 2016 年第 5 期 云岩讲堂 暨云岩区 数据白领 第一期培训班于 2016 年 9 月 6 日上午在鹿冲关校区贵阳大数据学院大讲堂顺利开讲 本次培训主要是以大数 据 大数据金融等领域的相关政策 知识和发展前沿等作为培训内容主体, 师资力量雄厚, 包括国内外大数据金融领域的顶尖企业家和专家学者等 培训的目标是提高云岩区党政相关部门工作人员关于大数据及大数据金融的认知水 平 理论素养和决策能力, 服务地方经济发展, 为全面贯彻落实贵阳大数据金融发展战略添砖加瓦 同时参加培训的还有 2017 届贵阳大数据金融学院硕士和本科三个实验班的全体同学 11

18 大数据金融信息剪辑 贵州财经大学贵阳大数据金融学院实践教学基地签约暨挂牌仪式在贵阳众筹金融交易所举行 2016 年 10 月 10 日上午, 贵州财经大学贵阳大数据金融学院实践教学基地签约暨挂牌仪式在贵阳众筹金融交易所举行, 贵阳大数据金融学院直属党支部书记张宁 贵阳大数据金融学院院长王作功 执行院长赵子铱等 贵阳众筹金融交易所董事长刘文献及公司其他领导员工参加 刘文献董事长在致辞中介绍了大数据金融对贵阳及至 当今世界众筹金融体系的理论创新和贡献, 提出贵阳众筹金融交易所得到了贵州财经大学大数据金融理论体系 人才交流 国际合作方面的支撑, 更好的促进了众筹金融在贵阳的蓬勃发展 张宁书记在致辞中介绍了贵阳大数据金融学院的办学理念和人才培养目标, 对贵阳众筹金融交易所对学院发展的支持表示感谢, 希望能为大数据金融人才培养提供更好 的实践平台 随后王作功院长与刘文献董事长签署实践教学基地协议并挂牌, 刘文献董事长向学院捐赠大数据金融有关图书 贵阳众筹金融交易所贵州财经大学贵阳大数据金融学院实践教学基地的建立, 标志着贵阳大数据金融学院的学子又多了一个实践实习的阵地, 多了一个自我教育 自我规范 自我展示的平台 贵州产业技术发展研究院与贵阳大数据金融学院 10 月 17 日上午, 贵州产业技术发展研究院产业项目研究部负责人刘渠带队到贵阳大数据金融学院洽谈合作事宜 贵阳大数据金融学院院长王作功同志介绍了贵阳大数据金融学院的成立背景以及在学生 培养 科学研究 社会服务等方面工作开展的情况 ; 刘渠同志介绍了贵州产业技术发展研究院的基本情况以及在科学研究 社会培训等方面取得的成绩 双方同意在大数据金融 产业发展等领域开展课题研 究 专题培训等方面的合作, 并就合作机制 合作模式等进行了深入交流 随后, 刘渠一行还参观了贵阳大数据金融学院多功能报告厅等教学区域 12

19 2016 贵州高校大数据发展简介 贵阳大数据金融学院与贵阳大数据交易所签订 实践教学基地协议 2016 年 10 月 20 日下午, 贵州财经大学贵阳大数据金融学院第二家实践教学基地签约暨挂牌仪式在贵阳大数据交易所举行, 贵阳大数据金融学院直属党支部书记张宁 贵阳大数 据金融学院院长王作功 执行院长赵子铱等 贵阳大数据交易所执行副总裁陆广龙及公司其他领导员工参加 仪式前, 贵阳大数据金融学院领导与陆广龙进行了深度 会谈, 双方在校企合作 课题研究 专业实习 培训交流等方面达成了共识, 并就合作机制 合作模式等进行了深入交流 随后王作功与陆广龙签署实践教学基地协议并挂牌 伦敦大学亚非学院院长克里斯汀 奥顿教授访问贵阳大数据金融学院 11 月 3 日下午, 英国伦敦大学亚非学院 (SOAS) 院长克里斯汀 奥顿 (Christine Oughton) 教授到我院参观并进行了交流座谈 大数据金融学院直属党支部书记张宁 院长王作功 执行院长赵子铱 副院长夏换等相关人员参加了此次座谈会 克里斯汀 奥顿教授参观了大数据金融实验室 图书馆, 观摩了大数据金融实验班 的数据挖掘与分析实验课, 她对实验课及学生的学习态度与成效表示高度肯定 参观结束后, 在我院会议室举行了交流座谈会 会上, 张宁书记首先代表贵阳大数据金融学院对克里斯汀 奥顿女士的到来表示了热烈的欢迎 随后, 双方就硕士研究生和博士研究生合作办学的相关问题进行了探讨和交流并初步达成意向 双方还就目前各自的研 究方向和研究重点进行了学术交流, 在普惠金融 绿色金融 大数据金融等研究领域找到了契合点并就这些领域的研究进行了更进一步的探讨和交流 最后, 奥顿女士表示非常期待能与贵阳大数据金融在办学及学术交流方面进行合作 贵阳市外办胡舒迪和贵阳市卓越科技金融有限公司唐鹤子陪同参观与交流 13

20 大数据金融信息剪辑 中央民族大学法学院邓建鹏教授为大数据金融实验班学生开设讲座 11 月 4 日下午, 中央民族大学法学院博士生导师邓建鹏教授为大数据金融实验班的学生做了题为 互联网金融 : 监管与新趋势 的讲座 贵阳大数据金融学院院长王作功 任课教师游宗君及本科实验班近 100 名学生参加 邓建鹏首先详细介绍了当下互联网金融发展的诸多业 态, 指出互联网金融特别是大数据金融将是未来金融行业发展的新趋势, 也是传统金融业力求改革创新的方向, 同学们一定要抓住机遇 迎接挑战, 努力学习相关专业知识, 茁壮成长为大数据金融领域的第一批弄潮儿 接着, 对互联网金融的安全和监管做了深入讲解, 从近几年来我国破获的几 项重大非法集资案件入手, 进而指出该行业目前存在的诸多隐患及监管上存在的尚未解决的问题, 深入分析了几家大型的 P2P 网络借贷平台, 并跟同学们分享了众多的切身调查感受和经验 最后, 亲切的和同学们进行交流互动, 整个会场呈现出欢乐和谐的氛围 上海贝格 数据宝和九州证券到贵阳大数据金融学院举行招聘宣讲会 11 月 9 日上午, 在鹿冲关校区第二教学楼, 数据宝副总裁高培德 渠道经理左承鑫与人事部滑雪 上海贝格技术总监助理河源与人事部朗璇 刘智慧和九州证券的姚金研到我院举行招聘宣讲会 大数据金融学院学生科负责人王丰阁 班主任项美玉与杨博雯和大数据金融实验班的全体同学参加 了此次宣讲会 三家公司分别对各自的成立与发展 企业文化 人才培养与激励体系 人才需求岗位作了详尽的介绍 随后, 双方展开热烈互动, 从双方的交流中可以看出, 相对薪酬福利, 学生更注重自身的成长, 关注企业业务与产品是否与自己的专业相匹配 企业的人才培训 内容与方式是否可以有效地提升自身的能力 通过举行此次招聘宣讲会, 让学院坚定大数据金融的专业人才培养方向 通过与企业的交流, 学院了解到企业的人才需求, 有助于探索 完善交叉学科人才培养的方案 实验班的同学们则在参加宣讲会后, 坚定自己的选择, 明确努力的方向 14

21 2016 贵州高校大数据发展简介 贵阳大数据金融学院贵州翼云大数据服务有限公司实践教学基地挂牌成立 2016 年 11 月 29 日下午, 贵州财经大学贵阳大数据金融学院实践教学基地签约暨挂牌仪式在贵州翼云大数据服务有限公司举行, 贵阳大数据金融学院院长王作功 贵州翼云大数据服务有限公司总经理刘大 平 贵州翼云大数据培训有限公司总经理许懿及公司其他领导员工参加 仪式前, 王作功院长在许懿的陪同下参观了翼云大数据展示中心, 并与刘大平 许懿进行了深度会谈, 双方在校企 合作 人才培养 专业实习 实战课程 培训交流等方面达成了共识, 并就合作机制 合作模式等进行了深入交流 随后王作功与刘大平 许懿签署实践教学基地协议并挂牌 贵阳大数据金融学院承办的微金融 50 人论坛 2016 峰会云计算与大数据分论坛顺利举办 2016 年 12 月 日, 微金融 50 论坛 新华网 中国信息通信研究院主办的 2016 峰会在北京国际会议中心成功举办, 本次峰会的主题是 微金融 新经济 大未来, 中国人民大学副校长吴晓求教授, 阿里巴巴集团副总裁 阿里研究院副院长高红冰先生, 贵阳市金融办副主任罗尧重先生等 50 多位专家与会并发表演讲 贵阳大数据金融学院承办了云计算与大数据分论坛, 我院院长王作功主持分论坛 王作功院长介绍了贵州 贵阳大数据产业发展取得的成就, 向企业家 专家发出来到贵阳发展大数据和大数据金融的邀请, 也表达了贵阳大数据金融学院与各位企业家 专家开展合作的愿望 中关村大数据产业联盟秘书长赵国栋, 阿里云数据架构部总架构师周卫天, 云天大数据公司 CEO 雷涛, 数联铭品科技有限公司首席风险官 我院学术委员会主任袁先智等分别发表了关于大数据产业生态 云计算与大数据智 能 深度学习在信用卡审批反欺诈的应用 大数据金融风险管理的主题演讲 随后, 王作功 袁先智 周卫天 雷涛以及软通动力高级副总裁史研 泛海保险在线技术总监李璞 安永合伙人吴大维等举行了圆桌论坛, 就云计算与大数据应用的前景 存在的问题等进行了认真的讨论 论坛吸引了 100 多位业内听众分享 论坛在中午 12 点结束后, 与会听众还与专家进行了热烈讨论, 大家相约明年峰会再见! 15

22 大数据金融信息剪辑 贵州大学 来源 : 贵州大学新闻网 我校与北京邮电大学洽谈大数据合作事宜并签署本科生交流培养协议 贵大新闻网讯 ( 对外合作处 ) 为落实今年 6 月 16 日北京邮电大学党委书记王亚杰来我校考察时与郑强校长达成的合作意向,6 月 22 日, 副校长李军旗率队前往北京邮电大学, 洽谈大数据国家重点实验室建设合作事宜, 并签署本科生交流培养协议 北京邮电大学任晓敏副校长介绍了北邮的发展及科研情况, 并表示将积极支持我校大数据国家重点实验室的建设 李军旗介绍了我校近年来的发展 变化, 重点介绍大数据方面的科研进展 取得的成绩和遇到的困难, 尤其是在申报国家重点实验室方面希望得到北邮的帮助和支持 6 月 22 日下午, 李军旗副校长一行前往北京大学, 拜访了北京大数据研究院院长 北京大学元培学院院长 中国科学院院士鄂维南教授 李军旗介绍了我校在申报大数据国家重点实验室所面临的困难 问 题, 希望鄂维南院士在人才 团队建设 申报材料等方面给予我校大力支持和帮助 鄂维南院士简要介绍了北京大数据研究院情况, 对我校大数据建设进行了分析, 并表示支持我校大数据国家重点实验室建设, 同意我校派年轻教师到研究所做访问学者, 在科研团队建设等方面提供帮助和支持 北京大数据研究院吴中海副院长参加会见 贵州省公共大数据重点实验室研究人员参加 英国大数据代表团与科技厅科技创新合作研讨会 贵大新闻网讯 5 月 26 日, 由贵州省科技厅组织召开的 英国大数据代表团与科技厅科技创新合作研讨会 于贵阳新世界酒店举行 此次会议旨在促进英国科技创新处与贵 州省科技厅就中英大数据合作平台, 尤其在能力建设和科技创新方面的交流与合作达成初步想法, 以及使英国代表和贵州大数据专家就开放数据大数据进行深入讨论, 推动交流合 作机制的形成 贵州大学田有亮教授和黄瑞章副教授参加了此次会议, 并就贵州省公共大数据重点实验室在大数据领域的发展需求和合作与英方代表进行交流 16

23 2016 贵州高校大数据发展简介 国家 863 课题项目总体组研讨会暨贵州省公共大数据重点实验室建设专家咨询交流会在我校召开 贵大新闻网讯 ( 童奇扬姚 瑶罗庆亚 摄影方志仁 )5 月 23 日, 由贵州大学 ( 贵州省 公共大数据重点实验室 ) 和长城 网络系统应用有限公司承办的国 家 863 课题项目总体组研讨会暨 贵州省公共大数据重点实验室建 设专家咨询交流会在我校西校区 崇理楼 607 会议室召开 中国工程院院士方滨兴 国防科技大学教授贾焰 教育 部长江学者特聘教授马建峰 中国科学院信息工程研究所研 究员李凤华及中科院 北京大 学 武汉大学等十个课题组长 及课题主要成员专家 30 余人参 加了本次会议 报告会期间, 校党委书记 陈坚会见了方滨兴院士一行, 陈 坚书记 李军旗副校长与方滨兴 院士一行进行了深入交流 贵州省公共大数据重点实验室召开动员大会 贵大新闻网讯 ( 贵州省公共大数据重点实验室 )5 月 17 日下午, 贵州省公共大数据重点实验室全面启动动员大会在贵州大学西校区崇理楼 607 报告厅举 行, 标志着贵州省公共大数据重点实验室已全面启动 本次大会的任务是调动全省大数据相关科研和技术人员积极投入重点实验室建设和科学研究 我校副校长 李军旗 科研院及相关学院负责人 贵州省大数据产业发展应用研究院及其实验室负责人出席会议, 校内研究人员和校外兼职研究人员参加会议 贵州省何力副省长主持会议研究公共大数据重点实验室建设 2016 年 5 月 11 日上午, 贵州省何力副省长主持召开会议, 研究大数据重点实验室建设有关问题, 省政府副秘书长潘小林 省科技厅副厅长林浩 贵州大学副校长李军旗, 省科技厅计划处 省公共大数据重点实验室有关负责人参加会议 会上, 李军旗副校长汇报了自上次何力副省长在贵州大学调研以来, 贵州大学按照何 力副省长要求和指示在推进实验室建设方面的相关工作情况和面临的困难问题, 随后, 实验室相关负责同志进行了补充汇报 在听取汇报后, 林浩副厅长表示, 希望贵州大学要丰富实验室建设内涵, 把实验室的建设和贵阳大数据产业技术创新试验区的建设结合起来, 加快推进国家重点实验室的申建工作 最后, 何力副省长在讲 话中指出, 接下来公共大数据重点实验室要持续推进几方面的工作 : 一是实验室现有团队要积极组织起来, 学校要为实验室团队提供保障 二是要充分认识自身不足, 围绕实验室研究方向强化人才队伍建设 三是与省内相关单位加强联动, 对现有大数据应用领域进行深入挖掘, 提炼科学问题, 以尽快形成重点实验室自有研究成果 17

24 大数据金融信息剪辑 贵大教授谢泉 : 贵阳应建设国家级公共大数据中心 摘要 : 今年的全国两会上, 政府工作报告 专门提出促进大数据 云计算 物联网广泛应用 对于贵阳打造大数据综合创新试验区这一目标, 谢泉提出合理布局 数据交易立法 数据安全 建设国家级数据中心四点建议 谢泉认为, 贵阳应借助贵 州建设大数据综合试验区的机遇, 合理布局 合理规划, 推进大数据产业领先领跑, 围绕 核心业态关联业态衍生业态, 构建大数据全产业链, 各区市县之间不要重叠发展 全国人大代表谢泉 : 就业率 100% 贵州大数据专业毕业生被 一抢而空 首届大数据专业研究生去向如何? 又是一年全国两会, 谢泉带来了鼓舞人心的答案 : 就业率 100%, 被一抢而空! 他说, 贵州通过创新培养和人才引进的方式, 大数据产业人才问题已经不再是难题 副省长何力一行来校调研指导公共大数据重点实验室筹备工作 贵大新闻网讯 ( 文 / 周贤军图 / 陈恒 )12 月 4 日, 副省长何力, 省政府副秘书长潘小林 省科技厅 省经信委 贵阳市政府等相关单位负责人到我校调研指导公共大数据重点实验 室 ( 以下简称实验室 ) 筹备工作 我校领导陈坚 郑强 赵德刚 李军旗陪同调研 何力一行首先来到西校区大数据学院新楼, 现场考察实验室的选址, 听取大数据学院 副院长王旭博士对实验室功能划分与分布情况的介绍, 了解实验室装修 块数据 实验室 公共大数据运用等筹备工作推进情况 我校大数据重点实验室筹建工作提速 贵大新闻网讯 ( 记者丁龙摄影陈恒 )11 月 10 日下午, 省委常委 贵阳市委书记陈刚 副省长何力到我校调研贵州大学筹建大数据重点实验室工作开展情况 校领导陈坚 郑强 赵德刚 李军旗陪同调研, 省科技厅 贵阳市 贵州大学有关部门负责人参加调研 在贵州大学科技园千人计划大数据研究院, 陈刚 何力 听取了我校专家在大数据应用上的科研成果汇报, 并详细了解我校在大数据技术研发 技术转化 人才培养等方面取得的成绩 18

25 2016 贵州高校大数据发展简介 贵州省大数据发展应用条例 ( 草案 ) 起草座谈会在我校举行 贵大新闻网讯 ( 记者丁龙摄影陈恒 )10 月 28 日上午, 贵州省大数据发展应用条例 ( 草案 ) 起草座 谈会在一号会议室举行 省人大法制委员会主任委员张卫华, 校领导陈坚 王红蕾以及省人大法工委 省经信 委 我校相关部门负责人参 加座谈会 副校长王红蕾主 持座谈会 花溪区政府与大数据学院开展合作交流 贵大新闻网讯 ( 大数据与信息工程学院摄影报道 )9 月 8 日, 花溪区政府与大数据与信息工程学院合作交流会在我校北校区博学楼 901 举行 本次交流会旨在增强花溪区政府与 大数据学院的相互了解, 为今后的合作发展奠定基础 花溪区园区常务副主任 区政府党组成员管路及花溪区政府办 人才办 发改局 农业局 工信局 科技局 商务 局 人社局 供销联社 孟关乡等部门代表参加会议 大数据学院院长谢泉 副院长丁召及学院相关科室代表参加座谈 会议由大数据学院党委副书记王高军主持 千人计划专家与大数据创新创业论坛贵州大学举行 摘要 :5 月 25 日,2015 全球大数据时代贵阳峰会之千人计划专家与大数据创新创业论坛在贵州大学举行 5 月 25 日,2015 全球大数据时代贵阳峰会之千人计划专家与大数据创新创业论坛在贵 州大学举行 论坛上, 贵州大学校长郑强作题为 大学生创业视野和定位 的主旨演讲, 千人计划专家代表薛杨作题为 新常态下创新创业新模式 的主旨演讲, 投资代表汪潮涌作题为 创新产业 的主旨演讲 千人计划专家团队和投资人团队分别以 大数据时代 创新带动创业发展的机遇与挑战 利用创新产业增强国际投资吸引力 为主题展开现场对话, 并与现场观众互动 19

26 大数据金融信息剪辑 花溪区来校商谈千人计划大数据研究院入驻贵大科技园工作 贵大新闻网讯 ( 记者致远 )5 月 19 日, 花溪区区委书记康克岩 区长向子琨率相关部门负责人来校商谈千人计划大数据研究院入驻贵大科技园等相关工作 校党委书记姚小泉, 校长郑强 副校长吴次南出席座谈会 学校相关部门负责人参加座谈 会上, 学校 花溪区相关部门负责人汇报了工作准备情况 姚小泉指出, 今年是贵州大学发展的关键时期, 千人计划大数据研究院入驻贵州大 学科技园, 将为学校综合实力提升增添新动力 他表示, 贵州大学的发展离不开省委省政府 市委市政府和花溪区的关心和支持, 学校将全力配合做好相关工作, 确保活动成功举办 郑强表示, 贵州大学高度重视高层次人才引进工作, 并积极创造条件为高层次人才开展科技创新, 服务贵州经济社会发展搭建平台 郑强要求学校相关部门完善工作方案, 加快工作进度, 积极做好与花溪区的工作对接 康克岩 向子 琨分别讲话 双方就千人计划大数据研究院入驻贵州大学相关工作以及花溪区与贵州大学进一步加强联系, 完善交流机制, 推动双方共同发展等内容进行了交流 据了解,5 月 25 日上午, 2015 贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会 千人专家 创业创新分会将在贵州大学举行 作为分会的重要内容, 届时, 贵州大学 千人计划大数据研究院 将揭牌成立 贵州大学实施专业综合改革助推大数据产业发展 4 月 20 日上午, 贵州大学大数据与信息工程学院信息与通信工程系主任张达敏和往常一样来到办公室, 继续 通信工程 专业综合改革试点项目具体实施方案的制定 这个项目主要是实施专业综合改革, 为贵州大数据产业发展培养实用人才 张达敏说 为响应我省实施的大数据产业发展战略, 作为省内唯一的 211 高校, 贵州大学于 2014 年 5 月成立大数据与信息工程学院, 设立大数据科学与工程系, 目前有信息管理与信息系统 ( 电商大数据 ) 和物联网工程 ( 大数据采集与分析 ) 两个本科专业, 成 为首个以大数据作为学院设置方式的高校 当时, 张达敏参与了这两个本科专业培养方案的制定 张达敏说, 制定大数据人才培养方案, 面临的首要困难就是可参考资料少, 因为全国范围内目前还没有专门培养大数据人才的高校, 教育部的本 20

27 2016 贵州高校大数据发展简介 科专业和研究生专业目录中尚没有明确的大数据专业, 学科建设和人才培养得不到充分有效的参考和借鉴 为此, 张达敏和相关学科的负责老师一起进行多番研究 考察 分析, 最后整合信息管理与信息系统以及物联网工程两个本科专业, 在信息管理与信息系统专业开设电商大数据技术方向, 物联网工程专业开设物联网大数据采集与分 析方向 至此, 贵州大学大数据人才培养的基础建立 有了本科生培养计划, 张达敏又开始为培养更高层次的大数据人才而忙碌, 参与学院大数据研究生创新班培养方案的制定 去年, 学院大数据研究生创新班开班, 从统计 信息工程等大数据相关专业中选拔第一批 30 人的研二学生作为首批创新班研究生, 重点培养为高层次大数据人才 在如此短的时间内完成贵州大数据人才培养的基础工作, 基本形成 本科硕士博士博士后 的一体化人才培养格局, 不能不说是一个值得骄傲的成绩 张达敏说, 在今年的研究生招生调剂工作中, 学院的大数据特色吸引许多优秀考生前来学院接受复试选拔, 说明大数据专业的发展前景被看好 我校召开贵州省大数据产业发展应用研究院理事会筹备会 贵大新闻网讯 ( 记者尹梓熹 )4 月 24 日下午 3 点, 贵州省大数据产业发展应用研究院理事会筹备会在我校行政楼第一会议室召开 贵阳市副市长徐昊, 贵安新区开发投资有限公司副总经理陈永军, 我校校长郑强及副校长吴次南 李军旗, 贵州民族大学副校长 贵州省大数据产业发展应用研究院常务副院长韦维, 贵州大学科学技术研 究院 基建处 计算机科学与技术学院 先进技术研究院 大数据与信息工程学院等相关单位负责人参加会议 吴次南主持会议 贵州省大数据产业发展应用研究院由贵阳市 贵安新区 贵州大学联合建设, 该院紧紧围绕 贵州省大数据产业发展应用规划纲要 ( 年 ), 致力构建以研发为主的集科学研究 人才培养 技术创新为一体的大数据协同创新生态中心 贵州省大数据产业发展应用研究院相关负责人汇报研究院工作开展情况 韦维从平台建设 人才培养 开发项目 获奖情况和存在问题等方面进行汇报 基建处负责人汇报了研究院大楼建设情况并展示研究院大楼规划 21

28 大数据金融信息剪辑 我校获贵州省大数据领域科技创新第一个重大专项 贵大新闻网讯 ( 现代制造重点实验室 ) 日前, 我校大数据研究领域李少波教授牵头的 数据聚合机制及分析与交易机理研究 获贵州省应用基础研究计划重大项目支持, 成为贵州省大数据领域科技创新的第一个重大专项 数据规模的快速增长以及数据模式高度复杂化已成为许多行业共同面对的严峻考验和宝贵机遇, 为此, 国家基础研究发展 十二五 专项规划 省政府 关于加快大数据产业发展应用若干政策的意见 等相关文件 都将大数据确定为重点研究领域 根据省委省政府的部署, 省科技厅结合贵州大数据资源特点, 组织实施了 数据聚合机制及分析与交易机理研究 贵州省应用基础研究计划重大项目 该项目由我校李少波教授牵头, 组织中国科学院国家天文台 贵州师范大学 贵州电信 贵州联通 贵阳农业大数据交易中心 贵阳铝镁研究院 贵州科学院等单位, 面向贵州大数据产业发展, 以工业 农业 天文 运营商大数据为依托, 提出我省 大数据产业发展的重大科技基础研究战略问题 据悉, 该项目建设目标主要是提出我省大数据产业发展的重大科技基础研究战略问题, 形成一支在全国领先的大数据研究团队 ; 探索凝练大数据信息获取 存取 应用 安全等方面的关键科学问题, 建立基础科学研究构架 ; 突破重大应用基础技术, 研究交易机理与交易标准, 构建交易平台, 为我省大数据交易及服务性企业培育 发展提供支撑, 为我省大数据产业的发展提供支撑 贵州省大数据产业研究院 贵州大学大数据与信息工程学院揭牌 贵大新闻网讯 ( 记者唐娟 )5 月 28 日下午, 贵州省大数据产业发展应用研究院 贵州大学大数据与信息工程学院在贵州大学揭牌 省人大党组书记 副主任龙超云, 副省长何力, 省政协副主席陈海峰, 上海交通大学副校长 中国科 学院院士梅宏, 贵阳市委副书记 市长刘文新, 贵安新区管委会主任马长青等出席揭牌仪式 校党委书记姚小泉主持仪式 校长郑强介绍了贵州省大数据产业发展应用研究院 贵州大学大数据与信息工程学院 的筹建情况 贵阳市 贵安新区 贵州大学签署了 共建贵州省大数据产业发展应用研究院合作协议 陈海峰 马长青为贵州大学大数据与信息工程学院揭牌, 何力 刘文新为贵州省大数据产业发展应用研究院揭牌 22

29 2016 贵州高校大数据发展简介 我校进军大数据产业研究 贵大新闻网讯 ( 实习记者慎志懿 ) 为进一步推动大数据产业研究院的成立, 促进全省乃至全国大数据产业的发展,4 月 23 日上午, 贵州大学大数据产业发展应用研究院专家研讨 会在我校北校区行政楼第一会议室举行 浙江大学 中国计算机学会大数据专家委员会 华为公司 贵安新区 省经信委 省发改委 省教育厅和贵州省移动通讯公司的相关专家 应邀出席 校领导郑强 封孝伦 宋宝安 赵德刚, 助理巡视员谢田凯以及相关部门和学院负责人参加研讨 常务副校长封孝伦主持会议 我省将建大数据产业研究院 记者从昨日举行的贵州大学大数据产业发展应用研究院研讨会上获悉, 研究院由贵安新区管委会 泰豪集团有限公司 贵州大学等联合建设, 建设总经费 万元, 由研发大楼 综合办公楼 产业孵化楼和公寓等组成, 实行理事会领导下的院长负责制 研究院的建设, 以 贵州省大数据产业发展应用规划纲要 ( 年 ) 为指导, 以贵州大学为核心, 联合浙江大学 省内各职能部门 科研院所 高校等, 建设内 容包括基础设施 人才队伍 研发机构 培育基地 数据中心 管理机构 公司等 研究院的发展分为三个阶段 2014 年至 2015 年为第一阶段, 将完成大数据研究院建设工作, 建立大数据基础研究所 大数据应用研究所 智慧城市研究所 大数据重点实验室 两个产业培育基地 ( 智慧城市基地 大数据产业基地 ) 一个中心( 大数据中心 ) 和两个公司 ( 风投公司 基金公司 ), 并设立学术委员会 学位委员会和工业委员 会 同时, 围绕大数据产业开展相关研究, 引进和培养 200 名大数据高端人才, 培养 1000 名应用人才, 孵化 2 至 3 家 10 亿元以上企业和 3 至 5 家亿元以上企业 2016 年至 2017 年为第二阶段 2018 年至 2020 年为第三阶段, 将完成 100 项以上项目研究, 引进和培养 1000 名大数据高端人才, 培养 5000 名应用人才, 孵化 10 家以上 100 亿元企业, 孵化 20 家 10 亿元以上企业和超过 30 家亿元以上企业 ( 本报记者王远白 ) 23

30 大数据金融信息剪辑 贵州师范大学 大数据专家苏建峰到我校开展 大数据背景下的体育产业发展 论坛 5 月 30 日晚, 体育学院在宝山校区田家炳三楼多功能厅举行 大数据背景下的体育产业发展论坛 参加贵州省数博会的专家 北京和健道信息科技有限公司 CEO 苏建峰 贵州中康致远体育发展有限公司董事长陈国辉 深圳好家庭实 业有限贵州公司总经理高智应邀出席 体育学院院长姚鑫 副院长曾晓进 朱江副教授等陪同 体育学院部分师生参加 论坛由姚鑫主持 苏建峰为大家作 大数据背景下的体育产业发展 健身宝 生态链平台 的报告, 涉及体育人怎么看互联网和体育产业 大数据背景下体育产业发展定位 如何构建大健康产业 我们未来的优势和赢利模式等, 并向大家介绍了论道健身 健身宝商业计划 我校与贵阳大数据交易所签署战略合作协议 近日, 我校副校长乙引与贵阳大数据交易所执行副总裁陆广龙代表校企双方, 在贵阳大数据交易所签订战略合作协议 双方围绕紧密合作, 优势互补, 资源整合, 打造大数据产业链等议题进行了深度探讨 根据合作协议, 双方将在互有优势 交叉性强的领域开展跨界合作, 整合 产 学 研, 鼓励双方的交流从应用层级向行业方向延伸, 培育新的学科增长点并提供大数据培训 数据分析及挖掘等支持 ; 共同探索大数据综合开发利用机制, 促进行业经济整体发展, 优化产业结构 ; 共同打造 大生态 大扶贫 大健康 等具有 多彩贵州 特色的行业大数据应用产品, 切实促进大数据的市场 化 有价化, 共同推进大数据产业的发展 我校将发挥自身人才优势, 与贵阳大数据交易所联合开展大数据应用的分析研究, 积极推动大数据交易及相关信息的传播, 助推大数据产业的快速健康发展, 提升学校服务地方经济社会和产业发展的能力 24

31 2016 贵州高校大数据发展简介 副校长谢晓尧为贵州省大数据产业发展与应用高级研修班授课 12 月 1 日下午, 贵州省政 协副主席 贵州省大数据领导小组副组长 贵州省大数据专家组副组长 我校副校长谢晓尧在宝山校区田家炳教育书院三楼多功能厅, 为贵州省大数据产业发展与应用高级研修班学员授课, 主题为 拥抱大数据时代 谢晓尧围绕大数据的定义 贵州实施大数据战略行动历程及国家重大工程 500 米球面射 电望远镜三个方面畅谈了贵州大数据产业发展与应用 谢晓尧从大数据的定义展开, 谈到大数据的起源与断代, 他指出, 随着大数据应用领域扩展, 技术的不断演进, 为大数据广泛应用提供了条件 他提到, 经过近两年的探索实践, 我省大数据发展风生水起, 我们还将深入挖掘大数据商用价值, 培育大数据核心业态 关联业态和衍生业态, 促进三次产业加快发展 谢晓尧教授还向 大家详细介绍了 FAST 项目, 包括建设过程 科学目标及未来发展应用等内容 讲座结束后, 研修班的学员们纷纷表示, 听完谢晓尧教授的讲座后, 更深入地了解到了贵州省大数据产业发展与应用的情况和 FAST 工程, 学习到了大数据相关先进的理念, 在专业技术方面得到了很大提升, 为以后的工作打下了坚实的基础 师大计划新增大数据专业 4 月 7 日, 贵州师范大学举行大数据与计算机科学学院成立暨揭牌仪式, 该学院计划新增大数据相关本科专业助力我省大数据产业发展 据介绍, 大数据产业为我省经济发展带来了发展机遇, 但同时也急需大量的产业人才和应用人才 贵州师范大学在大数据与计算机科学领域已开展了大量科研工作, 积累了成果 : 拥有平塘 500 米射电望远镜 FAST 早期科学数据中心 教育大数据研究所 喀斯特地区关键信息技术及应用国家地方联合工程实验室 贵州省信息与计算科 学重点实验室 贵州省山地环境信息系统与生态环境保护重点实验室等科研平台, 在 500 米射电望远镜 FAST 早期科学数据 茶产业大数据 生物大数据 物联网工程 桥梁健康监测 三维虚拟现实及仿真 信息安全 云计算等方面形成了众多科研成果 据透露, 贵州师范大学将在一到两年内申报数据科学或数据工程本科专业, 为我省大数据产业提供人才支持 目前, 贵州师范大学已与 IBM 华为 浪潮等国内外企业达成了合作协议, 分别建立贵州师范大学 IBM 大数据学 院 贵州师范大学 华为网络信息学院 贵州师范大学 浪潮大数据学院, 并将在 IBM 一计划的支持下, 建立贵州师范大学大数据及分析技术中心 同时, 将 IBM 华为 浪潮等核心课程植入本科生培养计划中, 科学设计课程体系 大数据与计算机科学学院将整合学校优势特色学科, 与相关院系联合培养本科生及研究生, 在电子信息 生物 地理信息 旅游 电子商务 工商管理等学科开设大数据应用方向, 采取 2+2 模式 (2 年基础教学 +2 年大数据应用教学 ), 培养学生的大数据应用能力 25

32 大数据金融信息剪辑 厦门大学林子雨教授来校讲解 大数据技术 6 月 20 日, 厦门大学林子雨教授在学院楼 6203 教室为大数据与计算机科学学院的学子们带来以 大数据技术 为主题的讲座 院长苏明担任主持 林子雨主要从云计算 大数据 物联网技术及其产业 化应用案例四方面给同学们讲解 由于存储数据 传输数据 处理数据的技术的提升和数据产生方式的变革促使大数据时代到来, 在这个大数据自然界里有着数据最大 数据类型繁多 处理速度快 价值密度低的四大特点 因此, 分布 式存储 分布式处理成为了大数据的关键技术 其中 Hadoop 技术被频繁用于磁盘里处理, 然而有了技术还不够面对这些大数据还要合理选择计算模式, 大数据计算模式有 : 批处理计算 流计算 图计算 查询分析计算模式 花溪大学城大数据和科技创新发展座谈会在我校召开 8 月 13 日, 省委常委 常务副省长 贵安新区党工委第一书记秦如培来校调研并在花溪校区行政楼五楼 2 会议室召开花溪大学城大数据和科技创新发展座谈会 校党委书记韩卉, 省政协副主席 副校长谢晓尧, 副校长陈云坤, 花溪大 学城各高校领导及贵安新区相关部门主要负责人出席会议 秦如培深入我校大数据与计算机科学学院及相关实验室参观考察, 他高度评价了我校大数据与计算机科学学院的建设情况, 对我校在学院建设 课程设置 人才培养等方面的 工作给予充分肯定 他强调, 要深入贯彻学习陈敏尔书记在全省科技创新大会上的讲话精神, 解放思想, 创新思路, 抢抓机遇, 以大数据引领科技创新, 为贵州大数据产业的发展培养和输送更多优秀的人才 26

33 2016 贵州高校大数据发展简介 我校举办的 贵州省大数据产业发展与应用高级研修班 圆满结业 为加大高层次专业技术人才培养力度, 不断提高行业专业技术人员专业素质和创新能力,11 月 28 日 12 月 2 日, 由贵州省人力资源和社会保障厅主办, 贵州师范大学承办的 贵州省大数据产业发展与应用高级研修班 在我校举行 省人社厅培训中心主任刘明忠, 我校人事处 ( 教师工作处 ) 副处长张葳出席开班典礼 来自全省各地州市统计 工信 大数据产业等相关行业的专业技术人员共 70 余名参加 研修班主要包括专题讲座 小组讨论 实践考察三个模块 在专题讲座模块, 邀请了贵州省政协副主席 贵州省 大数据领导小组副组长 我校副校长谢晓尧教授, 贵州理工学院副院长景亚萍教授, 贵阳朗玛信息技术股份有限公司行政总监李亚萍, 贵州师范大学苏明教授 张仁津教授 夏道勋副教授, 贵州大学何庆副教授等为学员授课 内容涉及拥抱大数据时代 大数据思维 大数据的战略意义和现实意义 大数据与工业 4.0 支持大数据技术的信息科学 大数据技术及应用实践 互联网医疗深耕者等等 在小组讨论模块, 由授课教师组织学员进行分组讨论, 帮助学员解决在专业技术工作中遇到的实际问题等等 在考察交流模块,12 月 2 日, 组织学员赴黔南州平塘县参观世界最大射电望远镜 500 米口径球面射电望远镜 (FAST) 项目, 并由 FAST 工程部郑云勇老师向学员们介绍了工程的建设过程 各主体结构的系统组成以及运行 维护 管理模式 随着实践学习的结束, 此次研修也划上了圆满的句号 学员们纷纷表示通过与专家 同行的深入交流, 扩大了知识面, 学习了大数据技术及其发展思路, 深入体会到应用大数据思维对实际工作的促进和帮助, 并要将学到的知识真正运用到实际工作中 学校大数据与计算机科学学院成立 4 月 7 日, 学校在花溪校区办公楼六楼多功能厅举行大数据与计算机科学学院成立暨揭牌仪式, 标志着贵州师范大学 大数据与计算机科学学院正式成立 校党委书记韩卉 贵安新区管委会副主任欧阳武 省 经信委民营经济发展局副局长王骥出席揭牌仪式并致辞 省政协副主席 我校副校长谢晓尧介绍大数据与计算机科学学 27

34 大数据金融信息剪辑 院筹建情况 校长李建军主持揭牌仪式 省教育厅科研处处长熊星, 校领导刘肇军 徐晓光 赵守盈 乙引 银熙惠, 以及 IBM 北京软通动力有限公司 华为公司 浪潮贵州公司 贵州汇通华城股份公司 贵州兴富祥立健机械制造有限公司 深圳丹弗科技有限公司等企业的嘉宾出席 韩卉在致辞中指出, 大数据目前已成为国际上高度重视的新学科领域, 广泛应用于产业与生物 物联网工程 桥梁健康监测 三维虚拟现实及仿真 信息安全 云计算等诸多领域 对大数据领域的深入研究具有极其重大的战略意义和应用前景 当前, 贵州大数据产业发展势头良好, 势不可挡 而大数据产业要想快速持续健康发展, 专业人才的培养与储备必不可缺 作为教育部与贵州省人民政府共建的高校, 贵州师范大学始终以服务地方经济社会发展为己任, 积极响应国家和省委省政府的号召, 顺势而为, 聚集校内相关学科的师资力量, 整合相关优势学科, 积极筹划组建了大数据与计算机科学学院 她希望, 大数据与计算机科学学院要充分借鉴国内外的成功经验, 以 贵州省大 数据产业发展应用规划纲要 为指导, 更加主动地对接当前该领域的科学发展和地方经济建设的需要, 不断创新机制体制和发展思路, 培养更多的急需人才, 大力推进协同创新与产学研结合, 力争在该领域有更大的作为 发挥更大的作用 仪式上, 副校长乙引代表学校分别与浪潮贵州公司 贵州汇通华城股份公司 贵州兴富祥立健机械制造有限公司 深圳丹弗科技有限公司签署校企合作协议 韩卉 李建军 谢晓尧 欧阳武 王骥 熊星共同为贵州师范大学大数据与计算机科学学院 贵州师范大学浪潮大数据学院 贵安新区大数据人才培养基地揭牌 据了解, 组建大数据与计算机科学学院是学校推动教育供给侧改革, 适应贵州大数据试验区建设对本土产业人才和应用人才的需求的重大举措 我校在大数据与计算机科学领域已开展了大量科研工作, 积累了丰硕的成果, 拥有平塘 500 米射电望远镜 FAST 早期科学数据中心 教育大数据研究所 喀斯特地区关键信息技术及应用国家地方联合工程实验室 贵州省信息与计算科学重点实验 室 贵州省山地环境信息系统与生态环境保护重点实验室等科研平台, 在 500 米射电望远镜 FAST 早期科学数据 茶产业大数据 生物大数据 物联网工程 桥梁健康监测 三维虚拟现实及仿真 信息安全 云计算等方面形成了众多科研成果 大数据与计算机科学学院成立后, 将强化校企 校地合作, 促进学院自身建设与发展 目前已与 IBM 华为 浪潮等国内外企业达成了合作协议, 将 IBM 华为 浪潮等核心课程植入本科生培养计划中, 科学设计课程体系, 不断改革教学方法, 强调培养人才的实用性, 培养适应我省大数据战略实施的应用型人才 大数据与计算机科学学院将整合学校优势特色学科, 与生命科学学院 地理与环境科学学院 国际旅游文化学院 经济与管理学院等紧密合作, 联合培养本科生及研究生, 在电子信息 生物 地理信息 旅游 电子商务 工商管理等学科开设大数据应用方向, 采取 2+2 模式 (2 年基础教学 +2 年大数据应用教学 ), 培养学生的大数据应用能力, 也为贵州大数据战略提供人才支持 28

35 2016 贵州高校大数据发展简介 贵安新区与贵州师范大学将共同培养大数据人才 10 月 18 日, 记者在贵州师范大学 IBM 大数据学院课程置换宣讲会上获悉, 贵安新区与贵州师范大学将拉开共同培养大数据人才的序幕 据了解, 双方本次合作期限为三年, 将培养 2400 名大数据相关专业人才, 力争在第一年为贵安新区提供不低于 500 人的 IBM 专业数据应用技能培训, 第二 第三年每年不低于 1000 人的规模 参培对象是整个花溪大学城在校大学生以及贵州师范大学大数据相关专业高年级学生, 参培学生全程免费 课程设置方面, 所有课程按课程置换形式开设, 分为跨校通识课程 校级通识课程和专业选修课程三大类, 开设的 课程有 大数据技术在主要行业的应用 商业智能及数据仓库设计 数据可视化原理及操作 等 8 门课程 课程设置强调培养人才的实用性, 培养适应我省大数据战略实施的应用型人才 在培养过程中, 会根据需要实时对课程设置做科学合理的调整 据悉, 为了加快推进贵安新区 贵州省大数据产业的发展, 更好地服务贵州省大数据战略, 充分发挥校地双方 校企双方合作的优势 贵安新区与贵州师范大学于 2016 年 7 月 28 日签订 " 贵安 - 贵州师范大学 IBM 大数据学院投资合作协议 ", 标志着贵安新区 贵州师范大学 IBM 大数据学院正 式成立 学院的宗旨是为贵安新区 贵州省培养一批高素质的具有大数据分析 大数据管理 大数据应用技能人才 学院的成立是推动教育供给侧改革, 适应国家大数据 ( 贵州 ) 综合试验区建设对本土产业人才和应用人才的需求的重大举措 学院成立以后, 将始终以大数据人才培养和服务地方经济社会发展为己任, 强化校地 校企合作, 促进学院自身建设和发展 更加主动地衔接地方经济建设, 不断创新机制体制和发展思路, 培养更多的大数据技能人才, 力争在该领域有更大的作为 发挥更大的作用 大数据与计算机科学学院带领学生前往贵州 NIIT 大数据与软件服务外包实训基地开展实训 5 月 9 日上午, 大数据与计算机科学学院党委副书记田茂超 副院长张仁津带领本科三年级计算机科学与技术专业 数字媒体与技术专业 50 余名学生, 前往贵安新区 NIIT 实训基 地开展实训活动 双方就学生实训期间的安全管理和教育教学进行了沟通了解, 并就有关事项达成一致 学院领导还专门与前期参与实训的 12 级本科学生进行 了座谈, 重点了解了学生实训期间的学习生活情况及实训学习效果 学生表示, 实训期间收获很大, 对未来就业充满信心 29

36 大数据金融信息剪辑 湄潭县 2016 年新入职公务员赴我校接受大数据素养教育 11 月 8 日至 9 日, 湄潭县 2016 年新入职公务员 ( 共 43 人 ) 在中共湄潭县委党校副校长吴大江的带领下, 到我校接受大数据素养教育 大数据与计算机科学学院党委书记戴雪梅 副院长苏明出席开班仪式, 仪式由学院校企合作部主任夏道勋主持 仪式上, 苏明在致辞中代表学校对来校参加培训的学员 表示欢迎, 介绍了学校基本情况以及大数据与计算机科学学院在教学 科研和社会服务方面开展的主要工作 接着, 夏道勋博士做了 提升大数据素养, 服务大数据战略 主题讲座, 讲座主要围绕 IT 时代到 DT 时代转换成因 大数据发展现状 大数据技术概况 大数据技术案例和我们身边的大数据五个方面进行阐述 会后, 全体学员赴贵安新区电子信息产业园大数据基地进行实地观摩考察 据悉, 公务员入职培训是根据经济 社会和行政管理的需要以及职位的要求, 对新入职的公务员有计划 有组织地通过各种形式进行政治和业务等方面的教育培养和训练, 具有极其重要的意义, 是对国家公务员的继续教育 我校赴威宁草海国家级自然保护区进行大数据调研 11 月 15 日, 省政协副主席 副校长谢晓尧, 副校长乙引率领我校专家组一行赴贵州省威宁草海国家级自然保护区进行大数据调研 威宁县委副书记 草海管委会常务副主任冯兴忠, 草海管委会副主任赵毅 李茂等陪同调研并参加座谈 座谈会上, 冯兴忠介绍了草海自然保护区的历史和现状, 草海管委会成立的背景, 管委会的目标和工作, 同时谈 到草海云的筹划工作以及目前草海拯救保护工作遇到的困难 乙引介绍了贵州师范大学和草海历史渊源, 师大大数据的相关项目和能力, 探讨了双方可能合作的方向和方式 在保护草海和大数据的结合方向上, 与会的专家团从水资源 植物 动物 生态 物联网和决策支持等各自研究领域献计献策, 充分展现了大数据技术在草海保护领域的广泛用途 谢晓尧介绍了贵州省大数 据发展和现状, 表明我省已经具备良好的大数据基础设施, 草海云的技术条件已经成熟, 强调草海云不能等, 同时为草海云高度规划了的三个应用平台 : 草海大数据综合治理平台 草海生物多样性平台和草海文化旅游平台 冯兴忠感谢专家团队对草海的建议, 同时表示要加强和师大交流合作, 请师大帮助规划草海云的工作方案, 以及今后的合作事宜等工作 30

37 2016 贵州高校大数据发展简介 贵州师范大学牵手 IBM 等企业重视大数据人才实用性 4 月 7 日, 贵州师范大学举行了大数据与计算机科学学院成立暨揭牌仪式, 该学院重视校企 校地合作, 培养实用型的大数据人才 经贵州省编办批复, 贵州师范大学大数据与计算机科学学院正式成立 4 月 7 日, 贵州师范大学举行了大数据与计算机科学学院成立暨揭牌仪式, 该学院重视校企 校地合作, 培养实用型的大数据人才 经贵州省编办批复, 贵州师范大学大数据与计算机科学学院正式成立 大数据与计算机科学学院将强化校企 校地合作 目前已与 IBM 华为 浪潮等国内外企业达成了合作协议, 分别建立贵州师范大学 -IBM 大数据学院 贵州师范大学 - 华为网络信息学院 贵州师范大学 - 浪潮大数据学院, 并将在 IBM-U100 计划的支持下, 建立贵州师范大学大数据及分析技术中心 同时, 将 IBM 华为 浪潮等核心课程植入本科生培养计划中, 科学设计课程 体系, 不断改革教学方法, 强调培养人才的实用性, 培养适应贵州省大数据战略实施的应用型人才 贵州师范大学在大数据与计算机科学领域已开展了大量科研工作, 积累了丰硕的成果, 拥有平塘 500 米射电望远镜 FAST 早期科学数据中心 教育大数据研究所 喀斯特地区关键信息技术及应用国家地方联合工程实验室 贵州省信息与计算科学重点实验室 贵州省山地环境信息系统与生态环境保护重点实验室等科研平台, 在 500 米射电望远镜 FAST 早期科学数据 茶产业大数据 生物大数据 物联网工程 桥梁健康监测 三维虚拟现实及仿真 信息安全 云计算等方面形成了众多科研成果 大数据与计算机科学学院将整合学校优势特色学科, 与贵州师范大学生命科学学院 地理与环境科学学院 国际旅游文化学院 经济与管理学院等紧密合作, 联合培养本科 生及研究生, 在电子信息 生物 地理信息 旅游 电子商务 工商管理等学科开设大数据应用方向, 采取 2+2 模式 (2 年基础教学 +2 年大数据应用教学 ), 培养学生的大数据应用能力, 也为贵州大数据战略提供人才支持 此外, 学校与贵阳大数据交易所签署了战略合作协议, 将共同打造 大生态 大扶贫 大健康 等具有 多彩贵州 特色的行业大数据应用产品, 切实促进大数据的市场化 有价化, 共同推进大数据产业的发展 同时大数据与计算机科学学院还将与北京软通 贵州汇通华城 贵州兴富祥 深圳丹佛科技等企业, 进一步深入探讨合作模式, 找准合作点, 在教育大数据 旅游大数据 生态大数据 扶贫大数据 产业大数据等方面开展大数据应用研究 31

38 大数据金融信息剪辑 大数据与计算机科学学院组织学生前往贵阳大数据创新产业发展中心参加微软技术培训营活动 6 月 14 日, 大数据与计算机科学学院组织各年级学生 30 余人前往贵阳大数据创新产业发展中心, 参加基于 Windows Azure 的混合云及大数据平台培训讲座 本次讲座包含丰富的微软技术课程, 邀请了董乃文 张强两位微软 ( 中国 ) 有限公司 开发体验及平台合作事业部的两位行业资深技术达人为同学们详细介绍了相关专业知识, 同学们通过电脑实际操作, 对 混合云 等前沿科技有了进一步的了解和掌握 随后, 同学们还参观了贵阳大数据创新产业发展中心, 了解目前贵州大数据产业发展现状 本次活动是通过整合优势资源, 实现教学相互补充, 开门办学的一次校外实践活动 以后, 学院将继续依托贵州大数据产业发展优势, 深入挖掘整合办学优势资源, 着力培养大数据产业专业技术型人才 我校思雅众创空间 福农宝 农业大数据产业项目受到人民网报道 8 月 2 日, 人民网 - 贵州频道标题为 贵州农信携手瓮福集团开创 三赢 局面 的报道中提到的 福农宝 电子商务平台是我校思雅众创空间入驻团队为瓮福集团研发的农业大数据产业项目 福农宝电子商务平台具有化肥进销存管理 农资销售 客户管理 农业信息服务等功能, 这个电商平台上线后瓮福集团的产品将可以直接下到最基层的农村进行销售 福农宝 农业大数据产业项 目是我校大学科技园 ( 思雅众创空间 ) 主动融入贵州大扶贫 大数据战略中的务实作为, 是积极推进供给侧改革 解决贫困农户生产生活需求的创新举措, 是众创空间服务实体经济的生动实践 32

39 2016 贵州高校大数据发展简介 贵安新区 贵州师范大学 IBM 大数据学院成功举办课程置换宣讲会 为了加快推进贵安新区 贵州省大数据产业的发展, 更好地服务贵州省大数据战略, 充分发挥校地双方 校企双方合作的优势 在贵安新区政府的大力支持下, 贵州师范大学和 IBM 秉承 优势互补 互惠双赢 共同发展 服务社会 的宗旨, 建立长期 紧密的合作关系, 构建了贵安新区 贵州师范大学 IBM 大数据学院, 学院的宗旨是为贵安新区 贵州省培养一批高素质的具有大数据分析 大数据管理 大数据应用技能人才 10 月 18 日下午, 学院成功举办了大数据课程置换宣讲会 贵安新区社会事务管理局局长邓波, 贵安新区经济发展局副局长潘军 ; 我校知行学院 ( 创新创业学院 ) 院长兼教务处副处长周勋, 大数据与计算机科学学院党委书记戴雪梅 副院长苏明 副书记田茂超, IBM 项目主要负责人宋天河团队以及全校三百多名师生参加了宣讲会 宣讲会由大数据与计算机科学学院副院长张仁津主持 邓波指出, 贵安新区 贵州师范大学 IBM 大数据学院走到今天来之不易, 是多家单位共同努力的结果, 政策和经费方面得到了贵安新区的大力支持 学院应以大数据人才培养为重心, 与 IBM 展开更为深入的合作, 办出活力 办出特色 第一年的培训工作非常关键, 要让首次参培的学生真正感受到经过培训后, 在大数据素养或者大数据专业技能方面得到较大的提升, 以此来吸引更多的同学参与进来, 形成良性循环 周勋从课程置换的管理上做了详实的介绍, 并为置换课程的学生选课做了预案 他讲到, 此次课程置换, 更有利于 学生的创新创业思维的培养, 应该多和 IBM 合作, 争取贵安新区更多的政策支持 主讲人宋天河从大数据关于世界 大数据关于 IBM 大数据关于贵州和大数据关于我们四个层面来讲解 重点讲述了大数据的由来 大数据的定义 大数据的应用领域 IBM 大数据与分析案例以及智慧城市等, 逐层剥开大数据的神秘面纱, 并详细分析了贵州大数据战略取得显著成果的成因 对置换课程的课程设置 授课安排 授课教师都一一做了介绍 在师生互动环节, 详细解答了参会同学所提出的问题 整个宣讲会在轻松的氛围下进行 通过本次宣讲会, 同学们不仅对大数据有了进一步的了解, 更对日后的学习增强了信心, 提高了学习兴趣, 为服务好贵州大数据战略明确了目标 33

40 大数据金融信息剪辑 数学与计算机科学学院组织学生前往贵阳国际大数据产业博览会观展 2015 年贵阳国际大数据产业博览会开幕以来, 数学与计算机科学学院学生对此次盛会高度关注, 特别是计算机科学与技术 信息与计算科学及数字媒体与技术等相关专业的学生对此次博览会纷纷表现出极高的热情和浓厚的兴趣 5 月 28 日, 在学院领导的精心组织下, 由学院计算机专业教师刘彬及辅导员陈凌燕带队, 组织 13 级数字媒体与技术专业的全体学生前往贵阳国际会议中心观展 展会上, 同学们对 什么是大数据 大数据的应 用 有了全新理解, 对自身的专业发展如何与大数据发展相契合有了全新认识, 对今后的学习方向定下了新目标 通过此次观展, 同学们对数字媒体与技术这一新兴专业的发展情景和贵州蓬勃发展的大数据产业充满信心 副校长刘肇军出席南明大数据电商产业聚集区开园仪式 4 月 11 上午, 副校长刘肇军出席贵阳市南明大数据电商产业聚集区开园仪式 教务处副处长周勋, 经济与管理学院党委书记陈椽 院长吕萍等参加 开园仪式上, 刘肇军代表学校向聚集区授予 贵州师范大学实践教学基地 刘肇军一行还参观了南明大数据电商产业聚集区大数据电商营运 展 示厅 O2O 体验中心 创客空间以及已入住的省内著名品牌老干妈 北极熊等传统企业转型电商中心 跨境电商深圳车网联盟 本土农产品电商秀色可餐等 南明大数据电商产业聚集区是由南明区携手贵州佰仕佳集团 ( 经济与管理学院校企合作单位 ) 共同打造, 采取 政府主导 企业运作 合作共 赢 的市场化运作模式的聚集区 近年来, 学校将校企合作作为主动适应地方经济社会发展需求, 提升学生创新创业能力的主要举措 贵州师范大学南明大数据电商产业聚居区教学实践基地 的建立, 将对提升我校电子商务等专业的人才培养质量, 推动学科建设和科研创新能力等方面起到积极的促进作用 34

41 2016 贵州高校大数据发展简介 清华大学教授陈国青莅临我校解析大数据时代 10 月 17 日, 清华大学经济管理学院 EMC 讲席教授 教育部长江学者特聘教授陈国青莅临我校, 并在田家炳三楼多功能厅为我校师生作题为 大数据时代管理理论与实践挑战 的学术讲座 讲座由经济与管理学院院长吕萍主持 陈教授首先从大数据时 代说起, 介绍了大数据时代的背景和十大战略技术, 指出大数据存在体量大 多样性 价值密度高和速度快的特点 随后陈教授谈到管理理论与实践挑战, 并介绍管理的两个喻意, 第一个喻意即 IT 融合 内外融合 和 价值融合, 第二 个喻意是新模式 新业态和新人群 面对管理理论研究, 他指出我们应该明确学术问题和挑战 最后并建议对大数据时代有兴趣的同学积极响应挑战, 把握机遇, 更好拥抱大数据时代, 创新大数据应用 副校长谢晓尧到大数据与计算机科学学院调研指导工作 4 月 5 日下午, 贵州省政协副主席 我校副校长谢晓尧教授到大数据与计算机学院调研指导工作, 检查计算机一级学科硕士点建设及学院揭牌仪式筹备工作 学院党委书记戴雪梅, 副院长苏明 张仁津及教师代表参加座谈会 座谈会上, 谢晓尧详细了解了学院挂牌仪式相关工作筹备情况, 并对学院目前阶段 工作开展情况给予了肯定, 并就计算机一级学科硕士点建设及发展情况与学院负责人进行了深入交流探讨 同时, 他对 计算机科学与技术 和 软件工程 两个一级学科硕士点建设提出要求 : 要进一步创新思路, 深化改革, 充分发挥自主命题优势, 提升本科教学水平, 选送优秀本科毕业生继续深造 ; 学科建设要与我校信息 与计算科学重点实验室 生命科学学院等相关资源交叉融合, 与大数据学院建立资源共享平台, 助推大数据学院更好更快发展 学院负责人就下一步研究生专业招生提出了可行性计划, 将从加强在各院校的宣传力度, 以及学院本科推免研究生工作力度两方面着手, 提升研究生培养质量 35

42 大数据金融信息剪辑 我校组织参加贵州省赴省校合作高校大数据等重点产业人才专场招聘活动 自 2013 年以来, 贵州省 先后与北京大学 清华大学 南京大学 复旦大学 浙江大 学 上海交通大学 中山大学 等高水平大学签署战略合作协 议, 双方在决策咨询 科技创 新 人才交流 重点产业等方 面开展全方位 多领域 深层 次的长期合作, 积极促进科研 成果 科学技术 人才资源与 贵州经济 社会 文化发展相 融合, 助推贵州跨越发展 赴 省校合作高校进行人才专场招 聘, 已成为宣传贵州 为贵州 引才纳智的重要平台 为落实 2015 年省校合作协议知名高 校相关人才引聘活动的工作要 求, 根据 2016 云上贵州大数 据招商引智再出发活动人才引 进工作方案, 我校积极组建 人才引聘团队参加本次招聘高 层次人才活动 为充分利用好此次贵州省 赴省校合作高校大数据等重点 产业人才专场招聘, 校党委高 度重视, 专门召开人才引聘工 作会议, 要求各单位 各负责 人要提高认识, 利用好此次引 进高层次人才的好机会, 抓住 省委省政府搭建的平台, 充分 发挥好省校合作专场招聘宣传 我校的窗口作用 按照校党委 及相关工作要求, 由人事处具 体负责, 制定了此次人才引聘 工作方案 根据我校本次人才引聘 工作方案,4 个招聘团队分别 由校党委书记韩卉 副校长蔡 永生 校党委副书记银熙惠带 领, 在省委组织部 省人社厅 的组织安排下, 先后赴上海 北京 西安 广州等 8 个招聘 现场 ( 大学 ) 组织引聘具体工 作 通过此次省校合作高校 大数据等重点产业人才专场招 聘活动, 学校的人才引聘工作 取得了良好效果 在此次专场 招聘中, 我校共接待应聘人员 500 余人, 其中博士 100 余人, 双方签订意向协议 24 人 学校 人才引聘工作不仅得到省领导 及相关上级部门的肯定, 也充 分利用这一平台宣传了学校 我校组团赴浙江大学参加贵州省组织的大数据等重点产业高层次人才引聘工作 11 月 3 日, 由校党委书记韩卉带队的一行 5 人赴浙江大学参加了贵州省大数据等重点产业人才引聘活动 本次贵州省大数据等重点产业人才引聘暨选调优秀毕业生活动是继复旦大学 上海交通大学 西安 理工大学 北京大学 清华大学 中国人民大学 中山大学后的本年度最后一站 为充分利用好此次贵州省赴省校合作高校大数据等重点产业人才专场招聘, 学校高度重视, 此次赴浙江大学招聘由 韩卉亲自带队 现场指导 我校通过本次人才引聘活动取得了良好的效果, 在浙江大学专场招聘中, 我校一共接待来应聘的高层次人才 30 余人, 其中博士研究生 12 人, 双方达成意向协议的 6 人 36

43 2016 贵州高校大数据发展简介 我校大学科技园思雅众创空间应邀参加云岩区大数据人才培养 三个一批 计划启动仪式 9 月 5 日, 贵阳市云岩区举行了云岩区大数据人才培养 三个一批 计划启动仪式 云岩区区委书记王建忠 贵阳 市工信委常务副主任唐振江等领导出席仪式, 我校大学科技园主任陈辉林应邀参加启动仪式 仪式由云岩区副区长周勤 主持 启动仪式上, 云岩区领导为我校思雅众创空间等六家众创空间进行了授牌 丁永强畅谈 云计算与大数据 5 月 29 日, 北京优帆科技技术咨询总监丁永强先生应我校经济与管理学院邀请, 在田家炳教育书院三楼多功能厅做了题为 云计算与大数据 的专题讲座 贵州信息技术产业联盟各成员企业总经理及我校经管学院的部分师生约 80 余人到场聆听讲座 丁永强从云的由来, 什么 是云,Iaa 云计算的标准及何为大数据等几个方面向我们解析了云计算与大数据 他指出, 云计算和大数据, 是当今时代发展的必然趋势, 是时代变革的动力 正是由于现今某些业务对网络与应用系统的依赖 对成本的控制及新 IT 资源消费观的变化, 促使了云的出现 从传统 IT 到云模式, 云计 算和大数据将普及我们的时代 据悉, 此次讲座是由贵州信息技术产业联盟主办, 贵州师范大学经济与管理学院承办, 其目的是为了让大家深入了解云计算与大数据的相关知识和重要意义, 学习和掌握大数据实战方法 大数据与计算机科学学院举办实习招聘会 为了更好的开展实习就业工作, 提高同学们的就业竞争力,6 月 15 日, 大数据与计算机科学学院在学院楼前广场举办了包括千锋公司 国信安公司和深圳远标培训公司等八个公司的实习招聘会 招聘人主要从企业需要什么样的员工 企业怎样选拔人才 企业的面试标准和要学 会什么才能通过面试等方面表述了职场面试的重要问题, 同学们在回答招聘考官给出的问题时, 紧密结合应聘的相关工作 在招聘现场, 同学们与用人单位和企业招聘主管积极主动地交流沟通, 询问单位的工作性质和选人用人标准等问题 只有在特定的天地里种下 自己的奋斗目标, 并为之付诸行动, 最终才会品尝到成功的果实 这次招聘会, 让同学们认识到了自己的优势与不足, 鼓励同学们积极追求自己的爱好 理想, 用汗水去践行自己的社会主义核心价值观, 将自己所学投身于社会主义的现代化建设中去, 为美好的明天而不懈努力奋斗 37

44 大数据金融信息剪辑 副校长乙引带队到大数据与计算机科学学院进行科研工作调研与指导 8 月 24 日, 副校长乙引带队到大数据与计算机科学学院开展了科研工作专项调研与指导 科技处处长龙建 学院党委书记戴雪梅 副院长苏明 副院长张仁津 党委副书记田茂超 学院教授委员会成员和部分科研骨干教师代表参加 会上, 苏明介绍了学院科研工作的基本情况和下一步工作设想, 汇报了学院在数字图象处理 大数据技术及应用 工业 4.0 仿真设计与社会服务等 三方面的科研优势和进展, 同时也分析了学院在科研团队组织 实验室建设 研究生培养上的一些困境与不足 另外, 部分教师代表就学院提升国家基金项目获批率 研究生导师资格与研究生招生 科研平台建设 科研管理工作等方面, 提出了建议或咨询 乙引认真听取了相关意见, 对学院的科研工作思路给予了充分肯定, 对老师们在科研中的一些疑惑给予了一一解 答 特别是对科研工作中存在的问题和困境, 乙引提出了建设性意见, 包括一些解决办法 同时要求科技处要尽其所能为各学院提供服务 学院相信, 在学校领导的支持和关心下, 在相关部门的帮助下, 在全院老师的共同努力下, 大数据与计算机科学学院的科研水平和实力一定能跨上新的台阶 大数据与计算机科学学院开展 零距离就职游戏公司 专题讲座 9 月 21 日晚, 大数据与计算机科学学院在花溪校区 GJ6401 教室举办主题为 零距离就职游戏公司 专题讲座 讲座邀请大型游戏公司博思中国的副总裁韩摩苍先生主讲 学院部分学生聆听了讲座 在观赏了一段国内外知名游戏开发过程的视频后, 韩摩苍介绍了博思中国的三大子公 司, 龙之谷, 博思游戏学校和大米游戏, 使大家对游戏公司有了初步认识 随后, 他用数据为同学们分析了游戏行业的就业前景和趋势, 并与大家分享了游戏公司的类型, 技术岗位的细分等内容, 使同学们对自己的兴趣有了更好的定位 同时, 也分享了游戏开发工作者的成长路线, 强调了实践和 思维的重要性, 鼓励在校大学生进一步提升专业技术能力 通过此次讲座, 增强了学院学生对游戏开发的团队 工作和职位的认识, 并对就职游戏公司的途径有了更深层次的了解, 同学们都表示本次讲座使自己受益匪浅 38

45 2016 贵州高校大数据发展简介 大数据与计算机科学学院开展职业生涯规划系列讲座 为在行业眼界 技术水平 职业选择三个方面增强学院学生的就业竞争力, 大数据与计算机科学学院于 5 月 12 日上午和下午分别在学院楼 6202 教室开展了两场结合专业技术发展的职业生涯规划讲座 上午讲座的主讲嘉宾是来自中国科学院研究员 博士生导师苏璞睿教授, 讲座主题为 APT 攻击与防御技术进展浅析, 他首先以 APT 的危险性做了精彩的导入, 而后讲解了 APT 的概念 类型 特征, 最后重点讲述了 APT 的攻击过程和 APT 的攻击检测 下午讲座的主讲人是来自湖州师范学院的薛德黔教授, 他以独有的幽默但不失严谨的讲授方式辅以贯穿整场的 钉 子屋 4D 人格 等互动游戏, 让同学们以轻松娱乐 简单易懂的方式得到了在职业生涯规划 团队建设和个人性格养成等多方面的知识和提高 此次系列讲座, 开阔了同学们的眼界 提高了大家对专业学习的兴趣 更是让即将走向实习的同学们得到了职业生涯规划方面的有效指导 大数据与计算机科学学院阮方鸣教授参加中美合作静电防护与标准化国际研讨会并作大会报告 由中国标准化研究院 中国空间技术研究院 电磁环境效应国家重点实验室 美国贸易开发署 (USTDA) 美国国家标准协会 (ANSI) 美国静电放电协会 (ESDA) 联合主办的中美合作第 5 届静电防护与标准化国际研讨会, 于 11 月 日在西安举行 来自中美两国的十一位资深专家在研讨会上作报告 我校大数据与计算机科学学院阮方鸣教 授作为中方专家, 应邀在会上作了题为 小间隙静电放电的电极移动速度效应研究和非接触静电放电标准初探 的大会报告 该报告介绍了贵州师范大学电磁兼容科研团队经过多年努力, 在静电放电研究领域攻克带电体向靶高速移动放电与避免仪器损坏的国际研究难题 发明了国际上首台静电放电多因素效应测试系统的突破性和开创性成果, 受到中国工 程院刘尚合院士和与会的其他中外专家学者的充分肯定和高度评价 通过与参会专家学者和代表交流, 中国标准化研究院 电磁环境效应国家重点实验室 中国空间技术研究院 514 所 上海航天电子有限公司与贵州师范大学初步达成协议, 将在非接触静电放电性质和测试国际标准的深入研究上展开进一步的合作 39

46 大数据金融信息剪辑 贵安新区社会事务管理局局长邓波莅临大数据与计算机科学学院调研 4 月 16 日上午, 贵安新区社会事务管理局局长邓波一行二人到大数据与计算机科学学院调研 学院党委书记戴雪梅 副院长苏明及相关同志参 加 邓波认真听取了学院领导的工作介绍, 并就大数据人才培养 学生就业培训 校企合作等进行了现场研讨 大家一 致认为, 要从强化学生职业技能培训入手, 不断提升毕业学生的综合素质, 切实增强服务贵安新区大数据战略的工作能力以及人才储备能力 甲骨文公司高级技术专家张维亮莅临我校做学术讲座 应我校教务处邀请,3 月 23 日下午, 世界五百强企业, 全球最大企业软件提供商 甲骨文 中国大区 Oracle OAEC 项目技术教学高级顾问 甲骨文 OAEC 教育事业部华东区总监张维亮先生在花溪校区 GJ6201 教室作了题为 软件行业的发展现状及未来技术发展带来的就业机遇 的讲座 教 务处 大数据学院相关领导及学生 300 余人聆听了讲座 张维亮从 Oracle Comes 开始, 介绍了移动互联网的发展现状 大数据的未来发展前景 大数据的商业应用 进入大数据行业需要的具体技能 云计算及大数据行业的就业市场需求 大型公司的人才需求及福利待遇等方面内 容并和同学们探讨了如何学习才能迎接大数据时代的挑战 张维亮鼓励同学们要抓住大数据时代给就业带来的机遇 同学们表示通过此次讲座对大数据有了个更深层次的了解, 对自己未来的职业生涯有了一个初步的认识, 受益匪浅 副校长谢晓尧会见 NIIT 中国区教育业务总裁柯谋一行 5 月 4 日, 贵州省政协副主席 我校副校长谢晓尧会见 NIIT 中国区教育业务总裁柯谋一行, 大数据与计算机科学学院副院长苏明 NIIT 中国政府 事务和商务拓展总监徐海峰 贵州海上丝路公司总经理张钊参加会见, 双方就联合培养大数据人才等方面开展深入合作达成共识 谢晓尧就贵州师范大学与 NIIT 在联合培养大数据人才方面提出了实质性 可操作性的建议 40

47 2016 贵州高校大数据发展简介 省政协主席王富玉一行来校视察 10 月 25 日上午, 省政协主席王富玉率领省政协常委视察团来我校, 对 落实大数据战略行动 推动大数据应用服务情况 进行视察 省政协副主席孙国强 蒙启良 陈海峰 左定超 谢晓尧 陈敏 班程农 李汉宇, 秘书长李月成及部分省政协常委参加视察 校长李建军及学校相关单位负责人陪同 省政协视察团先后来到国 家天文台 贵州师范大学 FAST 早期科学数据中心 贵州茶云 平台实地视察, 听取情况汇报, 参观应用展示, 深入了解贵州师大支持我省大数据应用服务的最新进展情况 校领导会见 IBM 大西区客户代表 7 月 15 日,IBM 大西区资深客户代表及资深行业顾问庞涛, 黔云高科董事长王青青 总经理丁宇 董事长助理骆俊舟到我校交流 校党委书记韩卉 校长李建军 副校长刘肇军在花溪校区行政楼五楼会客厅接见了来访客人 学校办公室 教务处 研究生院 数学 与计算机科学学院 网络与信息中心等相关部门负责人会见时在座 会上, 韩卉代表学校党委 行政对莅临我校的各位客人表示热烈欢迎 她说, 在贵州大数据发展期间, 高等学校要争取对大数据发展多做贡献, 同时要趁此机遇发展自 身 我校在大数据方面关联学科多, 人才培养体系比较完整, 科研团队积累了较为强大的力量, 希望双方今后能多做沟通, 深度合作, 共同发展 庞涛对我校的热情接待表示感谢 他希望双方能够进一步加强交流, 优势互补, 深化合作 大学科技园推进我校主题创客空间建设工作 为进一步推进我校 双创 工作, 推动创新人培养平台建设, 探索创新人才培养的工作机制 4 月 22 日, 科技园主任陈辉林带领团队到大数据与计算机科学学院, 围绕三级创新创业服务体系, 主动与学院对接主题创客空间共建事宜 在对接工作会上, 陈辉 林听取了学院关于建设创客咖啡吧的介绍, 对创客咖啡吧的建设明确表示支持, 并从创客咖啡吧名称 场地装修 运营团队建设 文化氛围营造 创客活动开展等方面提出了具体意见和建议 陈辉林表示, 通过双方合作建设创客咖啡吧, 有利于搭建创客沟通交流的平台, 建成学院开放的创新创业 教育第二课堂 双方还就围绕专业特色建设主题创客空间等事宜深入交换了意见 大数据与计算机科学学院党委书记戴雪梅 副院长苏明等对科技园的合作高度重视, 表示将全力支持主题创客空间的建设, 共同推动学院 双创 工作, 提高人才培养质量和服务社会的能力 41

48 大数据金融信息剪辑 省科技厅厅长廖飞一行莅临我校大学科技园思雅众创空间视察指导工作 7 月 13 日上午, 省科技厅厅长廖飞一行莅临我校大学科技园思雅众创空间视察指导工作, 校党委书记韩卉 校长李建军等陪同考察 省科技厅厅长廖飞一行首先参观了众创空间入驻企业创新创业成果, 并听取了大学科技园主任陈辉林的成果汇报 随后, 对众创空间 以 福农宝 农业大数据平台 母亲云 农村留守妇女就业电商平台 贵电商 贵阳供销集团黔货出山电商平台以及科技创业企业的创业成果进行了考察, 观看了空间 芊玖舒胶囊 3D 打印技术 刷力控制功能牙刷 等成果展示, 并与各团队负责人进行了深 入交流 廖飞厅长对思雅众创空间建设取得的成绩表示了充分肯定, 对空间围绕 大数据 大扶贫 大健康 服务实体经济的众创模式给予了高度评价, 表示省科技厅将进一步支持贵州师范大学, 推进成果转化, 服务产业发展 我校和印度国家信息技术学院开展校企合作 9 月 21 日, 校长李建军在贵州海上丝路国际投资有限公司 (GIIC) 总部会见了印度国家信息技术学院 (NIIT) 中国区总裁柯谋先生一行 NIIT 中国政府事务总监徐海峰 GIIC 副总经理张晖 贵阳国家高新区产业投资公司董事长钟蕾女士以及我校办公室主任 人事 处处长杨泉, 大数据与计算机科学学院副院长苏明参加会见 各方就我校与 NIIT 合作共建计算机科学与技术 ( 软件外包方向 ) 专业的相关事宜举行了深入交流 李建军对双方前期的合作给予了充分的肯定 柯谋表示了对合作前景的期 待, 希望双方在合作协议的基础上共同推进工作 我校大数据与计算机科学学院将以 NIIT 项目合作为契机, 与贵阳国家高新区产业投资公司开展深入合作, 打通教育培训与产业发展的通道 42

49 2016 贵州高校大数据发展简介 印度国家信息学院 (NIIT) 全球 CEO 帕特瓦尔丹一行来校交流 5 月 26 日,NIIT 全球 C E O 帕特瓦尔丹 ( R a h u l Patwardhan) 中国区总裁柯谋 (Kamal Dhuper) 一行来校交流 校长李建军 副校长赵守盈在花溪校区行政楼五楼会议室会见了帕特瓦尔丹 (Rahul Patwardhan) 一行, 各相关单位主要负责人参与会见 会议由赵守盈主持 李建军向客人介绍了我校的办学历史 办学条件 学科 发展等情况, 他指出, 学校希望和 NIIT 建立更创新, 更全面的合作, 希望双方的合作会有更深 更远的发展 帕特瓦尔丹 (Rahul Patwardhan) 先生介绍了 NIIT 到访的目的,NIIT 中国区政府事务总监徐海峰详细地介绍了 NIIT 的发展历程 教育理念 国际合作等情况, 特别是与中国的教育合作 贵州海上丝路国际投资有限公司董事长张林介绍了 GIIC 致力于 构建中印友好桥梁, 实现走出去 引进来的工作 本着友好合作 互利互惠的原则, 我校与 NIIT 就双方合作办学, 致力于贵州大数据 IT 人才培养进行了深层次的沟通和交流, 初步达成了合作意向, 双方商定, 下一步将加强双边交流, 探索人才培养模式, 为贵州大数据产业发展做出贡献 我校受邀参加贵州省 十二五 科技创新成就展 8 月 11 日 13 日, 贵州省 十二五 科技创新成就展在贵阳市白云区贵州科学城举行 我校国家大学科技园 ( 思雅众创空间 ) 受邀参展 本次贵州省 十二五 科技创新成就展以 合作创新 加强转化 重点突破 引领跨越 为主题, 展览通过 十二五 科技创新成就展区 大众创业万众创新展 区 技术市场展区 大型实物展区 4 个展区全面展示我省 十二五 期间科技创新取得的重大成就 作为贵州省 十二五 期间 双创 平台发展成就典型代表, 我校国家大学科技园思雅众创空将参展作品 VR 数字内容制作 球齿钎头修磨机 福农宝 农业大数据产业项目 智能装备 生物科技 产品等成果进行了展示 活动期间, 到我校展位来体验 交流 咨询的人群络绎不绝, 人头攒动 我校大学科技园思雅众创空间展品的精彩亮相, 在向外界充分展示园区近年来科技创新成果与实力的同时, 也进一步为学校和园区树立了良好的社会形象 43

50 大数据金融信息剪辑 导读 2016 中国大数据技术大会 聚焦行业最佳实践, 应用与数据深度融合 是大数据领域规模最大 最具影响力的 IT 盛会 促进大数据时代变革 共赢新时代机遇和挑战 为主题的 2016 中国 ( 北京 ) 国际大数据产业博览会暨高峰论坛, 展示了大数据在金融领域的 10 大趋势 互联网金融千人会高峰会今举办, 贵阳领取 2016 互联网金融十大创新城市 荣誉 大数据金融征信和风控体系建设, 将向更加广泛的领域渗透 ; 在数据化的时代, 标准化的工作在各个行业都急需开展和落实, 目前社会上高度重视大数据标准化工作, 国家层面也采取了一系列的措施 2016 中国大数据技术大会在北京盛大召开 摘要 :2016 年 12 月 8 日, 作为大数据领域规模最大 最具影响力的 IT 盛会, 2016 中国大数据技术大会 (BDTC 2016) 在北京新云南皇冠假日酒店盛大开幕, 本届大会的主题是 聚焦行业最佳实践, 应用与数据深度融合 2016 年 12 月 8 日, 作为大数据领域规模最大 最具影响力的 IT 盛会,2016 中国大数据技术大会 (Big Data Technology Conference 2016, BDTC 2016) 在北京新云南皇冠假日酒店盛大开幕 本次大会历时三天, 以更加国际化的视野, 邀请众多国内外大数据专家齐聚一堂, 从政策法规 技术实践和产业应用等角度深入探讨大数据落地后的挑战, 与往届相比, 本届大会更关注行业应用最佳实践, 突出应用和数据的深度融合, 并首次将人工智能 高性能计算等热点话题引入大会, 作为大数据产业界 科技界与政府部门密 切合作的重要平台, 本届大会吸引了数千名大数据技术从业者与技术专家到场参会 BDTC2016 由中国计算机学会 (CCF) 主办,CCF 大数据专家委员会承办, 中国科学院计算技术研究所 中科天玑数据科技股份有限公司与 CSDN 共同协办 为了更好地探讨大数据技术生态系统的现状和发展趋势, 交流大数据技术实践经验, 进一步推进大数据技术创新与应用, 展示国内外大数据领域的最新成果,BDTC 2016 除第一天的全体大会外, 主办方还精心策划了 16 场专题技术和行业论坛, 涵盖了大数据分析与生态系统 大数据云服务 HPC 大数据 推荐系统 数据安全与隐私保护 人工智能 网络与通讯 政策法规与标准化 工业与制造业 数据库 金融 精准医疗和生物医药大数据 交通 44

51 大数据会议活动集锦 旅游与出行等主题 数据开放与政府治理高层沙龙 超过 130 位技术专家, 将奉上 100 多场精心准备的技术演讲, 与参会者聚而论道 回顾十年大数据历程, 聚焦最佳实践从 2005 年 Hadoop 项目诞生至今, 大数据已经走过 10 年历程, 在互联网 运营商 IT 服务提供商以及众多传统企业中落地实践 在全体大会演讲环节, 海内外顶级专家学者将深入探讨大数据数据技术这十年来的发展历程和思考, 并结合最新大数据技术发展方向探查潜在应用 其中,8 日上午的主会环节, 启明星辰公司副总裁,CCF 大数据专家委员会副秘书长潘柱廷带来了 大数据发展趋势报告 主题分享, 详细解读各种大数据技术的最新发展和动态 ; 东京大学教授, 日本国家信息研究所所长喜连川优分享了探讨大数据从商业价值到社会价值的转变 ; 中国移动苏州研发中心大数据部总经理, 高级工程师钱岭则回顾和思考了十年大数据技术演进历程 ; 美国伊利诺伊大学香槟分校 (UIUC) 计算机系教授翟成祥则将侧重点聚焦在文本大数据分析与挖掘的机遇 挑战及应用前景 ; 普元信息 CTO 焦烈焱针对 数字化转型中的大数据治理架构 做出解读, 星环科技董事长 &CTO 孙元浩全面剖析 大数据技术的最新进展和潜在应用 在备受关注的语音 金融以及智能驾驶领域, 三位不同领域的专家也做了重点探讨 科大讯飞大数据研究院副院长谭昶分享 讯飞大数据的实践与思考, 百度金融研发负责人沈抖讲述 大数据助推普惠金融发展与创新, 驭势科技联合创始人兼 CEO,CCF 大数据专家委员会委员吴甘沙则剖析 智能驾驶中的人工智能, 都从不同维度解读大数据的发展趋势及不同领域的最佳实践 此外, 来自 Facebook PayPal 华为 百度 中兴飞流 滴滴出行 云账户等 12 家机构的一线专家, 齐聚大数据生态论坛, 研讨当前大数据生态领域的热门技术和实践 包括华为技术有限公司大数据设计部部长 Apache CarbonData PMC Committer 李昆, Apache Kylin project CTO 李扬,PayPal 数据科学家张彭善,Apache Apex PMC 华思远,Facebook 工程经理金昀, 中国移动苏州研发中心高级研发工程师陶捷,Apache HAWQ 创始人常雷, 跬智科技首席技术官李扬等, 都将从各自企业实践出发, 剖析大数据为行业带来的变革, 为与会者绘制了一幅大数据生态全景图 大数据云服务, 输出是关键 随着大数据的广泛应用, 各大互联网公司如何打造基于公有云的大数据输出能力成为抢占新一轮技术制高点的关键 本届会议上, 主办方也为参会者准备了多场基于公有云的大数据实践, 华为中央软件院大数据系统架构师孙桂林, 小米云平台研发工程师崔建伟, 亚信数据 DataFoundry 平台负责人叶鹏, 中国联通信息化部数据中心项目负责人李大中, 去哪儿网实时数据平台负责人晓旭, 腾讯云高级工程师陈鹏都将从不同角度解读基于公有云的大数据实践 垂直领域应用百花齐放, 数据和应用加速融合大数据技术已在交通 医疗 金融 制造 通讯 推荐系统等行业中得到了广泛深度应用, 基于大数据的垂直领域应用前景广阔, 因此也成为众多业内人士关注的焦点 同时, 大数据和行业应用的融合发展已成趋势 大数据产业快速发展, 产业链加速形成, 正在对经济社会发展发挥着越来越重要的作用 为此, 本届大会特开设多场大数据行业应用论坛, 深 45

52 大数据金融信息剪辑 入探讨大数据在行业中的落地案例, 挖掘大数据的潜在应用前景 大数据加速制造业转型 迈入工业 4.0 时代, 制造业的主要特征转向智能和互联, 制造业整个价值链 制造业产品的生命周期都涉及诸多的数据, 数据量的暴涨成了许多行业共同面对的严峻挑战和宝贵机遇 大数据在工业制造领域的应用将会使得企业能够在低成本运营的同时, 有效实现按需生产, 实现绿色生产, 提高企业经营效率 为此, 中航信息中心首席顾问宁振波, 昆仑数据 CEO 兼北京工业大数据创新中心主任陆薇, 兮易控股董事长陈广乾, 宝信软件大数据事业部副总经理李一名在 工业与制造业大数据 论坛共同探讨工业 4.0 时代大数据的价值 大数据助力交通更加便捷高效 庞大的用户市场催生的海量数据让各大交通和旅游的互联网公司, 能够利用这些真实数据打造更加便捷高效的出行服务, 在 交通与旅游大数据 坛, 滴滴出行资深总监 智能交通云负责人杨毅, 易到技术 VP 尹佐宁, 携程大数据平台总监张翼等带来大数据在交通和旅游领域的应用分享 大数据驱动金融精细化运营 无论银行 证券还是保险, 众多金融机构正利用大数据驱动业务的优化运营 数字时代, 金融行业如何利用大数据顺应时代的发展? 上海证券交易所前总工程师 China Ledger 联盟技术委员会主任白硕, 平安大数据首席总监肖京, 百度金融研发负责人沈抖, 蚂蚁金服生物及智能安全部总监 资深数据专家陈继东, 微众银行大数据中心负责人姚军, 宜信大数据创新中心技术总监郑赟为听众现场解疑 大数据助推精准医疗快速发展 大数据分析是精准医疗发展助推器, 是跨界合作的重要领域 医疗大数据的收集处理, 对生命科 学 临床医学 临床药理有着重要意义, 可以对基因突变做出正确解析 标记有临床意义的注释 在本届大会的 精准医疗和生物医药大数据 论坛上, 国内顶级科研院所的十几位专家学者详细剖析大数据给精准医疗和生物医药领域带来的变化 包括来自上海交通大学生命学院, 微生物代谢国家重点实验室的魏冬青, 中国科学院上海生命科学研究院的陈洛南 深圳华大基因研究院副院长和生物信息中心主管方林, 清华大学数据科学研究院医疗健康大数据研究中心副主任江瑞等就相关话题展开讨论 另外, 针对大数据在通讯以及推荐系统领域的广泛应用, 本届大会也都从各个细分领域出发, 单独开设论坛进行重点分享 紧跟大数据技术前沿, 突出产学研用高性能计算完美契合了大数据在运算能力 高性能存储等方面需求, 而大数据则给高性能计算提供了新型商业市场, 有助于推动高性能计算拓展新的市场蓝海, 两者在产业生态链上的紧密衔接可以很好地推进信息资源组织模式的深入变革与发展 高性能计算与大数据的结合将实现优势互补 在备受瞩目的 高性能计算与大数据融合 论坛, 华中科技大学教授金海带来题为 大数据时代的新型计算机系统结构 演讲 ; 清华大学教授陈文光的演讲题目为 Gemini: 基于图计算的高性能大数据分析系统 ; 澎峰科技 PerfXLab 联合创始人 &CEO 张先轶讲解了 ARM 嵌入式系统的 DNN 性能优化 ; 上海市数据科学重点实验室教授 副主任斯雪明则分享了 SKA 科学数据处理中方联盟研究进展 ; 商汤集团研发执行总监林倞带来题为 深度学习的基础架构 : 从算法创新到生产力的助推器 的演讲 他们深度探讨了 46

53 大数据金融资讯 高性能计算与大数据的融合现状 对于大数据创业者和开发者都有很强的指导意 大数据和计算能力的提升打开了人工智能 义 此外 12月8日举办的 数据开放和政府治 时代的大门 大数据对于人工智能领域有着怎样 理高层沙龙 与会者就政府数据如何开放 政 的推动作用 人工智能如何借助大数据实现技术 府如何利用大数据提升治理能力和经济社会发展 的升级和应用的拓展 成为大家关注的焦点 为 等话题展开讨论 此次论坛召开对于国内数据治 此 在BDTC 2016上 主办方特别设置了人工 理创新有着强大的推进作用 智能论坛 包括华为诺亚方舟实验室 香港 研 无论企业或组织 数据安全都不容忽视 如 究员 项目经理耿彦辉 微软亚洲互联网工程院 何在注重数据安全和用户隐私的前提下 挖掘数 资深总监曹文韬 京东Director of Research殷 据价值成为企业和组织必须解决的问题 在 安 大伟 今日头条首席算法架构师曹欢欢 氪信 全与隐私保护 论坛 来自360 明朝万达 三 CreditX CEO&Founder朱明杰 智课教育首席科 味信安 安天科技等安全领域的实力公司为参会 学家李曙光分别带来主题分享 围绕人工智能在 者带来了大数据安全和隐私保护的分享 搜索 金融 媒体等领域的深度实践展开讨论 关注安全和隐私保护 以数据开放创新政府 治理 大会期间 组委会开设了各种方便互动和社 交的交流环节和场所 每一场精彩讲演之后都可 以进行深入地提问和讨论 作为大数据技术与应 大数据技术的发展和应用 离不开政府政策 用深度结合的新起点 BDTC 2016已经成为产业 保驾护航 BDTC 2016设置了 政策法规与标准 界 科技界与政府部门密切合作的新平台 为推 化论坛 来自政府部门和科研院校从事大数据 动我国大数据的产学研用做出了重大贡献 法律研究的5位专家详细解读大数据相关法律 部分会议议程 47

54 大数据金融信息剪辑 48

55 大数据会议活动集锦 2016 大数据博览会 : 大数据在金融领域的 10 大趋势 由中国高科技产业化研究会主办, 中国高科技产业化研究会信息化工作委员会协办, 北京百科汇国际展览服务有限公司承办 2016 中国 ( 北京 ) 国际大数据产业博览会暨高峰论坛 将于 2016 年 9 月 12 日 -9 月 14 日, 在北京 中国国际展览中心举办 本届展览会将以 促进大数据时代变革 共赢新时代机遇和挑战 为主题, 诚邀各单位 企业负责人及专业观众一起探讨大数据产业的未来和发展, 共同展示大数据产业领域的最新成果 新技术, 探讨行业动向 进行面对面的商业交流等 且此次会展将吸引世界各国的媒体前来报导 现在, 放眼 2016 年将要面对的, 我们猜测金融服务公司为了利益最大化进而不断整合大数据环境而言, 他们面前的路依旧漫长 银行家们也正在起草大数据战略, 制定入门和随后的用例 2015 年对于银行和金融业公司来说是一个开局之年, 在这一年中他们继续用大数据来帮助他们进行业务和组织架构的演进 现在, 放眼 2016 年将要面对的, 我们猜测金融服务公司为了利益最大化进而不断整合大数据环境而言, 他们面前的路依旧漫长 银行家们也正在起草大数据战略, 制定入门和随后的用例 对于银行来说, 大数据主要还是围绕提高客户情商, 减少风险, 符合监管 在可见的未来处 于第一梯队的大型金融集团都会继续围绕大数据展开各种动作 在低端市场, 一些中小型的公司 ( 经纪 资产管理 区域银行 顾问等 ) 能够更快速的适应大数据平台 ( 云平台和本地部署 ), 这些都帮助他们构建能够支撑复杂业务的大型系统, 同时这些系统也都是比他们大的竞争对手所必须面对的 这块市场因此能够快速成长 ( 对比那些大银行所关注的长期而规范的和成本为主的项目 ) 能够马上看到更加直接收入贡献和战略 ( 概念 / 实验 ) 项目 对于大数据软件提供商和服务提供商来说, 市场已经到了一个银行业必须要接受的爆发点上 大家都要在高可用 大规模 内部管控和面向客户活动方面有一些措施 同时, 这些内容和我们看到的云技术的发展路线有所不同 下面给大家展示几个大数据技术发展方向的预测, 和这些发展带来的变化如何影响金融服务业 : 1 机器学习将会加速发展, 同时大批量的应用在反欺诈和风控领域 数据科学家人才本身的供需关系将会朝着更加平衡的方向发展 在反欺诈和风控领域将会使用更加成熟的技术来改善风控模型本身, 并且加速发展实时分析监控和预警 这些快速的发展和变化会来自于业界领导者的传授和在现实世界的实践与应用 49

56 大数据金融信息剪辑 2 业界领导和进步缓慢者之间的差距将会越来越大 每一年我们都能看到银行为了适应新技术而加大油门快速前进, 同时在组织架构方面非常保守 业务和用户在 2016 年都将要激增而且会非常多变, 结果就是在广阔的市场导致更强的可观察到的和可衡量的业务大量回归 ( 不只是成本的下降 ) 3 数据治理, 血统和其他的合规性方面问题将会更加深入的集成到大数据平台中去 为了找到一个能够在合规性方面提供更强大功能的数据解决方案, 许多银行都购买或者开发了单点解决方案, 再不行就是用已经运行很多年的传统解决方案平台, 但是这些解决方案都无法应对现今大规模爆发的数据 幸亏现在有越来越多的 Hadoop 改进方案来进行数据治理, 改善血统和提供数据质量 更重要的是, 这些新数据平台能够超越 Hadoop 平台达到传统数据存储的效果, 并且做的更加大容量, 更快, 且在细节上达到合规性要求 此外在 2016 年我们将继续看到为融合监管和风险控制 (RDARR) 中心服务的叫做 数据湖 方面的更多进展 4 金融服务业正在利用物理网数据方面做出努力 这一波浪潮正是抓住大数据吸引力炒作 / 发力的好时机, 同时金融服务应用的为题也很多 物联网数据在许多行业应用中已经实践 ( 电信, 零售, 制造业 ) 这些行业驱动了物联网的数据的需求并且处于垄断地位 那么对于银行来说物联网数据是否能够用在 ATM 或者移动银行业务中? 这些都是在明年的多渠道实时数据流中值得探索的 例如, 实时, 多渠道的商业行为可以使用物联网数据对银行零售客户在正确的时间点提供适时的报价 或许我们反过来想想, 金融公司可以将自己的服务内嵌植入到用户的某种 东西 或者设备或者其他和客户接触的点上, 不在那些 交易设施上, 而是在家 5 与贸易, 投资组合管理和咨询申请集成成为软件供应商的一个显著特点 鼓吹与 从大数据获得更多利益 相关的新闻头条越奏越响 最终, 这些观点都将被金融终端用户 可见的利益 ( 或者不可见 无法衡量的利益 ) 还有易用性等因素决定 大数据平台的建设核心将要提供的就是一个桥梁就是大数据, 并且将其锐化突出 我们已经看到了市场数据供应商最喜欢的动作, 但是并没有其他商业用户的应用, 那么朝这个方向努力 (CRM,OMS/EMS 等 ) 6 风险控制和监管数据管理将继续成为顶级大数据平台的重要任务 增长和用户中心相关的商业行为将稳坐战略合作列表第一的位置, 会有很多的公司会把未来的战略与大数据关联起来 不论你的银行是不是发达的数据驱动的公司不断变化发展的规律还是面对大量的挑战, 朝着预测发展的分析都是一条漫长的道路, 同时也是一个必要的需求和被公司首席高官确认有意义的事 除非老天开恩或者监管机构放松要求, 否则风险控制和监管仍然是 2016 年所有金融机构的首要挑战 7 金融服务业采用 Hadoop 作为关系型数据库进行存取将会大大增加 大家在不同的时间使用了相同的技术之间并没有任何差别 长尾 效应还很遥远, 但是中小型银行将会从 Hadoop 的以下几方面获益 : 供应商将整合整套集成解决方案, 服务, 平台用户社区持续成长, 并能提供一个基础参考作为突破口数据降载成为当今 Hadoop 一个 经典 应用 ( 相对来讲 ), 同时许多大数据专家继续再更大的数据集合上前进, 未来将会有更多的普通人加 50

57 大数据会议活动集锦 入到大数据应用的行列 8. 金融服务 大数据终结 app 理论在市场得到了越来越多的认可 FinTech 已经孵化了 2-3 年, 形成了大数据平台和用户间从前端到终端的连接 希望看到更多的银行作为证明概念来运行这些应用, 这些实践将检验软件所提供的 完整解决方案 的基础 前端到终端和后端都应进行整合, 而不是分割 大家可以看到市场迅速的从服务集成扩展到后端, 这将迎来银行业的关于如何定位 大数据软件 和 传统软件 的激烈讨论 9. 变化来了, 获得前进动力的最后一次机会 随着越来越多的高可靠大数据平台的出现, 安全专家, 深层次的丰富元数据, 集成 LEI 和其他标准成为一个严峻的现实 传统的数据的方法是有效的, 只是需要一些思想来充分利用新的解决方案 - 例如处理架构和数据建模 更深一层, 随着大数据工作在前台, 市场营销和风险控制方面形成的工作模式, 我们能够看出这里面在办公的中后期业务上有明显和巨大的数据重叠部分, 这些重叠能够很容易的应用在现有的数据湖中 我们预计, 在中等的商业风险评估与性能相关的大数据的商业行为将迅速增加 更进一步, 我们将看到关于如何切实带来后台功能的更深层次的交流 ( 合作等 ) 10. 银行的机构方将开始采用并从零售业务的方式来获取线索增进对于市场目标客户的了解 有一些纯 B2B 的公司利用大数据来改善客户商情, 但是大部分时候他们处于 B2C 业务的不利 地位, 信用卡业务, 银行零售业, 财富管理或者借贷业务 一个简单的跨界就是基金的配置 ( 大型共同基金经理 ) 从财富顾问网络和经纪人相互作用来改善数据收集的过程, 同时也提高产品利用率 一旦被从客户群中移除, 这对于共同基金通常是非常重要的, 所以加强对于机构客户的理解显得尤为重要 信任仍然是许多大型银行的使用新供应商 大数据 的主要因素 换句话说, 当你展望 2016 年, 将会有很大的来自管理层的推动力, 来把大数据项目移出 IT 然后放到商业用户手中 为了达成目的, 我们需要考虑架构, 功能, 速度, 可用性, 安全性等问题 与往常一样, 采用传统的严谨性以全新的架构布局并没有改变, 传统架构将的成本和缓慢的进展将开始在新的 Hadoop 表现和融合的大数据的架构过程中逐步展现 更进一步, 将来一定会有更加强大的工具来处理现有的工作, 例如数据治理, 数据质量, 参考数据管理, 标准 这将要求各方持续的教育, 即那些 IT 意外的继续教育 用以了解市场的快速发展 最后, 针对平衡开源和供应商解决方案将展开长期讨论 不是所有的开源项目设计之初就符合机构客户, 开源项目传递了一种敏捷性需求开发 每个银行的需求都在不停的变化, 为大数据找到合适的点才是更加重要的 总而言之,2016 年的市场将会不断前行, 混乱随之减少, 同时会使大数据的海洋变得风平浪静 51

58 大数据金融信息剪辑 2016 贵阳大数据金融 互联网金融千人会高峰会今举办 深圳 上海之后排名第五, 很了不起! 贵阳在金融生态建设中的积极作为和示范效应, 对西南地区普惠金融的发展和绿色发展意义重大, 也是 2016 互联网金融千人会高峰会 互联网金融千人会移动金融大会将落地贵阳举办的重要原因 据悉, 贵阳在进入新常态的大背景下, 以大数据产业生态发展为重要抓手, 紧盯技术前沿, 11 月 3 日,2016 互联网金融千人会高峰会在互联网金融十大创新城市之一 贵阳召开, 贵阳市人民政府王玉祥副市长作开幕致辞 国家互联网金融安全技术专家委员会秘书长吴震, 互联网金融千人会创始会长 中央财经大学金融法研究所所长黄震教授分别作 互联网 + 金融更需要 互联网 + 安全技术保驾护航 互联网金融风险整治的逻辑与监管的趋势的主题演讲 贵阳市金融办罗尧重副主任出席 互联网金融十大创新城市 颁奖典礼, 代表贵阳领取 2016 互联网金融十大创新城市 荣誉 在 IFC1000 最新发布的 2016 互联网金融十大创新城市 榜单中, 贵阳市位列全国第五 贵阳凭借天然的地理气候环境 近年来大数据科技及互联网金融的迅猛发展优势, 成为西南区域唯一上榜的城市 同时上榜的还有杭州 北京 深圳 上海等城市 在 十大互联网金融城市 评选中, 贵阳是公众网络投票得票最多的城市, 说明老百姓对贵阳市互联网金融产业创新发展的认可度很高 据大会主办方之一 IFC1000 互联网金融千人会创始会长黄震教授介绍 在全国互联网金融创新发展的格局中, 贵阳能够继杭州 北京 在互联网金融技术带来巨大变革时, 贵阳紧抓历史机遇, 相继成立了全球第一家大数据交易所 第一家众筹金融交易所 第一家大数据金融学院, 也是移动金融五个试点城市之一, 并运用区块链技术推动贵阳市大数据的应用发展 目前贵阳大数据产业规模已达 916 亿元 一座 中国数谷 正在崛起 本次论坛期间, 来自德勤中国 甜橙金融 恒生云融 益盟股份 上上签 中天城投等知名企业代表聚焦 移动 普惠 绿色 的会议主题, 就 移动支付 征信 金融产品创新与规范发展 大数据风控 区块链 普惠金融 等热点话题进行了精彩主题发言与讨论 黄震教授与来自贵阳移动金融发展有限公司 中伦文德律师事务所 贵州省小贷协会 北京基石兆业控股 掌众金融等嘉宾作了 移动互联助力普惠金融 的主题对话 科技创新是金融发展的第一动力, 服务实体经济 普惠社会是金融发展的最大红利 在举国上下对移动互联助力普惠金融寄予极大希望的时候, 在贵阳全力繁荣金融生态的时候, 我们有的理由相信, 移动金融春天的正在到来 n shtml 52

59 大数据会议活动集锦 2016 年大数据金融信用体系建设和风险控制 系列活动贵阳共识 2016 贵阳大数据金融信用体系建设和风险控制系列活动, 在与会的有关监管机构 政府部门 企业家 金融机构和专家学者的共同参与下, 进行了为期四天热烈而深入的研讨, 于 2016 年 11 月 4 日圆满结束 本次活动以 大数据金融信用体系建设和风险控制 为主题, 重点探讨如何利用大数据 区块链等新兴科技, 开展传统金融和新金融征信体系建设和风险控制, 达成了如下共识 : 一 贵阳作为国家大数据 ( 贵州 ) 综合实验区的核心区域, 在大数据产业发展方面形成了先发先行优势 通过着力构建大数据内容中心 服务中心和金融中心, 促进大数据共享开放和创新应用, 加快了大数据与三次产业的深度融合, 推动了产业的转型升级, 培育了比较完整的产业链条和产业生态 二 贵阳的大数据战略把大数据金融当成重要的战略重点之一 大数据金融是大数据产业的核心要素和顶层结构, 大数据金融源于互联网金融, 高于互联网金融, 包括互联网金融和传统金融 大数据金融是新一轮科技革命驱动下的金融创新的最新成果, 具有强大的生命力和广泛的应用前景 三 贵阳 大数据金融 通过整合更多的数据维度, 推动整个信用体系建设, 为信用体系建设提供了有力的支撑 特别是在传统金融征信基 础之上, 有效地进行了行业条数据与地区 部门块数据有效的结合, 叠加了更多维度的数据, 从中筛选出有效数据, 为对企业 个人更加精准的画像和造影 为新型征信和信用评价提供了更加精准 更加高效的依据 四 贵阳 大数据金融, 有助于防范包括传统金融和新金融在内的金融风险 通过运用大数据 云计算 区块链 人工智能等技术, 对传统金融和新金融的风险管理有显著提高 利用大数据建立风控模型, 逐渐实现传统倚重人工判定财务数据向依靠大数据分析违约概率转变, 依靠大数据实现业务的全流程实时动态的监控 五 贵阳大数据金融信用体系和风险控制的探索与试点, 得到了社会各界及相关领导的高度重视和认可, 在全国开启了运用大数据, 支持大数据金融产业发展和风险控制的先河! 伴随着金融科技革命的不断涌现, 创新成果和监管规则的不断完善, 大数据金融征信和风控体系建设, 将向更加广泛的领域渗透 我们期待, 通过大家的共同努力, 让大数据金融从贵阳起步, 辐射带动全国大数据金融产业的发展, 让大数据金融真正为发展普惠金融, 解决小微企业融资难 融资贵问题和发展实体经济服务, 推动形成全球大数据金融蓬勃发展的崭新局面! 来源 : 数据观 - 贵阳日报 53

60 大数据金融信息剪辑 48家单位共同发起 关于数据标准化和治理的倡议书 数据观获悉 11月6日 首届中国数据标 社会各界力量 搭建一个共同交流 沟通和标准 准化及治理大会 在清华大学圆满召开 在会 验证的平台 着力宣传和普及标准化及治理的前 上 组委会特意向 贵州省大数据局 全国海关 沿理念 方法与实践 并且将这些工作常规化 信息中心等40余家单位及大多数与会嘉宾发起了 周期性持续地开展 关于数据标准化和治理 的倡议 国际数据管理协会中国分会主席胡本立先生 倡议的目的是 促进各界大数据生产者 使 也表达了同样的观点和愿望 并表示将不遗余力 用者和从业者对于数据标准化 数据质量及数据 地促进中国数据标准化及治理相关产业的发展 治理理念达成共识 呼吁大家关注和重视数据治 非常期望能与社会各界携手共建权威 开放及广 理 数据质量等基础数据能力建设 发动社会各 泛参与的交流平台 界能联起手来共同创建数据和谐生态 清华大学数据科学研究院院长助理王霞女 中国电子技术标准化研究院副院长高林先生 士现场宣读了 关于数据标准化和治理的倡议 在致辞中指出 在数据化的时代 标准化的工作 书 号召广大从业者在以下五个方面达成共 在各个行业都急需开展和落实 目前社会上高度 识 重视大数据标准化工作 国家层面也采取了一系 列的措施 希望与会专家包括清华大数据产业联 合会 DAMA China等这类组织共同呼吁并聚集 一 从现在开始 关注和重视基础数据能 力建设 二 高层领导 搭班子 定战略 做积极 倡导者 三 业务人员 发挥 数据主人翁意识 做深度参与 者 四 信息技术人员 技 术与管理并重 做综合型数据 管家 五 为基础数据工作创 造开放 宽松的发展环境 54

61 大数据会议活动集锦 相信通过努力开展以上五个方面工作 从基 层员工到高层管理 从文化建设到人才培养 数 据标准化 数据质量及数据治理的工作必定会渗 实现整个社会的数据更可靠 更可用 使大数据 产业发展更稳健 更扎实 以下为48家共同发起倡议单位名单 透到各行各业的实践中 并长期坚持下去 逐步 来源 55

62 大数据金融信息剪辑 2016 年贵阳大数据金融信用系列活动论坛观点集锦 一轮一轮的观点交锋, 一次一次的智慧碰撞, 成就一场思想的盛宴 11 月 3 日,2016 年贵阳大数据金融信用体系建设和风险控制系列活动中的大数据金融与现代信用城市建设论坛 互联网金融千人会高峰会 大数据金融的众筹金融信用体系建设及发展论坛 保险业大数据风险防范及征信探索论坛相继召开 工信部信息化和软件服务业司处长傅永宝 北京移动金融产业联盟秘书长班延伦 银联智慧信息服务 ( 上海 ) 有限公司董事长徐燕军 近百名来自政 企 产 学 研的专家学者汇聚贵阳国际生态会议中心, 基于大数据视角, 对金融模式的创新和发展又有了一次新的探索和实践 在大数据金融与现代信用城市建设论坛上, 参会嘉宾提出 在现代信用城市建设的过程中, 利用好大数据金融是关键一环 11 月 3 日, 大数据金融与现代信用城市建设论坛举行, 来自国内政企产学研等领域的 10 个专家学者齐聚一堂, 共话 大数据金融与现代信用城市建设 与会嘉宾认为, 以大数据为支撑加快信用体系建设, 能广泛适用于金融服务 社会治理 行政监督 民生服务等诸 多领域, 其中, 基于金融业存量数据规模大的特点, 大数据金融是现代信用城市建设的关键一环 工信部信息化和软件服务业司处长傅永宝在论坛中就提到, 随着信息技术与经济社会的深入融合, 数据正在呈现爆炸式增长的态势, 以前叫 工业革命, 现在叫 信息革命, 数据已经成为国家的战略资源, 对于我国来说, 如何把握发展机遇, 充分利用好大数据, 是一个重要的课题 在现代信用城市建设的过程中, 如何利用好大数据? 傅永宝认为, 基于金融业存量数据规模大的特点, 大数据金融是现代信用城市建设的关键一环 他说, 金融行业是国内外信息化程度较高的行业之一, 出于稳定经营 控制风险的需要以及国家相关金融法规的要求, 金融机构都保留了大量的业务数据, 而这些持续经营产生的存量数据就成为了金融行业利用大数据的基础, 这也是现代城市信用体系建设的数据源头 听了傅永宝的观点后, 中国互联网金融协会外部专家戴志辉也表示认同 他说, 大数据金融本身会产生海量的大数据, 有信贷数据, 有被拒绝的数据, 这些数据能够使金融行为带来的财富效应有利于信用城市的建设, 在信 56

63 大数据会议活动集锦 用城市建设里面, 最终的目的就是要让守信者受益, 大数据金融本身就是一种根源式的体现 在大数据时代下, 信用本身就是一种财富 戴志辉举例, 银行的贷款和 P2P, 不同的信用等级可以获得不同的利率折扣 ; 同样在保险的领域, 车险的差距费率也体现了这一点 此外, 大数据金融还呈现出一种网络化特征, 失信者受戒, 除了不能乘坐飞机 高铁之外, 基于信息的互联互通, 在其它领域也会处处受阻 既然认识到了大数据金融的重要性, 那么在现代信用城市建设的过程中, 该如何利用好大数据金融? 戴志辉认为大数据金融现在还处于早期阶段, 基础设施的发展还急需完善 首先, 大数据金融公司要关联多个数据源, 有的甚至十几个, 包括工商 法院 公积金等, 有的企业还可能需要来自电商的交易数据 社交媒体的社交数据等 这么多的数据, 现在没有一个统一的大数据基础设施, 所以不少大数据金融公司不得不同时连接多达十个以上的数据源, 这占到整体的风控成本的一半以上, 因此, 做好基础设施建设是迫在眉睫的事情 公安部第三研究所网络身份技术事业部执行主任严则明也提出建议, 在大数据金融的运用中, 要加强隐私保护的建设工作 有数据统计, 随着大数据时代到来, 全球网络犯罪的案值超过 3 万亿美金, 你看, 我们买房了 买车了, 马上推销的电话来了, 这都是个人隐私信息泄露 在保险业大数据风险防范及征信探索论坛上, 参会嘉宾认为 大数据将会引导保险行业进入高速发展的快车道 11 月 3 日, 保险业大数据风险防范及征信探索论坛举行, 来自中国保险学会 中国平安保险等机构和企业的 8 位知名专家 企业家围绕 保险业大数据风险防范及征信探索 这一主题进行了探讨 他们认为, 随着大数据时代的到来, 作为金融业 三驾马车 之一的保险业也迎来前所未有的发展机遇 只需充分利用好大数据技术和理念, 中国的保险行业必将进入高速发展的快车道 有数据统计, 截至 2015 年底, 中国的人寿保险市场保费收入为 亿元, 同比增长 25%; 财产险保费收入 7995 亿元, 同比增长 11% 然而尽管发展迅速, 但我国保险市场的保险深度却只有世界平均水平 6.3 的一半 很大的一个原因就在于保险行业的不可计量性以及信息不对策的制约 中国人民财产保险股份有限公司执行董事 副总裁王和说, 由于缺乏信息, 在相当长的一段时间内, 行业对风险的认知和管理不得不依赖于主观的判断, 或者言之, 以往人们知道风险的存在 知道风险有某一些特征, 但是人们没有办法了解 感知和管理风险 但是随着大数据时代的到来, 我们将迎来一个客观管理时代, 数据的数量 纬度和实时性的极大丰富, 能够让我们客观地去认识风险 评估风险和管理风险 王和认为, 这主要是基于大数据的数据分析能力和云计算能力, 一方面是让人们有可能获得更多 更丰富的数据, 从而进入了一个数字化的社会, 让人们有了对比的可能性 ; 另一方面是云计算技术的应用, 保险业迎来一个风险计算的时代, 比如文本挖掘 图像识别 云识别等等进行数据的分析和预测, 是否有风险一算即可 对于 大数据将会引导保险行业进入高 57

64 大数据金融信息剪辑 速发展的快车道 的观点, 中国平安保险 ( 集团 ) 股份有限公司保险系列首席技术官钟捷作了补充 钟捷说, 根据平安这几年的实践, 大数据可以为保险公司带来如下几个方面的益处 : 一是风险定价, 保险公司分析定价因子来做 UBI 险种的常识 ; 二是欺诈的识别, 比如通过关系网络来进行风险评分, 来避免欺诈 ; 三是运营的优化, 比如每年理赔的时候有上亿图片上传, 在处理这些图片的时候经过人工来看清晰度, 确定理赔金额, 如果可以通过图片识别技术把人工环节减去, 即可大大地降低效率和增强用户的体验 ; 四是精准营销, 通过大数据手段对客户进行评分, 哪一类客户更容易销售, 来进行更准确地推荐 当然, 利用大数据推动保险行业的发展并不是一蹴而就的事情 中国保险信息技术管理有限责任公司副总裁陈克文就提出, 信息共享是首要解决的问题, 因为只有信息共享, 才能让每个行业能够快速查询被保人的相关信息, 被投保人也能够获得快速的查询服务 ; 同时也可以形成跨地区的协同合作, 以防止保险欺诈, 例如某一个人在一个公司投某一个保险, 这个保险公司就可以查看这个人以前投的全部险种, 以及这个人的出险记录, 这样就可以判断这个人是否存在保险欺诈的行为 互联网金融千人会会长黄震也提议, 在利用大数据之前, 如何保护大数据所涉及的个人隐私 个人信息是前提 他说, 如果没有对于个人隐私信息的保护, 必然会带来更多的风险, 比如现在的商家, 拼命的捞数据 挖数据 购买数据, 但这些数据是否经过合法途径, 谁也不知道 今天上午有一位企业讲到他们坚决不用那些可能有瑕疵的数据, 我就要 为他点赞 黄震如是说 在互联网金融千人会高峰会上, 与会嘉宾认为 互联网 + 金融更需要 互联网 + 安全技术 11 月 3 日下午,2016 年贵阳大数据金融信用体系建设和风险控制系列活动 互联网金融千人会高峰会在筑举行 与会嘉宾围绕 互联网 + 金融更需要 互联网 + 安全技术保驾护航 互联网金融风险整治的逻辑与监管的趋势 区块链 风口之中的新兴技术等主题, 通过主题演讲与主题对话等方式对互联网金融进行了多角度的探讨 随着国务院提出大众创业 万众创新的发展战略和互联网 + 行动计划以来, 我国的互联网金融产业高速发展, 但是也为金融市场产生了许多全新的课题 国家互联网金融专家委员会秘书长吴震表示, 首先从互联网金融的定义看, 它基于互联网技术 移动通讯技术实现资金融通, 符合信息中介的信息金融模式, 是互联网模式与金融的有利结合 从形式来看, 既有传统业务的互联网化, 也有互联网催生的新兴的业务, 互联网金融就是互联网 + 金融, 更准确地说它不是层次上的叠加, 而是新兴的融合的产业 同时, 互联网金融具有 多 新 快 杂 虚 的特征, 而正因为这些特征, 互联网安全事件频发, 如巨额资金去向不明, 所以只有解决安全问题, 才能促进互联网金融的繁荣和发展 对此, 中央财经大学金融法研究所所长 教授黄震表示赞同, 并就互联网金融风险整治的逻辑与监管趋势进行深入解说 有了大数据 云计算 区块链 人工智能等一代又 58

65 大数据会议活动集锦 一代的技术催生各种产业的革命, 加上金融是产业的顶端, 经济的血液, 因此必然裹胁着改变 黄震表示, 互联网金融的发展, 说明传统产业生态出了严重的大问题, 一方面互联网金融与传统的实体越来越背离和阻隔, 二是不同的产业进行不同的监管, 导致同样的监管体系中的部门之间无法实现融通, 而这种金融体系是背离金融本质的 因此, 在互联网金融整治的逻辑上, 黄震认为, 首先是要促进互联网金融的健康发展, 其次看到异军突起要进行监管, 第三是要规范发展 同时, 互联网金融的逻辑又分三个层级 一是创新逻辑, 主要是技术创新驱动 ; 第二是监管的逻辑, 它与金融市场主体的权利 利益的碰撞有关 ; 第三是分析问题的整治 监管让互联网金融平衡, 不能平衡的时候只有整治, 而整治的目的是促进其健康发展 黄震说道 那大家该如何应对今后的整治以及监管呢? 黄震表示, 在后监管时代, 合规很关键 当各种 细则 办法 在不断出台中时, 企业要抓住动态性的规范, 做到动态合规 如今互联网金融的特点是跨界 协同, 要跨十几个部门才可能对它进行监管, 因此想要合规就要考虑每一个有关部门的规定对你有什么影响, 而不仅仅是原来的主管机构就行了 黄震建议, 企业应先把内规梳理出来, 争取把内规升级变成外规, 以达到动态合规 在大数据金融的众筹金融信用体系建设及发展论坛上, 参会专家学者提出 构建众筹金融生态体系将贵阳打造成大数据区域金融中心 11 月 3 日,2016 年贵阳大数据金融信用体系和风险控制系列活动分论坛 大数据金融 的众筹金融信用体系建设及发展论坛举行 参会专家学者提出, 在智能化的移动互联网时代, 要让金融与互联网 大数据结合起来 加强金融基础设施建设, 保障金融市场安全高效运行和整体稳定, 将贵阳打造成大数据区域金融中心 谈到大数据金融如何和地方金融改革结合起来 贵阳如何成为区域的金融中心? 中国区块链研究联盟主任 中国社科院金融所所长助理杨涛在做主题演讲时认为, 大数据金融时代, 在发达经济体, 影响了金融基础设施, 在新兴经济体, 影响了金融机构与产品 与日益增长的经济金融创新与发展需求相比, 我国的金融基础设施有效供给仍然严重不足 要加强金融基础设施建设, 保障金融市场安全高效运行和整体稳定 杨涛指出, 大数据时代的金融基础设施建设, 应该以信用等级为抓手, 促进提升基础设施的比较优势与外溢性 第一阶段可能会是迷茫与磨合阶段, 在该阶段大数据金融效应外溢与数据流动会失衡 到第二阶段, 就到了短期受益阶段, 在该阶段, 大数据金融集聚直接带来政府税收收益, 更易服务于地方产业部门, 最终服务于公众福利改进 第三阶段, 长期提升阶段, 大数据金融辐射服务于区域经济 跨界, 辐射带动区域内外众多公众受益 到第四阶段为开放平台阶段, 大数据金融科技的创新引领与输出, 金融要素在区内外快速的流动, 以技术标准 规划与文化为主导 那贵阳如何成为大数据区域金融中心, 标准是什么? 杨涛认为, 一方面, 通常取决于是否具备基础性条件, 比如经济环境 贸易环境 城市发展水平 人力资源 法律监管 历史与文化积淀 另一方面, 其金融机构体系的 59

66 大数据金融信息剪辑 健全程度 金融机构筹资和投资的能力 金融产品创新 支付清算等金融设施 金融人才的聚集等, 是否达到了领先程度 如果从全球范围来衡量, 则还要考虑资本开放程度 货币体系稳定性与金融的安全性 杨涛举例说, 以新加坡为例, 就是通过构建七大支柱来支撑自己的金融中心梦想, 包括国际性资产管理中心 债券中心 证券及衍生品交易中心 外汇交易中心 保险业中心和离岸金融中心 其针对亚洲三大经济体, 包括中国 印度和日本, 构建了全球最大的亚洲股指期货离岸市场 同时, 当地也成为离岸人民币的中心之一 在谈到如何建设众筹金融信用体系时, 财政部财政科学研究所所长 博士研究生导师贾康认为, 众筹金融信用体系的建设, 是要在供给侧改革下进行的, 可以进行多元化改革, 形成多元化的供给侧改革体系, 有效支撑金融体系建设 要结合金融交易的特性, 让绿色金融, 小微金融, 普惠金融都融入进来并给予支持 同时, 要进行金融互联网的创新, 这一定要在互联网的支撑下进行, 甚至要超越互联 网 互联网与移动互联网时代的到来, 产生了移动金融, 这是一次产业的革命 贾康认为, 在贵阳, 金融已经插上了互联网的翅膀, 取得超常规发展 贵阳可借助生态文明和科技创新, 发掘更多资源潜力, 让金融与互联网大数据结合起来, 共享经济, 形成盈利模式 要让互联网下的金融产生更多的产品, 让产品市场化, 商业化, 真正带来一个移动互联网状态下消费, 提升用户的体验感 来自京东集团的李贺明在谈到 互联网金融大数据风探体系建设 时提出, 应该通过体系的监管与服务促进地方金融产业的发展 体系建设要建立金融行政监管与服务行政规范及行业的标准, 金融企业经营财务数据信息实现实时获取并精准 在众筹交易平台 征信体系 区块链技术方面搭建风控模型, 建立企业 行业信用标准 风险预警, 建立可复制 可推广的金融监管政策 法律 法规标准体系 来源 : 大数据观察 article/mdawmdu3n8zq4.html 60

67 大数据会议活动集锦 首届中欧大数据金融论坛开启大数据金融的思维碰撞 随着大数据技术受到越来越多的重视, 这项技术的应用场景也越来越丰富 目前, 政府 教育 医疗 交通 环保 金融 互联网金融 地产 零售 媒体 航空 旅游 酒店 耐用消费品等领域都出现了大数据技术的身影 尤其是在互联网金融领域, 大数据技术的应用及发展非常活跃 互联网金融从最初的模式创新走到了今天的科技创新, 中间起到关键作用的因素, 除了金融科技的逐步完善之外, 更有大数据技术的强大助力 正是看到大数据与金融科技的碰撞, 催生了大数据金融的星火燎原大势, 作为国内金融产业异常活跃的前沿城市 深圳非常重视大数据与金融产业的结合 在国家外国专家局 中国国际人才交流基金会及深圳政府的支持与指导下, 深圳龙华新区经济服务局 深圳软件园中心 英国南安普顿大学协同深圳市华傲数据技术有限公司, 计划在 2016 年 12 月 7 日 -8 日举办 第一届中欧大数据金融论坛 此次论坛的参与嘉宾规格非常高, 包括了牛津大学副校长 Anne Elizabeth Trefethen 教授 德国柏林洪堡大学 Wolfgang Hardle 教授 德国柏林洪堡大学陈怡璇副教授 英国剑桥大学 David Stillwel 博士 英国南安普顿大学马铁军博士 深圳市前海金融控股有限公司阮华伟博士 北京大学汇丰商学院代表卢俊博士 深圳市华傲数据技术有限公司于文渊博士 胡吉友先生等 同时, 此次论坛将以 洞见未来 为主题, 政府 学术 企业等多方代表共同探寻大数据技术与金融科技之间的结合之道, 并围绕金融风控领域的大数据技术应用开展专业学术与市场实践 的专业性探讨 得益于在智慧城市 金融 互联网等领域的大数据出色成绩, 深圳市华傲数据技术有限公司 ( 以下简称 : 华傲数据 ) 作为承办单位承办了如此高规格的论坛 2011 年, 英国爱丁堡大学贾西贝博士就带领着他的大数据团队从英国回到中国, 扎根深圳, 创建了华傲数据 贾西贝博士以其超前的眼光, 早早在政府 金融 互联网这三大领域进行大数据产业布局, 为这三大领域的客户带来了世界顶级的数据管理与清洗分析技术, 并充分发挥了以数据清洗为核心的技术优势, 为客户提供大数据采集 大数据智慧城市 大数据风控等产品及服务 在短短五年发展时间内, 华傲数据就曾被 哈佛商业评论 评为全球 引领大数据发展 的领军企业, 当时与其一同入围的中国企业仅有腾讯与百度 ; 而且其国内发明专利申请达到 91 项, 并已完成 40 件 PCT 专利申请 如今, 华傲数据领跑中国大数据领域, 样板客户囊括了一二三四线的大数据风口城市, 大数据产品及服务已经走出深圳, 在天津 贵阳 沈阳 三亚 盐城等大数据风口城市多点开花 未来几年, 大数据与金融科技的结合脚步一点不会停止, 类似 第一届中欧大数据金融论坛 这种在政府 企业 机构等多方推进的思维探索 产业讨论活动会举办得越来越多 大数据技术在产业结合的过程中将继续充当关键角色, 并且发挥越来越重要的作用 来源 : info html 61

68 大数据金融信息剪辑 任正非回家领华为助推贵州大数据发展 11 月 12 日, 贵州省人民政府与华为技术有限公司战略合作协议签字仪式在贵阳举行 根据协议, 双方将本着 优势互补 自愿平等 开放公平 互利共赢 的原则, 充分发挥华为公司在云计算 大数据等领域的先进技术优势和丰富运营经验, 结合贵州实施大数据战略行动, 推动双方在云计算大数据应用发展 物联网和智能制造建设 智慧城市和平安城市建设等方面深化合作 共同发展 贵州省委书记 省人大常委会主任陈敏尔, 省委副书记 省长孙志刚, 华为技术有限公司总裁任正非, 华为技术有限公司副董事长 轮值 CEO 徐直军, 省领导秦如培 陈刚 慕德贵出席签字仪式 在签字仪式前, 陈敏尔 孙志刚与任正非 举行了会谈 双方一致认为, 贵州资源丰富, 生态良好, 空气清爽, 气候凉爽, 发展大数据具有得天独厚的优势 双方表示, 将以本次签约为契机, 在已有良好合作基础上, 进一步完善沟通交流 工作推进机制, 确保协议确定的合作项目早日落地生根 开花结果 任正非, 中国家喻户晓的名字, 世界知名电子科技巨头华为技术的掌舵人 主要创始人 总裁 1944 年 10 月 25 日, 任正非出生于贵州省镇宁县 此次华为与贵州省政府达成合作, 被誉为任正非回乡兴业之旅, 这使得华为科技与贵州大数据战略高度融合, 助推贵州大数据再上台阶 这也是贵州省继成功引进阿里巴巴 百度 腾讯等 IT 巨头以来, 再次引来了世界 500 强企业华为技术, 将贵州大数据发展战略再次推向高潮 1963 年, 任正非在重庆建筑工程学院 ( 现已并入重庆大学 ) 毕业后, 就业于建筑工程单位 1974 年为建设从法国引进的辽阳化纤总厂, 应征入伍加入承担这项工程建设任务的基建工程兵, 历任技术员 工程师 副所长 ( 技术副团级 ), 无军衔 任正非也因工程建设中的贡献出席了 62

69 大数据会议活动集锦 1978 年的全国科学大会和 1982 年的中共第十二次全国代表大会 1987 年, 任正非集资 元人民币创立华为公司,1988 年任华为公司总裁 2003 年, 任正非荣膺网民评选的 "2003 年中国 IT 十大上升人物 ";2005 年入选美国 时代 杂志全球一百位最具影响力人物 ;2011 年, 任正非以 11 亿美元首次进入福布斯富豪榜, 排名全球第 1153 名, 中国第 92 名 2015 福布斯华人富豪榜排名 350, 全球富豪榜排名 胡润 IT 富豪榜, 任正非以 105 亿元排名第 35 贵州是任正非的故土, 环境优美, 生态俱佳 而使华为与贵州携手合作, 共同推进大数据发展的原因, 自然有任正非的家乡情结 但更重要的当属贵州省近年来实施的 大数据 战略 贵州实施大数据战略行动, 是牢记总书记嘱托, 守住发展和生态 两条底线 的具体举措, 也是贵州有机结合结构调整与转型升级, 因地制宜发展好产业, 弯道取直的新路 可以说 : 实施大数据战略行动, 是贵州实现弯道取直 后发赶超的战略选择 贵州是我国南方最适合建设大型数据中心的省份, 发展大数据具有生态环境好 能源价格低 地质稳定等得天独厚的先天优势 2015 年, 国务院关于印发促进大数据发展行动纲要的通知 明确提出 : 支持贵州等综合试验区建设, 贵州大数据发展正式上升为国家战略 2015 年 2 月 14 日, 李克强总理考察贵阳大数据应 用展示中心时, 希望贵州在大数据领域探索出一片新天地, 为服务国家战略作贡献 ;2015 年 5 月 26 日, 马凯副总理在出席贵阳数博会并考察贵州信息产业发展情况时, 充分肯定贵州发展大数据是创造性落实中央精神的重大举措, 给了贵州加速发展的信心和底气 2016 年 5 月 24 日, 李克强总理出席在贵阳出席中国大数据产业峰会暨中国电子商务创新发展峰会对话会时指出 : 中国经济既要培育新经济 新动能, 也要改造提升传统动能 而传统产业的改造升级, 很大程度还需要依靠新经济 新动能, 包括大数据 云计算等新技术 现在由于大数据 云计算 互联网 + 等新技术的产生, 虚拟世界和真实世界正在日益融合 我们进入了一个新的时代 贵州发展大数据, 正是得益于党中央 国务院的关心支持 近年来, 贵州将发展大数据与 大生态 大扶贫 大健康 大旅游 作为五位一体的重大工程来抓, 在系统平台建设 大数据立法 大数据交易 大数据创业创新等方面率先起步, 积累了一些先行优势, 得到国家层面和业界的广泛认可 我想这也是华为入驻贵州最主要的选择因素吧 总之, 任正非回家了, 我们家里人十分的欢迎 期待华为在贵州更加辉煌 ( 杨松 ) 来源 : p/5a7woor.html 63

70 大数据金融信息剪辑 美国的数据交易产业是怎样发展的? 近年来, 各国加紧推进大数据的资产化 有价化, 探索对大数据进行计价 赋值 交易 参照美国数据经纪产业发展模式, 以数据开放共享推动大数据交易资源建设, 以交易和产品双足运行推动大数据交易时新发展, 可能是我国未来大数据交易产业健康良性发展的可选之路 一 美国数据交易的典型模式美国数据资产交易主要有三种模式 第一种是数据平台 C2B 分销模式 用户将自己的个人数据贡献给数据平台, 数据平台向用户给付一定数额的商品 货币 服务等价物或者优惠 打折 积分等对价利益 第二种是数据平台 B2B 集中销售模式 数据平台以中间代理人身 份为数据提供方和数据购买方提供数据交易撮合服务, 数据提供方 数据购买方都是经交易平台审核认证 自愿从事数据买卖的实体公司 ; 数据提供方往往选择一种交易平台支持的交易方式对数据自行定价出售, 并按特定交易方式设定数据售卖期限及使用和转让条件 美国微软 Azure Datamarket Factual Infochimps 等数据中间平台代理数据提供方 数据购买方进行的数据买卖活动, 大多属于此类模式 第三种是数据平台 B2B2C 分销集销混合模式 数据平台以数据经纪商 (data broker) 身份, 收集用户个人数据并将其转让 共享与他人, 主要以安客诚 (Acxiom) Corelogic Datalogix ebureau ID Analytics Intelius PeekYou Rapleaf Recorded Future 等数据经纪商为代表 美国数据经纪商产业发展现状 在美国数据交易的三种主要模式中, 第三种数据平台 B2B2C 分销集销混合模式发展迅速, 目前已经形成相当市场规模, 塑造了在美国数据产业中占据重要地位的数据经纪产业 二 美国九大数据经纪商 Acxiom 为市场营销和欺诈侦探提供用户数据和分析服务, 数据库中包括了全球范围内 7 亿用户的个人数据, 其中包括涉及几乎每个美国用户的 3000 条数据段 Corelogic 向商业和政府机构提供包括财产信息 消费信息和金融信息在内的用户数据及其分析服务, 其数据库中包含 7.95 亿条资产交易历史数据 9300 万条抵押贷款申请信息以及涵盖 99% 以上美国住宅物业的 1.47 亿条特定资产 64

71 大数据金融资讯 信息 Datalogix 向商业机构提供涵盖几乎每个美国家庭 涉及金额超过 1 万亿美元以上的用户交易信息 2012 年 9 月,Facebook 宣布与 Datalogix 建立合作伙伴关系, 以便评测其 10 亿用户在社交网站上浏览某一产品广告的频次与其在某一实体零售店完成购买交易之间的关联关系 e B u r e a u 向营销商 金融公司 在线零售商以及其他商业主体提供预测评级和数据分析服务, 最早只是分析某人是否可能成为潜在的优质客户或者某笔交易是否存在商业欺诈 后来发展为向其客户提供数以亿计的用户消费记录, 而且每月还以 300 万条新增消费记录的速度在急速增长 ID Analytics 主要提供以身份认证 交易欺诈检测和认证为目的的数据分析服务, 其认证网络中包括了数以百亿计的数据集成点 (aggregated data points) 11 亿条独特的身份数据元素, 涵盖了 14 亿条用户交易信息 I n t e l i u s 向商业机构和客户提供背景调查和公开记录信息, 其数据库中包含了 200 亿条以上的公 开记录信息 (public record information) PeekYou 拥有能够分析 60 家社交媒体网站 新闻来源 网站主页 博客平台内容的专利技术, 向客户提供详细的用户配置文件 (consumer profiles) Rapleaf 是一家数据集成商, 拥有一个以上能够连接超过 80% 以上美国用户电子邮件地址的数据点以及 30 个其他类型的数据点, 并且不断在其电子邮件地址列表中增补电子邮件用户年龄 性别 婚姻状况等信息 Recorded Future 通过互联网捕捉用户和企业的各类历史数据, 利用该类历史数据分析用户和企业的未来行为轨迹, 截至 2014 年 5 月, 已经实现对 502,591 家不同开放互联网站点各类信息的接入和抓取功能 三 美国数据经纪商从哪采集数据美国数据经纪商不是直接从用户处收集数据, 而是主要通过政府来源 商业来源和其他公开可用来源等三个途径收集数据 由于一个数据经纪商只能提供一个用户行为轨迹所需的很少数据元素, 因此数据经纪 商必须将其所掌握的数据汇集起来, 描绘出用户生活更加复杂的多维图景 联邦政府数据源 上述 9 家数据经纪商中的 6 家直接从联邦政府渠道获得其所需要的数据 地方政府数据源 有些数据经纪商并非直接从地方政府获取其所需要的数据, 而是通过其他数据经纪商获取其所需要的地方政府数据 后者往往通过雇佣人员对地方政府官员展开公关, 以便获取对地方政府数据进行编纂和整理的机会 ; 或者与地方政府具有业务往来关系, 地方政府同意其在业务往来中自动收集 获取地方政府数据 公共数据源 ( 包括社交 博客 互联网等 ) 一半以上数据经纪商表示他们收集通信录 电话本 新闻报道等其他可用公共数据 商业数据源 除 1 家数据经纪商外, 其余 9 家数据经纪商都通过广泛的商业渠道来购买其所需要的用户个人数据 例如, 数据经纪商从零售商 产品目录公司等渠道购买详细的商品交易信息, 部分数据经纪商还从期刊发行商那里购买详细的用户订阅类型 65

72 大数据金融信息剪辑 互为数据源 数据经纪商的绝大多数商业数据源实际上来自上述 9 家数据经纪商之外的其他数据经纪商 部分数据经纪商共享同一数据源, 每一家数据经纪商都能从不同数据源收集到相同或相近的数据 四 美国数据经纪商的产品类型数据经纪商通常提供市场营销产品 风险控制产品和人员搜索产品等三类数据应用产品 2012 年 9 家主要数据经纪商的三类主要数据产品全年总收入大约为 4.26 亿美元 市场营销产品有 5 家数据经纪商面向其客户销售自己的市场营销产品,2012 年全年营业总收入大约为 1.96 亿美元 美国联邦贸易委员会 (FTC) 将数据经纪商的数据营销产品分为下列几类 : 第一类是直销产品 包括邮件 电话营销 电子邮件营销等三类 ; 第二类是在线营销产品 包括通过互联网向用户进行营销 ( 互联网营销 ) 通过移动设备向用户营销 ( 移动营销 ) 以及通过有线电视和卫星电视向用户营销 ( 有线电视卫星电视营销 ) 等三类 ; 第三类是营销分析 所有这三类产品都能使数据经纪商 的客户面向其客户量身定制各类市场营销信息 风险控制产品接受调查的 10 家数据经纪商中有 4 家面向市场销售其自己开发的风险控制产品,2012 年的年收入总额为 1.77 亿美元 美国联邦贸易委员会 (FTC) 将风险控制产品分为身份认证产品和欺诈侦测产品两类 人员搜寻产品上述 9 家数据经纪商中有 3 家面向市场销售其自己开发的人员搜寻产品,2012 年的年收入总额为 0.52 亿美元 人员搜寻产品主要提供用户个人数据, 这类产品能使用户基于最少的数据元素便能发现最多的用户相关信息 数据经纪商通常会提醒用户不要将上述个人数据用于 公平信用报告法案(FCRA) 规定以外的其他目的, 包括就业资格认定 信用评级 保险费评定 房屋买卖以及其他类似或相同目的 五 美国数据经纪的产业特征美国数据经纪商有如下产业特征 : 1 数据经纪商通过多种信源广泛收集用户个人信息, 绝大多数情况下用户对此并不知情 2 数据经纪产业由多层互为提供数据的数据经纪商所 组成 数据经纪商不仅为终端用户提供数据, 同时也互相互为提供数据 3 数据经纪商收集 存储着海量数据元素, 几乎覆盖了每个美国用户 4 数据经纪商联结并分析用户数据, 以便做出包括潜在敏感推理在内的用户推理 数据经纪商从用户数据中推理用户兴趣, 根据用户兴趣结合其他信息对用户进行分类 5 数据经纪商将线上线下数据与市场用户的在线数据相结合 数据经纪商依托网站注册功能和浏览器 cookies 抓取跟踪功能来发现用户在线行为轨迹, 推理用户离线行为特征并向其推送在线互联网广告 六 美国数据经纪产业的利弊分析 用户能从数据经纪商收集 使用数据的众多目的中真正获益 数据经纪产品能够预防欺诈 增加产品销量 向用户推送量身定制的广告 许多数据的收集和使用行为对用户造成一定程度的风险 如果用户因数据经纪商的错误而不能完成一项风险控制产品的交易, 用户往往因不知情而使自己受损 数据经纪商一定程度上会向用户提供其个人数据的选择权, 但是这些选择权绝大多数情况下是不完整 不可兑 66

73 大数据金融资讯 现的 用户通常情况下不知在哪里去行使其选择权或者不知如何行使选择权 储存用户数据永远都具有不可预知的安全风险 虽然存储数据对于实现未来商业目的是有益的, 但是数据存储的安全风险可能要远远大于其商业利益 七 对我国大数据交易的借鉴意义参照美国数据经纪产业发展模式, 以数据开放共享推动大数据交易资源建设, 以交易和产品双足运行推动大数据交易时新发展, 可能是我国未来大数据交易产业健康良性发展的可选之路 一是大力推进公共数据开放共享 坚持政府数据以开放为原则 不开放为例外, 坚持政府数据开放先行 公共数据开放跟进, 推进落实公共数据开放共享, 为数据交易产业提供不竭资源源泉, 活跃 繁荣数据交易产业, 做大作强数据交易产业量体 二是夯实大数据交易基本功能 鼓励数据交易机构积极探索实践, 推动大数据供需有效对接, 搭建大数据讨价议价撮合机制, 探索大数据交易交割模式, 增强大数据流通变现能力, 引导大数据资源以多种 价值形态参与社会生产生活活动 三是构建适用于大数据交易的云端集散中心 鼓励数据交易机构积极申办云存储中心 对象存储空间 可寻址存储空间 云数据多点共享协同中心 集聚式自助管理系统 中央存储平台等云交易系统, 通过云平台实现数据集中, 形成自主可控且能增值利用的大数据集散中心 逐步面向社会公众开放数据接口, 引导第三方数据开发者和社会力量对数据进行社会化开发 汇聚和整合, 推动大数据按照等价支付 有序流动的原则在云架构中进行自由流动, 带动整个数据价值链的规模化发展 四是与数据源保持同步更新数据 数据交易机构应当与数据源签署明确的数据更新协议, 按照数据源数据升级时间表的频度, 与数据源按日 按周 按月 按半年或按年同步升级数据 由于用户本人往往是最原始 最可靠的数据源, 为了激发基于用户身份信息 (PII) 的用户端应用和服务的创新浪潮, 用户应当被赋予明确的权利 以便其能够以可行 机器可读的方式接入用户个人数 据, 使得用户能够表达其政策诉求 使用偏好和缔约要求, 推动用户和数据源签约公司共同参与大数据的治理和精用 五是推动大数据交易和大数据应用连体融通发展 数据交易机构应当瞄准重要行业的重大应用需求, 利用前沿性的大数据分析挖掘技术, 实施大数据资源价值的深度分析和关联开发, 探索富具市场特色 满足市场特需的数据创新应用模式, 形成适用于重点行业大数据挖掘技术 分析流程 领域模型等关键应用和产品 六是打造全国性的大数据交易产业链 数据交易机构应当以推动数据资源开放 流通 应用为宗旨, 广泛聚集大数据提供方 数据开发者 大数据交互平台 大数据使用方及数据投资者 推广应用个性化医疗 数字金融 智能交通 精准营销等基于大数据的新型商业模式, 在基础设施 数据资源 数据应用等关键环节形成产业合力, 打造全国性的大数据流通 开发 应用产业链 来源 : 搜狐财经 business.sohu.com/ / n shtml 67

74 大数据金融信息剪辑 从美国数据经纪产业窥探我国大数据交易的良性发展之路 马志刚博士 ( 中国信息通信研究院政策与经济研究所副总工 ) 当前, 随着大数据技术和应用的不断发展, 大数据对社会生产生活的价值不断凸现, 社会各界各领域产生了大数据交换交易的客观需求和现实实践 近年来, 各国加紧推进大数据的有价化, 探索对大数据进行计价 赋值 交易的可能性 参照美国数据经纪产业发展模式, 以数据开放共享推动大数据交易资源建设, 以交易和产品双足运行推动大数据交易时新发展, 可能是我国未来大数据交易产业健康良性发展的可选之路 一 美国数据交易的典型模式美国数据资产交易主要有三种模式 第一种是数据平台 C2B 分销模式 用户将自己的个人数据贡献给数据平台, 数据平台向用户给付一定数额 的商品 货币 服务等价物或者优惠 打折 积分等对价利益 例如 2011 年, 美国 Car and Driver 网站通过其网站面向用户提供一款服务, 用户只要提供汽车注册车主的汽车型号 车辆年限等信息, 即可获得网站提供的各种现金优惠 ; 2013 年, 美国发布一款 消费者数据库 的新产品, 用户通过这款产品可以向其他公司分享自己的部分隐私数据来换取相应的折扣或者是其他好处, 比如让航空公司看到你的收入情况可以获得一定数量的会员积分或者下一次航班升舱的补偿 ; 美国 personal.com 公司是一个初创公司, 旨在打造一个将应用软件和结构化用户数据连接起来的交易平台, 它允许用户拥有 控制 获取其个人数据并从其个人数据中获益, 即向用户提供一个在线 数据宫 (data vault), 被划分为称作 精品 (gems) 的许多小隔间, 本人可以将其个人数据存储在其中并与他人实现共享, 用户可以将其 精品 (gems) 与亲朋好友进行共享, 并将 精品 (gems) 的接入权卖给商业机构, 从而实现个人数据的货币化, personal.com 公司从交易额中抽取 10% 作为自己的收益 第二种是数据平台 B2B 集中销售模式 数据平台以中间代理人身份为数据提供方和数据购买方提供数据交易撮合服务, 数据提供方 数据购买方都是经交易平台审核认证 自愿从事数据买卖的实体公司 ; 数据提供方往往选择一种交易平台支持的交易方式对数据自行定价出售, 并按特定交易方式设 68

75 大数据金融资讯 定数据售卖期限及使用和转让条件 美国微软 Azure Datamarket Factual Infochimps 等数据中间平台代理数据提供方 数据购买方进行的数据买卖活动, 大多属于此类模式 我国数据堂 中关村大数据交易产业联盟 贵阳大数据交易所 中国互联网优质受众营销联盟 (UMA) 大数据平台 (DMP) 等数据中间交易体, 大多基本也属于此类模式, 例如 DMP 只面向 UMA 联盟成员开放, 倡导 空平台模式 下的数据握手交易, 各个平台间免费互换数据, DMP 只提供标签和数据处理模型, 由企业自主决定哪些数据可以标记和共享 第三种是数据平台 B2B2C 分销集销混合模式 数据平台以数据经纪商 (data broker) 身份, 收集用户个人数据并将其转让 共享与他人, 主要以安客诚 (Acxiom) Corelogic Datalogix ebureau ID Analytics Intelius PeekYou Rapleaf Recorded Future 等数据经纪商为代表 二 美国数据经纪商产业发展现状在美国数据交易的三种 主要模式中, 第三种数据平台 B2B2C 分销集销混合模式发展迅速, 目前已经形成相当市场规模, 塑造了在美国数据产业中占据重要地位的数据经纪产业 ( 一 ) 美国九大数据经纪商 Acxiom 为市场营销和欺诈侦探提供用户数据和分析服务, 数据库中包括了全球范围内 7 亿用户的个人数据, 其中包括涉及几乎每个美国用户的 3000 条数据段 Corelogic 向商业和政府机构提供包括财产信息 消费信息和金融信息在内的用户数据及其分析服务, 其数据库中包含 7.95 亿条资产交易历史数据 9300 万条抵押贷款申请信息以及涵盖 99% 以上美国住宅物业的 1.47 亿条特定资产信息 Datalogix 向商业机构提供涵盖几乎每个美国家庭 涉及金额超过 1 万亿美元以上的用户交易信息 2012 年 9 月,Facebook 宣布与 Datalogix 建立合作伙伴关系, 以便评测其 10 亿用户在社交网站上浏览某一产品广告的频次与其在某一实体零售店完成购买交易之间的关 联关系 ebureau 向营销商 金融公司 在线零售商以及其他商业主体提供预测评级和数据分析服务, 最早只是分析某人是否可能成为潜在的优质客户或者某笔交易是否存在商业欺诈, 后来发展为向其客户提供数以亿计的用户消费记录, 而且每月还以 300 万条新增消费记录的速度在急速增长 ID Analytics 主要提供以身份认证 交易欺诈检测和认证为目的的数据分析服务, 其认证网络中包括了数以百亿计的数据集成点 (aggregated data points) 11 亿条独特的身份数据元素, 涵盖了 14 亿条用户交易信息 Intelius 向商业机构和客户提供背景调查和公开记录信息, 其数据库中包含了 200 亿条以上的公开记录信息 (public record information) PeekYou 拥有能够分析 60 家社交媒体网站 新闻来源 网站主页 博客平台内容的专利技术, 向客户提供详细的用户配置文件 (consumer profiles) Rapleaf 是一家数 69

76 大数据金融信息剪辑 据集成商, 拥有一个以上能够连接超过 80% 以上美国用户电子邮件地址的数据点以及 30 个其他类型的数据点, 并且不断在其电子邮件地址列表中增补电子邮件用户年龄 性别 婚姻状况等信息 Recorded Future 通过互联网捕捉用户和企业的各类历史数据, 利用该类历史数据分析用户和企业的未来行为轨迹, 截至 2014 年 5 月, 已经实现对 502,591 家不同开放互联网站点各类信息的接入和抓取功能 ( 二 ) 美国数据经纪商的数据采集美国数据经纪商不是直接从用户处收集数据, 而是主要通过政府来源 商业来源和其他公开可用来源等三个途径收集数据 由于一个数据经纪商只能提供一个用户行为轨迹所需的很少数据元素, 因此数据经纪商必须将其所掌握的数据汇集起来, 描绘出用户生活更加复杂的多维图景 联邦政府数据源 上述 9 家数据经纪商中的 6 家直接从联邦政府渠道获得其所需要的数据 地方政府数据源 有些数据经纪商并非直接从地方政府获取其所需要的数据, 而是通过其他数据经纪商获取其所需要的地方政府数据, 后者往往通过雇佣人员对地方政府官员展开公关, 以便获取对地方政府数据进行编纂和整理的机会 ; 或者与地方政府具有业务往来关系, 地方政府同意其在业务往来中自动收集 获取地方政府数据 上述 9 家数据经纪商已经认可 25 家其他数据经纪商为能够从地方政府合法获取地方政府数据的数据经纪商 但是几乎所有的地方政府立法均规定, 使用这些地方政府数据需要取得数据本人同意和授权 公共数据源 ( 包括社交 博客 互联网等 ) 一半以上数据经纪商表示他们收集通信录 电话本 新闻报道等其他可用公共数据 有些数据经纪商从 Bebo LinkedIn 等社交媒体网站直接抓取信息, 这些社交媒体网站的用户尚未设定隐私设置以限制其个人信息访问, 所以社交媒体网站便授权数据经纪商接入并获取这些用户个人信息 商业数据源 除 1 家数据经纪商外, 其余 9 家数据 经纪商都通过广泛的商业渠道来购买其所需要的用户个人数据 例如, 数据经纪商从零售商 产品目录公司等渠道购买详细的商品交易信息, 部分数据经纪商还从期刊发行商那里购买详细的用户订阅类型 3 家数据经纪商从用户注册网站处获取用户名单列表, 用户注册并登录这些网站的目的往往是为了获取其所需要的零售 新闻或旅游等特定服务 有些数据经纪商从金融服务公司处获取其所需要的集合交易数据 (aggregated transaction data), 其中既有敏感数据也有非敏感数据 有些数据经纪商声称从其商业合作伙伴或金融服务公司客户处直接获取数据, 以便为该特定客户定制 增强某种特定产品或服务, 或者在其他产品或服务中以集合 去身份化方式使用这些数据 其他诸如社交媒体信息来源于与非客户企业之间签订的具体合同安排 至少有 1 个以上数据经纪商从网络广告中获取用户的浏览器行为信息 互为数据源 数据经纪商的绝大多数商业数据源实际上来自上述 9 家数据经纪商之外的其他数据经纪 70

77 大数据金融资讯 商, 例如, 收集电话公司新开固定帐户用户信息的数据经纪商, 收集汽车经销商销售 保修 售后服务 修理等信息的数据经纪商, 针对 2600 多家商家近 19 亿个人用户的消费历史进行数据汇聚和建模的数据经纪商, 收集体育比赛 市场调查 保单登记等活动中用户以有线无线等方式提交申报信息的数据经纪商等, 一家专门收集此类信息的数据经纪商拥有近 24 条用户申报信息, 并将其分为 1000 多种兴趣类型 部分数据经纪商共享同一数据源, 每一家数据经纪商都能从不同数据源收集到相同或相近的数据, 例如, 有一家数据经纪商从 20 多个数据源获取其用户联系数据 9 家数据经纪商中有 7 家相互买卖其所需要的数据, 因此, 用户几乎不可能知道谁是特定数据元素的最早创建人, 必须经过一系列中间数据经纪商才能追溯到数据流动轨迹并最终追寻到原始数据源 ( 三 ) 美国数据经纪商的产品类型数据经纪商通常提供市场营销产品 风险控制产品和人员搜索产品等三类数据应用产品 2012 年 9 家主要 数据经纪商的三类主要数据产品全年总收入大约为 4.26 亿美元 1. 市场营销产品有 5 家数据经纪商面向其客户销售自己的市场营销产品,2012 年全年营业总收入大约为 1.96 亿美元 美国联邦贸易委员会 (FTC) 将数据经纪商的数据营销产品分为下列几类 : 第一类是直销产品, 包括邮件 电话营销 电子邮件营销等三类 ; 第二类是在线营销产品, 包括通过互联网向用户进行营销 ( 互联网营销 ) 通过移动设备向用户营销 ( 移动营销 ) 以及通过有线电视和卫星电视向用户营销 ( 有线电视卫星电视营销 ) 等三类 ; 第三类是营销分析 所有这三类产品都能使数据经纪商的客户面向其客户量身定制各类市场营销信息 1) 直销产品以所收集到的数据为基础, 美国联邦贸易委员会 (FTC) 将直销产品分为数据追加 (data append) 产品和营销清单 (marketing lists) 产品两类 数据追加 ( d a t a append) 产品数据追加 ( d a t a append) 产品能使企业更多地了解用户和市场 客户会要求数据经纪商雇员提供姓名 地址等用户信息, 雇员接着会选出用户电话号码 购买习惯等额外信息, 这些额外信息是数据经纪商追加在客户数据集中以供其用于直接电邮 电话营销以及电子邮件营销活动的附加信息 有些数据产品能够帮助客户填补其用户联系信息中的空白, 例如, 客户提出用户的姓名和地址, 数据经纪商填补对应的用户座机电话号码和电子邮件地址, 换言之, 客户提出用户的座机电话号码 移动电话号码和电子邮件地址, 数据经纪商填补对应的用户姓名和地址 在有些数据追加产品中, 客户提供用户的姓名和店铺的邮政编码, 数据经纪商填补对应的用户地址 有些数据追加产品能够帮助客户更好地理解其用户, 当客户提供用户的身份识别信息时, 数据经纪商马上能对客户数据集进行数据追加, 许多数据经纪商能向客户提供包括年龄 信仰 技术偏好 性别 种族等许多信息在内的原生和派生数据元素 营销清单产品 71

78 大数据金融信息剪辑 市场营销清单能够识别具有特定相同特征的用户 ( 例如与 2 个以上孩子共同生活的所有人群,2 个以上拥有专车品牌的妇女, 对糖尿病感兴趣的所有人群, 成员中有吸烟嗜好的家庭等 ) 客户从用户受众中识别出身份属性和身份特征, 数据经纪商提供拥有这些身份属性和身份特征的用户清单, 例如, 客户要求提供一份 被银行拒绝提供服务 或者 具有财务挑战 用户的清单, 以便向其推送次级贷款广告或者提供其他服务 营销清单产品可限于用户姓名或地址, 以便向其发起直接邮件活动 ; 可限于用户姓名和电话号码, 以便向其发起电话营销活动 ; 可限于用户电子邮件地址, 以便向其发起电子邮件营销活动 客户希望得到强健的数据以便适时调整其市场营销活动, 数据经纪商需要根据数据追加产品描述, 在数据营销清单产品中增加一些其他数据元素或者数据字段, 例如客户要求提供一份特定地区对美食烹饪感兴趣的用户清单, 以便向其发起直接邮寄活动, 除用户姓名和地址之外, 数据经纪商需要在数据 营销清单中叠加用户年龄或年龄段 家庭收入等相关信息 2) 线上营销产品有 3 家数据经纪商直接或间接通过互联网 移动设备 有线电视或卫星电视向用户营销特定商品 美国联邦贸易委员会 (FTC) 将数据经纪商的线上营销产品分为注册用户瞄准 (registrationtargeting) 合作伙伴瞄准 (collaborative targeting) 和线上线下追踪 (onboarding) 产品三种类型 注册用户瞄准 (registrationtargeting) 产品数据经纪商能够更有效 更贴近用户体验地帮助注册网站向用户推广产品 例如 XYZ 旅游网站希望向用户推送特定旅游产品, 它可以向数据经纪商提出一份它自己的注册用户列表, 数据经纪商向 XYZ 旅游网站逐一提供所有注册用户的旅行兴趣, 在这些信息的帮助下, XYZ 旅游网站根据 Jane Doe 对热带岛屿的特殊爱好为其量身定制了一份夏威夷的旅游套餐, 当 JaneDoe 登录网站时便将这份套餐推送给 她 当 XYZ 旅游网站不想为个人注册用户提供旅游套餐产品, 而是希望在其网站上销售第三方广告空间时, 它可以先向数据经纪商提供一份其注册用户列表, 数据经纪商告诉 XYZ 旅游网站其大多数用户喜欢摩托车和家用清洁用品, 依据这些信息, XYZ 旅游网站便可面向摩托车经销商 家用清洁用品生产制造商兜售其网站广告空间 合作伙伴瞄准 (collaborativetargeting) 产品在注册用户瞄准 (registrationtargeting) 服务中, 数据经纪商既向注册网站提供数据服务 也向注册网站的广告商提供数据服务, 注册网站向数据经纪商提供一份用户列表, 注册网站的广告商也向数据经纪商提供一份其自己客户的列表清单, 数据经纪商发现双方均未实际接入对方客户 潜在客户以及注册用户的个人信息, 只有数据经纪商同时拥有双方所有客户或用户的所有个人信息, 于是它可以替广告商提供数据分析服务, 以便广告商决定是否继续在该注册网站上投放广 72

79 大数据金融资讯 告 3) 线上线下追踪 (onboarding) 产品在线上线下追踪 (onboarding) 产品中, 数据经纪商在 cookies 文件中植入登录用户的离线数据, 以便广告商在互联网上能够垂直地搜寻到所有目标用户, 广告商可以根据客户的离线行为数据来决定是否通过互联网向其在线推送广告信息 线上线下追踪 (onboarding) 的需求方可以向数据经纪商提供其客户的相关数据, 以便数据经纪商能够在互联网上发现这些客户并向其推送广告商定义好的广告内容 ; 也可以委托数据经纪商识别共同拥有特定属性或特征的消费者受众, 在互联网上发现并定位这类消费者受众人群, 并向其推送广告商定义好的广告内容 线上线下追踪 (onboarding) 产品往往采取字段定义 线索匹配和在线目标锁定三个步骤 字段定义 (segmentation) 线上线下追踪 (onboarding) 开始于客户向数据经纪商发出搜寻具有特定特征属性用户的要求, 数据经纪商基于预期客户的要求可能创建过股票数据字段 海关数据字段等等, 这一过程被称为字段定义 例如, 数据经纪商可以基于其定义好的数据字段, 通过锁定服装零售商已有用户 为服装零售商发掘新的用户等多种方式, 帮助服装零售商向其用户在线推送奢侈时装品牌的广告 线索匹配 (matching) 线索匹配是指数据经纪商通过数据字段的在线处理来搜寻 发现其已识别的用户的过程 为了发现在线用户, 数据经纪商往往与注册网站订立合同购买注册用户列表, 然后将这些注册用户列表与通过数据字段处理程序识别 发现的用户进行比对, 以便在两者中发现能够匹配的重合线索, 一旦发现匹配线索, 数据经纪商便会将与该用户有关的所有数据元素和数据字段追加在该用户的数据库列表之中 在线目标锁定 ( t a r g e t i n g consumersonline) 锁定已经匹配好的在线用户是线上线下追踪 (onboarding) 活动的最后 一道程序 当注册网站通知数据经纪商其先前识别的用户现已在线并且正在浏览本站, 数据经纪商立刻在已识别用户的浏览器中植入一个 cookies, cookies 包含了数据经纪商追加在用户身份属性上的所有相关信息, 尽管接受调查的数据经纪商异口否认其 cookies 中含有姓名 电子邮件地址 邮政地址等传统意义上的用户身份信息 当数据经纪商将其 cookies 植入用户浏览器以后, 只要该 cookies 留存在用户浏览器中不被删除, 数据经纪商就可以通过互联网向该用户推送广告 数据经纪商类似于通过在各种不同网站购买广告空间组成了一个自管理广告网络系统, 这些广告网络系统在每个网站都拥有安全的广告空间, 从而可以任意向这些广告空间投送其所定义的广告内容 例如数据经纪商在 Jane Doe 的浏览器中植入含有 女性 邮政编码为 老练的顾客 等字段的 cookies, 代理时装零售商或者其他线上线下客户在其合作伙伴网络中向 Jane Doe 推送广告 线上线下追踪 73

80 大数据金融信息剪辑 (onboarding) 产品客户还可以使用该产品从事用户重定向 (retargeting) 跨渠道销售 (Cross- Channel Campaigns) 等活动 所谓用户重定向 (retargeting), 是指线上线下追踪 (onboarding) 产品客户利用其用户和厂家名单通过互联网向其发出特定广告要约, 例如, 借贷银行希望重定向 (retargeting) 其财务困境客户并向其发出新的次级信用卡申办要约, 宾馆希望重定向 (retargeting) 其高端优质会员客户并向其发出度假旅游的广告邀请等 所谓跨渠道销售 (Cross-Channel Campaigns), 是指零售商希望锁定多个渠道的相同用户, 例如, 宠物商店希望通过直接邮寄 电子邮件 互联网广告等方式向宠物主人兜售犬用香波, 通过线上线下追踪 (onboarding) 产品, 它发现了其曾经发送过直邮或电邮广告的宠物主人, 于是锁定他们并同时向其推送互联网广告 需要指出, 尽管数据经纪商利用用户离线活动信息向其推送在线广告, 但是他们并未计划使用用户浏览器在线活动信 息来识别 追踪其离线活动, 但是有报告指出部分数据经纪商确实利用用户浏览器在线活动信息线下向其推广直销产品 4) 市场分析产品有 5 家数据经纪商从事以市场营销为目的的市场分析活动, 以便预测用户行为 市场分析产品能够帮助数据经纪商客户在广告推广 产品改进 社区竞选等活动中更加精准地瞄准并锁定目标用户, 并且深度洞察和窥探用户态度和偏好 例如, 数据经纪商深度分析其客户的用户的相关数据, 建议其客户通过互联网 报纸 电视等媒体渠道面向目标用户或者面向特定地域推送特定产品或品牌的广告信息 作为市场分析的重要组成部分, 数据经纪商还帮助其客户分析 计算各种营销策略的预期结果, 以使其客户能够更好地向其用户推送产品广告信息, 例如, 数据经纪商可以向其客户预测完全通过 twitter 进行广告推送是否能够达到预期的广告效果 有些数据经纪商向其客户提供广告活动影响结果的评估服务, 这些数据分析产品往往包含一个奠基于成 千上万个数据元素之上的算法模型, 包括其客户提供的历史数据 数据经纪商从政府部门收集到的数据 商业来源数据以及其他公共可用数据, 都是该算法模型的参数数据 例如, 电信运营商在线推广其新款移动设备之后, 可能想知道有多少用户浏览过这个广告 有多少用户去过实体店以及有多少用户实际购买过这一新款移动设备等详细数据 部分数据经纪商将其分析数据转化成市场营销评级产品, 根据对市场营销活动的不同响应或不同潜在响应将其客户的用户分为不同的级别, 客户可以根据市场评级来识别 瞄准用户, 或者针对低响应率用户发送直邮广告 ; 客户也可以根据市场评级来识别低收邮率 (high undeliverable mail rate) 的地址或者低购买率的用户 这些市场评级产品还可被用以定义用户愿意接收广告要约的类型 广告要约的数量以及面向特定用户提供的服务质量水平 其他评级产品还能够用以测定用户在互联网上的在线离线状态 用户对其他非用户群体的影响等 这些评级产品通常是 74

81 大数据金融资讯 通过分析计算用户博客活动 参与 Facebook 和 twitter 等社交媒体网站的活动情况 用户拥有的好友跟随者读者数量 用户在互联网上创建的信息内容数量以及用户的新闻知名度, 客户使用这些社会影响评级结果能够准确地向特定用户推送其产品的广告信息, 并且希望其用户能够向自己的好友 跟随者宣传 推广这些产品 2. 风险控制产品接受调查的 10 家数据经纪商中有 4 家面向市场销售其自己开发的风险控制产品, 2012 年的年收入总额为 1.77 亿美元 美国联邦贸易委员会 (FTC) 将风险控制产品分为身份认证产品 (identity verification) 和欺诈侦测 (fraud detection) 产品两类 身份认证产品 (identity verification) 身份认证产品能够帮助客户确认其用户的身份 基于多种原因和需求, 客户非常愿意使用数据经纪商提供的身份认证产品, 例如, 银行使用这种身份认证产品以便能够满足 爱国者法案 (the USA PATRIOT Act) 中 了解你的客户 身份验 证要求或者在用户启动一笔金融交易时为其进行在线欺诈侦测 数据经纪商采取各种不同格式面向客户推广其身份认证产品 首先, 数据经纪商向其客户提供一份评级表格, 上面标明了交易关联风险水平的数值评分级别, 同时附有该数值评分级别的详细说明 针对高风险评分客户, 评级说明会指出该用户提供的社会保障号码 (SSN) 与某个死者有关, 用户正在使用的住所与某个欺诈案件有关或者该住所是一所监狱的住所, 该社会保障号码 (SSN) 在某个较短时限内被连续不断地频繁使用, 或者该社会保障号码 (SSN) 隶属于用户提供住所之外的另外一个住所等 其次, 数据经纪商向其客户提供一份调查问卷产品, 作为独立产品或者提供身份真实性验证的附加产品, 上面标明用户容易回答但不会出现在身份盗取者窃取信息中的一些典型问题, 例如隐藏在用户钱包里的信息 这些信息通常会包括 哪些是你曾经使用过的邮件地址? 或者 你妈妈的生日是哪一天?, 当其被与某个评级产品关联使用时, 如果用户 的风险评级水平较高, 数据经纪商的客户会要求其用户正确回答 6 个问题中的 5 个 ; 如果用户的风险评级水平较低, 数据经纪商的客户只要求其用户正确回答 6 个问题中的 3 个 再者, 数据经纪商提供一份 匹配 / 不匹配 表格, 用于验证用户提供的信息是否与数据经纪商的数据库信息相匹配, 数据经纪商有时会提供一个 接近匹配 选项, 例如, 发现一个电话号码中的两个数字似乎已被调换了 有些数据经纪商还提供一种名为 身份状态验证 (status verification) 的产品, 既能提供用户身份识别又能揭露用户身份现状 身份状态验证产品 (status verification) 能够揭示用户是否是一名现役军人 向其提供特定抵押品止赎权 (foreclosure) 的担保保护, 或者标明用户是否被列为政府采购合同的禁用名单 数据经纪商还提供就业状况的认证产品, 例如 X 用户为 Y 雇主工作 欺诈侦测产品 ( fraud detection ) 有些数据经纪商还面向客户销售欺诈侦测产品 75

82 大数据金融信息剪辑 (frauddetection), 帮助客户识别并减少商业欺诈, 例如, 有的数据经纪商提供一种标明用户电子邮件是否存续较长时间或者是否具有关联交易历史的产品, 有的数据经纪商专门追踪用户的住址信息, 帮助公司和企业侦测与尝试欺诈有关的方式和模式, 例如指出交货地址与清单列表用户无关等 欺诈侦测产品 (fraud detection) 还能帮助企业或组织确证用户提交信息的可靠性 真实性, 例如, 某项公共福利是根据用户收入水平制定的, 在用户填写了其收入状况以后, 数据经纪商从广泛的人口统计数据便能够推断并确证这些信息的可靠性和真实性, 或者在征求用户同意以后, 根据用户国税服务 (Internal Revenue Service) 纳税退税申报表来确证用户收入申报信息是否可靠和真实 数据经纪商的欺诈侦测产品 (fraud detection) 还能建立分析模型, 帮助发生过数据泄露的公司或组织来检测被泄露个人数据是否存在滥用的可能, 如果被泄露数据包含了用户的社会保障号码 (SSN), 公司组织可以向 数据经纪商提供一份所有社会保障号码 (SSN) 的列表清单, 委托数据经纪商监测列表中某个特定社会保障号码 (SSN) 是否突然与多个不同地址发生了关联, 从而监测并锁定某个潜在的欺诈事件 3. 人员搜寻产品上述 9 家数据经纪商中有 3 家面向市场销售其自己开发的人员搜寻产品 (people search products),2012 年的年收入总额为 0.52 亿美元 人员搜寻产品 (people search products) 往往包含了从政府部门或社交媒体网站等其他公共可用数据源所获得的用户相关信息, 这些信息通常独一无二, 供潜在的个人用户使用, 但也可同时被公司等组织使用 用户通常使用人员搜寻产品 (people search products) 来追踪公司高管或竞争对手的行为信息 搜寻老朋友 研究用户潜在的爱好兴趣或其邻居情况 在线检索或定位用户的法庭记录等 人员搜寻产品 (people search products) 主要提供用户个人数据, 这类产品能使用户基于最少的数据元素便能发现最多的用户相关信息, 包 括姓名 住所 城市 所在州 固定电话号码 移动电话号码 电子邮件地址 用户姓名 社会保障号码 (SSN) 等, 具体而言, 包括了别名 婚姻记录 年龄和出生日期 电子邮件地址 新闻故事 犯罪记录 电话号码 离婚记录 性别 民事记录 ( 包括破产 扣押 留置 法院裁判等 ) 兴趣和偏好 住所历史 财产所有权和销售历史 ( 包括举债活动 ) 教育信息 死亡记录 社交媒体信息 ( 包括用户名 页面 URL 朋友关系等) 亲戚亲属 邻居 ( 包括性侵犯者 ) 就业历史等详细信息 有些数据经纪商提供免费的人员搜索服务, 但也有数据经纪商提供付费的人员搜索服务 数据经纪商通常会提醒用户不要将上述个人数据用于 公平信用报告法案 (FCRA) 规定以外的其他目的, 包括就业资格认定 信用评级 保险费评定 房屋买卖以及其他类似或相同目的 ( 四 ) 美国数据经纪商 ( Data brokers ) 的产业特征 数据经纪商通过多 76

83 大数据金融资讯 种信源广泛收集用户个人信息, 绝大多数情况下用户对此并不知情 数据经纪商往往通过商业 政府及其它公共途径收集用户个人数据, 收集的数据种类包括破产信息 选民登记信息 用户消费信息 网络浏览器运行信息 担保品登记信息 用户日常互动的细节信息等等 数据经纪产业由多层互为提供数据的数据经纪商所组成 数据经纪商不仅为终端用户提供数据, 同时也互相互为提供数据 绝大多数数据经纪商的数据来源于其他数据经纪商, 而不是某一固定原始信源 数据经纪商收集 存储着海量数据元素, 几乎覆盖了每个美国用户 数据经纪商的数据收集范围几乎涵盖了每个美国家庭和每笔商业交易, 例如一家数据经纪商的数据库中储存了 1.4 万亿条用户交易信息 7000 亿条集成数据元素 ; 一家数据经纪商的数据库中存储了 1 万亿美元的用户交易信息 ; 另一家数据经纪商逐月添加 30 亿条新的数据记录 ; 还有一家数据经纪商拥有几乎每个美国用户的 3000 条数据段 数据经纪商联结并 分析用户数据, 以便做出包括潜在敏感推理在内的用户推理 数据经纪商从用户数据中推理用户兴趣, 根据用户兴趣结合其他信息对用户进行分类, 有些分类如 狗主人 冬季运动爱好者 邮件按序应答者 等是无害的, 有些分类自一开始便聚焦于伦理和收入问题, 如 城市抢夺人 移动式搅拌器 等便聚焦于低收入的拉丁美洲人和非裔美国人, 因此属于 潜在敏感分类 数据经纪商将线上线下数据与市场用户的在线数据相结合 数据经纪商依托网站注册功能和浏览器 cookies 抓取跟踪功能来发现用户在线行为轨迹, 推理用户离线行为特征并向其推送在线互联网广告 ( 五 ) 美国数据经纪 (Data brokers) 产业的利弊分析 用户能从数据经纪商收集 使用数据的众多目的中真正获益 数据经纪产品能够预防欺诈 增加产品销量 向用户推送量身定制的广告 与此同时, 许多数据的收集和使用行为对用 户造成一定程度的风险 如果用户因数据经纪商的错误而不能完成一项风险控制产品的交易, 用户往往因不知情而使自己受损 ; 有些营销产品的分级定级程序对用户并不透明, 使得用户对其较低评级无所适从并减轻其负面影响, 使得自己永远处于次级信用评级从而无法获得部分公司提供的部分高端服务 数据经纪商一定程度上会向用户提供其个人数据的选择权, 但是这些选择权绝大多数情况下是不完整 不可兑现的 用户通常情况下不知在哪里去行使其选择权 ; 数据经纪商提供的 选择退出机制 往往并未明确指出用户是否可以对其所有个人数据均可选择退出, 从而导致 选择退出机制 在具体实施过程中非常混乱 ; 许多市场营销产品为用户提供的选择权往往含糊不清, 许多风险控制产品甚至并未向用户提供其个人数据的接入功能以及错误数据的修改删除功能 储存用户数据永远都具有不可预知的安全风险 虽然存储数据对于实现未来商业目的是有益的, 但 77

84 大数据金融信息剪辑 是数据存储的安全风险可能要远远大于其商业利益 三 我国大数据交易存在的问题和建议 2014 年 1 月, 我国北京中关村成立了第一家大数据交易平台, 随即成立了由 70 多家大数据企业参加的中关村大数据交易产业联盟 时至今日, 上海 贵阳 武汉等地陆续尝试性建设运营了多个大数据交易平台 总结各地大数据交易平台的发展现状, 我国大数据交易实践存在的问题, 一是数据缺乏开放共享影响交易数据的量体规模 各地各行各业普遍缺乏开放共享数据的主动性 积极性, 部分行业开放数据助力大数据交易流通的服务意识不足, 不能满足大数据交易产业对数据源的实际需求, 长期看必然影响数据交易产业的量体和规模 二是交易数据脱离信息网络基础设施静止不转 数据必须依附于云平台 内容分发网络 (SDN) 等信息网络基础设施进行流动, 才能展现出其应有的资产价值 ; 离开信息网络基础设施, 数据容易板结化 固态化 静态化和僵尸化, 其资产价值会与时衰减甚至消失 这就要 求数据交易机构应当以自建或租用等方式, 发展自营的数据库 云计算 边缘存储和分发设施, 至少在局域范围内拥有数据和基础设施的联合体, 以信息网络基础设施作为自营数据资源着床发育的母体, 以自营数据资源作为信息网络基础设施滋生繁衍的新生体, 只有两者联合互动, 才能使数据价值枝繁叶茂, 否则, 如果数据资源脱离了信息网络基础设施, 就容易变成静止不转的板结数据 固态数据 静态数据和僵尸数据, 不仅将使交易数据的价值难以得到正常发挥, 而且长期看可能不利于数据交易产业的良性发展 三是交易数据脱离数据信任源进行离心偏转 数据资产不同于传统资产的一个显著特征, 就是新的数据不断产生能够补充并代替旧的数据, 经济学上称之为永久可再生性和永久可流动性 只要可信的数据信任源不断运行并开展正常社会生产生活活动, 那么新的数据就会源源不断被生产出来, 并以 活水资源 形式被补充到原有的数据流之中去, 从而形成一幅生生不息的数据长河 数据一旦脱离其原生 可信数据源, 就变成无本之木 无源之流, 不但导致数据逐渐失去其真实性 可靠性, 而且也会导致数据资源价值日渐枯竭, 致使数据交易涸泽而不能渔, 无法进行可持续的良性发展 四是交易数据脱离应用和产品而无效空转 数据资产不同于其他传统资产的特征之一, 就是它不具有排他性, 可以无限复制并呈辐射状蔓延开去 根据产权交易理论, 没有排他性的资产标的可以形成无节制的 免费搭车, 外部性效益增加的同时其边际效益不断递减, 而资产所有人的边际成本不仅并未出现同步递减相反却出现额外递增, 从而造成交易成本奇高无比, 导致交易价格渐趋为零并最终丧失可交易性 正由于此, 美国数据经纪商在进行数据互为交易 流转的同时, 着力于利用自身的数据优势, 开发数据营销产品 风险控制产品 人员搜寻产品等各类适销对路的数据应用和数据产品, 资源 应用 产品三位一体 三足鼎立 三箭齐发, 从而取得市场制胜的可靠法宝 数据如果脱离应用和产品, 就会陷入 免费搭车 的外部性 78

85 大数据金融资讯 陷阱, 数据无限空转的同时, 数据交易机构的合法权益也得不到有效的保障, 最终将限制甚至窒息数据交易产业的良性发展 参照美国数据经纪产业发展模式, 以数据开放共享推动大数据交易资源建设, 以交易和产品双足运行推动大数据交易时新发展, 可能是我国未来大数据交易产业健康良性发展的可选之路 一是大力推进公共数据开放共享 坚持政府数据以开放为原则 不开放为例外, 坚持政府数据开放先行 公共数据开放跟进, 推进落实公共数据开放共享, 为数据交易产业提供不竭资源源泉, 活跃 繁荣数据交易产业, 做大作强数据交易产业量体 二是夯实大数据交易基本功能 鼓励数据交易机构积极探索实践, 推动大数据供需有效对接, 搭建大数据讨价议价撮合机制, 探索大数据交易交割模式, 增强大数据流通变现能力, 引导大数据资源以多种价值形态参与社会生产生活活动 三是构建适用于大数据交易的云端集散中心 鼓励数据交易 机构积极申办云存储中心 对象存储空间 可寻址存储空间 云数据多点共享协同中心 集聚式自助管理系统 中央存储平台等云交易系统, 通过云平台实现数据集中, 形成自主可控且能增值利用的大数据集散中心 逐步面向社会公众开放数据接口, 引导第三方数据开发者和社会力量对数据进行社会化开发 汇聚和整合, 推动大数据按照等价支付 有序流动的原则在云架构中进行自由流动, 带动整个数据价值链的规模化发展 四是与数据源保持同步更新数据 数据交易机构应当与数据源签署明确的数据更新协议, 按照数据源数据升级时间表的频度, 与数据源按日 按周 按月 按半年或按年同步升级数据 由于用户本人往往是最原始 最可靠的数据源, 为了激发基于用户身份信息 (PII) 的用户端应用和服务的创新浪潮, 用户应当被赋予明确的权利, 以便其能够以可行 机器可读的方式接入用户个人数据, 使得用户能够表达其政策诉求 使用偏好和缔 约要求, 推动用户和数据源签约公司共同参与大数据的治理和精用 五是推动大数据交易和大数据应用连体融通发展 数据交易机构应当瞄准重要行业的重大应用需求, 利用前沿性的大数据分析挖掘技术, 实施大数据资源价值的深度分析和关联开发, 探索富具市场特色 满足市场特需的数据创新应用模式, 形成适用于重点行业大数据挖掘技术 分析流程 领域模型等关键应用和产品 六是打造全国性的大数据交易产业链 数据交易机构应当以推动数据资源开放 流通 应用为宗旨, 广泛聚集大数据提供方 数据开发者 大数据交互平台 大数据使用方及数据投资者, 推广应用个性化医疗 数字金融 智能交通 精准营销等基于大数据的新型商业模式, 在基础设施 数据资源 数据应用等关键环节形成产业合力, 打造全国性的大数据流通 开发 应用产业链 来源 : qq.com 79

86 大数据金融信息剪辑 金融大数据的机会 张灿 张灿, 视野金融联合创始人 COO 12 年金融 IT 从业经验, 证券 基金从业资格 拥有大型 中型 创业公司工作经验, 历任销售 咨询 管理等岗位, 具有丰富的企业管理和实战经验 在金融大数据 新三板数据研究 XBRL 信贷财务分析 风险评级 支付 IT 营销管理领域有很深的研究, 并拥有丰富的实践经验和深厚的人脉资源, 曾主导过多家大型银行 证券公司 第三方支付机构信息系统及互联网项目的建设 上周六 (2016 年 12 月 3 日 ) 第 19 期智能金融沙龙, 文因互联非常荣幸地邀请到金融大数据的大咖 北京视野金融的 COO 张灿, 和大家聊聊金融大数据 人工智能金融和新三板数据的分析与整合 本文为张灿在文因互联智能金融沙龙现场分享的实录 : 一 金融大数据行业的发展真正的金融信息化, 应该是在 1998 年之后才真正开始的 为什么说 1998 年之后? 因为当时我们在某银行做系统时就发现早些年的数据根本找不到 而到了 2010 年, 金融机构的数据质量才慢慢好起来 1. 金融信息化二十年, 金融数据在做什么? 数据大集中数据大集中是一个过程, 之前整个银行体系都在分行, 包括证券公司也是如此 这些金融机构并没有集中的数据中心概念, 所以他们先做了数据大集中 数据仓库数据仓库是在数据大集中的基础上, 提升 改善了数据 的质量 报表在上面两步的基础上, 做了两个报表 : 一个是监管报表, 另一个是内部管理报表 决策支持决策支持是基于报表而形成的系统 但是, 最后形成的决策支持系统扮演的角色并不是全局性的 比如, 针对风险部门的是风险数据仓库, 针对业务部的是客户数据仓库, 所以在金融信息化过程中, 以上四个方面还是部分处于分离的状态 2. 最近几年, 金融数据在做什么? 数据效率和即席分析最近几年, 大家又开始认为数据收集过多 对国内的金融机构来讲更是这样 实际上从数据的角度来讲, 用户量实在太大了 现在我有几个同事 80

87 大数据金融资讯 在用 Hadoop 给银行做解决方案, 大家发现数据效率已经成了非常大的瓶颈, 因为其中有些计算实在太复杂 原来从数据库导到数据仓库里, 可以延时来算这个数据, 但现在发现这样不可行了 最典型的一个案例就是 反欺诈 P2P 现在已经有团伙性作案诈骗, 这就导致选择模型很难, 然而又不能像银行放贷一样速度很慢 所以我觉得, 提升数据效率和即席分析这两个结合起来, 诞生了非常多的机会 数据整合无论做什么样的分析, 数据质量是最重要的 如果数据质量差, 很多事情都做不了 公开数据现在越来越开放, 比如说工商数据 征信数据 所以我觉得很多公开数据的运用, 确实为数据分析提供了非常好的基础 智能金融的尝试为什么用尝试二字, 因为我还是持一个比较保守的观点 就智能金融而言, 现在的数据挖掘技术与人工智能技术还是不够的, 但是我相信科技的不断发展肯定会解决这个问题 我一直坚信一个观点就是 : 以后绝对不会存在物理上云的概念 再过十年或者二十 年所有的东西都是云, 这就是趋势, 是你没有办法改变的 我觉得智能金融或者大数据是一个趋势, 是一个没有办法去改变 没有余地可讨论的趋势 3. 银行 贷款机构的大数据应用热点信用评级 + 这部分对金融机构来说是不可或缺的, 无论是何种形式的评级都发展得很快 押品管理这是大家没有解决好的一点 比如车贷评级还是一个弱项 实时放贷银行在这方面的应用上其实要负一大部分责任 因为我们的金融体系还不健全, 导致小额贷款难度较大 实时预警提到实时放款就会涉及到实时预警 做到实时预警, 需要将现有数据系统变成一个可计算的系统 整个的存储架构包括业务逻辑与数据计算的架构, 都需要做出改变 实时预警并不仅仅是计算模型这么简单, 贷前 贷中与贷后的实时预警都是必须的 如果大家有兴趣做, 这会是一块很大的市场 另外还有两个大数据的应 用热点是 营销和客户分析 和 金融机构的工厂化 4. 投资机构的大数据应用热点投资机构的大数据应用是这两年我们一直在做的事情 第一张图是 百度股市通, 我觉得挺有意思的是股票雷达, 用搜索的情绪来看其对 A 股的影响 因为 A 股确实是散户市场, 情绪的影响确实很明显 使用以后你会发现, 搜索热度和上证指数在一年和两年的时期内基本是一致的 对于现在比较热门的量化, 我们也在和公募基金 私募基金合作进行研究 但是需要明白的是, 量化还有很长的路要走 再往下讲就是风控 投资机构合规性做的很好 但是对市场的预警与企业的预警, 银行比证券公司做得好, 比如在证券市场崩盘前很多银行已经在撤资了 二 企业分析评价探讨 1. 企业评级的演变企业风险评级有一个演变的过程 : 打分卡 评级 风险预警关于影响企业评级的因素, 有以下几个维度 : 财务因素只考虑财务指标, 数据全部来源于财务报表, 并可由系 81

88 大数据金融信息剪辑 统自动计算指标值, 标识指标值的表现好坏, 按照一定规则计算出财务评分, 得到财务子模型评级级别 非财务因互素涉及一般情况下可获取的客户相关信息, 例如财务管理水平, 经营管理水平, 外部征信情况, 银企关系等 行业地区因素主要业务范围所处地区的信用分析 所在行业的前景展望和行业信用分析 财务预警主要考虑对客户评级级别影响较大的财务指标, 其值可以由系统自动从财务报表中计算得到 比较指标值与预警的阀值, 显示是否有预警 非财务预警考虑出现概率比较小, 影响程度比较大的预警事件 外部影响要考虑与企业相关的宏观信息, 例如政府支持 政策导向 重大经济事件等 2. 行业分析的拓展大家做企业评级 分析 参照的核心其实是两点 : 行业和规模 实际上, 我觉得行业分类无论是采用统计局还是证监会的分类标准, 其实差别都不大 况且, 在分析中小企业时, 这些标准的适用性并不 强 关于行业分析的扩展, 视野金融也正在进行尝试 首先, 我们做的是宏观数据和行业数据的配比 宏观数据的可读性较差, 可以说只是一个库而已 但对单列的某个行业来讲, 比如铁路运输量和煤炭行业, 白酒的销售和 A 股白酒行业的业绩表现, 这些指标和行业趋势还是比较吻合的 将统计局的数据与行业数据相结合, 还是可以看到大趋势的 其次, 是关联关系的分析 A 股的两千多家公司中有很多关联公司, 如果再加上新三板的挂牌企业, 相当于将一万多家企业进行关联 将这两部分关联关系的优点是 : 披露信息更全 因为通过工商数据的关联关系, 只能查到一些股权关系, 信息不够全面 最后, 是大家都在尝试的产业链分析 这其中涉及前五大供应商 前五大供货商的分析等 三 新三板数据挖掘探讨大家在新三板上想做的事情, 我觉得都很类似 无非是企业画像 投资机构画像 投资模型 并购模型 引入第三方数据等 我们现在其实也能感觉出来, 通过数据发现企业 价值和对投资机构分析的需求是非常核心的 目前, 我认为新三板还处于一个 不透明 的起步阶段, 大家想知道很多问题 比如投资机构想知道其他类似投资机构的投资收益 新三板公司也希望知道同行业里有哪些投资机构在投, 有哪些动作, 如果融资的话, 以一个怎样的价格谈比较合适 在引入第三方数据时, 我们发现三板四板 A 股 美股港股 国家统计局 国资委 工商 证监协会的数据量比 A 股大的多 A 股是两千多家公司, 加上四板和新三板企业, 差不多有五万多家企业 所以, 对这部分数据的挖掘任务还是非常重的 四 聊聊企业融资在做新三板市场时, 我们发现大家都在考虑股权融资 但是适当借债或者是用并购的思路去融资也是不错的选择 现在, 很多新三板企业融资难, 解决这个问题的核心就是要读懂金融机构的思维 简单来说, 银行思考的是企业的偿债能力, 而投资机构思考的是能不能退出 因为银行的钱基本来自于存在, 所以银行要保证资金的安全性, 其次是能否兑付 投资机构则需要保证资金的按时的收益率 82

89 大数据金融资讯 最后一点, 我认为企业要对照投资机构的思维挖掘自身优势, 包括投资机构看重的行业的一些优势, 比如这家投资机构投过产业链里哪些企业等 除此之外, 企业还需要对金融机构有一个判断, 了解投资机构的偏好 创始人和合伙人的背景, 这样你会发现融资的脉络就会变得很清晰了 嘉宾提问环节 : 1. 关于建设企业数据库, 很多金融机构都有这方面的需求, 但是为什么现在还没有出现? 答 : 我简单说一下我的观点, 第一个就是银行和证券行业看起来都是金融行业, 但其实处于信息不对称的割裂状 态 去年, 某银行在做一个项目时需要一些企业数据, 而那家供应商的解决方式是在新浪网上搜 我认为, 这样的信息是割裂的 另一方面, 这件事情虽然有价值, 但前期投入太高, 所以收益并不太高, 比如说国内的知名金融数据终端在新三板上面吃力但不讨好 但是我们想过一个方式, 比如大智慧在安徽建立了一个基地 把这个标准定好的话, 可以请一些稍微便宜的人力来解决这个问题 机器虽然可以解决一大部分事情, 但是很多事后还是需要依靠人力 2. 能不能具体分享一下, 在特定行业中的数据服务? 答 : 目前, 针对特定行 业数据服务的需求还是挺多的, 这是一个典型的金融机构需求 因为金融机构其实是不懂行业的, 也不可能去培养那么多特定行业的人去研究某个行业 所以我觉得金融机构获取行业信息的途径可以分三部分 : 第一部分就是研究报告, 比如券商或者独立研究机构的研究报告 ; 第二部分则是聘请咨询公司做调研 ; 第三部分就是请一些行业专家做一个访谈 像大型金融机构会在每年校招的时候倾向去招相关专业的人才 来源 : qq.com 83

90 大数据金融信息剪辑 大数据是未来互联网金融的核心 人工智能和区块链这两个技术, 在未来会使数字货币在金融市场当中的使用权重大大增强 同时可以彻底改造人和金融机构之间的关系 所以在大数据意义上, 未来的金融机构的核心能力不是存量的改造, 而完全是增量的变化 大数据是未来互联网金融的核心今天中国互联网金融行业可以说面临着一种低谷, 这是发生巨大变革过程当中的一个必然, 就像 2000 年互联网泡沫破灭的时候一样, 那个时候人人觉得末日要来临了, 规范要重建 但是在接下来发生的事情, 未来几年在金融行业发生的事情, 变革的脚步一点都不会停下来, 它一定会在新的方向上进行发展 在任何一个产业发生这些革命性变革的时候, 所有既得利益者很少能在新的业态当中成为领导者, 我们没有看到过一家马车公司转 型成为一家成功的汽车企业 在手机领域我们没有看到一家模拟机领域时代的领导者在智能机时代还是领导者 甚至在互联网领域, 我们没有看到一家 PC 领域的领导品牌可以在今天移动互联网领域依然还可以保留地位 这个行业正在变革 发展 裂变的过程当中 余额宝是 2013 年出来的, 支付宝是 2003 年出来的 我们把 2003 年看成是中国金融部门开始给互联网公司拉开一条门缝, 到 2013 年的时候, 实际上门缝已经很大了, 潮水涌进来了 在这个过程当中, 互联网几乎对所有行业都有冲击, 首先冲击了信息行业, 然后是制造业, 接着是服务业, 到 2013 年, 冲击到了所有行业最底部的结构性部门 金融行业 这个时候中央政府又开始推动 互联网 +, 互联网 + 的推出和余额宝的出现其实有很强的意识形态变化 接着, 制 度建设跟在变革发生之后 在短短的这些年里, 出现了很多崩溃式的数据 我们看到 2016 年 7 月底 P2P 平台当中一般的企业不见了 我见过很多互联网 P2P 的人, 很多都是 80 后, 很多甚至是律师出身, 或者是大型互联网公司的人二次创业, 那为什么还出现这么多骗子, 那么一定和土壤有关 所谓互联网金融所有的基础概念已经不再讨论了 代价惨重的启蒙期已经过了 讨论那些基础概念已经不再有意义 无论是支付环节也好, 负债也好 网点也好, 都被今天的互联网一层层地给改变了 渠道创新不再是核心动力今天我们再讨论互联网对银行或者是金融机构的渠道变革, 这个环境已经消失了 中国原有的金融机构认为还是通过大流量方式获取大规模用户, 建立自己一个平台, 用这个平台抗衡现在的互联网金融 84

91 大数据金融资讯 平台机构的话, 这个思想已经是非常落后了 随着技术的变革和中产阶级的出现, 人们对金融的概念 货币和人的关系发生了变化 另外一些新的技术产生, 也使得人和金融之间的关系发生了不可逆的变革 随后我们把互联网金融看成是一个渠道的变革 过去我们把网点去掉, 变成 APP, 将所有业务都放到手机端完成, 这也不再是一个未来发展的战场了 今天互联网发生的最大的变革是两个东西 第一个东西就是大数据, 大数据彻底改变了人和货币之间的关系, 以及经营体系在中国区市场重建的速度和效率, 大大的改变了 从技术上就改变了人和货币上的关系 另一方面区块链等这样的技术, 未来会产生有 记忆 的钱 互联网会变成一种基因 其三是有效监管会成为必要的动作 其四是互联网成为金融的新基因 互联网金融正在发生的重大变化国务院去年 3 月份在杭州市开启了非常重要的试点叫跨境电子商务综合试验区, 之后又开放了 12 个城市, 到现在是 12+1, 这个试验改革到今 天已经有一年半时间 大概进行到第一年的时候就发生了一种情况 因为这一次的跨境电商改革是中国外贸转型的非常重要的一步 地方政府把海关报关 检验检疫 税务 审计等等的工作通过单一窗口方式搬到网上 再配套一些第三方的互联网公司, 比如说阿里巴巴 亚马逊 慧聪, 这些公司协助中国外贸公司在单一窗口上, 在这个平台上进行外贸进出口贸易 这大大提高了中国外贸透明度 到今年年初的时候, 很多人都看到了机遇 上个月的时候阿里和杭州市政府选择了 300 家杭州市重点外贸企业, 每家给 50 万美金的金保, 非常类似于 2003 年的支付宝 你通过单一窗口平台和国外公司做贸易, 他要采购你的商品的话, 他可以先把钱打到第三方窗口, 然后你拿钱去采购, 采购之后再把东西给到他 这是上个月刚刚开始的 如果说这条路被走通的话, 就可以看到中国外贸未来发展和中国互联网金融产业会出现一个非常大的交融 我们在京东做调研的时候看到一个景象, 未来企业或者说个人, 和金融之间的关系将是交易过程当中的一个环节 在京东上所有做贸易的公司你可以向京东做短期贷款, 所有贷款都不需要担保, 因为他有你在京东上的交易数据, 你的信用在你的交易过程当中产生 在阿里和京东的平台上, 我们可以看到未来金融发生的一个重要的特征, 就是它不再是一个交易本身, 他的时间会成为利润衡量的维度之一, 这已经超出了银行可以给到企业贷款的基本模式 这是我们在外贸领域看到的一个基本情况 随着中国内贸市场慢慢繁荣, 这一部分的变革也会进入到中国的内贸市场 第一大亮点, 大数据会成为互联网金融的核心 人工智能和区块链这两个技术, 在未来会使数字货币在金融市场当中的使用权重大大增强 同时可以彻底改造人和金融机构之间的关系 所以在大数据意义上, 未来的金融机构的核心能力不是存量的改造, 而完全是增量的变化 在这种情况下, 你现的核心能力, 无论是网点能力 客户能力还是你的产品能力, 在大数据和人工智能的范畴当中, 所有的资产都可能会失去意义 第二个亮点是互联网成为金融社群化试验的工具 经过 85

92 大数据金融信息剪辑 这几年的发展, 陆金所人均年交易量是 中国的中产阶级开始出现, 越来越多的金融衍生品需要向中国的中产阶级贩售, 所有这些东西是无法完全通过互联网在线实现的 一般来说, 大家好像说这又回到了传统银行私人银行业务, 私人银行点对点的模型又开始发挥作用了 但是其实, 我们并没那么看 浙江省工商银行在浙江省就有超过 3000 个私人银行的理财人员, 一个省就要 3000 人, 去服务大概 100 万客户, 所以这还是一个非常传统的 人力成本非常高的交易模式 我们最近陆金所这些机构在研究说, 如果说通过大数据方式, 通过人脸识别方式, 可以把高净值, 愿意接受新的金融产品的人抓取出来, 那很可能现在银行所保有的这一块, 现在来看还是一个非常具有竞 争能力的私人银行业务, 他们自己也是通过社群化的方式, 重新打通用户的关系点 今天互联网金融的发展在三个层面上有障碍 第一个是部门大数据的 篱笆墙 每个人都说未来的趋势是互联网金融, 未来是大数据时代, 但是我们去做调研的话, 你会发现在中国数据领域, 比如说 BAT 的数据是封闭的, 政府各个部门之间很多数据都是封闭的 我觉得现在数据通过洗白的方式公开给大家, 这个真的是应该快点进行的 未来的互联网金融也好, 很多互联网服务也好, 如果说它是建立在大数据基础上的话, 首先一个前提是数据之间的 篱笆墙 必须要拆掉 我觉得在这个意义上来讲, 可能是一件非常大的 跨部门协调的事情 至少在一些公用事业行业首先把这些数据开放给我 们 这样的话, 所谓的互联网金融, 所谓的大数据时代才可以真正到来 第二, 民营金融机构面前的 玻璃门 我们希望在这一次整顿当中, 政府可以继续鼓励民营机构创新, 可以把我们面前很多的 玻璃墙 旋转门 该拆的拆, 可以让市场化的力量得到一个巨大推动 第三, 监管部门职能创新 现在我们讲互联网金融 P2P 股权众筹等等, 在一行三会的职能都是分散的 这些条块分割的景象, 对于互联网这样集聚裂变和跨界的特点来说, 已经非常不适用了 监管部门的机构改革已经提上了议事日程, 只有这样我们的互联网金融才可以迎来下一轮大的高潮 来源 : qq.com/ 86

93 大数据金融资讯 大数据遇上金融科技, 开启金融风控新时代 12 月 7 日, 第一届中欧大数据金融论坛在深圳开幕, 中国国际人才交流基金会苏光明主任发来贺信, 深圳市科技创新委李志远副主任 教育部软件学院联盟理事长芦苇教授 龙华区政府筹备组成员陈建民出席论坛并致辞 深圳软件园管理中心徐绍禹主任主持开幕式 来自深圳金融大数据相关行业协会与企业代表 人才组织 科研院所 创投机构代表以及媒体记者共 300 余人参会 本届论坛以 大数据遇上金融科技, 开启金融风控新时代 为主题, 英国牛津大学副校长 Anne Elizabeth Trefethen 教授 德国柏林 洪堡大学 Wolfgang Hardle 教授 德国柏林洪堡大学陳怡璇副教授 英国剑桥大学 David Stillwel 博士 英国南安普顿大学马铁军博士 深圳市前海金融控股有限公司阮华伟博士 北京大学汇丰商学院卢骏博士 深圳市华傲数据技术有限公司于文渊博士 胡吉友先生等专家学者围绕大数据与金融科技等等热点发表主题演讲, 从各自的视角, 把脉深圳市金融科技未来发展之路 中国国际人才交流基金会主任苏光明为论坛发来贺信, 苏光明在贺信中提到, 2015 年国务院印发 促进大数据发展行动纲要, 纲要 指出促进国际交流合 作, 坚持平等合作 互利共赢的原则, 建立完善国际合作机制, 积极推进大数据技术交流与合作, 充分利用国际创新资源, 促进大数据相关技术发展 举办中欧大数据金融论坛, 这是促进国内外金融与大数据企业 科研机构友好交流的一件盛事, 交流与探讨, 碰撞与合作, 必将为推动大数据与金融科技的融合发展作出贡献 据了解, 本届论坛由深圳市科技创新委 中国国际人才交流基金会 教育部示范校软件学院联盟指导, 深圳软件园管理中心 深圳市龙华新区经济服务局 英国南安普顿大学 国家软件人才国际培训 ( 深圳 ) 基地 87

94 大数据金融信息剪辑 共同主办, 深圳市华傲数据技术有限公司 深圳市宝能科技园 深圳软件园龙华分园 北京大学汇丰商学院联合承办 并得到了龙华新区高层次人才发展促进会 深圳市高层次人才联谊会 深圳市欧美同学会 深圳市金融人才协会 深圳市互联网金融协会 深圳市大数据研究与应用协会等单位的大力支持 论坛期间, 还将举办国内外高层次人才座谈会, 赴有关金融与大数据企业考察交流, 促成具体合作项目的落地开展 近日, 深圳市政府印发了 深圳市促进大数据发展行动计划 (2016~2018 年 ), 明确到 2018 年底, 深圳市将建成完善的大数据 基础设施, 形成较完善的具有核心自主知识产权的大数据产业链, 成为国内领先的大数据创新应用示范市和大数据产业发展高地 深圳市将实施促进大数据发展的重大工程, 推动大数据与移动互联网 云计算 金融科技的深度融合, 加强跨领域 跨行业的数据融合和协同创新, 积极探索创新协作的应用模式和商业模式, 培育大数据新兴业态 特别是我市互联网 金融等重点领域的大数据融合与应用创新 随着经济全球化发展的日益加快, 特别是新兴的互联网金融风险日趋复杂化和多样化, 使人们更加意识到金融风险管理的必要性和紧迫性 金融业一直是深圳的 支柱产业和标志性产业, 深圳金融业的发展史与这座城市的崛起史密切同步 浑然一体 当下, 大数据正在对我国金融行业产生着广泛而深刻的变革 深圳一直是改革开放的 试验田 和 排头兵, 为全国的经济体制改革提供了珍贵的实践经验 深圳金融业态的转型升级需要与大数据 金融科技等新兴技术相结合, 面向产品创新 商业模式创新 服务创新 管理创新等方面的数据价值挖掘, 将创造出巨大的商业价值 经济价值和社会价值 来源 : qq.com/ 88

95 大数据金融资讯 实务 大数据技术在金融检察工作中的运用 摘要 : 由于金融发展与现代信息技术的深度融合, 运用大数据技术作为支撑, 提升办案能力, 是金融检察工作因应犯罪信息化 智能化新情况的必然举措 当前, 金融检察工作面临数据源缺乏 大数据运用水平低 数据分析人才匮乏 传统审查思维僵化等问题, 应进一步打通数据调取通道, 推动设立数据共享平台, 理顺技术协作机制, 解决大数据运用的基础问题 同时, 应培养专门的法律大数据分析人才, 提升检察技术和信息化队伍的专业素质 一 运用大数据技术办理金融犯罪案件的方法一般而言, 大数据技术手段比较丰富 用途多样 因此, 在金融犯罪的办理和预防中, 应根据案件类型 案件所处阶段 应用目的和掌握数据情况的不同, 使用不同的大数据分析方法 1 洗钱案件办理中的大数据运用 在互联网时代, 洗钱犯罪呈现交易量大 单笔交易金额少 地理位置分散的新特点, 对传统的反洗钱预防 办理手段构成了挑战 如何将大数据技术运用于反洗钱工作, 是应当认真思考与研究的课题 目前我国金融业主要使用基于第一代反洗钱技术的智能信息系统, 虚警率和有效性均不尽如人意 就国外的使用经验而言, 第二代反洗钱技术经过分层, 进行全方位的鉴别与分析, 能够带来效率和效果的明显改善 对此, 金融检察部门可以采用检察建议的方式督促有关部门 机构研发和部署 2 庞氏骗局案件办理中的大数据运用 在我国, 庞氏骗局以传统的民间金融互助模式为掩护, 进行金融投资诈骗 而在互联网时代, 它又假 借互联网金融的名号进行诈骗 以互联网金融为伪装形式的新型庞氏骗局犯罪, 其涉案金额较过去也有了数量级的提高 事实上, 通过大数据分析, 对新型庞氏骗局犯罪进行预警是完全可能实现的 可采用大数据聚合方法进行风险预警, 互联网金融企业的注册信息 招聘信息 网站访问量 营销广告等特征数据经大数据平台聚合, 形成对企业的 数据画像 为定量地评估该互联网金融平台的安全性, 可将各种特征数据进一步抽象为合规性 特征词命中 传播力 收益率和投诉率五个特征指数, 将上述五项指数加权 整合后, 所测算出的数字即是企业 冒烟指数, 代表其所涉非法集资的风险 同时, 要尽可能保障被害人合法权益, 就需要运用大数据技术分析各种财务数据, 通过关联分析追踪资金流向, 最大限度发现和追 89

96 大数据金融信息剪辑 回赃款 此外, 大数据的数据聚合技术在追踪对象的行为轨迹方面有较大优势, 对于畏罪潜逃的金融犯罪嫌疑人, 通过聚合其银行 通讯 交通 住宿 监控录像等相关数据, 能够描绘出其活动轨迹 行为时间线, 推测其潜逃方向和藏匿地点, 辅助公安机关实施抓捕 3 老鼠仓 案件办理中的大数据运用 利用未公开信息进行交易, 就是俗称的 老鼠仓 实践中, 沪深两大证券交易所启用了针对利用未公开信息交易的监测分析系统, 使用大数据技术监控识别 老鼠仓 行为, 使得监管水平实现了质的变化和量的飞跃 运用大数据技术监测 老鼠仓, 主要是基于沪深两大证券交易所每天的海量数据 : 首先, 通过对网络信息和交易数据的分析, 挖掘出可疑账户 ; 其次, 通过分析交易 IP 开户人身份 社会关系等进一步确认 ; 最后, 进入调查阶段 交易所针对老鼠仓等交易行为还建立了专项核查和定期报告制度 当然, 利用监测系统识别 老鼠仓 行为还存在不尽如人意之处, 如存在监测手段过度依赖时间窗筛选, 其他维度数据聚合水平不高, 造 成虚警率高, 对人工核查依赖较大等问题 又如, 系统架构上还有潜力可挖 : 沪深证券交易所和中金所的数据互不相通, 信息互不掌握, 降低了大数据 捕鼠 的威力 二 金融检察工作中运用大数据技术面临的问题 1 数据隔离问题 数据共享是运用大数据技术的基础和前提 然而, 现实中数据隔离无处不在 大量数据以数据孤岛的状态被分割在各部门内部而无法被关联与聚合 涉及金融领域的数据隔离表现在以下几个方面 : 一是金融机构的数据隔离 上交所和深交所 2013 年已启动了基于大数据技术的市场监测系统, 然而两大交易所之间至今依然未进行数据交流和通整 分立的数据使得对 老鼠仓 等非法行为的大数据监测未能达到足够理想的效果, 存在较高的虚警率和人工分析依赖性 除了不同金融机构之间的数据隔离之外, 同一机构的不同分支机构之间也存在数据隔离现象, 这对跨地域乃至跨境案件的数据调取和分析带来了困难 二是金融机构和监管部门 司法部门之间的数据隔离 各金融机构在和监管部 门 司法部门的数据联结上, 依然是 自我监测 发现异状 向监管部门报案 监管部门向有关方面调取涉案数据用于分析 向司法部门移交案件 司法部门向有关方面调取涉案数据用于核查 的原始方式, 各机构的大数据无法汇集到监管部门和司法部门, 导致其调取涉案数据的手续庞杂 费时费力 同时, 司法部门向金融 ( 监管 ) 机构提出数据调取要求, 金融机构往往只提供机打纸质明细清单, 这对于洗钱 金融投资诈骗等交易量大 涉案账号多的金融犯罪案件的办理增加了难度 三是内设机构之间的数据隔离 金融监管机构和司法部门的内设机构间也存在着数据隔离现象 对检察机关而言, 需要理顺内设机构之间的工作机制, 清晰保密界限, 畅通数据共享和线索传达途径, 并实现业务部门和检察技术部门之间的协作 2 运用水平问题 尽管近年来国内大数据技术发展很快, 但还存在数据聚合度低 运用水平不高等问题 就金融犯罪的办理而言, 技术水平还停留在以单维度数据分析及展示为主要技术手段的第一代大数据应用范畴, 关联分析和 90

97 大数据金融资讯 多维度数据聚合等第二代大数据技术的运用较少, 相应的数据共享模式也未能建立 大数据应用平台多为各部门各自建设, 除数据隔离的问题外, 还有硬件投入较大导致的零星建设和更新缓慢等问题 3 数据分析人才匮乏 大数据既然是一种技术, 意味着需要专业知识来掌控, 因此, 法律研究 审查应用和立法领域都需要具有丰富经验的法律大数据分析人才提供协助 此外, 随之兴起的数据挖掘 机器学习 人工智能 3D 打印 数据清洗等相关技术, 可能会改变数据世界里的很多计算方法和基础理论, 而这也将使得金融检察的对象和工作模式由传统的 1.0 时代向 2.0 时代跨越, 并进一步驱动检察工作的变革 4 传统审查思维僵化 大数据技术的运用不亚于一场革命, 在这项新技术出现以后, 是一整套知识 价值 社会组织的重组 传统案件的审查思维是较多依赖于供述与陈述的线性的 逻辑的和孤立的审查思维, 但是大数据技术提供了相互连接的, 非平面 立体化 无中心 无边缘的网状结构, 必然呼唤新的思维习惯与分析架构 大数据技术在金 融检察工作中的应用即象征了这种变迁 法律人的思维也必将随之发生革命性的转变, 即不再探求难以捉摸的法律因果关系, 转而关注社会复杂事物之间的相联关系 三 金融检察工作中运用大数据的路径选择 ( 一 ) 解决大数据运用的基础问题由于当前数据调取通道不畅通 数据共享水平低, 金融检察工作的开展缺乏必要的数据基础 在金融检察工作中运用大数据技术, 需要做好以下基础建设工作 1 打通数据调取通道, 解决涉案数据信源问题 涉案数据的调取是基础中的基础, 然而由于一些涉案机构的工作机制和历史遗留问题, 金融检察实务中往往只能调取到近期 当地 纸质的涉案数据 这成为金融检察案件办理中运用大数据技术的第一道障碍 因此, 应考虑由最高人民检察院会同有关机构乃至行业监管部门建立全局性的 长期的数据调取工作机制, 从根本上解决数据信源问题 2 推动设立数据共享平台, 提升大数据分析预警能力 我国目前在反洗钱 反 老鼠仓 等金融犯罪案件中 已启用大数据分析预警系统, 但各机构的数据互不相通, 明显降低了大数据分析的预警效能 同时, 在金融犯罪案件查办过程中, 往往需要进行多头 反复地数据调取, 浪费人力物力而且容易耽误时机 检察机关应推动行业监管部门建立跨机构 跨门类的大数据共享平台, 用于金融犯罪分析预警, 提升防范能力 3 理顺技术协作机制, 提供案件办理的技术支持 金融检察工作中运用大数据技术, 离不开检察技术部门的保障和支持 当前, 检察业务部门和技术部门之间尚未建立起稳定的协作机制 金融检察部门可率先建立和检察技术部门的协作机制, 从制度层面上解决案件介入和保密问题, 并根据需求督促检察技术部门强化相应的技术能力, 积极在金融检察工作中多用 用好技术协作, 身体力行实践 科技强检 4 整合建立金融情报机构 建立金融情报机构是世界各地有效打击金融犯罪的大趋势 金融情报机构是发放及接收可疑交易的情报中心, 通过信息共享及情报交换, 有效整合各部门的信息资源, 以加强打击金融犯罪体系的严密性 91

98 大数据金融信息剪辑 当前国内金融监管机构部门林立, 但缺乏统一的整合, 难免存在重复监管和监管盲区, 更为关键的是, 容易造成相互之间的信息数据壁垒, 显然不符合当前打击金融犯罪的需求, 也不符合大数据技术在金融监管和打击金融犯罪中的运用趋势 因此, 亟须建立一个统一的机构来解决当前困局 从长远看, 建立永久性 具有权威性的金融情报机构当属最佳选择 可充分利用现代科学技术, 对数据进行系统汇总 整理及加工, 有效处理信息数据 ( 二 ) 大数据技术在金融检察工作中的运用在大数据技术运用基础得以保障的前提下, 金融检察部门能够利用大数据技术进行分析案情 引导侦查 核实证据 诉讼监督 理论研究 犯罪预防等工作 1 追索资金流向 就金融犯罪案件而言, 资金流向可谓整个案件的核心事实 运用大数据技术, 可对银行账目和其他交易账目明细进行大数据分析, 以有效掌握线上金融活动中的资金流向 如若有适当 的涉案人员线下行为数据用于数据聚合, 甚至可能在一定程度上掌握线下资金流向, 从而为侦查工作迅速打开缺口, 提高办案效率, 提高打击犯罪的精准度, 也为追赃工作打下良好基础 2 涉案人员追逃 涉案自然人卷款潜逃是金融犯罪案件中的常见情形, 尽管可以发布通缉令 上网追逃, 但追逃工作在线索不足的情况下往往持续时间较长 通过将涉案人员的相关数据, 如电信通联数据 金融账户数据 网络账户数据 公共服务利用数据等进行充分的聚合与分析, 就有可能了解其潜逃前行为 掌握其潜逃地线索, 为追逃工作提供线索 指引方向, 从而大幅缩短追逃周期 提高追逃成功率和追逃效率 3 证据核实 证据真实性的审查判断是刑事案件办理中的一大难题, 问题证据乃至虚假证据如果和证据链吻合良好, 往往具有欺骗性和误导性 由于大数据的巨量性和非人为生产的特点, 要通过人为捏造数据改变大数据分析的结果相当困难 因此, 大数据技 术可用于对部分证据进行核实 原则上, 当大数据分析的结论和既有证据冲突时, 应当深入核实冲突证据的真实性 4 理论研究 大数据技术可以通过分析某一类历史数据来总结该类事件发生的规律性 通过对金融犯罪案件的历史数据进行分析聚合, 金融检察部门可以总结出一些金融犯罪案件的发生模式和相关的制度漏洞或工作机制缺陷, 为实证研究提供更好的路径 同时, 这些大数据分析成果也可用于指引金融犯罪案件的办理, 实现理论研究成果的转化 5 犯罪预防 基于金融犯罪案件涉案资金大 涉及人数多 牵涉地域广以及追赃难等特点, 金融犯罪的预防工作具有特别意义 金融检察部门可运用大数据技术, 将对历史案件的分析成果通过检察建议等方式传达给相关监管部门和涉案机构, 建议其进行摸排整改, 有助于从根源上杜绝同类案件的发生 ( 高扬捷福建省泉州市人民检察院检察长 ) 来源 : 人民检察微信公众号 92

99 大数据金融资讯 大数据在金融 : 数据的价值 移动互联网 大数据 金融三个热点词汇叠加在一起, 将会爆发出多么大的想象力 大数据时代不是突然出现的, 实际上过去的几十年间, 数学家就已经涉猎金融行业了, 如诺贝尔经济学奖获得者哈里. 马克维茨 威廉. 夏普, 罗伯特, 恩格尔都是数据家 他们通过数学模型对金融市场进行分析, 利用计量经济学知识和金融市场数据来建立数学模型, 预测金融市场产品收益同风险波动的关系 数据分析和数据挖掘一直就存在于过去的商业活动中 大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果 确切的说是移动互联网时代产生了海量的数据, 大数据技术完美的解决了海量数据的收集 存储 计算的问题, 因此大数据时代开启企业利用数据价值的另一个时代 大数据对金融行业价值可 以从以下几个方面进行讨论 : 01 精准营销大数据可以提供某些企业交易特点和资金需求特点, 可以帮助业务部门对企业的资金需求进行分析和筛选, 提供现金管理产品, 帮助企业解决流动性问题 大数据可以帮助信用卡中心追踪热点信息, 针对特定人群提供精准营销产品, 增加新卡用户, 例如热映电影 娱乐活动 餐饮团购等 02 社交化营销人们的社交行为产生了巨大的数据, 利用社交平台, 结合大数据分析, 金融行业可以开展成本较低的社交化营销, 借助于开放的互联网平台, 依据大量的客户需求数据, 进行产品和渠道推广 通过互联网社交平台返回的海量数据, 评测营销方案的阶段成果, 实时调整营销方案, 利用口碑传销和病毒式传播来帮助金融行业快速进行产品宣传 品牌宣 传 渠道宣传等 03 信用风险评估建立基于大数据的信用风险评估模型和方法, 将会提高中小企业和个人的资金申请支持 个人信用评分标准的建立, 将会在即将到来的信用消费时代取得领先 基于大数据的动态的信用风险管理机制, 将会帮助金融机构提前预测高风险信用违约时间, 及时介入, 降低违约概率, 同时预防信用欺诈 04 欺诈风险管理大数据提供了多纬度的监控指标和联动方式, 可以弥补和完善目前反欺诈监控方式的不足 特别在识别客户行为趋势方面, 大数据具有较大的优势 此外, 金融机构还可以依据大数据分析, 为客户提供定制服务, 预知企业客户未来资金需求, 提高客户体验 05 需求分析和产品创新大数据提供了整体数据, 93

100 大数据金融信息剪辑 金融企业可以利用整体样本数据, 从中进行筛选 可以从客户职业, 年龄, 收入, 居住地, 习惯爱好, 资产, 信用等各个方面对客户进行分类, 依据其他的数据输入纬度来确定客户的需求来定制产品 06 运营效率提升大数据可以展现不同产品线的实际收入和成本, 帮助企业进行产品管理 同时大数据为管理层提供全方面报表, 揭示内部运营管理效率, 有力于内部效率提升 大数据可以帮助市场部门有效监测营销方案和市场推广情况, 提高营销精准度, 降低营销费用 大数据可以展现风险视图控制信用风险, 同时加快信用审批 07 决策支持大数据可以帮助金融企业, 为即将实施的决策提供数据支撑, 同时也可以依据大数据分析归纳出规律, 进一步演绎出新的决策 基于大数据和人工智能技术的决策树模型将会有效帮助金融行业分析信用风险, 为业务决策提供有力支持 金融行业新产品或新服务推向市场前, 可以在局部地区进行试验, 大数据技术可以对采集的数据进行分析, 通过统计分析报告为新产品的市场推广提供决策支持 进入大数据时代, 金融行业的客户信息 交易信息 资产信息 信用信息等数据经过有效采集和整理分析, 将会 成为具有价值的数据信息 内部数据结合外部数据将形成具有重要价值的数据资产, 可以有效帮助金融企业进行精准营销, 降低运营费用, 提高欺诈管理水平, 提高信用风险管理水评, 为决策提供有效支持, 同时帮助金融企业了解客户需求, 开发出符合客户需要, 具有创新精神的新产品 简单的讲, 大数据将帮助金融行业提高运转效率, 降低支出成本, 提高风险管理水平, 并基于客户需求进行更好的产品创新 来源 : com/archives/

101 大数据金融资讯 王玉祥 : 大数据金融时代的众筹解放 近年来, 贵州和贵阳通过发展大数据产业战略 弯道取直, 实现了跨越式创新发展, 受到了党中央和国务院的肯定, 获得了社会各界的高度认可, 也获得了国际社会的高度关注 贵阳市连续多年实现 GDP 两位数增长, 其 GDP 增速多年位居全国省会城市之首 李克強总理今年 5 月, 出席在贵阳举办的中国大数据博产业峰会暨中国电子商务创新峰会开幕式时, 高度肯定了贵州的发展模式, 他说 : 贵州是美丽是欠发达省份, 但是贵州在发展大数据 云计算 物联网上, 把 无 生了 有 而大数据是二十一世纪的钻石矿, 在大数据为代表的新一代互联网产业背景下, 落后的地方甚至可以抢占先机 中共贵州省委常委 贵阳市委书记陈刚, 他在最近视察贵州金融城时强调指出 : 要围绕国家大数据综合试验区 国家生态文明试验区和内陆开放型经济试验区建设, 要进一步清晰发展定位, 突出大数据金融特色, 打造大数据金融中心 要突破传统金融城发展思路, 积极适应互联网 大数据特征, 形成新的发展模式和业态, 建成以大数据金融辐射全国 乃至全球的特色金融中心 贵阳在建设全球大数据金融中心的顶层设计下, 也同时在思考 梳理 规划贵阳的众筹金融创新生态体系, 并对 解放众筹与众筹解放 的系列理论创新, 以及对众筹平台与领筹人制度的实践创新, 及时做出总结与评估 在这个过程中, 刘文献先生为中国众筹金融发展进程做出了非常有价值的探索 尤其是在当前中国, 对互联网金融的监管与创新并重的时代背景下, 在全球风起云涌的金融科技创新与跨境金融合作的强力推动下, 在 贵阳建设全球大数据金融中心的目标指引下, 贵阳的众筹金融创新发展, 具有非常重要的创新实践示范意义, 受到了中国乃至世界众筹金融行业的高度关注 我们认为, 众筹金融是大数据金融的核心组成部分, 在互联网尤其是移动互联网带来的全球化众联的 众时代, 承担了社会组织尤其是企业组织变革 经济制度尤其是 双创 制度创新 生产过程众创众包重组 资源众筹 分配重构 社会众扶促进普恵金融等方面, 具有不可替代的重要的结构性作用, 众筹金融发展的健康成熟与否及快慢强弱程度, 对大数据金融的发展有重大影响 中国人民大学法学院副院长杨东教授认为 : 互联网 + 金融 = 众筹金融 我个人也非常认同他的观点 同时我也认为 : 大数据金融起于互联网金融, 又高于互联网金融一包涵 95

102 大数据金融信息剪辑 了互联网金融和传统金融 如果说互联网金融的代表形态可能是众筹金融的话, 那么, 如果把大数据金融比喻成一个无边无际的正在形成新宇宙的银河系, 众筹金融就是浩瀚约银河系中的一个熣灿的星系, 既是银河系的不可分割的一部分, 又是相对独立的一个有着自己生命系统的星系 刘文献先生把众筹金融生态体系命名为太阳系, 并详细规划了以众筹金融交易所为核心, 內环环绕着世界众筹大会 世界众筹大赛 众筹金融协会 众筹金融研究院 众筹金融学院 众筹金融投资基金 众筹金融创客小镇 众筹金融双创孵化器 众筹金融产业园 众筹金融专业保险与行业银行等众筹金融平台, 中环则环绕着以几十个行业和产业领筹人为牵头的产业领筹金融公司 ; 外环则是浩瀚的企业 创客 经纪人 投资人 消费者 专业服务机构所组成的众筹交易世界 构建一个立体生态的众筹金融生态体系, 是刘文献先生众筹金融理论的代表性成果, 也使他区别于一般的众筹金融学者而有了全局的高度 同时, 在贵阳市政府的支持下, 他还带领团队和领筹人, 展开了轰轰烈烈而艰苦卓越的构建众筹金融生态体系的建设 工作, 为建设新世界众筹之都的梦想而付出艰苦的探索和努力 这些创新和实践, 为他赢得了全球同行的认可和尊重 在我带领贵阳众筹金融访问团访问英国, 并与英国政要和英国众筹界领袖交流过程中, 刘文献先生被他们尊称为中国众筹金融体系的开创者 2015 年 10 月 23 至 26 日, 2015 世界众筹大会在贵阳召开, 大会举办了开幕式主论坛及 39 场众筹专业与众筹行业论坛, 大会吸引了全球约 名众筹行业相关专业人士 创客 投资人及媒体记者参会 来自全球的 1569 个创业项目受邀在大会参加同期举办的世界众筹大赛 2015 世界众筹大会, 在 双创 四众 众筹金融体系创新与监管 众筹服务实体经济 众筹与传统金融合作 众筹交易新五版市场 全球跨境众筹合作 众筹人才培养 众筹扶贫 城市活动与全民众筹 知识产权众筹 大数据众筹金融等领域做了广泛而深入的研讨交流, 大会获得了圆满成功, 并在全球产生了积极而深远影响, 同时, 也为贵阳迈向全球大数据金融中心的目标 为贵阳成为全国双创城市做出了积极贡献 贵州省委副书记 省长孙志刚在 2015 世界众筹大会 开幕式上表示, 世界众筹大会是全球众筹领域领筹者 投资者 服务者和创意者交流合作的重要平台, 是贵州开放 创新的重大机遇 ; 原国家外经贸部副部长 博鳌亚洲论坛秘书长龙永图在主持大会开幕式时表示, 这可能是世界众筹领域在中国的一件开创性的大事, 也会成为中国大众创业 万众创新的历史进程当中一次引领性的盛会 在接受人民日报记者的专访时, 陈刚书记表示这次大会是个新生事物, 借着大会把大批 70 后 80 后 90 后齐聚贵阳, 大家展示成果 交流经验, 为 双创 四众 的发展提供宝贵的智力和实践支撑 他认为, 现在政府应该为互联网搭台 为搭台者搭台, 政府首先想到的应该是 筹众, 即如何实现企业 投资者 创新者的共同参与, 形成一个公共聚集的机制, 让草根 平民有更多参与的可能, 并且政府具有容错的精神对创新创业者至关重要 贵阳市委副书记 市长刘文新, 在会见与会嘉宾时表示, 希望越来越多的企业家和创客, 创新 众创 众包 众扶 众筹 理念, 让更多好项目在贵阳落地生根 开花结果, 实现自身与贵阳经济社会共进步 同发展 今年 11 月, 即将在贵阳召 96

103 大数据金融资讯 开的大数据金融信用体系建设与风险控制研讨会中, 将会进行高规格 高水平 高层次的国际化的大数据金融的创新与风控研讨及阶段性成果发布 中英跨境众筹产业园 中英跨境众筹产业基金 中英跨境众筹交易版块 中英大数据众筹创新与风控课题 中英大数据众筹金融博士生合作计划等国际众筹合作成果都将发布亮相, 这其中就有刘文献先生以及领筹人卓越领筹科技金融产业园李梓正董事长的贡献 领筹人制度和领筹金融 ( 集团 ) 推动下的各个产业领筹金融公司构建, 也是刘文献先生对众筹金融体系理论和实践创新的又一重要贡献 现在, 一批产业领筹金融公司已完成成立工作, 有的已有一些初见成效, 如 : 卓越领筹金融公司在中英跨境众筹领域的成果, 五星生活金融公司在农村金融领域已合作建立了 5000 多个农村金融小超市进展, 体育金融公司也开始了 楼云跳 青少年体育中心的全国规划布局, 领筹电竞产业金融公司协助国家体育总局信息中心, 与贵阳市政府 中国大唐集团举办的首届中国移动电子竞选大赛, 推动电竞小镇的建设 其它一些领筹人, 如新华领筹消费积分大数据电商 天坛电影金融 领筹美食金融 神州趋缓扶贫金融 汇金领筹房地产金融 永恒领筹智慧能源交易 汖致旅游金融 南北巢医养金融等, 也都逐步有了产业众筹金融项目抓手, 各类商业模式也正趋于成熟, 假以时日, 如果有切实有效控制好各类风险, 扎扎实实的做实做大, 则完全可能看到贵阳众筹金融体系, 服务更多实体行业和实体企业的成功范例 贵阳众筹金融交易所是全球首个众筹金融的交易平台, 刘文献先生做为董事长和贵阳财经大学贵阳大数据金融学院的执行院长, 提出了一系列富有大数据金融特点, 并且有良好巿场价值和社会普惠意义的创新交易品种, 比如三五版市场众筹交易品种 知识产权证券化交易品种 消费积分大数据交易品种 公共资产 RlETs 交易品种 智慧能源收益权交易品种等 我希望这些交易品种经过风控论证和试点工作后, 可以能够更好地让众筹交易为实体经济服务 贵阳在发展建设大数据金融中心过程中, 始终坚持创新和风控两手抓, 两手硬 今年也是众筹金融创新和风控两手抓 两手硬的关键时期 贵阳市委书记陈刚同志很早就提出了大数据铁笼计划, 就是要用大数据对政府审批权力 市场平台权力 企业公众融资权 力和投资者的风险投资承受力进行全方位全流程的监管和预警 同时, 也是更好地利用大数据帮助投资人对企业和项目进行更纵深更全面和更智能的投资分析 此外也可以用历史大数据和大数据智能比对模型等手段, 来对投资会员的风险偏好和风险投资承受力进行评估 针对性培训 风险值预警及投资熔断 所以说, 责任铁笼 计划, 也是打造贵阳全球大数据金融中心的必要条件和监管基础设施 今年以来, 国家加强了对互联网金融的监管, 基本上形成中央政府及全国金融管理部门出监管政策, 地方政府及地方金融实施具体监管的格局 改革开放以来的中国金融发展史, 是创新和风险管理的交替发展螺旋上升的发展史, 所以也有经济学家认为金融就是经营风险管理, 这句话虽不全面, 但也道出金融和风险防范及价值发现相伴相生的本质 对于刚刚才几岁的中国互联网金融来说, 关健是如何创新? 又如何监管? 创新的工作表面上看虽主要是由企业和创客来做, 政府只要出好支持政策和放手鼓励就好了 但对于身处大数据时代的中国创新来说, 创新不能完全让市场处于自发的原始水平, 政府如何开放管理大数据, 构建大数据政府服 97

104 大数据金融信息剪辑 务平台, 提高创新的大教据服务能力, 这是一个必须正视的问题, 也是必须解决定的一个问题 贵阳正在进行的探索和实践, 就是个非常积极主动和具有深远影响的重要尝试 当前, 地方政府对互联网金融的监管, 也缺乏非常有效的监管的基础设施和监管的手段, 所以同样不能让政府监管处于完全原始的状态, 因为这样不但管不好管不住风险, 反而有可能误伤了创新, 贵阳正在实施的数据 铁笼计划 以及多个系统的数控金融系统建设, 就是要提升政府和互联网金融平台及从业者的大数据风险防范能力 正是在上述大数据创新和大数据风险防范的意义上来说, 我们认为 : 大数据金融, 起于互联网金融, 又高于互联网金融 互联网金融就好比是个可以野蛮生长的原生金融世界, 而大数据金融则是个有人类科学管理和价值服务的智慧金融世界 原始社会发展靠丛林法则, 而现代社会发展靠技术创新基础上带来的民主发展与科学管理 毫无疑问, 大数据技术无疑是当代最重要的奇点来临 贵阳正在形成一种共识 : 人类社会的每一次大进步和发展, 无不起始于科技创 新, 完善于制度创新, 成就于金融创新 今天的贵阳, 一座现代化的贵州金融城已拨地而起, 屹立立在中囯西部 围绕国家大数据综合试验区 国家生态文明试验区和内陆开放型经济试验区建设, 进一步清晰金融城发展定位, 突出大数据金融特色, 打造大数据金融中心, 突破传统金融城发展思路, 积极适应互联网 大数据特征, 形成新的发展模式和业态, 成为大数据时代贵阳业发展的宏伟目标 我们相信 : 富有责任感和使命感的企业和企业家, 是市场创新和风险控制的最重要主体 今天, 我们在全球大数据金融中心创新的的大舞台上, 来为包括从事众筹金融 互联网金融 移动金融 区块链金融 消费金融 文化金融 绿色金融 农村金融 科技金融等创新金融的企业和企业家搭台者抬台 特别是像刘文献先生这是样东西创新金融代表人物 是大数据金融时代的孔雀西南飞的 贵漂, 更重要的是, 他们以人生的大智慧 大执着 大努力和大激情, 以不畏艰苦 不怕失败的勇气, 正带领更多的企业和企业家团队 向崛起中的全球大数据金融中心集聚, 和贵阳相互成就, 一群人和一座城市, 共同的梦想, 共同的未来 2015 年初, 我们在北京邀请刘文献院长来贵阳发展的时候, 他刚完成 解放众筹 大作, 他以 解放众筹 一书, 以无限的创新激情, 预言 迎接 并发起了以 双创 四众 为主题的世界众筹大会, 推动形成了众筹金融的创新格局 今年秋天, 他以众筹金融体系构建的新实践和新思考, 写成 众筹的解放 一书, 以凤凰涅磐的心态, 再次迎接 推动参与发起 2016 贵阳大数据金融信用体系建设和风险控制研讨会 我们深信并期待, 众筹的解放 它对未来的大数据金融特别是众筹金融, 将产生深远的影响 像跳舞一样, 左脚创新, 右脚风控 像季节一样, 有冬天, 就会有春天 我们相信, 在贵阳大数据金融发展的星空中, 众筹解放和解放众筹, 都将为我们带来解放和被解放的巨大梦想和澎湃前景 是为序, 不仅为本书 来源 : qq.com/ 98

105 大数据金融资讯 2016 大数据金融企业谁是王者?( 分类排行 ) 金融服务产业向来是全球范围内的强势产业, 随着互联网通信技术的不断提升发展, 互联网金融正成为致力于产业效率和用户体验提升的新动力 近几年伴随着移动互联网的普及, 互联网金融业正在经历着跳跃式增长 当进入到 2016 年, 在合规整改的浪潮中, 监管新规不断落地, 加速了互联网金融产业的净化, 同时也促进了产业向纵深发展 2016 年, 在政策和市场因素双重作用下, 互联网金融行业正经历着前所未有的际遇 不论是第三方支付的逐步成熟 互联网银行 保险的启程, 还是 P2P 消费金融 大数据金融等新兴金融模式的兴起, 亦或是传统企业在互联网金融领域的试水, 都彰显着互联网金融朝阳般的前景和强大的生命力 在国家加大整改力度后, 主要的互联网金融企业将重心 放在合规整改 兼并收购 收割小平台退出后的市场等方面, 产品和模式创新的力度有所收缩, 从业机构数量的快速下降并不应该成为互联网金融创新发展的阻力, 优胜劣汰是社会进程的规则, 合规整改下的互联网金融, 门槛更高, 形式也更多样 P2P 在质疑声中多云转晴从 2012 年, 开始有零星的 P2P 平台跑路事件开始, 风险不断累积和发酵, 直至 e 租宝事件严重扰乱了社会经济秩序, P2P 行业已然成为此次互联网金融整改的重点目标 2016 年以来, 中国网贷行业的监管政策及实施细则逐步明确和落地, 行业自律和信息披露逐步加强和完善,P2P 网贷行业总体是在向透明和规范的方向发展 与此同时, 网贷行业经营环境的改善, 也正成为投资人较好的投资渠道 消费金融成为最亮的那颗星消费金融市场的用户个人需求量小, 但是需求群体却很大, 市场前景广阔, 加之媒体的推波助澜, 很快将消费金融推向市场顶峰 99

106 大数据金融信息剪辑 一大出口国和第二大进口国 整个IT产业的神经 大数据已 快速增长的跨境交易市场意味 渗透各行各业 挖掘数据中的 着巨大且不断增长的跨境网上 商业价值 目前中国在大数据 支付需求 网络支付运营主体 应用方面还处在起步阶段 与支付业务均呈现多元化发展 趋势 中国经济的飞速发展必 然迎来天量的数据处理 而数 据量处理的爆发又会带动硬件 设备支出 数据中心大规模建 设 以及相关应用服务领域的 商机 未来 中国大数据产品 的潜在市场规模有望给IT行业 开拓一个全新的黄金时代 此消彼长 联合创新 合规整改的终极目的在 于通过整顿归纳总结出有效指 引 有效原则和有效标准 建 立中国互联网金融健康发展的 消费金融以小额分散为 长效机制 据第三方机构的报 主要特点 然而小额分散对团 告显示 2016年中国互联网 队风控模型建构能力 技术能 金融行业市场规模将达17.8万 力以及管理能力的要求都极 网络支付的快速发展一 亿 未来五年 行业年均复 高 经验不足 管理深度不够 方面丰富了电子商务的支付体 合增长率将达到24.67% 到 都会导致平台在高速发展中面 系 健全了信用体系 另一方 2020年预计超过43万亿 作为 临考验 平台的安全性不在于 面 作为一种新型的支付方 新兴产业 互联网金融市场未 业务 核心在于平台的综合实 式 它的发展同时也增加了新 来的发展空间和潜力巨大 力 的经济风险和社会风险 依靠 监管的完善是网络支付发 展的外部推动力 当下的移动支付迎来 破 冰 时代 由于移动端应用需 求的普及 未来有望呈现爆发 式增长 主要的第三方支付机 健全的法律制度 成熟的政府 监管体系和完善行业自律体 系 网络支付服务才能长期稳 健发展下去 大数据有望开拓全新的黄 金时代 构纷纷布局移动支付 其次 继物联网 移动互联网 全球化趋势明显 作为世界第 云计算之后 大数据再次挑动 100

107 大数据金融资讯 随着应用和消费场景的日显丰富, 互联网金融也必将呈现出极大的多样性, 除了目前的第三方支付 P2P 互联网银行 互联网保险 互联网证券外, 互联网消费金融 金融大数据等细分领域在近期正在迅猛发展 正如人的追求没有止境一样, 互联网金融在探索未知的路上永远不可能停顿 目前, 作为互联网金融的代表形态, 第三方支付的需求正在得到突显, 支付宝 翼支付 华为钱包等移动支付方式正在得到大量的应用 ;P2P 正遇来了规范发展期, 陆金所 宜人贷 Ppmoney 人人贷 拍拍贷等公司坚持合规运营, 并不断优化服务, 在行业中取得了有利的竞争位置 信贷消费已经成为人们日常消费中非常普遍的选择, 很多电商及互联网金融平台依托自身业务特点, 开展了消费分期服务, 促进了自身业务的壮大和发展, 受到消费者的欢 迎 如蚂蚁花呗 京东白条等金融服务对于在淘宝及京东平台购物的用户来说, 提供了极大的方便 而且现在越来越多的垂直平台也在这方面进行着尝试, 例如拿去花就是土巴兔装修提供的一种装修贷产品 此外趣分期 分期乐等面向校园和白领消费的互联网金融平台也正迎来高速发展期 近年来, 由互联网公司牵头发起的金融创新不断涌现, 互联网银行 互联网保险等有别于传统金融的新模式快速推进, 与之相关的互联网征信技术和资讯服务也都得到了快速发展, 安心保险 泰康在线 安心保险 易安财险, 以及网商银行 微众银行这些新型的互联网金融企业正成为推动现代金融改革的探路者 结语当人们汇入到移动互联网大潮之中后, 互联网金融新形态也随之兴起 近年来, 互联网金融凭借成本低 效率高 覆盖广 发展快等优势, 提供多样化的产品与服务, 满足各个金融服务领域的需求 但是互联网金融的健康稳定发展离不开完善的互联网金融监督体系的支持 完善互联网金融监督和安全防范制度体系, 才能促进互联网金融的健康稳定发展 互联网金融市场的规范化管理为企业发展提供公平的竞争空间, 不良平台将无处遁形 快速淘汰 抓住大格局整顿契机, 寻求行业之间的创新联合, 无疑是互联网金融市场的一个新走向 越来越合规的互联网金融, 在行业进程下因地制宜, 将在现有市场基础上更新更快的走向下一季辉煌, 是所有的消费者和行业人都翘首以盼的结局 来源 : com/ /n shtml 101

108 大数据金融信息剪辑 数据可视化 2016 信息之美 金奖作品全解析 信息之美奖 全名为 个特别奖 视飞机上 用来获取更广阔的 视野 凯度信息之美奖 The 获奖作品赏析 Kantar Information is Beautiful 1 全场最大奖项 最佳 美国政府的空中监视行 Awards 是为了嘉奖信息 信息之美奖 Most Beautiful 为截止到目前几乎不为人知 与数据可视化的优秀作品而设 天空中的密探 BuzzFeed News通过分析从航 立的奖项 2012年 记者兼数 据可视化学者大卫 麦克坎德 作者 Peter Aldous 和 Charles Sefie 美国 班追踪网站Flightradar24上得 到的大约200架已辨别的联邦 莱思 David McCandless 和 凯度集团 译者注 凯度集团 系全球知名的研究 分析和咨 询网络集团 公司创意总监艾 兹 卡米 Aziz Cami 共同创 立了该奖 奖项类别 今年的 信息之美奖 共 分为 数据可视化 信息 图 交互可视化 数 据可视化网站 数据新 来源媒体 Buzzfeed 飞机位置数据 通过动态化的 闻 数据可视化项目 6个 图片截取自美国科 地图和路线图 借助VR技术 类别 每个类别都评出了金 罗拉多州博尔德Churchill 形成了一幅前所未有的美国政 银 铜三个奖项 一些类别还 Navigation软件公司关于 增 府监视行动规模图景 为大家 评出了荣誉提名奖 除此之 强现实 系统的宣传视频 让 清晰展现一个政府监视下的美 外 主办方特别设立了 最佳 读者可以更加直接鲜活感受该 国 团队 学生奖 社区 系统的强大感知能力 这种系 这部作品曾经获得过2016 奖 最佳信息之美奖 等9 统安装于美国联邦调查局的监 年全球数据新闻奖年度最佳数 102

109 大数据金融资讯 据可视化奖 真是拿奖拿到手 对应的人类活动 在过去的两 软!新闻坊之前详细解读过这个 万多年间 全球平均气温由最 失踪移民地图 基于 作品 赶紧来温习下这篇吧 初的零下4.3摄氏度增加到将 失踪移民项目 The Missing 近零上1摄氏度 作品链接 Migrants Project 收集的 数据 该项目由国际移民组织 2 数据可视化类 Data Visualization 金奖作品 地球 的气温变化时间轴 作者 Randall Munroe 美国 来源媒体 美国XKCD博客 3 信息图 Infographic 金奖作品 失踪移民地图 作者 Valerio Pellegrini和 Michele Mauri 意大利 成功移民和死亡的人口数据 IOM 的全球移民数据分析 中心 GMDAC 与媒体与通讯 事业部 MDC 共同发起 来 收集全球范围内在非法移民过 小编注 这是一个极客漫画 程中死亡或失踪的人口数据 网站 这项研究始于2013年 当年 10月 两艘非法非洲移民船只 在意大利南部岛屿兰佩杜萨岛 附近沉船 造成至少368人丧 生 该项目的地图只有地理信 息 来展示不同地区的形态 也强调了我们都是世界公民这 一点 这项作品最初在2015 年9月完成 后来在2016年2 月进行更新 加入了新的移民 失踪事件的数据 作品链接 infographics 图为从该作品中截取的 该图展示了地中海区域 4 数据可视化项目 1000年到2016年全球平均气温 变化曲线图及未来气温变化走 向预测 全球变暖是真的吗?还是一 些科学家所说的骗局? 美国网络 漫画家Randall Munroe用温度 变化曲线向我们展现了从上一 次冰川时期 公元两万年前 到2016年的全球气温变化时间 轴 并在曲线旁标注该时间段 103

110 大数据金融信息剪辑 Dataviz Project 金奖作品 业的数据 用披萨来展示芬兰 伴随着关于对商业航运的重 数据美食 首都赫尔辛基的不同种族人口 要性 运输货物的重要河流 比率等 及地区等的讲解 作者 Moritz Stefaner和 Susanne Jaschko 德国 在伊朗 一半全球 作品链接 作品链接 shipmap.org/ 前500的网站被封禁 但是 5 交 互 可 视 化 类 6 数据可视化网站 70%的年轻网络用户试用代 Interactive 金奖作品 航 Dataviz Website 金奖作品 理服务器访问这些网站 该 运地图 流动的数据 图用意大利调味饭中不同颜 作 色的米粒代表这些数据 其 者 Robin 中上半部分的黄色米粒代表 Houston 和 可访问的网站 下半部分代 Duncan Clark 表被封禁的网站 下半部分 英国 的黄色米粒代表通过代理服 务器进行访问的网站 该作品是 基于2012全 食物可以作为展示数 年全球商业 据的工具吗?数据是什么味 航运数据的 道? 数据美食工作坊将美食 交互式3D地 作为一种工具来展示数据 图 展示了 该工作坊由德国艺术设计网 现代商业航 站Prozessagenten发起 运的巨大规 由数据可视化专家Moritz 模 大型商船 Stefaner负责艺术设计 该工 的航运路线 不同类型商船 作坊会采用当地的食物来展示 的地理分布和它们的碳排放 当地相关的数据 比如说用当 量 这幅地图以动画片的形 Flowingdata.com网站由 地鱼类做的鱼汤来展示当地渔 式呈现 在缓缓的音乐中还 数据统计师Nathan Yau运营 作者 Nathan Yau 邱南 森 持续更新原创或整合的数据可 视化内容 该网站上现在有大 量的数据可视化作品 数据可 视化学习教程和指南等 作品链接 flowingdata.com/ 特别奖 商 业 项 目

111 大数据金融资讯 作品通过研究1958年至 2015年公告牌歌曲的排名变 化 展现各个时代音乐的流行 趋势 作品链接 polygraph.cool/history/ 3 最 佳 团 队 奖 Outstanding Team FiveThirtyEight网站 Commercial/biz Project 金 奖作品 数据美国 该 网 站 由 的变革 01 对话电影 德 勤 Deloitte Datawheel数据 公司和麻省理工学院媒体实验 室Macro Connections共同创 建 数据美国是一个开放的免 费资源平台 提供美国政府多 家统计部门的官方数据 现有 180多万个数据可视化成果 范围涵盖工业 教育 职场等 多个领域 作品链接 datausa.io/ 2 年度最佳工作室 Studio of the Year Polygraph工作室 Polygraph斩获了今年的 年度最佳工作室 奖 工作 美国FiveThirtyEight网站 作品探讨了性别 社会背 团队获得此奖 该网站成立于 景 票房数据等因素对于电影 2008年 特点是基于大量数 的影响 通过数据鲜明反映出 据来预测新闻 最具代表性的 了当今电影的多元化趋势 作品便是通过棒球比赛数据成 作品链接 polygraph.cool/films/ 02 音乐品味的变革 功预测出奥巴马将赢得美国总 统大选 网站在不牺牲严密性 和准确性的前提下 让数据新 室研究的话题广泛 相比用文 闻变得生动且通俗易懂 更加 字枯燥的表述 他们更喜欢借 吸引读者 代表作品是 2016 助画面 符号等动态信息开展 年美国大选预测 话说小 对不同课题的研究 代表作品 编很想知道这次特朗普当选 为 对话电影 和 音乐品味 FiveThirtyEight的预测是否靠谱 105

112 大数据金融信息剪辑 Moritz Stefaner 德国 代表 啊 4 社区奖 Community Awards 金奖 由全球数据可 作品 天神项目 季风能源 预测 视化社区通过网上投票得出 基于相关调查机构 教育 中国各省经 资源和研究文章 作者曾经为 济增长 作者 Alberto Lucas 英国医学杂志 提供过数十 López 美国 来源媒体 南 幅信息图表等可视化的数据呈 华早报 现 这些可视化的信息能够让 忙碌的医务人员快速而便捷地 天气预报的预测范围局限 于未来几周 气候预报的预测 范围放眼于未来几年 对于能 找到他们所需要的信息 作品链接 bmj.com/infographics 源交易商来说 了解未来几个 02 Nadieh Bremer代表作 月的风况则最为重要 基于复 品 奥运旋翼 自1896年以 杂的气候模型 该项目将尝试 来奥运会金牌获得者信息一览 用新的方法预测未来几个月的 风况 为风能基地提供帮助 作品链接 6 明日之星 奖 Rising Star Will StahlTimmins 英国 和Nadieh Bremer 荷兰 01 Will Stahl-Timmins代 中国的经济增长在过去的 20年中吸引了全世界的目光 表作品 英国医学杂志信息图 表 南华早报 的作品用信息图 表相结合的形式记录了过去20 年中国各省的经济增长态势 通过交互式的数据可视 并将全国分为了8个经济区域进 化 作者展现了自1896年第 行了展示 一届奥运会 和当前的奥运纪 5 最 佳 个 人 奖 录 以来 按照项目 性别和 Outstanding Individual 国家等顺序总共5100名奥运金 106

113 大数据金融资讯 牌获得者的信息 你可以通过 多数情况下 收入分化与种族 8 最佳非英语类作 底部的时间线任意查询 说不 隔离相关 暗指城市规划背 品 Best Non-English 定就会找到一个有趣的故事 后的政治操控 作品链接 Language BIG 作者 作品链接 Terre Urbaine 法国 需要特别提一下的是 南 github.io/olympicfeathers/ 7 学生奖 Student 京艺术学院设计学院的叶培蕾 Awards 洛杉矶及芝加哥 同学凭借信息图作品 垃圾分 的收入差距 作者 Herwig 类回收图表 见下图 荣获 Scherabon 美国 学生奖银奖 成为这项全球性 数据可视化比赛开始五年来第 一个获奖的中国大陆作品 恭 喜! 作品通过视频等动态设计 展现了整个地球在漫长岁月中 的城市化过程 作品链接 paris/ 评选方式2016年 信息之 美奖 邀请了包括Google 数 据编辑西蒙 罗杰斯 Simon Rogers 美国迈阿密大学 传播学院视觉新闻学的教授 艾尔博尔特 卡罗 Alberto Cairo 数据可视化专家安 迪 柯克 Andy Kirk 2015 年 信息之美奖 最佳信息 之美奖 和 数据可视化项 目 金奖获得者斯蒂芬妮 波 萨维奇 Stefanie Posavec 在内的30多位数据可视化专家 作者通过两张大图将洛 担任评审 同时网站的访问用 杉矶和芝加哥的收入差距可视 户也可参与投票决定最后的获 化 图中两座城市的矩形建筑 奖者 物高度对应了每个区域的收入 水平 清晰地展现了现代城市 来源 me/n/ 中的贫富差距 文中指出 大 107

114 大数据金融信息剪辑 导读 大数据蕴藏着丰富的信息和价值, 如何处理好大数据并发掘其潜藏的商业价值, 这是大数据时代的新挑战 我们将为大家提供与大数据相关的最新技术和资讯 一篇对大数据深度思考的文章, 让你认识并读懂大数据 在写这篇文章之前, 我发现身边很多 IT 人对于这些热门的新技术 新趋势往往趋之若鹜却又很难说的透彻, 如果你问他大数据和你有什么关系? 估计很少能说出一二三来 究其原因, 一是因为大家对新技术有着相同的原始渴求, 至少知其然在聊天时不会显得很 土鳖 ; 二是在工作和生活环境中真正能参与实践大数据的案例实在太少了, 所以大家没有必要花时间去知其所以然 我希望有些不一样, 所以对该如何去认识大数据进行了一番思索, 包括查阅了资料, 翻阅了最新的专业书籍, 但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆积起来形成毫无价值的转述或评论, 我很真诚的希望进入事物探寻本质 如果你说大数据就是数据大, 或者侃侃而谈 4 个 V, 也许很有深度的谈到 BI 或预测的价值, 又或者拿 Google 和 Amazon 举例, 技术流可能会聊起 Hadoop 和 Cloud Computing, 不管对错, 只是无法勾勒对大数据的整体认识, 不说是片面, 但至少有些管窥蠡测 隔衣瘙痒了 也许, 解构 是最好的方法 怎样结构大数据? 首先, 我认为大数据就是互联网发展到现今阶段的一种表象或特征而已, 没有必要神话它或对它保持敬畏之心, 在以云计算为代表的技术创新大幕的衬托下, 这些原本很难收集和使用的数据开始容易被利用起来了, 通过各行各业的不断创新, 大数据会逐步为人类创造更多的价值 其次, 想要系统的认知大数据, 必须要全面而细致的分解它, 我着手从三个层面来展开 : 第一层面是理论, 理论是认知的必经途径, 也是被广泛认同和传播的基线 我会从大数据的特征定义理解行业对大数据的整体描绘和定性 ; 从对大数据价值的探讨来深入解析大数据的珍贵所在 ; 从对大数据的现在和未来去洞悉大数据的发展趋势 ; 从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈 第二层面是技术, 技术是大数据价值体现的手段和前进的基石 我将分别从云计算 分布式处理技术 存储技术和感知技术的发展来说明大数据从采集 处理 存储到形成结果的整个过程第三层面是实践, 实践是大数据的最终价值体现 我将分别从互联网的大数据, 政府的大 108

115 大数据金融知识 数据, 企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图 和大数据相关的理论 1 特征定义最早提出大数据时代到来的是麦肯锡 : 数据, 已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素 人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈余浪潮的到来 业界 (IBM 最早定义 ) 将大数据的特征归纳为 4 个 V ( 量 Volume, 多样 Variety, 价值 Value, 速 Velocity), 或者说特点有四个层面 : 第一, 数据体量巨大 大数据的起始计量单位至少是 P(1000 个 T) E(100 万个 T) 或 Z(10 亿个 T); 第二, 数据类型繁多 比如, 网络日志 视频 图片 地理位置信息等等 第三, 价值密度低, 商业价值高 第四, 处理速度快 最后这一点也是和传统的数据挖掘技术有着本质的不同 其实这些 V 并不能真正说清楚大数据的所有特征, 下面这张图对大数据的一些相关特性做出了有效的说明 古语云 : 三分技术, 七分数据, 得数据者得天下 先不论谁说的, 但是这句话的正确性已经不用去论证了 维克托 迈尔 - 舍恩伯格在 大数据时代 一书中举了百般例证, 都是为了说明一个道理 : 在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值 书中, 作者提及最多的是 Google 如何利用人们的搜索记录挖掘数据二次利用价值, 比如预测某地流感爆发的趋势 ;Amazon 如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐, 以此有效提升销售量 ;Farecast 如何利用过去十年所有的航 线机票价格打折数据, 来预测用户购买机票的时机是否合适 那么, 什么是大数据思维? 维克托 迈尔 - 舍恩伯格认为,1- 需要全部数据样本而不是抽样 ;2- 关注效率而不是精确度 ;3- 关注相关性而不是因果关系 阿里巴巴的王坚对于大数据也有一些独特的见解, 比如, 今天的数据不是大, 真正有意思的是数据变得在线了, 这个恰恰是互联网的特点 非互联网时期的产品, 功能一定是它的价值, 今天互联网的产品, 数据一定是它的价值 你千万不要想着拿数据去改进一个业务, 这不是大数据 你一定是去做了一件以前做不了的事情 特别是最后一点, 我是非常认同的, 大数据的真正价值在于创造, 在于填补无数个还未实现过的空白 有人把数据比喻为蕴藏能量的煤矿 煤炭按照性质有焦煤 无烟煤 肥煤 贫煤等分类, 而露天煤矿 深山煤矿的挖掘成本又不一样 与此类似, 大数据并不在 大, 而在于 有用 价值含量 挖掘成本比数量更为重要 2 价值探讨大数据是什么? 投资者眼里是金光闪闪的两个字 : 资产 比如,Facebook 上市时, 评估机构评定的有效资产中大部分都是其社交网站上的数据 如果把大数据比作一种产业, 那么这种产业实现盈利的关键, 在于提高对数据的 加工能力, 通过 加工 实现数据的 增值 Target 超市以 20 多种怀孕期间孕妇可能会购买的商品为基础, 将所有用户的购买记录作为数据来源, 通过构建模型分析购买者的行为相关性, 能准确的推断出孕妇的具体临盆时间, 这样 109

116 大数据金融信息剪辑 Target 的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷 Target 的例子是一个很典型的案例, 这样印证了维克托 迈尔 - 舍恩伯格提过的一个很有指导意义的观点 : 通过找出一个关联物并监控它, 就可以预测未来 Target 通过监测购买者购买商品的时间和品种来准确预测顾客的孕期, 这就是对数据的二次利用的典型案例 如果, 我们通过采集驾驶员手机的 GPS 数据, 就可以分析出当前哪些道路正在堵车, 并可以及时发布道路交通提醒 ; 通过采集汽车的 GPS 位置数据, 就可以分析城市的哪些区域停车较多, 这也代表该区域有着较为活跃的人群, 这些分析数据适合卖给广告投放商 不管大数据的核心价值是不是预测, 但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉 从大数据的价值链条来分析, 存在三种模式 : 手握大数据, 但是没有利用好 ; 比较典型的是金融机构, 电信行业, 政府机构等 没有数据, 但是知道如何帮助有数据的人利用它 ; 比较典型的是 IT 咨询和服务企业, 比如, 埃森哲,IBM,Oracle 等 既有数据, 又有大数据思维 ; 比较典型的是 Google,Amazon,Mastercard 等 未来在大数据领域最具有价值的是两种事物 : 拥有大数据思维的人, 这种人可以将大数据的潜在价值转化为实际利益 ; 还未有被大数据触及过的业务领域 这些是还未被挖掘的油井, 金矿, 是所谓的蓝海 Wal-Mart 作为零售行业的巨头, 他们的分析人员会对每个阶段的销售记录进行了全面的 分析, 有一次他们无意中发现虽不相关但很有价值的数据, 在美国的飓风来临季节, 超市的蛋挞和抵御飓风物品竟然销量都有大幅增加, 于是他们做了一个明智决策, 就是将蛋挞的销售位置移到了飓风物品销售区域旁边, 看起来是为了方便用户挑选, 但是没有想到蛋挞的销量因此又提高了很多 还有一个有趣的例子,1948 年辽沈战役期间, 司令员林彪要求每天要进行例常的 每日军情汇报, 由值班参谋读出下属各个纵队 师 团用电台报告的当日战况和缴获情况 那几乎是重复着千篇一律枯燥无味的数据 : 每支部队歼敌多少 俘虏多少 ; 缴获的火炮 车辆多少, 枪支 物资多少 有一天, 参谋照例汇报当日的战况, 林彪突然打断他 : 刚才念的在胡家窝棚那个战斗的缴获, 你们听到了吗? 大家都很茫然, 因为如此战斗每天都有几十起, 不都是差不多一模一样的枯燥数字吗? 林彪扫视一周, 见无人回答, 便接连问了三句 : 为什么那里缴获的短枪与长枪的比例比其它战斗略高? 为什么那里缴获和击毁的小车与大车的比例比其它战斗略高? 为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高? 林彪司令员大步走向挂满军用地图的墙壁, 指着地图上的那个点说 : 我猜想, 不, 我断定! 敌人的指挥所就在这里! 果然, 部队很快就抓住了敌方的指挥官廖耀湘, 并取得这场重要战役的胜利 这些例子真实的反映在各行各业, 探求数据价值取决于把握数据的人, 关键是人的数据思维 ; 与其说是大数据创造了价值, 不如说是大数据思维触发了新的价值增长 现在和未来我们先看看大数据在当下有怎样的杰出表 110

117 大数据金融知识 现 : 大数据帮助政府实现市场经济调控 公共卫生安全防范 灾难预警 社会舆论监督 ; 大数据帮助城市预防犯罪, 实现智慧交通, 提升紧急应急能力 ; 大数据帮助医疗机构建立患者的疾病风险跟踪机制, 帮助医药企业提升药品的临床使用效果, 帮助艾滋病研究机构为患者提供定制的药物 ; 大数据帮助航空公司节省运营成本, 帮助电信企业实现售后服务质量提升, 帮助保险企业识别欺诈骗保行为, 帮助快递公司监测分析运输车辆的故障险情以提前预警维修, 帮助电力公司有效识别预警即将发生故障的设备 ; 大数据帮助电商公司向用户推荐商品和服务, 帮助旅游网站为旅游者提供心仪的旅游路线, 帮助二手市场的买卖双方找到最合适的交易目标, 帮助用户找到最合适的商品购买时期 商家和最优惠价格 ; 大数据帮助企业提升营销的针对性, 降低物流和库存的成本, 减少投资的风险, 以及帮助企业提升广告投放精准度 ; 大数据帮助娱乐行业预测歌手, 歌曲, 电影, 电视剧的受欢迎程度, 并为投资者分析评估拍一部电影需要投入多少钱才最合适, 否则就有可能收不回成本 ; 大数据帮助社交网站提供更准确的好友推荐, 为用户提供更精准的企业招聘信息, 向用户推荐可能喜欢的游戏以及适合购买的商品 其实, 这些还远远不够, 未来大数据的身影应该无处不在, 就算无法准确预测大数据终会将人类社会带往到哪种最终形态, 但我相信只要发展脚步在继续, 因大数据而产生的变革浪潮将很快淹没地球的每一个角落 比如,Amazon 的最终期望是 : 最成功的书籍推荐应该只有一本书, 就是用户要买的下一本书 Google 也希望当用户在搜索时, 最好的体验是搜索结果只包含用户所需要的内容, 而这并不需要用户给予 Google 太多的提示 而当物联网发展到达一定规模时, 借助条形码 二维码 RFID 等能够唯一标识产品, 传感器 可穿戴设备 智能感知 视频采集 增强现实等技术可实现实时的信息采集和分析, 这些数据能够支撑智慧城市, 智慧交通, 智慧能源, 智慧医疗, 智慧环保的理念需要, 这些都所谓的智慧将是大数据的采集数据来源和服务范围 未来的大数据除了将更好的解决社会问题, 商业营销问题, 科学技术问题, 还有一个可预见的趋势是以人为本的大数据方针 人才是地球的主宰, 大部分的数据都与人类有关, 要通过大数据解决人的问题 比如, 建立个人的数据中心, 将每个人的日常生活习惯, 身体体征, 社会网络, 知识能力, 爱好性情, 疾病嗜好, 情绪波动 换言之就是记录人从出生那一刻起的每一分每一秒, 将除了思维外的一切都储存下来, 这些数据可以被充分的利用 : 医疗机构将实时的监测用户的身体健康状况 ; 教育机构更有针对的制定用户喜欢的教育培训计划 ; 服务行业为用户提供即时健康的符合用户生活习惯的食物和其它服务 ; 社交网络能为你提供合适的交友对象, 并为志同道合的人群组织各种聚会活动 ; 政府能在用户的心理健康出现问题时有效 111

118 大数据金融信息剪辑 的干预, 防范自杀, 刑事案件的发生 ; 金融机构能帮助用户进行有效的理财管理, 为用户的资金提供更有效的使用建议和规划 ; 道路交通 汽车租赁及运输行业可以为用户提供更合适的出行线路和路途服务安排 ; 当然, 上面的一切看起来都很美好, 但是否是以牺牲了用户的自由为前提呢? 只能说当新鲜事物带来了革新的同时也同样带来了 病菌 比如, 在手机未普及前, 大家喜欢聚在一起聊天, 自从手机普及后特别是有了互联网, 大家不用聚在一起也可以随时随地的聊天, 只是 病菌 滋生了另外一种情形, 大家慢慢习惯了和手机共渡时光, 人与人之间情感交流仿佛永远隔着一张 网 大数据隐私你或许并不敏感, 当你在不同的网站上注册了个人信息后, 可能这些信息已经被扩散出去了, 当你莫名其妙的接到各种邮件, 电话, 短信的滋扰时, 你不会想到自己的电话号码, 邮箱, 生日, 购买记录, 收入水平, 家庭住址, 亲朋好友等私人信息早就被各种商业机构非法存储或贱卖给其它任何有需要的企业或个人了 更可怕的是, 这些信息你永远无法删除, 它们永远存在于互联网的某些你不知道的角落 除非你更换掉自己的所有信息, 但是这代价太大了 用户隐私问题一直是大数据应用难以绕开的一个问题, 如被央视曝光过的分众无线 罗维邓白氏以及网易邮箱都涉及侵犯用户隐私 目前, 中国并没有专门的法律法规来界定用户隐私, 处理相关问题时多采用其他相关法规条例来解释 但随着民众隐私意识的日益增强, 合法合规地获取数据 分析数据和应用数据, 是进行大数据分析时必须遵循的原则 说到隐私被侵犯, 爱德华? 斯诺登应该占据一席之地, 这位前美国中央情报局 (CIA) 雇员一手引爆了美国 棱镜计划 (PRISM) 的内幕消息 棱镜 项目是一项由美国国家安全局 (NSA) 自 2007 年起开始实施的绝密电子监听计划, 年耗资近 2000 亿美元, 用于监听全美电话通话记录, 据称还可以使情报人员通过 后门 进入 9 家主要科技公司的服务器, 包括微软 雅虎 谷歌 Facebook PalTalk 美国在线 Skype YouTube 苹果 这个事件引发了人们对政府使用大数据时对公民隐私侵犯的担心 再看看我们身边, 当微博, 微信,QQ 空间这些社交平台肆意的吞噬着数亿用户的各种信息时, 你就不要指望你还有隐私权了, 就算你在某个地方删除了, 但也许这些信息已经被其他人转载或保存了, 更有可能已经被百度或 Google 存为快照, 早就提供给任意用户搜索了 因此在大数据的背景下, 很多人都在积极的抵制无底线的数字化, 这种大数据和个体之间的博弈还会一直继续下去 专家给予了我们一些如何有效保护大数据背景下隐私权的建议 : 减少信息的数字化 ; 隐私权立法 ; 数字隐私权基础设施 ( 类似 DRM 数字版权管理 ); 人类改变认知 ( 接受忽略过去 ); 创造良性的信息生态 ; 语境化 112

119 大数据金融知识 但是这些都很难立即见效或者有实质性的改善 比如, 现在有一种职业叫删帖人, 专门负责帮人到各大网站删帖, 删除评论 其实这些人就是通过黑客技术侵入各大网站, 破获管理员的密码然后进行手工定向删除 只不过他们保护的不是客户的隐私, 而大多是丑闻 还有一种职业叫人肉专家, 他们负责从互联网上找到一个与他们根本就无关系用户的任意信息 这是很可怕的事情, 也就是说, 如果有人想找到你, 只需要两个条件 :1- 你上过网, 留下过痕迹 ;2- 你的亲朋好友或仅仅是认识你的人上过网, 留下过你的痕迹 这两个条件满足其一, 人肉专家就可以很轻松的找到你, 可能还知道你现在正在某个餐厅和谁一起共进晚餐 当很多互联网企业意识到隐私对于用户的重要性时, 为了继续得到用户的信任, 他们采取了很多办法, 比如 google 承诺仅保留用户的搜索记录 9 个月, 浏览器厂商提供了无痕冲浪模式, 社交网站拒绝公共搜索引擎的爬虫进入, 并将提供出去的数据全部采取匿名方式处理等 在这种复杂的环境里面, 很多人依然没有建立对于信息隐私的保护意识, 让自己一直处于被滋扰, 被精心设计, 被利用, 被监视的处境中 可是, 我们能做的几乎微乎其微, 因为个人隐私数据已经无法由我们自己掌控了, 就像一首诗里说到的 : 如果你现在继续麻木, 那就别指望这麻木能抵挡得住被 扒光 那一刻的惊恐和绝望 和大数据相关的技术云技术大数据常和云计算联系到一起, 因为实时的大型数据集分析需要分布式处理框架来向 数十 数百或甚至数万的电脑分配工作 可以说, 云计算充当了工业革命时期的发动机的角色, 而大数据则是电 云计算思想的起源是麦卡锡在上世纪 60 年代提出的 : 把计算能力作为一种像水和电一样的公用事业提供给用户 如今, 在 Google Amazon Facebook 等一批互联网企业引领下, 一种行之有效的模式出现了 : 云计算提供基础架构平台, 大数据应用运行在这个平台上 业内是这么形容两者的关系 : 没有大数据的信息积淀, 则云计算的计算能力再强大, 也难以找到用武之地 ; 没有云计算的处理能力, 则大数据的信息积淀再丰富, 也终究只是镜花水月 那么大数据到底需要哪些云计算技术呢? 这里暂且列举一些, 比如虚拟化技术, 分布式处理技术, 海量数据的存储和管理技术, NoSQL 实时流数据处理 智能分析技术( 类似模式识别以及自然语言理解 ) 等 云计算和大数据之间的关系可以用下面的一张图来说明, 两者之间结合后会产生如下效应 : 可以提供更多基于海量业务数据的创新型服务 ; 通过云计算技术的不断发展降低大数据业务的创新成本 如果将云计算与大数据进行一些比较, 最明显的区分在两个方面 : 第一, 在概念上两者有所不同, 云计算改变了 IT, 而大数据则改变了业务 然而大数据必须有云作为基础架构, 才能得以顺畅运营 第二, 大数据和云计算的目标受众不同, 云计算是 CIO 等关心的技术层, 是一个进阶的 IT 解决方案 而大数据是 CEO 关注的 是业务层的产品, 而大数据的决策者是业务层 113

120 大数据金融信息剪辑 分布式处理技术分布式处理系统可以将不同地点的或具有不同功能的或拥有不同数据的多台计算机用通信网络连接起来, 在控制系统的统一管理控制下, 协调地完成信息处理任务 这就是分布式处理系统的定义 以 Hadoop(Yahoo) 为例进行说明, Hadoop 是一个实现了 MapReduce 模式的能够对大量数据进行分布式处理的软件框架, 是以一种可靠 高效 可伸缩的方式进行处理的 而 MapReduce 是 Google 提出的一种云计算的核心计算模式, 是一种分布式运算技术, 也是简化的分布式编程模式,MapReduce 模式的主要思想是将自动分割要执行的问题 ( 例如程序 ) 拆解成 map( 映射 ) 和 reduce( 化简 ) 的方式, 在数据被分割后通过 Map 函数的程序将数据映射成不同的区块, 分配给计算机机群处理达到分布式运算的效果, 在通过 Reduce 函数的程序将结果汇整, 从而输出开发者需要的结果 再来看看 Hadoop 的特性, 第一, 它是可靠的, 因为它假设计算元素和存储会失败, 因此它维护多个工作数据副本, 确保能够针对失败的节点重新分布处理 其次,Hadoop 是高效的, 因为它以并行的方式工作, 通过并行处理加快处理速度 Hadoop 还是可伸缩的, 能够处理 PB 级数据 此外,Hadoop 依赖于社区服务器, 因此它的成本比较低, 任何人都可以使用 你也可以这么理解 Hadoop 的构成, Hadoop=HDFS( 文件系统, 数据存储技术相关 )+HBase( 数据库 )+MapReduce( 数据处理 )+ Others Hadoop 用到的一些技术有 : HDFS: Hadoop 分布式文件系统 (Distributed File System) - HDFS (HadoopDistributed File System) MapReduce: 并行计算框架 HBase: 类似 Google BigTable 的分布式 NoSQL 列数据库 Hive: 数据仓库工具, 由 Facebook 贡献 Zookeeper: 分布式锁设施, 提供类似 Google Chubby 的功能, 由 Facebook 贡献 Avro: 新的数据序列化格式与传输工具, 将逐步取代 Hadoop 原有的 IPC 机制 Pig: 大数据分析平台, 为用户提供多种接口 Ambari:Hadoop 管理工具, 可以快捷的监控 部署 管理集群 Sqoop: 用于在 Hadoop 与传统的数据库间进行数据的传递 说了这么多, 举个实际的例子, 虽然这个例子有些陈旧, 但是淘宝的海量数据技术架构还是有助于我们理解对于大数据的运作处理机制 : 淘宝大数据如上图所示, 淘宝的海量数据产品技术架构分为五个层次, 从上至下来看它们分别是 : 数据源, 计算层, 存储层, 查询层和产品层 数据来源层 存放着淘宝各店的交易数据 在数据源层产生的数据, 通过 DataX, DbSync 和 Timetunel 准实时的传输到下面第 2 点所述的 云梯 计算层 在这个计算层内, 淘宝采用的是 Hadoop 集群, 这个集群, 我们暂且称之为云梯, 是计算层的主要组成部分 在云梯上, 系统每天会对数据产品进行不同的 MapReduce 计算 114

121 大数据金融知识 存储层 在这一层, 淘宝采用了两个东西, 一个使 MyFox, 一个是 Prom MyFox 是基于 MySQL 的分布式关系型数据库的集群,Prom 是基于 Hadoop Hbase 技术的一个 NoSQL 的存储集群 查询层 在这一层中,Glider 是以 HTTP 协议对外提供 restful 方式的接口 数据产品通过一个唯一的 URL 来获取到它想要的数据 同时, 数据查询即是通过 MyFox 来查询的 最后一层是产品层, 这个就不用解释了 存储技术大数据可以抽象的分为大数据存储和大数据分析, 这两者的关系是 : 大数据存储的目的是支撑大数据分析 到目前为止, 还是两种截然不同的计算机技术领域 : 大数据存储致力于研发可以扩展至 PB 甚至 EB 级别的数据存储平台 ; 大数据分析关注在最短时间内处理大量不同类型的数据集 提到存储, 有一个着名的摩尔定律相信大家都听过 :18 个月集成电路的复杂性就增加一倍 所以, 存储器的成本大约每 个月就下降一半 成本的不断下降也造就了大数据的可存储性 比如,Google 大约管理着超过 50 万台服务器和 100 万块硬盘, 而且 Google 还在不断的扩大计算能力和存储能力, 其中很多的扩展都是基于在廉价服务器和普通存储硬盘的基础上进行的, 这大大降低了其服务成本, 因此可以将更多的资金投入到技术的研发当中 以 Amazon 举例,Amazon S3 是一种面向 Internet 的存储服务 该服务旨在让开发人员能更轻松的进行网络规模计算 Amazon S3 提供一个简明的 Web 服务界面, 用户可通过它随时在 Web 上的任何位置存储和检索的任意大 小的数据 此服务让所有开发人员都能访问同一个具备高扩展性 可靠性 安全性和快速价廉的基础设施,Amazon 用它来运行其全球的网站网络 再看看 S3 的设计指标 : 在特定年度内为数据元提供 % 的耐久性和 99.99% 的可用性, 并能够承受两个设施中的数据同时丢失 S3 很成功也确实卓有成效,S3 云的存储对象已达到万亿级别, 而且性能表现相当良好 S3 云已经拥万亿跨地域存储对象, 同时 AWS 的对象执行请求也达到百万的峰值数量 目前全球范围内已经有数以十万计的企业在通过 AWS 运行自己的全部或者部分日常业务 这些企业用户遍布 190 多个国家, 几乎世界上的每个角落都有 Amazon 用户的身影 感知技术大数据的采集和感知技术的发展是紧密联系的 以传感器技术, 指纹识别技术,RFID 技术, 坐标定位技术等为基础的感知能力提升同样是物联网发展的基石 全世界的工业设备 汽车 电表上有着无数的数码传感器, 随时测量和传递着有关位置 运动 震动 温度 湿度乃至空气中化学物质的变化, 都会产生海量的数据信息 而随着智能手机的普及, 感知技术可谓迎来了发展的高峰期, 除了地理位置信息被广泛的应用外, 一些新的感知手段也开始登上舞台, 比如, 最新的 iphone 5S 在 home 键内嵌指纹传感器, 新型手机可通过呼气直接检测燃烧脂肪量, 用于手机的嗅觉传感器面世可以监测从空气污染到危险的化学药品, 微软正在研发可感知用户当前心情智能手机技术, 谷歌眼镜 InSight 新技术可通过衣着进行人物识别 除此之外, 还有很多与感知相关的技术革 115

122 大数据金融信息剪辑 新让我们耳目一新 : 比如, 牙齿传感器实时监控口腔活动及饮食状况, 婴儿穿戴设备可用大数据去养育宝宝,Intel 正研发 3D 笔记本摄像头可追踪眼球读懂情绪, 日本公司开发新型可监控用户心率的纺织材料, 业界正在尝试将生物测定技术引入支付领域等 其实, 这些感知被逐渐捕获的过程就是就世界被数据化的过程, 一旦世界被完全数据化了, 那么世界的本质也就是信息了 就像一句名言所说, 人类以前延续的是文明, 现在传承的是信息 大数据的实践互联网的大数据互联网上的数据每年增长 50%, 每两年便将翻一番, 而目前世界上 90% 以上的数据是最近几年才产生的 据 IDC 预测, 到 2020 年全球将总共拥有 35ZB 的数据量 互联网是大数据发展的前哨阵地, 随着 WEB2.0 时代的发展, 人们似乎都习惯了将自己的生活通过网络进行数据化, 方便分享以及记录并回忆 互联网上的大数据很难清晰的界定分类界限, 我们先看看 BAT 的大数据 : 百度拥有两种类型的大数据 : 用户搜索表征的需求数据 ; 爬虫和阿拉丁获取的公共 web 数据 搜索巨头百度围绕数据而生 它对网页数据的爬取 网页内容的组织和解析, 通过语义分析对搜索需求的精准理解进而从海量数据中找准结果, 以及精准的搜索引擎关键字广告, 实质上就是一个数据的获取 组织 分析和挖掘的过程 搜索引擎在大数据时代面临的挑战有 : 更多的暗网数据 ; 更多的 WEB 化但是没有结构化的数据 ; 更多的 WEB 化 结构化但是封闭的数据 阿里巴巴拥有交易数据和信用数据 这两 种数据更容易变现, 挖掘出商业价值 除此之外阿里巴巴还通过投资等方式掌握了部分社交数据 移动数据 如微博和高德 腾讯拥有用户关系数据和基于此产生的社交数据 这些数据可以分析人们的生活和行为, 从里面挖掘出政治 社会 文化 商业 健康等领域的信息, 甚至预测未来 在信息技术更为发达的美国, 除了行业知名的类似 Google,Facebook 外, 已经涌现了很多大数据类型的公司, 它们专门经营数据产品, 比如 : Metamarkets: 这家公司对 Twitter 支付 签到和一些与互联网相关的问题进行了分析, 为客户提供了很好的数据分析支持 Tableau: 他们的精力主要集中于将海量数据以可视化的方式展现出来 Tableau 为数字媒体提供了一个新的展示数据的方式 他们提供了一个免费工具, 任何人在没有编程知识背景的情况下都能制造出数据专用图表 这个软件还能对数据进行分析, 并提供有价值的建议 ParAccel: 他们向美国执法机构提供了数据分析, 比如对 个有犯罪前科的人进行跟踪, 从而向执法机构提供了参考性较高的犯罪预测 他们是犯罪的预言者 QlikTech:QlikTech 旗下的 Qlikview 是一个商业智能领域的自主服务工具, 能够应用于科学研究和艺术等领域 为了帮助开发者对这些数据进行分析,QlikTech 提供了对原始数据进行可视化处理等功能的工具 GoodData:GoodData 希望帮助客户从数据中挖掘财富 这家创业公司主要面向商业用户和 IT 企业高管, 提供数据存储 性能报告 数据分析等工具 TellApart:TellApart 和电商公司进行合 116

123 大数据金融知识 作, 他们会根据用户的浏览行为等数据进行分析, 通过锁定潜在买家方式提高电商企业的收入 DataSift:DataSift 主要收集并分析社交网络媒体上的数据, 并帮助品牌公司掌握突发新闻的舆论点, 并制定有针对性的营销方案 这家公司还和 Twitter 有合作协议, 使得自己变成了行业中为数不多可以分析早期 tweet 的创业公司 Datahero: 公司的目标是将复杂的数据变得更加简单明了, 方便普通人去理解和想象 举了很多例子, 这里简要归纳一下, 在互联网大数据的典型代表性包括 : 用户行为数据 ( 精准广告投放 内容推荐 行为习惯和喜好分析 产品优化等 ) 用户消费数据 ( 精准营销 信用记录分析 活动促销 理财等 ) 用户地理位置数据 (O2O 推广, 商家推荐, 交友推荐等 ) 互联网金融数据 (P2P, 小额贷款, 支付, 信用, 供应链金融等 ) 用户社交等 UGC 数据 ( 趋势分析 流行元素分析 受欢迎程度分析 舆论监控分析 社会问题分析等 ) 政府的大数据近期, 奥巴马政府宣布投资 2 亿美元拉动大数据相关产业发展, 将 大数据战略 上升为国家意志 奥巴马政府将数据定义为 未来的新石油, 并表示一个国家拥有数据的规模 活性及解释运用的能力将成为综合国力的重要组成部分, 未来, 对数据的占有和控制甚至将成为陆权 海权 空权之外的另一种国家核心资产 在国内, 政府各个部门都握有构成社会 基础的原始数据, 比如, 气象数据, 金融数据, 信用数据, 电力数据, 煤气数据, 自来水数据, 道路交通数据, 客运数据, 安全刑事案件数据, 住房数据, 海关数据, 出入境数据, 旅游数据, 医疗数据, 教育数据, 环保数据等等 这些数据在每个政府部门里面看起来是单一的, 静态的 但是, 如果政府可以将这些数据关联起来, 并对这些数据进行有效的关联分析和统一管理, 这些数据必定将获得新生, 其价值是无法估量的 具体来说, 现在城市都在走向智能和智慧, 比如, 智能电网 智慧交通 智慧医疗 智慧环保 智慧城市, 这些都依托于大数据, 可以说大数据是智慧的核心能源 从国内整体投资规模来看, 到 2012 年底全国开建智慧城市的城市数超过 180 个, 通信网络和数据平台等基础设施建设投资规模接近 5000 亿元 十二五 期间智慧城市建设拉动的设备投资规模将达 1 万亿元人民币 大数据为智慧城市的各个领域提供决策支持 在城市规划方面, 通过对城市地理 气象等自然信息和经济 社会 文化 人口等人文社会信息的挖掘, 可以为城市规划提供决策, 强化城市管理服务的科学性和前瞻性 在交通管理方面, 通过对道路交通信息的实时挖掘, 能有效缓解交通拥堵, 并快速响应突发状况, 为城市交通的良性运转提供科学的决策依据 在舆情监控方面, 通过网络关键词搜索及语义智能分析, 能提高舆情分析的及时性 全面性, 全面掌握社情民意, 提高公共服务能力, 应对网络突发的公共事件, 打击违法犯罪 在安防与防灾领域, 通过大数据的挖掘, 可以及时发现人为或自然灾害 恐怖事件, 提高应急处理能力和安全防范能力 117

124 大数据金融信息剪辑 另外, 作为国家的管理者, 政府应该有勇气将手中的数据逐步开放, 供给更多有能力的机构组织或个人来分析并加以利用, 以加速造福人类 比如, 美国政府就筹建了一个 data.gov 网站, 这是奥巴马任期内的一个重要举措 : 要求政府公开透明, 而核心就是实现政府机构的数据公开 截止目前, 已经开放了有 个 datasets;349citizen-developed apps;137 mobile apps;175 agencies and subagencies; 87 galleries;295 Government APIs 企业的大数据企业的 CXO 们最关注的还是报表曲线的背后能有怎样的信息, 他该做怎样的决策, 其实这一切都需要通过数据来传递和支撑 在理想的世界中, 大数据是巨大的杠杆, 可以改变公司的影响力, 带来竞争差异 节省金钱 增加利润 愉悦买家 奖赏忠诚用户 将潜在客户转化为客户 增加吸引力 打败竞争对手 开拓用户群并创造市场 那么, 哪些传统企业最需要大数据服务呢? 抛砖引玉, 先举几个例子 :1) 对大量消费者提供产品或服务的企业 ( 精准营销 );2) 做小而美模式的中长尾企业 ( 服务转型 );3) 面临互联网压力之下必须转型的传统企业 ( 生死存亡 ) 对于企业的大数据, 还有一种预测 : 随着数据逐渐成为企业的一种资产, 数据产业会向传统企业的供应链模式发展, 最终形成 数据供应链 这里尤其有两个明显的现象:1) 外部数据的重要性日益超过内部数据 在互联互通的互联网时代, 单一企业的内部数据与整个互联网数据比较起来只是沧海一粟 ;2) 能提供包括数据供应 数据整合与加工 数据应用等多环节服务的公司会有明显的综合竞争优势 对于提供大数据服务的企业来说, 他们等待的是合作机会, 就像微软史密斯说的 : 给我提供一些数据, 我就能做一些改变 如果给我提供所有数据, 我就能拯救世界 然而, 一直做企业服务的巨头将优势不在, 不得不眼看新兴互联网企业加入战局, 开启残酷竞争模式 为何会出现这种局面? 从 IT 产业的发展来看, 第一代 IT 巨头大多是 ToB 的, 比如 IBM Microsoft Oracle SAP HP 这类传统 IT 企业 ; 第二代 IT 巨头大多是 ToC 的, 比如 Yahoo Google Amazon Facebook 这类互联网企业 大数据到来前, 这两类公司彼此之间基本是井水不犯河水 ; 但在当前这个大数据时代, 这两类公司已经开始直接竞争 比如 Amazon 已经开始提供云模式的数据仓库服务, 直接抢占 IBM Oracle 的市场 这个现象出现的本质原因是 : 在互联网巨头的带动下, 传统 IT 巨头的客户普遍开始从事电子商务业务, 正是由于客户进入了互联网, 所以传统 IT 巨头们不情愿地被拖入了互联网领域 如果他们不进入互联网, 他们业务必将萎缩 在进入互联网后, 他们又必须将云技术, 大数据等互联网最具有优势的技术通过封装打造成自己的产品再提供给企业 以 IBM 举例, 上一个十年, 他们抛弃了 PC, 成功转向了软件和服务, 而这次将远离服务与咨询, 更多地专注于因大数据分析软件而带来的全新业务增长点 IBM 执行总裁罗睿兰认为, 数据将成为一切行业当中决定胜负的根本因素, 最终数据将成为人类至关重要的自然资源 IBM 积极的提出了 大数据平台 架构 该平台的四大核心能力包括 Hadoop 系统 流计算 (StreamComputing) 数据仓库 (Data Warehouse) 和信息整合与治理 118

125 大数据金融知识 (Information Integration and Governance) IBM 大数据另外一家亟待通过云和大数据战略而复苏的巨头公司 HP 也推出了自己的产品 : HAVEn, 一个可以自由扩展伸缩的大数据解决方案 这个解决方案由 HP Autonomy HP Vertica HP ArcSight 和惠普运营管理 (HP OperationsManagement) 四大技术组成 还支持 Hadoop 这样通用的技术 HAVEn 不是一个软件平台, 而是一个生态环境 四大组成部分满足不同的应用场景需要,Autonomy 解决音视频识别的重要解决方案 ;Vertica 解决数据处理的速度和效率的方案 ;ArcSight 解决机器的记录信息处理, 帮助企业获得更高安全级别的管理 ; 运营管理解决的不仅仅是外部数据的处理, 而是包括了 IT 基础设施产生的数据 个人的大数据个人的大数据这个概念很少有人提及, 简单来说, 就是与个人相关联的各种有价值数据信息被有效采集后, 可由本人授权提供第三方进行处理和使用, 并获得第三方提供的数据服务 举个例子来说明会更清晰一些 : 未来, 每个用户可以在互联网上注册个人的数据中心, 以存储个人的大数据信息 用户可确定哪些个人数据可被采集, 并通过可穿戴设备或植入芯片等感知技术来采集捕获个人的大数据, 比如, 牙齿监控数据, 心率数据, 体温数据, 视力数据, 记忆能力, 地理位置信息, 社会关系数据, 运动数据, 饮食数据, 购 物数据等等 用户可以将其中的牙齿监测数据授权给 XX 牙科诊所使用, 由他们监控和使用这些数据, 进而为用户制定有效的牙齿防治和维护计划 ; 也可以将个人的运动数据授权提供给某运动健身机构, 由他们监测自己的身体运动机能, 并有针对的制定和调整个人的运动计划 ; 还可以将个人的消费数据授权给金融理财机构, 由他们帮你制定合理的理财计划并对收益进行预测 当然, 其中有一部分个人数据是无需个人授权即可提供给国家相关部门进行实时监控的, 比如罪案预防监控中心可以实时的监控本地区每个人的情绪和心理状态, 以预防自杀和犯罪的发生 以个人为中心的大数据有这么一些特性 : 数据仅留存在个人中心, 其它第三方机构只被授权使用 ( 数据有一定的使用期限 ), 且必须接受用后即焚的监管 采集个人数据应该明确分类, 除了国家立法明确要求接受监控的数据外, 其它类型数据都由用户自己决定是否被采集 数据的使用将只能由用户进行授权, 数据中心可帮助监控个人数据的整个生命周期 展望过于美好, 也许实现个人数据中心将遥遥无期, 也许这还不是解决个人数据隐私的最好方法, 也许业界对大数据的无限渴求会阻止数据个人中心的实现, 但是随着数据越来越多, 在缺乏监管之后, 必然会有一场激烈的博弈 : 到底是数据重要还是隐私重要 ; 是以商业为中心还是以个人为中心 来源 : 119

126 大数据金融信息剪辑 找不到数据?21 个你应该知道的大数据资源 数据无处不在 并且很多都是免费的 在开始大数据分析之前, 公司不一定要建立自己的大规模数据仓库 企业和政府将大量信息投入到公共领域的举措, 使得每个人都能够获得海量数据 迄今为止, 从大蓝筹企业到极小型创业公司, 都可以使用比以往更多的数据 下面描述的就是如今可以获得的, 一些好用同时免费的大数据来源 (1)Data.gov 美国政府去年承诺使所有政府数据都能在网上免费获得 这个网站是第一阶段, 作为一个门户网站, 囊括了从气候到犯罪的一切惊人的信息 (2) 美国人口普查局 一个关于美国公民生活的丰富信息, 包括人口数据, 地域数据以及教育 (3) 欧洲联盟数据开放门户 如上所述, 但它是基于欧洲联盟机构的数据 (4)Data.gov.uk 来自英国政府的数据, 包括 英国国家书 目 自 1950 以来所有的英国书籍以及出版物的元数据 (5) 中情局世界概况 the-world-factbook/ 267 个国家历史 人口 经济 政府 基础设施以及军事信息 (6)Healthdata.gov 年来美国的医疗保健数据, 包括索赔型医保数据, 流行病学和人口统计 (7)NHS 健康和社会保健信息中心 来自英国国民健康服务的健康状况数据集 (8)Amazon 网络服务公共数据集 巨型公共数据源, 包括 1000 个基因组工程, 试图建立最全面的人类遗传信息数据库和美国宇航局的卫星图像数据库 (9)Facebook Graph graph-api 120

127 大数据金融知识 虽然 Facebook 用户个人资料中的很多信息是私有的, 但很多也不是 Facebook 提供 Graph API 作为查询大量信息的一种方式, 它的用户很乐意与世界分享 ( 或者说是不能隐藏, 因为他们还没有制定如何设置隐私功能 ) (10)Gapminder 世界卫生组织和世界银行的数据集合, 包括世界各地的经济 医疗以及社会统计数据 (11)Google Trend 自 2004 年以来, 对所有关键字的搜索量 ( 作为总搜索的比例 ) 的数据统计 (12)Google 财经 40 年的股票市场数据, 并实时更新 (13)Google Books ngrams/books/datasetsv2.html 搜索和分析数以百万计的数字图书全文, 作为 Google 图书项目的一部分 (14) 国家气候数据中心 quick-links#loc-clim 从美国国家气候数据中心收集的环境 气象以及气候数据集 全球最大的天气数据存档 (15) 环境云 通过全国性环境监控传感器网络 ( 包括 PM2.5 等各类空气质量指标 土壤环境质量指标监测网络 ) 所采集的数据, 以及从权威数据源 ( 中国气象网 中央气象台 国家环保部数据中心 美国全球地震信息中心等 ) 获取的各类环境数据, 配合代码示例和详尽的接口使用说明, 免费提供可靠丰富的 气象 环境 灾害以及地理数据服务 (16)DBPedia 维基百科包含数以百万计的数据, 生活中每个事物的结构化和非结构化信息 DBpedia 的是一个用来分类的大型工程, 并创建了一个公共的, 免费发布的并允许任何人来分析这些数据的数据库 (17)Topsy 免费而全面的社交媒体数据是很难得到的 毕竟这些数据是为那些大玩家 (Facebook,Twitter 等 ) 产生利润的, 所以他们不想轻易送人 然而 Topsy 提供了一个可搜索回溯至 2006 年公共微博的数据库, 和现在一些用来分析会话的工具 (18)Likebutton 在全球范围内, 从你自己的网络中挖掘 Facebook 的公共数据, 来了解在某个时刻人们 喜欢 什么 (19)New York Times 纽约时报 可搜索的新闻文章的索引档案, 可以追溯到 1851 年 (20)Freebase 一个关于人, 地点和事物的结构化数据的社区数据库, 记录数超过 45 万个 (21) 百万歌曲数据集 datasets/ 超过一百万首歌曲和音乐作品的元数据 部分属于亚马逊网络服务 来源 : 121

128 大数据金融信息剪辑 除 Hadoop 外你还需要知道的 9 个大数据技术 Hadoop 是大数据领域最流行的技术, 但并非唯一 还有很多其他技术可用于解决大数据问题 除了 Apache Hadoop 外, 另外 9 个大数据技术也是必须要了解的 Apache Flink Apache SamzaGoogle Cloud Data Flow StreamSets Tensor Flow Apache NiFi Druid LinkedIn WhereHows Microsoft Cognitive Services Apache Flink: 是一个高效 分布式 基于 Java 实现的通用大数据分析引擎, 它具有分布式 MapReduce 一类平台的高效性 灵活性和扩展性以及并行数据库查询优化方案, 它支持批量和基于流的数据分析, 且提供了基于 Java 和 Scala 的 API 这是一种由社区驱动的分布式大数据分析开源框架, 类似于 Apache Hadoop 和 Apache Spark 它的引擎可借助数据流和内存中(in- memory) 处理与迭代操作改善性能 目前 Apache Flink 已成为一个顶级项目 (Top Level Project,TLP), 于 2014 年 4 月被纳入 Apache 孵化器, 目前在全球范围内有很多贡献者 Flink 受到了 MPP 数据库技术 (Declaratives Query Optimizer Parallel in-memory out-of-core 算法 ) 和 Hadoop MapReduce 技术 (Massive scale out, User Defined functions, Schema on Read) 的启发, 有很多独特功能 (Streaming, Iterations, Dataflow, General API) 详细了解 Apache Samza: 是一个开源 分布式的 122

129 大数据金融知识 流处理框架, 它使用开源分布式消息处理系统 Apache Kafka 来实现消息服务, 并使用资源管理器 Apache Hadoop Yarn 实现容错处理 处理器隔离 安全性和资源管理 该技术由 LinkedIn 开发, 最初目的是为了解决 Apache Kafka 在扩展能力方面存在的问题, 包含诸如 Simple API Managed state Fault Tolerant Durable messaging Scalable Extensible, 以及 Processor Isolation 等功能 Samza 的代码可作为 Yarn 作业运行, 还可以实施 StreamTask 接口, 借此定义 process() 调用 StreamTask 可以在任务实例内部运行, 其本身也位于一个 Yarn 容器内 详细了解 Cloud Dataflow:Dataflow 是一种原生的 Google Cloud 数据处理服务, 是一种构建 管理和优化复杂数据流水线的方法, 用于构建移动应用, 调试 追踪和监控产品级云应用 它采用了 Google 内部的技术 Flume 和 MillWhell, 其中 Flume 用于数据的高效并行化处理, 而 MillWhell 则用于互联网级别的带有很好容错机制的流处理 该技术提供了简单的编程模型, 可用于批处理和流式数据的处理任务 该技术提供的数据流管理服务可控制数据处理作业的执行, 数据处理作业可使用 Data Flow SDK(Apache Beam) 创 建 Google Data Flow 为数据相关的任务提供了管理 监视和安全能力 Sources 和 Sink 可在管线中抽象地执行读写操作, 管线封装而成的整个计算序列可以接受外部来源的某些输入数据, 通过对数据进行转换生成一定的输出数据 了解详情 StreamSets:StreamSets 是一种专门针对传输中数据进行过优化的数据处理平台, 提供了可视化数据流创建模型, 通过开源的方式发行 该技术可部署在内部环境或云中, 提供了丰富的监视和管理界面 数据收集器可使用数据管线实时地流式传输并处理数据, 管线描述了数据从源头到最终目标的流动方式, 可包含来源 目标, 以及处理程序 数据收集器的生命周期可通过管理控制台进行控制 了解详情 TensorFlow: 是继 DistBelief 之后的第二代机器学习系统 TensorFlow 源自 Google 旗下的 Google Brain 项目, 主要目标在于为 Google 全公 123

130 大数据金融信息剪辑 司的不同产品和服务应用各种类型的神经网络机 数值运算 图谱中的节点代表数值运算 边缘代 器学习能力 表负责在节点之间进行通信的多维数据阵列 张 支持分布式计算的TensorFlow能够使用户在 量 Tensor 边缘还描述了节点之间的输入/输 自己的机器学习基础结构中训练分布式模型 该 出关系 TensorFlow 这个名称蕴含了张量在 系统以高性能的gRPC数据库为支撑 与最近发布 图谱上流动的含义 了解详情 的Google云机器学习系统互补 使用户能够利用 Druid Druid是一个用于大数据实时查询和 Google云平台 对TensorFlow模型进行训练并提 分析的高容错 高性能开源分布式系统 旨在快 供服务 速处理大规模的数据 并能够实现快速查询和分 这是一种开源软件库 可使用数据流图 析 诞生于2011年 包含诸如驱动交互式数据应 谱 data flow graph 进行数值运算 这种技 用程序 多租户 大量并发用户 扩展能力 每 术已被包括DeepDream RankBrain Smart 天上万亿事件 次秒级查询 实时分析等功能 Replyused在内的各种Google项目所使用 Druid还包含一些特殊的重要功能 例如低延迟数 据摄入 快速聚合 任意切割能力 高可用性 近似计算与精确计算等 创建Druid的最初意图主要是为了解决查询延 迟问题 当时试图使用Hadoop来实现交互式查询 分析 但是很难满足实时分析的需要 而Druid提 供了以交互方式访问数据的能力 并权衡了查询 的灵活性和性能而采取了特殊的存储格式 该技术还提供了其他实用功能 例如实时节 点 历史节点 Broker节点 Coordinator节点 使用基于JSON查询语言的索引服务 了解详情 数据流图谱使用由节点 Node 和边缘 Apache NiFi Apache NiFi是一套强大可靠 Edge 组成的有向图 Directed graph 描述 的数据处理和分发系统 可用于对数据的流转和 124

131 大数据金融知识 转换创建有向图 借助该系统可以用图形界面创 建 监视 控制数据流 有丰富的配置选项可供 该工具为数据发现提供了Web界面 支 使用 可在运行时修改数据流 动态创建数据分 持API的后端服务器负责控制元数据的爬网 区 此外还可以对数据在整个系统内的流动进行 Crawling 以及与其他系统的集成 了解详情 数据起源跟踪 通过开发自定义组件 还可轻松 对其进行扩展 Microsoft Cognitive Services 该技术源 自Project Oxford和Bing 提供了22种认知计 算API 主要分类包括 视觉 语音 语言 知识 以及搜索 该技术已集成于Cortana Intelligence Suite Apache NiFi的运转离不开诸如FlowFile Processor 以及Connection等概念 了解详情 LinkedIn WhereHows WhereHows提供带 元数据搜索的企业编录 Enterprise catalog 这是一种开源技术 提供了22种不同的认 可以让您了解数据存储在哪里 是如何保存到那 知计算REST API 并为开发者提供了适用于 里的 该工具可提供协作 数据血统分析等功 Windows IOS Android以及Python的SDK 能 并可连接至多种数据源和提取 加载和转换 ETL 工具 来源 125

132 大数据金融信息剪辑 中文文献 : 大数据背景下互联网金融对中小企业融资影响研究 作者 郑志来 ; 机构 盐城师范学院商学院 ; 摘要 互联网金融模式创新, 主要体现在大数据互联网金融公司 第三方支付平台 P2P 互联网借贷平台 众 筹互联网融资平台和互联网金融门户平台 互联网金融对中小企业融资影响主要体现在四方面 : 即对传统金融机构倒逼机制 ; 中小企业融资对象更加全面 科学 ; 中小企业融资服务更有针对性 ; 中小企业的融资成本 显著下降 关键词 大数据 ; 互联网金融 ; 中小企业 ; 融资 ; 所属期刊栏目 互联网金融 (2014 年 11 期 ) 大数据 互联网金融与信用资本 : 破解小微企业融资悖论 作者 黄子健 ; 王龑 ; A u t h o r H u a n g Zijian;Wang Yan;School of Finance,Xinjiang University of Finance and Economics; 机构 新疆财经大学金融学院 ; 摘要 通过构建互联网金融三部门信贷模型体系, 分析得到互联网金融模 式凭借大数据创造的 信用资本 和 信用抵押, 可以破解融资悖论, 消除信贷市场中的逆向选择和道德风险, 达到一个 良性循环 的共赢局面 为保障互联网金融模式的有效应用, 进一步分析了其风险控制, 指出可以采取 集约投保 + 集团承保 的信贷保险模式 最 后, 结合上海公共信息平台的启示, 提出搭建一个 信用信息信贷平台 的设想 关键词 大数据 ; 互联网金融 ; 信用资本 ; 小微企业融资悖论 ; 基金 新疆自治区研究生科研创新项目 (XJCX ) 126

133 文献传递 建立产学研合作高端服务平台推动大数据金融产业创新发展 作者 唐浩增 ; 机构 中国大数据金融产业创新战略联盟 ; 金电联行 ( 北京 ) 信息技术有限公司 ; 摘要 < 正 > 为贯彻落实国务院 促进大数据发展行动纲要 的精神, 发挥大数据在我国经济转型升级中的新引擎作用, 推动我国大数据金融产业的创新与发展, 在中国产学研合作促进会指导下, 由中国投资协会 贵阳互联网金融特区管理委员会 金电联行 ( 北京 ) 信息技术有限公司 中国标准化研究院 中央财经大学中国互联网经济研究院等 50 余家单位共同发起成立了 " 中国大数据金融产业创新战略联盟 "( 简称联盟 ) 关键词 金融产业 ; 互联网经济 ; 中国标准化 ; 联行 ; 引擎作用 ; 信息技术 ; 现代经济 ; 著名研究机构 ; 金融机构体系 ; 联盟标准 ; 所属期刊栏目 大数据 (2016 年 02 期 ) 打造大数据金融五大平台 作者 钟红涛 ; 徐福洲 ; 机构 湖北省联社 ; 摘要 < 正 > 大数据时代, 农信社应有效整合来自各方面的海量数据, 为科学决策和转型发展提供强力支撑数据是银行支持精细化管理 实现差异化服务 加强业务创新 提升风险分析能力的基础 近年来, 随着云计算等大数据技 术应用的日益深入, 互联网金融快速崛起, 给传统银行业的发展环境带来巨大变革 农信社 ( 含农商行 ) 作为农村中小金融机构, 面对的客户群体小 微 散, 如何运用大数据技术推进经营转型 加快业务发展, 布局大数据时代, 已成为农信社当前面临的重要课题 关键词 互联网产业 ; 经营转型 ; 差异化服务 ; 农商行 ; 风险分析 ; 经济资本管理 ; 中小金融机构 ; 信息技术 ; 操作风险 ; 内部评级 ; 所属期刊栏目 封面专题 _ 农信大数据的掘金之路 _ 观潮 (2015 年 02 期 ) 127

134 大数据金融信息剪辑 基于互联网金融平台的大数据挖掘研究 作者 董喆 ; 机构 山东英才学院 ; 摘要 十年前, 互联网和金融还是两个没有关系的领域 今天互联网企业已经开始大举进军金融领域, 打破了传统金融寡头的垄断格局 第三方支付 移动支付 众筹融资 P2P 网络信贷 供应链融资服务 互联网理财 保险等 多种互联网金融服务模式如雨后春笋般迅速成长起来 根据银监会的数据,2008 年 年, 国有大型银行的市场份额从 52% 下降到 42%,5 年里下降了 10%, 可以说互联网金融时代真正到来了 马云在 2012 年网商大会上鲜明地指出互联网金融未来的战略是围绕平台 金融 大数据展开 平 台汇聚大数据, 大数据衍生金融, 金融反哺平台 本文主要研究在互联网金融背景下, 我们该如何利用互联网带来的海量数据来帮助新形势下金融服务业创造更多的商业价值 关键词 互联网金融 ; 大数据 ; 融资 ; 所属期刊栏目 财经纵横 (2014 年 22 期 ) 大数据金融对理财产品的几点重要影响 作者 朱树豪 ; 机构 南京大学金陵学院 ; 摘要 本文从大数据的兴起出发, 谈到大数据金融的产生, 继而结合目前金融机构以及互联网金融平台在理财产品创新方面的几点成果, 主要 讨论了大数据金融对理财产品在交易成本 产品推广以及创新理念三个方面的重要影响 在交易成本方面, 我主要讨论了分布式金融服务系统 ; 在产品推广方面, 我突出了个性化信息推荐技术 ; 在创新理念方面, 我介绍了大数据对技术创新理 论的巨大贡献, 大数据金融的两个主要创新模式 平台金融和供应链金融 关键词 大数据 ; 大数据金融 ; 理财产品 ; 创新 ; 所属期刊栏目 投资理财 (2016 年 16 期 ) 128

135 文献传递 大数据背景下金融消费者信息权益保护浅析 作者 江小慧 ; 机构 中国建设银行龙岩分行 ; 摘要 商业银行天然具有数据属性, 大数据在为商业银行的经营管理提供充分的信息支持的同时, 也将大大增 加商业银行客户信息泄露的风险 大数据时代金融消费者信息权益保护工作面临着风险识别 信息安全保护 信息欺诈等方面的挑战, 为此商业银行要建立风险预警平台, 构筑支付防火墙, 完善数据运用机 制, 加强公众教育宣传 关键词 大数据金融 ; 金融消费者信息保护 ; 商业银行 ; 所属期刊栏目 金融实务 _ 金融消费者保护 (2016 年 01 期 ) 大数据金融时代中个人信用评估模型优化设计 作者 王蓓蓓 ; 胡迪 ; 舒鑫 ; 凡皓 ; 机构 东南大学 ; 摘要 大数据征信是现代金融发展的核心, 结合大数据理念建立和完善个人信用 评估模型, 对于分析和把握信用风险意义重大 因此, 本文针对大数据金融时代中个人信用评估模型的优化设计展开研究, 建立并优化了 BP 神经网络模型, 并就完善大数据时代中 个人信用评估制度提出了意见和建议 关键词 大数据金融 ; 个人信用 ; BP 神经网络模型 ; 所属期刊栏目 人力资源 (2016 年 09 期 ) 从哲学和管理角度探问大数据金融 作者 唐浩增 ; 机构 中国大数据金融产业创新战略联盟 ; 摘要 随着我国大数据金融产业技术升级换代快 转化周期短的发展趋势, 大数据金融产业的整体核心竞争力, 已不是技术的单一成分了, 还 要把文化理念 相关资源 专业能力 经营模式 组织管理等若干组成部分联接起来 为此, 我从哲学和管理的角度, 辅以实际案例, 就如何在大数据金融产业创新战略联盟的大平台下, 促进大数据金融产业健康发展, 略谈管见 关键词 金融产业 ; 古希腊数学 ; 产业技术升级 ; 毕达哥拉斯 ; 组织管理 ; 信用评价 ; 金融业务 ; 互联网经济 ; 中国标准化 ; 联盟标准 ; 所属期刊栏目 论坛 (2016 年 07 期 ) 129

136 大数据金融信息剪辑 互联网金融模式研究 以大数据金融为例 作者 郝恩成 ; 机构 南昌大学经济管理学院 ; 摘要 利用大数据的理念, 深入剖析了目前主流互联网金融模式, 研究认为大数据 是互联网金融模式的灵魂, 互联网金融具有独特的优势, 它激活了长尾市场 降低了交易成本 实现了普惠金融和信息对称性等, 是未来金融发展的方向 更多还原 关键词 互联网金融模式 ; 大数据 ; 大数据金融 ; 所属期刊栏目 金融商务 (2016 年 06 期 ) 大数据时代我国平台金融的发展趋势研究 作者 彭明威 ; 机构 武汉工程大学法商学院 ; 摘要 近年来, 以云计算和大数据为基础结合金融衍生而来的 " 互联网金融 ", 倒逼着银行的传统运营模式改革, 同时众多互联网电商巨头纷纷 乘势而上, 积极发展互联网平台金融 由于平台金融在我国发展时间不长, 存在大数据金融人才匮乏 驾驭大数据能力差等诸多问题, 伴随着大数据技术的成熟, 问题将会得到改善 本文就政府如何推动平台金融的发展, 及探究平台金融 发展趋势 关键词 平台金融 ; 大数据金融 ; 大数据 +; 互联网金融 ; 所属期刊栏目 财金投资 (2015 年 11 期 ) 130

137 文献传递 外文文献 : Big Data Analytics and Revision of the Common Rule Jacob Metcalf BIG DATA IS a major technical advance in terms of computing expense, speed, and capacity. But it is also an epistemic shift wherein data is seen as infinitely networkable, indefinitely reusable, and significantly divorced from the context of collection. 1,7 The statutory definitions of human subjects and research are not easily applicable to big data research involving sensitive human data. Many of the familiar norms and regulations of research ethics formulated to prior paradigms of research risks and harms, and thus the formal triggers for ethics review are miscalibrated. We need to reevaluate longstanding assumptions of research ethics in light of the emergence of big data analytics.6,10,13 JULY 2016 VOL. 59 NO. 7 COMMUNICATIONS OF THE ACM 131

138 大数据金融信息剪辑 Drug repositioning in SLE: crowd-sourcing, literaturemining and Big Data analysis AC Grammer1, MM Ryals1, SE Heuer1, RD Robl1, S Madamanchi1, LS Davis2, B Lauwerys3, MD Catalina1 and PE Lipsky1 1AMPEL BioSolutions and RILITE Foundation, University of Virginia Research Park, Charlottesville, VA, USA; 2Department of Internal Medicine, UTSW Medical Center at Dallas, Dallas, TX, USA; and 3Universite Catholique de Louvain, Brussels, Belgium Abstract: Lupus patients are in need of modern drugs to treat specific manifestations of their disease effectively and safely. In the past half century, only one new treatment has been approved by the US Food and Drug Administration (FDA) for systemic lupus erythematosus (SLE). In , the FDA approved 71 new drugs, only one of which targeted a rheumatic disease and none of which was approved for use in SLE. Repositioning/repurposing drugs approved for other diseases using multiple approaches is one possible means to find new treatment options for lupus patients. Big Data analysis approaches this challenge from an unbiased standpoint whereas literature mining and crowd sourcing for candidates assessed by the CoLTs (Combined Lupus Treatment Scoring) system provide a hypothesis-based approach to rank potential therapeutic candidates for possible clinical application. Both approaches mitigate risk since the candidates assessed have largely been extensively tested in clinical trials for other indications. The usefulness of a multi-pronged approach to drug repositioning in lupus is highlighted by orthogonal confirmation of hypothesis-based drug repositioning predictions by Big Data analysis of differentially expressed genes from lupus patient samples. The goal is to identify novel therapies that have the potential to affect disease processes specifically. Involvement of SLE patients and the scientists that study this disease in thinking about new drugs that may be effective in lupus though crowd-sourcing sites such as LRxL-STAT ( is important in stimulating the momentum needed to test these novel drug targets for efficacy in lupus rapidly in small, proof-of-concept trials conducted by LuCIN, the Lupus Clinical Investigators Network ( lucinstat). Lupus (2016) 25, Key words: LRxL-STAT; LuCIN; drug repurposing; drug repositioning; Stelara; ustekinumab; IL12; IL23; quinacrine; krill oil; HSCT; stem cells; meditation; mindfulness; ruxolitinib; tofacitinib; JAK; MEDI-7169; IL21; secukinumab; IL17 Lupus (2016) 25,

139 文献传递 How Does National Scientific Funding Support Emerging Interdisciplinary Research: A Comparison Study of Big Data Research in the US and China Ying Huang1, Yi Zhang1,2, Jan Youtie3, Alan L. Porter4, Xuefeng Wang1* 1 School of Management and Economics, Beijing Institute of Technology, Beijing, , China, 2 Centre for Quantum Computation and Intelligent Systems, Faculty of Engineering and Information Technology, University of Technology, Sydney, NSW 2007, Australia, 3 Enterprise Innovation Institute, Georgia Institute of Technology, Atlanta, GA, 30332, United States of America, 4 School of Public Policy, Georgia Institute of Technology, Atlanta, GA, 30332, United States of America Abstract How do funding agencies ramp-up their capabilities to support research in a rapidly emerging area? This paper addresses this question through a comparison of research proposals awarded by the US National Science Foundation (NSF) and the National Natural Science Foundation of China (NSFC) in the field of Big Data. Big data is characterized by its size and difficulties in capturing, curating, managing and processing it in reasonable periods of time. Although Big Data has its legacy in longstanding information technology research, the field grew very rapidly over a short period.we find that the extent of interdisciplinarity is a key aspect in how these funding agencies address the rise of Big Data. Our results show that both agencies have been able to marshal funding to support Big Data research in multiple areas, but the NSF relies to a greater extent on multi-program funding from different fields. We discuss how these interdisciplinary approaches reflect the research hot-spots and innovation pathways in these two countries. PLOS ONE DOI: /journal.pone May 24, /

140 大数据金融信息剪辑 Infrastructure planning and topology optimization for reliable mobile big data transmission under cloud radio access networks Xiang Hou, Bin Lin, Rongxi He* and Xudong Wang Abstract With the development of user-centered and environment sensing technology of 5G, large capacity and ubiquitous coverage and massive data collection and processing will bring new challenges in wireless networks. The cloud radio access network (C-RAN) has been envisioned to provide a new wireless architecture for reliable transmission of mobile big data. In this paper, we focus on network planning deployment issue based on the optical mixed diet (OMD) technology. Specifically, the ring and spur topology optimization (RSTO) problem under the C-RAN architecture is investigated. The RSTO problem is formulated as a generic integer linear program (ILP) which can optimally (i) minimize the network deploying cost; (ii) identify the locations of Remote Radio Units (RRUs) and optical add-drop multiplexers (OADMs); (iii) identify the association relations between RRUs and OADMs; and (iv) satisfy the mobile coverage requirements so as to allow the mobile big data to be transmitted through the RRUs. We propose a new heuristic algorithm based on C-RAN architecture. Numerical results validate the ILP formulation and show the performance benefits of the proposed algorithm in terms of efficiency and effectiveness against Gurobi, which is an ILP solver. In numerical studies, we also demonstrate the performance benefits of the incorporation of CoMP technology in terms of total deployment cost reduction. Keywords: Mobile big data, C-RAN, Integer linear program (ILP), Heuristic algorithm Hou et al. EURASIP Journal on Wireless Communications and Networking (2016) 2016:

141 文献传递 新书推荐 : ISBN: 作者 :[ 美 ] 米歇尔 钱伯斯, 托马斯 W. 迪斯莫尔著译者 : 韩光辉孙丽军等译定价 :69.00 出版时间 :2016/07 内容简介 : 随着大数据时代的来临, 越来越多的企业期望通过对大数据进行深入分析来为其创造更大的商业价值 大数据商业价值的实现依靠企业大数据战略 人才 组织 技术的完美结合, 本书向读者勾画了一幅大数据全图, 任何企业都可以在本书的指导下实践大数据战略, 定制适合自己的大数据分析路线图, 从大数据中获得更多价值 135

142 大数据金融信息剪辑 附件 1: 外文文献全文 Vviewpoints DOI: / Computing Ethics Big Data Analytics and Revision of the Common Rule Reconsidering traditional research ethics given the emergence of big data analytics. Jacob Metcalf IMAGE BY ANDREW OSTROVSKY BIG DATA IS a major technical advance in terms of computing expense, speed, and capacity. But it is also an epistemic shift wherein data is seen as infinitely networkable, indefinitely reusable, and significantly divorced from the context of collection. 1,7 The statutory definitions of human subjects and research are not easily applicable to big data research involving sensitive human data. Many of the familiar norms and regulations of research ethics formulated to prior paradigms of research risks and harms, and thus the formal triggers for ethics review are miscalibrated. We need to reevaluate longstanding assumptions of research ethics in light of the emergence of big data analytics. 6,10,13 The U.S. Department of Health and Human Services (HHS) released a Notice of Proposed Rule-Making (NPRM) in September 2015 regarding proposed major revisions (the first in three decades) to the research ethics regulations known as the Common Rule. a The proposed changes grapple with the consequences of big data, such as informed consent for biobanking and universal standards for privacy protection. The Common Rule a So named for its common application across signatory federal agencies. does not apply to industry research, and some big data science in universities might not fall under its purview, but the Common Rule addresses the burgeoning uses of big data by setting the tone and agenda for research ethics in many spheres. The NSF-supported Council for Big Data, Ethics and Society b has focused on the consequences these proposed changes for big data, including data science and analytics. 9 There is reason b See for concern that the rules as drafted in NPRM may muddle attempts to identify and promulgate responsible data science research practices. Is Biomedicine the Ethical Baseline? The Common Rule was instituted in It mandates federally funded research projects involving human subjects to receive prior, independent ethics review before commencing. Most projects go through Institutional Review Boards (IRB) 3 responsible for JULY 2016 VOL. 59 NO. 7 COMMUNICATIONS OF THE ACM

143 文献传递 viewpoints INTERACTIONS ACM s Interactions magazine explores critical relationships between people and technology, showcasing emerging innovations and industry leaders from around the world across important applications of design thinking and the broadening field of interaction design. Our readers represent a growing community of practice that is of increasing and vital global importance. To learn more about us, visit our award-winning website Follow us on Facebook and Twitter To subscribe: Association for Computing Machinery researchers due diligence in identifying and ameliorating potential physiological, psychological, and informational harms to human subjects. The Common Rule grew out of a regulatory process initiated by the 1974 National Research Act, a response to public scandals in medical and psychological research, including the Nuremberg Doctors Trial, the Tuskegee syphilis study, and Milgram experiment on obedience to authority figures. The Act led to a commission on humansubjects research ethics that produced the Belmont Report (1979). The Belmont authors insisted that certain core philosophical principles must guide research involving human subjects: respect for persons, beneficence, and justice. The HHS developed the specific regulations in the Common Rule as an instantiation of those principles. 12 Importantly, the Belmont authors understood that not all activities that produce knowledge or intervene in human lives are research, and not all research about humans is sensitive or personal enough to be about human subjects. To delimit human-subjects research within biomedicine, the Belmont commission considered the boundaries between biomedical and behavioral research and the accepted and routine practice of medicine. 12 This boundary reflects the ethical difficulties posed by unique social roles of physician-researchers who are responsible for both patient health and societal well-being fostered by research knowledge. This unique role creates ethical dilemmas that are often not reflected in other disciplines. Research defined by the Belmont Report is, an activity designed to test an hypothesis, permit conclusions to be drawn, and thereby to develop or contribute to generalizable knowledge. Practice is, interventions that are designed solely to enhance the well-being of an individual patient or client and that have a reasonable expectation of success. 12 Not surprisingly, the first draft of the Common Rule came under attack from social scientists for lumping together all forms of human-subjects research under a single set of regulations that reflect the peculiarities of biomedical research. 2 Not all research has the same risks and norms as biomedicine. A single set of rules might snuff out legitimate lines of inquiry, even those dedicated to social justice ends. The HHS responded by creating an Exempt category that allowed human-subjects research with minimal risk to receive expedited ethics review. Nevertheless, there has remained a low-simmering conflict between social scientists and IRBs. This sets the stage for debates over regulating research involving big data. For example, in her analysis of the Facebook emotional contagion controversy, Michelle Meyer argues that big data research, especially algorithmic A/B testing without clear temporal boundaries or hypotheses, clouds the distinction between practice and research. 8,11 Jacob Metcalf and Kate Crawford agree this mismatch exists, but argue that core norms of humansubjects research regulations can still be applied to big data research. 10 Big Data and the Common Rule Revisions The Common Rule has typically not been applied to the core disciplines of big data (computing, mathematics, and statistics) because these disciplines are assumed to be conducting research on systems, not people. Yet big data has brought these disciplines into much closer intellectual and economic contact with sensitive human data, opening discussion about how the Common Rule applies. The assumptions behind NPRM leaving big data science out of its purview are empirically suspect. Excluded A New Category Complaints about inconsistent application of the exempt category have prompted HHS to propose a new category of excluded that would automatically receive no ethical review due to inherently low risk to human subjects (.101(b)(2)). Of particular interest is exclusion of: research involving the collection or study of information that has been or will be acquired solely for non-research activities, or was acquired for research studies other than the proposed research study when the sources are publicly available, or the information is recorded by the investigator in such a manner that human subjects cannot be identified, directly or through identifiers linked to 32 COMMUNICATIONS OF THE ACM JULY 2016 VOL. 59 NO

144 大数据金融信息剪辑 viewpoints The contentious history of the Common Rule is due in part to its influence on the tone and agenda of research ethics even outside of its formal purview. the subjects, the investigator does not contact the subjects, and the investigator will not re-identify subjects or otherwise conduct an analysis that could lead to creating individually identifiable private information. (.101(b)(2)(ii)) 4 These types of research in the context of big data present different risk profiles depending on the contents and what is done with the dataset. Yet they are excluded based on the assumption that their status (public, private, preexisting, de-identified, and so forth) is an adequate proxy for risk. The proposal to create an excluded category is driven by frustrations of social and other scientists who use data already in the public sphere or in the hands of corporations to whom users turn over mountains of useful data. Notably, social scientists have pushed to define public datasets such that it includes datasets that can be purchased. 2 The power and peril of big data research is that large datasets can theoretically be correlated with other large datasets in novel contexts to produce unforeseeable insights. Algorithms might find unexpected correlations and generate predictions as a possible source of poorly understood harms. Exclusion would eliminate ethical review to address such risks. Public and private are used in the NPRM in ways that leave this regulatory gap open. Public modifies datasets, describing access or availability. Private modifies information or data describing a reasonable subject s expectations about sensitivity. Yet publicly available datasets containing private data are among the most interesting to researchers and most risky to subjects. For example, a recent study by Hauge et al. 5 used geographic profiling techniques and public datasets to (allegedly) identify the pseudonymous artist Banksy. The study underwent ethics review, and was (likely) permitted because it used public datasets, despite its intense focus on the private information of individual subjects. 5 This discrepancy is made possible by the anachronistic assumption that any informational harm has already been done by a public dataset. That the NPRM explicitly cites this assumption as a justification to a priori exclude increasingly prominent big data research methods is highly problematic. Perhaps academic researchers should have relaxed access to maintain parity with industry or further scientific knowledge. But the Common Rule should not allow that de facto under the guise of empirically weak claims about the risks posed by public datasets. The Common Rule might rightfully exclude big data research methods from its purview, but it should do so explicitly and not muddle attempts to moderate the risks posed by declaring public data inherently low risk. Exempt An Expanded Category The NPRM also proposes to expand the Exempt category (minimal review largely conducted through an online portal) to include secondary research using datasets containing identifiable information collected for non-research purposes. All such research would be exempt as long as subjects were given prior notice and the datasets are to be used only in the fashion identified by the requestor (.104(e)(2)). The NPRM does not propose to set a minimum bar for adequate notice. This can be reasonable given the high standard of informed consent is intended primarily for medical research, and can be an unreasonable burden in the social sciences. However, to default to end user license agreements (EULA) poses too low a bar. Setting new rules for the exempt category should not be a de facto settlement of this open debate. Explicit guidelines and processes for future inquiry and revised regulations are warranted. Conclusion The NPRM improves the Common Rule s application to big data research, but portions of the NPRM with consequences for big data research rest on dated assumptions. The contentious history of the Common Rule is due in part to its influence on the tone and agenda of research ethics even outside of its formal purview. This rare opportunity for significant revisions should not cement problematic assumptions into the discourse of ethics in big data research. References 1. boyd, d. and Crawford, K. Critical questions for big data. Information, Communication & Society 15, 5 (2012), Committee on Revisions to the Common Rule for the Protection of, Board on Behavioral, Cognitive, and Sensory Sciences, Committee on National Statistics, et al. Proposed Revisions to the Common Rule for the Protection of Human Subjects in the Behavioral and Social Sciences, 2014; read/18614/chapter/1. 3. Department of Health and Human Services Code of Federal Regulations Title 45 Public Welfare, Part 46 Protection of Human Subjects. 45 Code of Federal Regulations 46, 2009; humansubjects/guidance/45cfr46.html. 4. Department of Health and Human Services. Notice of Proposed Rule Making: Federal Policy for the Protection of Human Subjects. Federal Register, 2015; pdf/ pdf. 5. Hauge, M.V. et al. Tagging Banksy: Using geographic profiling to investigate a modern art mystery. Journal of Spatial Science (2016): King, J.L. Humans in computing: Growing responsibilities for researchers. Commun. 58, 3 (Mar. 2015), Kitchin, R. Big data, new epistemologies and paradigm shifts. Big Data & Society 1, 1 (2014). 8. Kramer, A., Guillory, J., and Hancock, J. Experimental evidence of massive-scale emotional contagion through social networks. In Proceedings of the National Academy of Sciences 111, 24 (2014), Metcalf, J. Letter on Proposed Changes to the Common Rule. Council for Big Data, Ethics, and Society (2016); letter-on-proposed-changes-to-the-common-rule/. 10. Metcalf, J. and Crawford, K. Where are human subjects in big data research? The emerging ethics divide. Big Data & Society 3, 1 (2016), Meyer, M.N. Two cheers for corporate experimentation: The a/b illusion and the virtues of data-driven innovation. Colorado Technology Law Journal 13, 273 (2015). 12. National Commission for the Protection of Human Subjects, of Biomedical and Behavioral Research and The National Commission for the Protection of Human Subjects (1979) The Belmont Report: Ethical Principles and Guidelines for the Protection of Human Subjects of Research; humansubjects/guidance/belmont.html. 13. Zwitter, A. Big data ethics. Big Data & Society 1, 2 (2014). Jacob Metcalf (jake.metcalf@gmail.com) is a Researcher at the Data & Society Research Institute, and Founding Partner at the ethics consulting firm Ethical Resolve. This work is supported in part by National Science Foundation award # See J. Metcalf Letter on Proposed Changes to the Common Rule. Council for Big Data, Ethics, and Society (2016) 9 for the public comment on revisions to the Common Rule published collectively by the Council for Big Data, Ethics and Society. This column represents only the author s opinion. Copyright held by author. JULY 2016 VOL. 59 NO. 7 COMMUNICATIONS OF THE ACM

145 文献传递 Copyright of Communications of the ACM is the property of Association for Computing Machinery and its content may not be copied or ed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or articles for individual use. 139

146 大数据金融信息剪辑 Lupus (2016) 25, SPECIAL ARTICLE Drug repositioning in SLE: crowd-sourcing, literature-mining and Big Data analysis AC Grammer 1, MM Ryals 1, SE Heuer 1, RD Robl 1, S Madamanchi 1, LS Davis 2, B Lauwerys 3, MD Catalina 1 and PE Lipsky 1 1 AMPEL BioSolutions and RILITE Foundation, University of Virginia Research Park, Charlottesville, VA, USA; 2 Department of Internal Medicine, UTSW Medical Center at Dallas, Dallas, TX, USA; and 3 Universite Catholique de Louvain, Brussels, Belgium Lupus patients are in need of modern drugs to treat specific manifestations of their disease effectively and safely. In the past half century, only one new treatment has been approved by the US Food and Drug Administration (FDA) for systemic lupus erythematosus (SLE). In , the FDA approved 71 new drugs, only one of which targeted a rheumatic disease and none of which was approved for use in SLE. Repositioning/repurposing drugs approved for other diseases using multiple approaches is one possible means to find new treatment options for lupus patients. Big Data analysis approaches this challenge from an unbiased standpoint whereas literature mining and crowd sourcing for candidates assessed by the CoLTs (Combined Lupus Treatment Scoring) system provide a hypothesis-based approach to rank potential therapeutic candidates for possible clinical application. Both approaches mitigate risk since the candidates assessed have largely been extensively tested in clinical trials for other indications. The usefulness of a multi-pronged approach to drug repositioning in lupus is highlighted by orthogonal confirmation of hypothesis-based drug repositioning predictions by Big Data analysis of differentially expressed genes from lupus patient samples. The goal is to identify novel therapies that have the potential to affect disease processes specifically. Involvement of SLE patients and the scientists that study this disease in thinking about new drugs that may be effective in lupus though crowd-sourcing sites such as LRxL-STAT ( is important in stimulating the momentum needed to test these novel drug targets for efficacy in lupus rapidly in small, proof-of-concept trials conducted by LuCIN, the Lupus Clinical Investigators Network ( lucinstat). Lupus (2016) 25, Key words: LRxL-STAT; LuCIN; drug repurposing; drug repositioning; Stelara; ustekinumab; IL12; IL23; quinacrine; krill oil; HSCT; stem cells; meditation; mindfulness; ruxolitinib; tofacitinib; JAK; MEDI-7169; IL21; secukinumab; IL17 Introduction Drug repurposing is not a new concept. However, using an evidence-based approach to examine drugs approved for one indication for their potential in systemic lupus erythematosus (SLE) is uncharted territory. Repositioning, rescue, reprofiling, retooling, and retasking are other commonly used terms for the process of utilizing a drug approved or tested for one condition for a completely different disease. 1 3 Lupus patients and the rheumatologists that care for them are unconsciously familiar with the concept of Correspondence to: Amrie C Grammer, AMPEL BioSolutions and RILITE Foundation, 1001 Research Park Boulevard, Suite 301 Charlottesville, VA 22911, USA amriegrammer@comcast.net repurposed drugs since SLE patients are routinely treated with drugs that were initially employed for other diseases such as hydroxychloroquine used for malaria, cyclophosphamide (CTX) used for cancer, mycophenolate approved for transplant rejection, and rituximab approved for lymphoma. Surprisingly, only four medications have been approved by the US Food and Drug Administration (FDA) for treatment of lupus patients (hydroxycholoroquine, aspirin, prednisone, and belimumab). Even as recently as 2013, deciphering which approved drugs might be appropriate for lupus patients was a daunting task. A variety of approaches are described in Figure 1. Traditionally, as occurred in the lupus field, drugs were repurposed because of opportune clinical observations and/or off-target properties. Biotech/Pharma companies often look! The Author(s), Reprints and permissions: /

147 文献传递 Figure 1 Crowd Sourcing Clinical Experience Literature Mining Drug Reposi oning Drug Proper es Gene cs Genomics Multi-pronged approaches to drug repositioning. for drugs with similar structures or adverse events by rescreening against targets with related threedimensional structural elements when attempting to repurpose existing compounds. 4,5 In the last few years, genome wide association studies (GWAS) began to identify potential disease-associated genetic perturbations that could serve as the basis of new target identification in many diseases, 6 including SLE. 7 9 Advances in bioinformatics approaches including analysis of differential expression of mrna and mirna, as well as methylation status of promoter regions in patients compared to normals, 20,21 provide additional powerful tools to identify new targets of therapeutic intervention. There is an intense interest from Biotech/Pharma to try to rescue pipeline drugs that failed in an additional indication or did not achieve FDA approval. Rheumatologists are also interested in repositioning drugs since Biotech/Pharma, with one exception, has not been successful in bringing new drugs for SLE patients to market. Moreover, standard-of-care (SOC) lupus treatments have serious side effects, and lack the necessary precision to target lupus pathways specifically and thereby address signs and symptoms of the disease in individual patients. Emphasizing the potential value of drug repositioning in lupus is that fact that belimumab (Benlysta, anti-blys/baff) is the only drug approved for SLE in the last 50 years. These considerations stimulated a push in the spring of 2013 by the Alliance for Lupus Research (ALR) and the Lupus Research Institute (LRI) to launch a drug repositioning effort (www. linkedin.com/in/lrxlstat), LRxL (Lupus Treatment Identifying novel targets and drugs for SLE AC Grammer et al. List)-STAT (SLE Treatment Acceleration Trials). Despite best efforts by academics and the pharmaceutical/biotech industry, the pace of development of new therapies for lupus patients is painfully slow. Even in well-described diseases with a large market forces, bringing a new drug through the FDA-approval process takes years and $ billion with less than a 10% success rate. 22 Lupus remains a serious unmet medical need and the need for rethinking the approach to find new therapies for SLE patients is urgent. 23,24 The initial repositioning approach initiated by the ALR and LRI, now merged into one organization called the LRA (Lupus Research Alliance), was a combination of crowd-sourcing and literature mining. This generated a large number of drug candidates that were prioritized using a composite scoring system of drug attributes, the Combined Lupus Treatment Scoring (CoLTs) system. This system ranks compounds numerically based on scientific rationale, experience in lupus mice/human cells, previous clinical experience in autoimmunity, drug properties, and adverse event profile. 25,26 Parallel efforts with support from the John and Marcia Goldman Foundation resulted in the development of a novel comprehensive meta-analysis algorithm that interrogates data from more than 2000 lupus gene expression profiles from the periphery as well as synovium, skin and kidney. 27,28 Combining hypothesis-driven and nonbiased approaches permits a better understanding of the systemic autoimmune and inflammatory networks operate in lupus and is useful to identify novel drugs as well as pathways that might be targets of therapeutic interventions. LRxL-STAT: ranking potential treatments for SLE patients using CoLTs Repositioning drugs into lupus has the potential to deliver new treatments to patients more quickly than standard drug development programs because early pre-clinical work as well as dosing, formulation, side effects, drug metabolism/interaction and pharmacokinetic/dynamic issues have already been characterized leaving only demonstration of efficacy in lupus to be determined. The 2013 goal of the LRxL-STAT initiative was to examine all compounds approved by the FDA for any indication (approximately 1100 compounds for 6800 indications), narrow down the list (LRxL) to those that may be efficacious in lupus patients (157 compounds), and to rank potential lupus treatments 1151 Lupus 141

148 大数据金融信息剪辑 1152 Lupus Identifying novel targets and drugs for SLE AC Grammer et al. using the evidence-based scoring system CoLTs. Consideration of 71 new drugs approved by the FDA in generated an additional 10 candidates with an appropriate set of characteristics to consider for CoLT scoring. The LRxL was constructed with extensive input from the interested lupus community, including patients. Excluded from the literature search were all drugs widely used for SLE (whether approved or not) as well as drugs known to be in development for SLE by Biotech/Pharma. All data used were in the public domain and no drug combinations were addressed. To compare and contrast candidates for repositioning into SLE, a novel scoring method was developed called CoLTs to rank the identified drugs/ therapies comparatively by a number of essential characteristics, including scientific rationale, experience in lupus mice/human cells (pre-clinical), previous clinical experience in autoimmunity, drug properties and safety profile including adverse events. 29 Potential candidates were scored in each of five categories: small molecules, cellular therapies, complementary and alternative therapies as well as drugs in development (DiD). Of the 157 therapies initially screened, more than 20 had an appropriate set of characteristics to consider for testing in clinical trials for lupus, including drugs targeting cellular metabolism, kinases, the immune system, HDACs, complement as well as cellular therapies and nondrug interventions. Consideration of the drugs approved by the FDA in generated additional candidates with an appropriate set of characteristics to consider for CoLT scoring and potential testing in lupus clinical trials, 30,31 including inhibitors of PI3K, PDE4, PARP, and HDACs as well as biologics with specificity for IL5, IL6, IL13, IL17alpha, VEGFR2, integrin receptors, and CD38. Newly approved PD1 checkpoint inhibitors that might have deletion as well as agonistic properties were also considered. The objective of the CoLTs system was to develop a metric that could capture applicable information from the literature and yield a composite score that would plausibly suggest that a drug candidate might be successful in lupus clinical trials. Of significance, the CoLT score reflects the state of knowledge at the time the candidate was scored but was designed to be dynamic and incorporate new knowledge as it becomes available. The motivation to develop the CoLTs system was the need for an objective way to score candidates, taking into consideration both likely efficacy as well as expected adverse event profile in lupus patients. Although estimations of possible efficacy, including mechanism of action, experience in animal models, pathway abnormalities identified in lupus patients, and previous clinical experience in other autoimmune/inflammatory experience were all thought to be valuable and carefully scored, greater weight was given to the adverse event profile. The adverse event profile is of particular importance in SLE where treatments with drugs such as glucocorticoids and immunosuppressive agents increase risk of infections, which could limit the use of other immunomodulatory therapies. Finally, properties of the compounds, including route of administration, dosing, drug metabolism, and drug drug interactions, were also scored, since they can be essential determinants of success in a chronic disease often treated with multiple drugs. Multiple iterations of the scoring system were considered in order to find the best combination of characteristics that separated drug candidates with a greater likelihood of success from those with a less attractive set of characteristics. The CoLTs system was validated by scoring a number of SOC agents and seeking face validity from experienced clinicians. The outcome was the CoLT score that provides a useful means to prioritize treatment candidates for SLE but is a dynamic, flexible measurement that takes into account new information about a therapy as it becomes available. Initially, one hundred and fifty seven therapies were examined in detail by the LRxL-STAT initiative (99 small molecules, 41 biologics, 5 cellular therapies, and 12 CAM (complementary and alternative medicines; see for the complete listing). The initial goal was to evaluate the likelihood of success of repositioning FDA-approved drug in SLE so the evaluation list scored with CoLTs was focused on the 76 FDAapproved or GRAS (Generally Recognized as Safe) therapies that scored higher than commonly used SOC lupus medications (Table 1). Drugs that scored higher than SOC medications were considered to be high priority and worth considering for small, proof-of-concept trials (STAT, SLE Treatment Acceleration Trials) that will potentially be carried out by the Lupus Clinical Investigators Network (LuCIN, As described previously and reviewed here, CoLT scores were calculated based on a numerical ranking system of 16 to þ 11 (Figures 2 and 3). All data used for scoring is in the public domain. Ten categories were scored for each candidate. Rationale was scored from 0 to þ 3, a sliding scale from no role in lupus receiving a zero and demonstrated role in lupus pathogenesis receiving a þ 3. Pre-clinical experience (lupus mice), lupus cells in vitro, lupus abnormality, autoimmunity clinical experience, and lupus clinical experience 142

149 文献传递 Table 1 Identifying novel targets and drugs for SLE AC Grammer et al. LRxL-STAT identifies candidate drugs for repositioning into SLE 1153 FDA-approved biologics FDA-approved biologics (cont.) FDA-approved small molecules FDA-approved small molecules (cont.) Abatacept 8 Infliximab 4 Azathioprine (SOC) 5 N-Acetyl cysteine 4 Adalimumab 4 Natalizumab 4 Abacavir 1 Nelfinavir 2 Belimumab (SOC) 5 Ofatumumab 5 Apremilast 5 Nilotinib 0 Certolizumab Pegol 4 Pembrolizumab 2 Bortezomib 6 Orlistat 1 Eculizumab 7 Rituximab 4 Carfilzomib 4 Panzopanib 4 Etanercept 5 Tocilizumab 8 Crizotinib 4 Quinacrine 7 Golimumab 5 Ustekinumab 10 Dasatinib 1 Roflumilast 5 Dimethyl Fumarate 4 Romidepsin 4 Complementary small molecules (CAMs) Cellular therapies Dipyridamole 4 Rosiglitazone 1 Erlotinib 4 Ruxolinib 5 Creatinine 1 Allogeneic HSCT 1 Everolimus 3 Sirolimus 2 Curcumin 7 Autologous HSCT 5 Fingolimod 5 Sorafenib 3 Nicotinamide adenine dinucleotide 4 Mesenchymal SCT 2 Glatiramer acetate 2 Statins (SOC) 3 Omega-3 Fish Oil (Krill) 8 Tregs 4 Gefitinib 1 Sunitinib 1 Promethylation diet (choline, methionine, folic acid) 6 Hydroxychloroquine (SOC) 5 Tacrolimus 5 Resveratrol 6 Ibrutinib 4 Tamoxifen 2 Tetrahydrobiopterin 0 Idelalisib 1 Tenofovir 1 TwHF (Thunder God Vine) 7 Imatinib 4 Teriflunomide 7 Ergocalciferol (Vitamin D) 6 Irinotecan 1 Thalidomide 2 Lamivudine 3 Tofacitinib 3 Alternative medicine/therapies Lapatinib 0 Valproic Acid 0 Leflunomide 3 Vandetanib 7 Acupuncture 1 Lenalidomide 5 Vemurafenib 6 Meditation/mindfulness 5 Metformin 1 Vorinostat 6 Yoga 3 Zidovudine 2 categories were scored from 1 to þ 1; a candidate was given a score of 1 for no benefit or not verified/present, zero for not determined/equivocal, or þ 1 for positive evidence. Properties of each candidate were scored from 3 to þ 3, as detailed in Figure 2 based on route/frequency administration, characteristics, specificity, interactions with SOC medications. Since some drugs have been shown to induce lupus, this category was scored as 1 for induces lupus and zero for a drug that does not induce lupus. Metabolism of each compound was scored from 2 to zero. If a candidate utilizes p450 enzymes for metabolism and has greater than 20% excretion by the kidneys, the drug received a 2. If one condition was met, the drug received a 1. Zero was assigned if the drug was not heavily metabolized by liver cytochrome oxidases and excretion by the kidneys was less than 20%. Adverse events were heavily weighted as a component of the CoLT score, numerically ranging from 5 to zero. The following formula was used to calculate the Adverse Events CoLTs sub-score: [sum of AE severity][#aes] ¼ ToxProduct! converted to whole number scale. Adverse event (AE) severity scores (renal, liver, cardiovascular, infection, cytological, cancer, pulmonary, skin) from Medscape were used to calculate CoLTs adverse event sub-score. Most FDA-assigned Black Box Warning (BBW) automatically were scored as a 5. Of note, hypersensitivity adverse events were not scored. Using the renal category as an example, since lupus patients are especially susceptible to kidney side effects, compounds were given a 4 for increasing/ inducing renal impairment /failure as well as for an increasing risk of renal toxicity or glomerulonephritis. Each event of increasing the risk of hypokalemia or hypophosphatemia was given a 1. The CoLT scores of all LRxL-STAT repositioning candidates are shown in Table 1; in this table and below, CoLT scores are in superscript. Preclinical or clinical experience in autoimmune diseases was typically available in the literature for high priority candidates. SOC lupus medications Belimumab and Hydroxychloroquine (HCQ) received a CoLT score of 5 whereas Rituximab received a CoLT score of 4 (Figure 3). The top scoring candidates for repositioning in each category are bolded in Table 1 and are as follows: biologic, Stelara/ustekinumab 10 targeting the p40 subunit of IL12/23 (called IL12b); small molecule, the lysosomal neutralizer quinacrine; 7 cellular therapy, autologous hematopoietic stem cell Lupus 143

150 大数据金融信息剪辑 1154 Identifying novel targets and drugs for SLE AC Grammer et al. Rationale (0 to +3) None Possible Likely Demonstrated Role in lupus pathogenesis Lupus mice Done, no benefit ND/conflicting results Benefit (-1 to +1) Lupus cells in vitro Done, not verified ND/conflicting results Target identified (-1 to +1) Lupus Abnormality Studied, not present ND/conflicting results Target active/abnormal (-1 to +1) Autoimmunity Trial no effect/ ND/diff results Beneficial trial/ Clinical Experience (-1 to +1) conflicting results diff diseases Case report Lupus Clinical Experience Trial no effect/ ND/diff results Beneficial trial/ (-1 to +1) conflicting results diff diseases Case report -1 Drug Properties (-3 to +3) *DDI w SOC lupus drugs; *IV, chimeric, *SC, Hu or humanized, * for each nonspecific w many targets BID qday, highly specific Induces Lupus (-1 to 0) -1 Yes -1 Drug Metabolism (-2 to 0) P450 issues & p450 issues OR NO p450 issues & Adverse Events (-5 to 0) 0 0 No >20% kidney excretion >20% kidney excretion <20% kidney excretion Figure 2 Components of Combined Lupus Treatment Scoring (CoLTs) to rank potential candidates for repositioning in lupus. The CoLT score for each drug candidate was calculated based on a numerical scoring system of 16 to þ 11. Rationale was scored based on scientific evidence for a role in lupus pathogenesis (0, no role; 1, possible role; 2, likely role; 3, demonstrated role). Preclinical evidence was assessed in lupus mice ( 1, no benefit; 0, not determined (ND) or equivocal; 1, benefit) or in vitro with human cells ( 1, not verified; 0, ND or equivocal; 1, target identified). Lupus abnormality was assessed ( 1, studied but not present; 0, ND or studied with conflicting results; 1, target active or abnormal). Clinical experience was assessed in autoimmune disease or in lupus itself ( 1, trial no effect or conflicting results; 0, ND or different results in different diseases; 1, beneficial trial or case report). Properties: 1 was given for non-specificity with many targets or for each drug drug interaction (DDI) with SOC lupus drugs (corticosteroids, MMF, AZA, CTX, statins, ACE inhibitors); 0 if the drug is chimeric or administered IV or BID; for each of the following, 1 point was given: if the drug is Hu or humanized, administered SC, given once a day, specific for its target. Induces lupus? (0, no; 1, yes). Drug metabolism was assessed ( 2, p450 metabolism and >20% kidney excretion; 1, p450 metabolism OR > 20% kidney excretion; 0, no p450 issues or < 20% kidney excretion). The rationale is summarized in Table 2. transplantation; 5 CAM: omega-3 PUFA (krill oil) 8 and meditation/mindfulness 4. (CoLT scores are indicated by superscript). All results were vetted by a committee of experts organized by the ALR and LRI in the spring of 2013 that reviewed the details of the CoLT scores (W Paul, Committee Chair with members J. Browning, M. Crow, J. Craft, M. Collins, P. Isakson, M. Sykes, and V. Werth). The initial goal of scoring drugs approved by the FDA for a non-lupus indication with the hope of encouraging Biotech/Pharma to test efficacy in lupus patients was realized in the fall of Based on LRxL-STAT s high priority CoLT score, Janssen Pharmaceuticals decided to test efficacy of Stelara/ustekinumab in lupus, with a Phase IIa trial that began in the fall of 2015 (NCT ). A number of the academic lupus centers that comprise the Lupus Clinical Investigators Network (LuCIN, are participants in this trial of Stelara/ustekinumab in lupus patients. The LRxL-STAT initiative is a living entity that is a vibrant and keeps up-to-date with all drugs approved by the FDA. In addition, the CoLT scoring is a dynamic process that was designed to constantly incorporate new information as it becomes available. Of all of the drugs approved by the FDA in , a number have potential to be highpriority candidates for repositioning into SLE as their targets are identical to drugs with high CoLT scores. Newly approved Ninlaro/ixazomib Lupus 144

151 文献传递 Identifying novel targets and drugs for SLE AC Grammer et al Belimumab HCQ Rituximab Rationale (0 to +3) Lupus mice (-1 to +1) Lupus cells in vitro (-1 to +1) Lupus Abnormality (-1 to +1) Autoimmunity Clinical Experience (-1 to +1) Lupus Clinical Experience (-1 to +1) Drug Properties (-3 to +3) Induces Lupus (-1 to 0) Metabolism of Drug (-2 to 0) Adverse Events (-5 to 0) CoLTs Figure 3 Combined Lupus Treatment Scoring (CoLTs, 16 to 11) of lupus SOC and top-ranked drugs for repositioning in lupus (see Table 3). Table 2 Categories of CoLT scoring Rationale (0 to þ 3) None Possible Likely Demonstrated Role in lupus pathogenesis Lupus mice Done, no benefit ND/conflicting results Benefit ( 1 to þ 1) Lupus cells in vitro Done, not verified ND/conflicting results Target identified ( 1 to þ 1) Lupus abnormality Studied, not present ND/conflicting results Target active/abnormal ( 1 to þ 1) Autoimmunity clinical experience ( 1 to þ 1) Trial no effect/conflicting results ND/diff results diff diseases Beneficial trial/case report Lupus clinical experience ( 1 to þ 1) Trial no effect/conflicting results ND/diff results Beneficial trial/case report diff diseases Drug properties ( 3 to þ 3) *DDI w SOC lupus drugs; *IV, chimeric, *SC, Hu or humanized, *for each nonspecific w many targets BID qday, highly specific Induces lupus ( 1 to 0) Yes No 1 0 Drug metabolism ( 2 to 0) P450 issues & >20% kidney excretion p450 issues OR >20% kidney excretion NO p450 issues & <20% kidney excretion Adverse events ( 5 to 0) inhibits the proteasome in a similar manner as Velcade/bortezomib 6, resulting in intracellular build-up of ubiquitylated proteins followed by apoptosis. The IL6 antagonist Sylvant/siltuximab (anti-il6) affects the same pathway as Actemra/ tocilizumab 8 (anti-il6r) and exerts anti-inflammatory effects as well as interferes with the differentiation/maintenance of plasma cells. Similar to the LRxL-STAT candidate vorinostat 6, Beldodaq/belinostat, Farydak/panobinostat, and givinostat are Lupus 145

152 大数据金融信息剪辑 1156 Lupus Identifying novel targets and drugs for SLE AC Grammer et al. Table 3 Rationale for CoLTs of top-ranked drugs for repositioning in lupus Belimumab HCQ Rituximab Rationale (0 to þ 3) Lupus mice ( 1 to þ 1) Lupus cells in vitro ( 1 to þ 1) Lupus abnormality ( 1 to þ 1) Autoimmunity clinical experience ( 1 to þ 1) Lupus clinical experience ( 1 to þ 1) Drug properties ( 3 to þ 3) Induces lupus ( 1 to 0) Metabolism of drug ( 2 to 0) Adverse events ( 5 to 0) CoLTs inhibitors of class I HDACs but also inhibit class II HDACs; both classes of HDACi induce intracellular accumulation of acetylated histones followed by apoptosis. There are a number of newly approved biologics specific for lineage markers that delete lymphocytes in a variety of ways. Blinatumomab/Blincyto, a Dual-Affinity Re- Targeting (DART) antibody specific for CD3 and CD19 that was suggested to LRxL-STAT when it was in development, goes a step beyond rituximab 4 since it targets CD3 þ T cells as well as CD19 þ B cells, inducing CD3 þ T cells to kill targeted B cells. A newly approved biologic, daratumumab/darzalex, targets CD38 which is highly expressed on autoantibody secreting plasma cells but is also expressed on a variety of other cell types and deletes them by ADCC. A number of first-in-class drugs approved by the FDA in may also be efficacious for lupus patients. The PDE4 small molecule inhibitors Daliresp/roflumilast and Otezla/apremilast receive high priority CoLT scores, 6 and 5 respectively. Phosphodiesterase-4 inhibitors prevent breakdown of camp and are anti-inflammatory because camp inhibition lowers the activation state of transcription factors required for the transcription of inflammatory cytokines such as IL12/IL23p40 and IL17. A new biologic targeting one of the products of Th17 cells through its specificity for IL17a, called secukinumab/ Cosentyx receives a high CoLT score of 8. A number of the drugs approved in target proteins are relevant to the pathophysiology of lupus but do not score well on the CoLT scale because of other issues. Eligustat/Cerdelga that inhibits glucosylceramide synthase may have some potential in lupus cerebritis but its lack of clinical experience in autoimmunity, mixed evidence from lupus mice, utilization of P450 for metabolism and high usage of kidneys for excretion makes it a low priority candidate for lupus drug repositioning. Another interesting candidate targets Th2 cytokines, mepolizumab/nucala (IL5). The target of mepoliziumab/nucala, IL5, is a potential biomarker of lupus nephritis and is one of the predictive markers in cerebrospinal fluid (CSF) for lupus cerebritis. 33 More work will need to be done to investigate the potential for mepoliziumab/nucala to be repositioned into lupus. Although the integrin receptor antagonist vedolizumab/entyvio was initially attractive for repositioning into lupus, further investigation revealed that it primarily targets inflammation in the gut by preventing the a 4 b 7 integrin subunit from binding to MAdCAM1. The VEGFR2 target of ramucirumab/cyramza does not score well since the target has conflicting evidence in both the lupus mice and human lupus abnormality categories. 35 Nexavar/sorafenib, the previously approved small molecule antagonist of VEGFR2 as well as PDGFR and RAF, received a CoLT score of 3 due to AEs and toxicity. A variety of intracellular-signaling inhibitors were investigated as potential candidates for repositioning into lupus. Kinase inhibitors ceritinib/zykadia (targeting ALK), selumetinib (targeting MEK1,2), idelalisib/zydelig (targeting PI3K-delta), and osemertinib/tagrisso (receptor TyrK inhibitor) were less attractive as potential candidates for repositioning into lupus because of severe adverse events that result in negative CoLT scores similar to the kinase inhibitor Xalkori/crizotinib 4 (targeting ALK). The PARP (poly ADP-ribose polymerase) inhibitor olaparib/lynparza that interferes with the DNA repair process and thus potential mutations leading to autoantibody production has good rationale, but its severe adverse event profile in combination with its utilization of P450 for metabolism and high usage of kidneys for excretion makes it a low priority candidate for lupus drug repositioning. Finally, adverse event profiles as well as negative results in lupus mouse models do not suggest that the checkpoint inhibitors, pembrolizumab/keytruda (anti-pd1) and nivolumab/ Opdivo (anti-pd1l1) are good candidates for repositioning into lupus. However, agonistic antibodies directed against PD1 remain an attractive target as a means to inhibit the function of activated T cells and especially T FH cells Deleting anti-pd1 antibodies might also be worth considering in the future. Top priority drug 146

153 文献传递 Identifying novel targets and drugs for SLE AC Grammer et al (a) Exptl. vs. Control KD, overexpression, or s mula on Ac ve SLE pa ent or healthy control sample (b) Disease Signature Signature from Drug or in vitro manipulation Exptl. vs. Control LINCS L1000 SLE vs. HC Meta Analysis LINCS All Genes Mean RankPt Connec vity Score (-100 to 100) Figure 4 Gene expression approach to drug repositioning: predicting drug candidates using LINCS. Drug induced transcriptional modules in the LINCS database give insights into drug action as well as function(s) of groups of genes targeted by drugs. Signatures in the LINCS database generated by in vitro manipulation (deletion or overexpression) as well as drug incubation are compared to a disease signature (i.e., DE genes from peripheral B cells: SLE vs normal individuals). candidates considered by LRxL-STAT for repositioning into SLE are shown in Table 1. Bioinformatic confirmation of top ranked drugs for repositioning into lupus To confirm high priority drugs identified by CoLT scoring through the LRxL-STAT initiative by orthogonal methodology and to identify more drug repositioning candidates for lupus patients, a second approach commonly used is the perturbagen database developed by the Broad Institute and publically available at l1000/ called LINCS (Library of Integrated Network-Based Cellular Signatures) (Figure 4). The LINCScloud is a searchable database that emerged from cmap (connectivity MAP). The first version of cmap was developed by the Broad Institute in 2006 using the Affymetrix human genome U133 (hgu133) microarray platform and consisted of a repository of four human cell lines treated with 1300 drugs. Subsequently, the Broad Institute expanded the set to 7000 expression profiles and 13,000 compounds. A new technology called the L1000 platform was developed for the next major version of cmap that is located at lincscloud, using Luminex Flexmap 3D bead technology that contained far greater probe sets than the hgu133 arrays. The Broad s L1000 results are the publically available transcription response portion of LINCS, and currently contains representative information linking gene expression to perturbagen profiles, generated from more than 1.4 million gene expression profiles obtained from 25 major cell types that were antagonized by 20,413 chemical perturbagens and 22,119 knockout or overexpression genetic perturbagens. Whereas LRxL-STAT is an hypothesis-driven literature-search approach involving crowd sourcing through the LinkedIn site, intensive literature mining and evaluation with the objective CoLT scoring tool (Figure 5), LINCS connectivity scoring affords the opportunity for a non-biased and experimentally-based comparison of the experimentally observed gene expression changes induced by various drugs and gene perturbations (i.e., what genes are up and downregulated by a given perturbagen) with gene expression abnormalities in lupus identified by meta-analysis of gene expression profiles. As is standard practice to determine gene expression abnormalities, microarray data generated from Lupus 147

154 大数据金融信息剪辑 1158 Identifying novel targets and drugs for SLE AC Grammer et al. Figure 5 Hypothesis-driven literature mining approach to drug repositioning. Figure 6 Non-biased gene expression approach to drug repositioning. mrna isolated from the periphery or tissue biopsies obtained from active lupus patients (SLEDAI 6; mixture of Caucasian (EA), African-American (AA), and Hispanic patients) or normal individuals was analyzed to determine differentially expressed genes. 27,28 A meta-analysis of multiple SLE studies generated a proposed genomic signature of overexpressed and Lupus 148

155 文献传递 underexpressed genes in lupus patients. Using Big Data bioinformatics methodology to understand genes abnormally expressed in lupus patients regardless of racial background is a strong approach to identify new drug candidates for lupus in an unbiased manner (Figure 6). Big Data bioinformatics will be described in detail below and includes techniques to measure differential expression, functional categorization in vitro and in vivo, interactions/potential pathways of gene products as well as correlation of expression to clinical characteristics. In addition, the combination of the LRxL-STAT hypothesis-driven approach with a meta-analysis Big Data approach defines a strategic methodology to identify potential drug targets and repositioning candidates for lupus patients. An in-depth bioinformatics approach has the ability to identify new and hitherto unanticipated druggable targets or biologic pathways in SLE pathogenesis and connect them with the influences (both known and unexpected) of drugs in use or in development as well as biologic pathways delineated by drug or genetic perturbation in multiple cell types. This non-biased approach will not only identify novel molecular pathways of SLE pathogenesis, but also will find novel targets of drug action that could not have been deduced from standard experimental biological approaches. The goal is to maximize the number of therapeutics that can be investigated for efficacy in SLE patients, using drugs already FDA-approved as well as drugs at all stages of development. The unbiased approach to find new drug repositioning candidates for lupus patients utilizes an analysis of lupus gene expression profiles using the LIMMA package in the R programming language to find differentially expressed (DE) genes compared to normal individuals. Genes abnormally expressed in lupus patients are tested for correlation with clinical traits such as disease activity, autoantibodies and complement components (C3/C4) using the Weighted Gene Coexpression Network Analysis (WGCNA) algorithm. Specifically, genes clustered using these unsupervised techniques (LIMMA, WGCNA) are rationalized against known cellular pathways by querying the functional, interactional and pathway databases to reveal mechanisms underlying lupus pathology. Immunologically-relevant DE lupus genes are identified in a variety of ways, queries of the JAX mouse genome informatics database ( informatics.jax.org) as well as comparison to the a variety of functional databases including the Interferome (to identify genes controlled by IFN- Identifying novel targets and drugs for SLE AC Grammer et al. alpha/beta versus IFN-gamma; as well as sites to categorize genes based on GO and KEGG terms such as DAVID (Database for Annotation, Visualization and Integrated Discovery; gov/) and the older PANTHER (Protein ANalysis Through Evolutionary Relationships; pantherdb.org/) site. Whereas potential direct interactions between gene products are predicted by the Interactome ( and STRING (Search Tool for the Retrieval of Interacting Genes/Proteins; functional pathways are predicted by proprietary IPA (Ingenuity Pathway Analysis; ingenuity.com/). Cytoscape synthesizes information from all of these sources in one figure using a network data analysis, integration and visualization tool ( Since GO (Gene Ontology; org/) and KEGG (Kyoto Encylopedia of Genes and Genomes; terms used by DAVID to make categories do not fit immunological functions very well, a curated pathway analysis pipeline was generated for the LRxL-STAT program that is specific for autoimmunity (Biologically Informed Gene-Clustering, BIG-C ). 27,28 Future comparison of lupus DE genes to GWAS/SNP information (ENCODE; and to epigenetic data showing gene methylation status ( from lupus studies as they become available will reveal the interaction between genetic susceptibility, epigenetic regulation of gene expression and pharmacologic manipulation of gene expression in lupus patients. Meta-analysis of lupus B cell transcriptomic data contributes to the quest for drug repositioning candidates Examination of lupus gene expression data has tended to focus only on the most highly expressed genes, such as those constituting the type 1 IFN signature. By contrast, genes that are expressed in rarer cell populations such as circulating plasma cells have not been easily detected in previous studies because of a number of factors, including sparsity of the cell type of interest and low expression levels of cell unique genes, which makes it difficult to discern them from background noise. 40 However, since active SLE is thought to be characterized by polyclonal activation of B cells, more complete analysis of lupus B cell gene expression 1159 Lupus 149

156 大数据金融信息剪辑 1160 Identifying novel targets and drugs for SLE AC Grammer et al. (a) GSE up 456 up GSE up GSE down 304 down GSE down 760 GENES COMMON TO ACTIVE SLE B CELLS DE Limma Gene Analysis (b1) Transcrip on Factor 1% Fa y Acid / Sphingolipid Metabolism 1% RNA Processing 4% RNA transla on 2% Increased in Lupus B Cells Ac n Cytoskeleton 1% Type I Interferon 7% Mitochondria ribosomal/other 9% Glycolysis, TCA, Ox Phos 4% ER to Golgi Transport/Processing 7% Oxida ve Stress / Redox Transcripts 2% GTPase Ac vity 1% Ubiquityla on 4% Histones 2% Plasmablasts / Ig Produc on 21% Nucleo de Biosynthesis 1% Nuclear 1% Golgi 4% Migra on 3% Apoptosis 5% Cell Cycle / Prolifera on 8% Decrease Prolifera on 1% MHC I and Immunoproteasome 5% Unfolded Protein Response 2% DNA Repair 3% Cell surface 1% (b2) Regula on of Small GTPase Ac vity 4% Secreted Proteins 3% Ubiquityla on 5% Decreased in Lupus B Cells Cytoskeleton 6% Ion Channels 1% ER 5% Golgi Apparatus 7% Lysosome 2% Endosomal Recycling 4% Nuclear import 2% RNA processing 12% Mitochondria & Energy 6% Chroma n Remodeling 4% Apoptosis 1% Transcrip on Regula on 13% Prolifera on 3% Cell surface proteins 7% Cytosolic Biochemistry 3% Intracellular Signaling 11% Figure 7 Bioinformatic approach to target identification in SLE: B cells as an example. (a) Differentially expressed genes in active lupus B cells (SLEDAI 6). In each of two B cell experiments (GSE10325, 4588), the total number of genes that were up- or downregulated in lupus patients compared with normal individuals is represented as a Venn diagram. A total of 760 genes were Lupus 150

157 文献传递 Identifying novel targets and drugs for SLE AC Grammer et al (c1) CELL DEATH MITOCHONDRIAL RESPIRATION CELL PROLIFERATION RNA PROCESSING CELL STRESS AND DAMAGE CELLULAR MAINTENANCE and ACTIVATION PROTEASOME UBIQUITYLATION IFN- INDUCIBLE (c2) Figure 7 Continued. consistently different in lupus peripheral B cells compared with normal peripheral B cells (456 genes with higher expression and 304 genes with lower expression). (b) Pathways up- and down-regulated in active lupus B Cells by curated functional analysis (BIG- C ). (c) STRING visualization identifies gene product interactions that are grouped using k-mean clustering, and curated through literature mining. (d) WGCNA analysis of GSE10325 active lupus B cell gene expression correlated with SLEDAI, increasing antidsdna Ab levels and decreasing levels C3/C4 complement components. Black arrows indicate modules correlated with SLEDAI. Pink boxes indicate correlation with increasing anti-dsdna Ab and blue boxes indicate correlation with decreasing C3/C4 levels. (e) STRING visualization of GSE10325 active lupus B cell genes in WGCNA identified modules correlated with SLEDAI. (f) Cytoscape visualization of network interactions of the top 300 genes DE in active lupus B cells (GSE10325) that are in WGCNA modules positively correlated with SLEDAI. Edge width and transparency are weighted based on the final STRING combined score for each connection. Nodes are colored based on LIMMA log fold-change (LFC) comparison of SLE to normal samples; the Lupus 151

158 大数据金融信息剪辑 1162 Identifying novel targets and drugs for SLE AC Grammer et al. (d) (e) (f) Figure 7 Continued. scale is based up green representing downregulated genes and red representing upregulated genes (white indicates that there was no difference between SLE and normals for a given gene). Border width indicates the FDR-adjusted p value of the LIMMA LFC measurement. The size of labels and nodes indicates how well a gene is co-expressed, or connected, to other genes in its module (WGCNA intramodular connectivity kim). Node shape indicates STRING cluster type: Cell Division (circle, lime green), DNA damage response (rectangle, brown), Proteosome (diamond, dark green), ribosome (triangle, orange), mitochondrial respiration (pink, parallelogram), protein processing and Kreb s cycle (hexagon, purple), IFN-inducible (V-shape, red) and cell maintenance/ activation (octagon, yellow). profiles may be important in identifying new targets of therapeutic intervention. Therefore, meta-analysis was carried out on raw data from two publically available lupus B cell gene expression datasets (GSE10325 and GSE4588). Specifically, DE lupus genes were determined by LIMMA and SAM analysis of genes abnormally expressed in lupus B cells from active patients (SLEDAI 6) compared to normal individuals (Figure 7(a)). Importantly, these two datasets contain gene expression profiles from subjects with diverse ethnic backgrounds; representation of as many racial groups as possible is preferable for gene expression meta-analysis. Critical for any successful meta-analysis is a standard method to curate data in order to avoid erroneous identification of genes or failure to identify genomic signatures accurately, including a standardized approach to quality control (QC) as well as a standardized normalization procedure for gene expression data. 41 Only raw datasets (not authornormalized) were examined in order to carry out standardized analysis. After QC has identified and eliminated signal artifacts, batch effects and outlier identification, uninformative probes were culled from the dataset using Affy and BrainArray Chip Definition Files (CDFs) which are revised periodically using the latest BLAST results of the Affy probes against the human genome. 43 Only probes specific to a single gene target were included in the subsequent analysis. GCRMA (Guanine Cytosine Lupus 152

159 文献传递 adjusted Robust Multi-array Analysis), which normalizes for the background intensities of array data including optical noise and non-specific binding, was employed. LIMMA (Linear Models for MicroArray and rna-seq data) is a statistical suite that was used to assess significance of DE genes. 44 LIMMA permits the use of linear models to assess differential expression in the context of multifactorily designed experiments and provides the ability to analyze comparisons between many RNA targets simultaneously. Genes are filtered to remove those with expression levels near background and outliers (log 2 > 5 standard deviations away). LIMMA is applied first by performing empirical Bayesian fitting to borrow localized variance and estimate mean gene expression between cohorts. Multiple testing correction is performed to calculate FDR (false discovery rate) adjusted p values. A consensus intersection of genes is generated for all samples within a group such as prototypic lupus B cells. WGCNA is used to redefine groups of genes based on output from principal-component, eigendistance dimensional analysis (i.e., clustering arrays by SLEDAI, autoantibodies, complement components, etc.). 45 Since WGCNA is used as part of a larger meta-analysis approach, care is taken to make sure that groups of genes are defined by the majority of arrays and not just by the arrays from one or two patients. Sub-groups, or modules, of genes are used to reiterate the differential gene expression process described above. Consensus genes resulting from stringent metaanalysis undergo gene annotation enrichment analysis for grouping into major functional pathways using the BIG-C (Figure 7(b)). STRING uses a variety of publically available information to visualize groups of interacting gene products. For each connection, a score is generated based on the confidence of two nodes being connected; if two nodes have more than one type of connection, a combined score for additional connections is generated. For example, overexpressed DE genes in lupus B cells can be grouped into cellular proliferation/division/ death, mitochondrial respiration, oxidative stress, RNA processing, proteasome/ubiquitylation, cellular maintenance/activation using STRING ( string-db.org), a database of protein-protein interactions (Figure 7(c)). To ask the question whether particular groups of genes are correlated with clinical parameters, WGCNA of arrays from lupus B cells was also carried out, looking for associations with disease activity (SLEDAI) as well as serum levels of autoantibodies (anti-dsdna Ab) and complement components (C3/C4). WGCNA-sorted modules, or Identifying novel targets and drugs for SLE AC Grammer et al. groups of genes, are shown in dendrogram form in Figure 7(d) and annotated with Pearson correlation r and p values (significance, p < 0.05). Although one module positively correlated with SLEDAI (green) did not have significant correlation with increasing autoantibody levels or decreasing complement levels, it is interesting that there are also modules of genes that are both positively and negatively correlated with SLEDAI, autoantibodies and complement. The purple and red modules positively correlated with SLEDAI are also significantly positively correlated with autoantibodies and complement (autoantibodies, r ¼ 0.5 and 0.6; C3/C4, r ¼ 0.6 and 0.7); the brown and turquoise modules, which are negatively correlated with SLEDAI are also significantly negatively correlated with autoantibodies and complement (autoantibodies and C3/C4, r ¼ 0.7 and 0.5). The magenta and yellow modules are negatively correlated with both SLEDAI and anti-dsdna Ab but not with complement C3/C4. STRING visualization of groups of genes correlated with disease activity is shown in Figure 7(e). Interestingly, all functional categorizations of upregulated genes in active lupus B cells compared to normal B cells are correlated with disease activity with the exception of oxidative stress and cellular death. Moreover, the ribosomal category is the only group of downregulated genes that is correlated with disease activity, whereas the functional categories of fatty acid biosynthesis, histone demethylation, G-protein/small GTPase signaling, transcriptional regulation and general intracellular signaling are not correlated with disease activity. Interestingly, the magenta module that is negatively correlated with disease activity and anti-dsdna autoantibodies but not complement contains a large number of Zn-finger transcriptional regulators. Cytoscape visualizes network interactions of the top 300 genes DE in active lupus B cells that are in WGCNA modules positively correlated with SLEDAI (Figure 7(f)). Edge width and transparency are weighted based on the final STRING combined score for each connection. Nodes are colored based on LIMMA log fold-change (LFC) comparison of SLE to normal samples; the scale is based on green representing downregulated genes and red representing upregulated genes (white indicates that there was no difference between SLE and normals for a given gene). Border width indicates the FDRadjusted p value of the LIMMA LFC measurement. The size of labels and nodes indicates how well a gene is co-expressed, or connected, to other genes in its module (WGCNA intramodular 1163 Lupus 153

160 大数据金融信息剪辑 1164 Lupus Identifying novel targets and drugs for SLE AC Grammer et al. connectivity k IM ). Node shape indicates STRING cluster type: Cell Division (circle, lime green), DNA damage response (rectangle, brown), proteasome (diamond, dark green), ribosome (triangle, orange), mitochondrial respiration (pink, parallelogram), protein processing and Kreb s cycle (hexagon, purple), IFN-inducible (V-shape, red), and cell maintenance/activation (octagon, yellow). The meta-analysis approach outlined here takes into account the correlation to disease activity of both pathways and individual genes in its search for new drug targets for lupus patients, including candidates for potential repositioning. Despite the most thoughtful approach to microarray analysis, subtly expressed genes cannot always be detected, but whole pathway analysis, which has the potential to include these genes by known biological association, can accomplish this detection indirectly. Additionally, only a relative handful of pharmacological substances exist which specifically target an individual gene target, but querying the LINCS drug perturbagen repository for all upstream and downstream gene targets elucidates targets included within identified pathways. Once potential drugs and pathways are identified by LINCS as candidates for intervention in lupus, IPA and the MS (molecular signature)-scoring system are used to score pathways potentially affected by a given drug. This combination approach to scoring potential drug targets and pathways for their potential for repositioning into lupus is very strong since it combines information from experiments (LINCS) with a signaling database (IPA ) and with log-fold change information about the target and its signaling pathway (MS-scoring system ). IPA and the MS-scoring system use similar approaches to score potential targets. IPA generates pathways using IPA core analysis of an input gene list of fold-change values, using both direct and indirection interaction information. The MSscoring system was developed because many immunologically-relevant pathways are not in the IPA knowledge base. For example, ustekinumab which targets both the IL12 and IL23 signaling pathways is being tested in a Phase IIb trial of lupus patients based on its high CoLT score. Only the IL12 pathway is currently in the IPA knowledge base. For comparison, the consensus lupus B cell DE list was cross-referenced to LINCS and received ranks of 90 and 96 (out of 100) for respective knockdown of either the alpha or beta subunits of IL12, indicating that ustekinumab is potentially a good candidate for targeting lupus B cells. As comparators, standard-of-care drugs in lupus such as atorvastatin, dexamethasone, methotrexate, and hydrocortisone received respective LINCS ranks of 90, 59, 94, and 91 for the DE list from lupus B cells. Scoring by MS and IPA can both be used to characterize gene expression profiles from lupus B cells. The IL12 signaling pathway scored positively by MS-scoring (Figure 8) as well as by IPA (data not shown) for both lupus B cell datasets (GSE10325, GSE4588); lupus skin that scores positively by both IPA and MS was examined since ustekinumab has been claimed to benefit lupus skin disease in case reports. 46 Importantly, both lupus B cell datasets scored positively for the IL23 signaling pathway by MS-scoring. In this example, ustekinumab appears to be a promising approach to treat lupus, supporting the results of literature mining. Gene expression analysis obtained from synovium as well as lupus nephritis (class 3/4 glomerulus or tubuloinsterstitium) also indicated involvement of the IL-12/23 pathway by both IPA and MS. In summary, analysis of gene expression data employing the hypothesis-based method CoLTs (highest scoring biologic), the experimentally based LINCS system as well as the unbiased meta-analysis approach scored by either IPA or MS all suggested a potential role of ustekinumab as a treatment for SLE. Moreover, layering on information from WGCNA that defines groups of genes that are positively or negatively correlated to SLEDAI revealed that all genes whose products are involved in either IL12 or IL23 signaling are correlated to disease activity. Specifically, all detected genes whose products are involved in IL12 signaling are in SLEDAI- correlated modules with the exception of Tyk2 (turquoise) and MAPK14/p38 (magenta). All detected genes whose products are involved in IL23 signaling are in SLEDAI-positively correlated modules with the exception of CCR6/MIP1a-ligand and IL6 (yellow module) and STAT5a/b (brown module). Together, analysis of peripheral B cells or skin biopsies from lupus patients supported the conclusion from CoLT scoring that ustekinumab is a high-priority candidate for repositioning into lupus. Janssen s Phase IIb clinical trial of lupus patients (NCT ) will definitively determine the effectiveness of ustekinumab for SLE patients. Other high priority candidates for drug repositioning based on CoLT scoring include small molecules that target JAKs. MS-scoring of JAK inhibitors (Jakafi ruxolitinib 5, Xeljanz tofacitinib 3 ) is shown in Figure 9(a) (CoLT scores in superscript). For comparison, the consensus lupus B cell DE list was cross referenced to LINCS and received ranks of 95 and 87 (out of 100) for 154

161 文献传递 Identifying novel targets and drugs for SLE AC Grammer et al Figure 8 MS-scoring assessment of ustekinumab for repositioning into SLE. The MS-scoring system assigns a score to each member of a signaling pathway using the following parameters. If the fold-change of a gene suggests that the pathway is activated; for example, if transcripts of members of the signaling pathway are upregulated or negative regulators of the pathway are downregulated, then the gene is given a score of þ1. If the fold change of transcripts suggest inhibition of the pathway (either transcripts of members of the signaling pathway are downregulated or negative regulators of the pathway are upregulated) then the gene is given a score of 1. A score of zero is assigned if the gene has no fold-change. Individual scoring of each component of the IL12/23 signaling pathway by the MS-scoring system. Scores for each gene in the pathway are added up for each dataset and normalized into a percentage by dividing the raw score over the total number of genes that could be possibly detected on the microarray chip in the signaling pathway. The final %score indicates the activation state of the pathway and can range from 100 to 100. Significance was assessed by Fischer s exact test and overlap p values < 0.05 are indicated. respective knockdown of either JAK1 or JAK2, suggesting that JAK inhibitors are potentially good candidates for repositioning into lupus. Signaling pathways characteristic of the drug targets of ruxolitinib/tofacitinib scored highly by MS in data sets from lupus B cells as well as for the more traditional target of the kidney for ruxolitinib/tofacitinib. Of interest, a number of gene products critically involved in JAK signaling positively correlated to SLEDAI following WGCNA analysis of active lupus B cells (25/69, or 36%; Figure 9(b)). Moreover, JAK2 is abnormally overexpressed in active lupus B cells compared to normal B cells; by contrast, expression of JAK1 was not overexpressed in both B cell datasets. Moreover, JAK2 along with its associated signaling molecules STAT1, PI3K-p100c/PIK3CG, GRB2, SOS1, N- RAS, and CDKN1A/p21 are all in WGCNA modules positively correlated with SLEDAI (IPA representation with WGCNA overlap in Figure 9(b)). Except for N-RAS, all of these gene products are in modules that are positively correlated with antidsdna autoantibody and C3/C4 complement. New drug targets: identifying pathways abnormally expressed in SLE As an example of how the MS scoring system can be used to assess the suitability of Drugsin-Development as a repositioning candidates for lupus patients, MEDI-7169, a biologic specific for IL21 that plays roles in maintenance of CD8 cells and NK cells and is essential for plasma cell differentiation, 47 was examined by CoLTs and the signaling database scoring systems (MS ). Of note, neither IPA nor LINCS could be used to examine the suitability of the IL21R signaling pathway. IL21R signaling is not included in the IPA knowledge base and LINCS does not include perturbagen or in vitro knock-down experiments that examine the IL21R signaling pathway. The CoLT scoring system was modified to a scale of 4 to7 for drugs in development like the anti-il21 antibody since data regarding toxicology such as drug properties, metabolism and adverse events are often not publically available while a drug is in Lupus 155

162 大数据金融信息剪辑 1166 Identifying novel targets and drugs for SLE AC Grammer et al. (a) (b) Figure 9 Pathway analysis of the role for JAK inhibitors as repositioned drugs into SLE. (a) Individual scoring of each component of the JAK1/JAK2 signaling pathway by the MS-scoring system. Scores for each gene in the pathway are added up for each dataset and normalized into a percentage by dividing the raw score over the total number of genes that could be detected on the microarray chip in the signaling pathway. The final %score indicates the activation state of the pathway and can range from 100 to 100. Significance was assessed by overlap confidence intervals and overlap p values < 0.05 are indicated. (b) IPA representation of JAK signaling in active lupus B cells (GSE10325). Individual molecules that are in modules either positively or negatively correlated with SLEDAI as assessed by WGCNA analysis are respectively indicated by a red plus sign or a green minus sign. Lupus 156

163 文献传递 Identifying novel targets and drugs for SLE AC Grammer et al (a) (b) Figure 10 MS-scoring assessment of DiD (drugs in development) for repositioning into SLE. Scores for each gene in the pathway are added up for each dataset and normalized into a percentage by dividing the raw score over the total number of genes that could be detected on the microarray chip in the signaling pathway. The final %score indicates the activation state of the pathway and can range from 100 to 100. Significance was assessed by overlap confidence intervals and overlap p values < 0.05 are indicated. Individual scoring of each component of the IL21 (a) or IL17 (b) signaling pathway by the MS-scoring system to assess potential repositioning of MEDI-7169 (s) or secukinumab (b) into lupus. development. Of note, this modified CoLTs approach previously had been employed to evaluate the ROCK2-inhibitor KD-025, 29,48 and appears to be able to distinguish likely drug candidates. Lupus mice have been successfully treated by blocking IL MEDI-7169 received a very high modified CoLT score of 7 (DiD CoLT scale 4 to 7). Moreover, the IL21 signaling pathway scored positively by MS-scoring (Figure 10(a)) for both lupus B cell datasets (GSE10325, GSE4588). Both IRF4 and PRDM1/BLIMP1, that are MS components downstream of IL21 Lupus 157

164 大数据金融信息剪辑 1168 signaling and are transcription factors essential for differentiation of plasma cells, segregate into WGCNA modules (IRF4, green; PRDM1, red) positively correlated with SLEDAI; interestingly, PRDM1 is in the red module which is additionally positively correlated with anti-dsdna Ab as well as C3/C4 complement components. In this example, as was the case for ustekinumab, examination of the feasibility of MEDI-7169 as a potential drug repositioning candidate for lupus patients predicts its success as a B cell target as well as a target for a variety of tissues. Arrays from biopsies of the positive control lupus skin as well as synovium and kidney (class 3/4 glomerulus or tubuloinsterstitium) scored positively by MS for the IL21 signaling pathway targeted by MEDI Approved in 2015 by the FDA for treatment of psoriasis, secukinumab 8 is a biologic that targets IL17a and is promising as a high priority drug repositioning candidate for lupus due to its CoLT score. Unfortunately as with MEDI-7169, LINCS does not include any perturbagens that block the IL17R signaling pathway nor did LINCS do any in vitro experiments knocking down either IL17 or its receptor. Blocking IL17 has been reported to inhibit B cell differentiation to plasma cells, decrease the presence of Th17 cells in kidneys from lupus mice, and increase the number/function of regulatory T cells The IL17 signaling pathway scored well for lupus B cells, both by MS and IPA (Figure 10(b)). In this example, as was the case for ustekinumab, the feasibility of secukinumab as a potential drug repositioning candidate for lupus patients was evident from MS-scoring, especially in B cells and a variety of tissues. Interestingly, the DE profile from lupus PBMC, whole blood and synovium all score well by MS and also overexpress IL17Ra. Summary Identifying novel targets and drugs for SLE AC Grammer et al. Together, the bioinformatic results shown here, support many of the drug candidates scored by CoLTs using literature mining in addition to crowd-sourcing and ongoing focused discussions with experts in the lupus community. In addition, the unbiased meta-analysis approach outlined here utilizing differential gene expression analysis of mrna microarrays from the active lupus patients is a highly effective means to identify candidate FDA-approved drugs to move forward into small, focused proof-of-concept trials such as the Phase II ustekinumab SLE trial that began in the fall of Some high scoring drugs-in-development such as the ROCK2 inhibitor KD-025 can be repositioned directly into lupus patients from other autoimmune diseases, in this case from psoriasis. 49 Other high scoring drugs-in-development may be at the right stage to be advanced into animal models of lupus, into in vitro analysis with human lupus cells or directly into LuCIN-STAT clinical trials, depending on the amount of information available on each individual agent. The field of drug repositioning has emerged to the stage that potential candidates for a given disease such as lupus can be assessed by a variety of algorithms and scoring systems to determine the feasibility of each candidate. This review compared and contrasted a hypothesis-driven approach, literature mining with prioritization by the CoLT scoring system that emerged from the LRxL-STAT lupus drug repositioning initiative, with unbiased approaches that include the currently available meta-analysis of mrna expression data (incorporating pathway and functional categorization tools). Both approaches are dynamic and can be focused and updated in real-time as new information emerges with examples given for newly approved drugs and drugs-in-development. Examples of candidate lupus drugs identified by CoLTs and confirmed by meta-analysis include the anti-il12/23 p40 antibody ustekinumab 10 that was repositioned into a lupus Phase II clinical trial from psoriasis after high priority scoring by CoLTs. Moreover, newly approved drugs in targeting the proteasome, IL6 and HDACs could be rapidly scored based on older FDA-approved drugs that were scored in the inaugural 2013 LRxL-STAT CoLT scoring group. The example of the drug-indevelopment KD-025 7, a ROCK2 inhibitor that is being repositioned into lupus from psoriasis based on modified CoLT scoring was extended with the example of MEDI , an anti-il21 monoclonal that is being considered for lupus. A first-in-class drug approved in 2015, secukinumab 8, an anti- IL17a Ab, was reviewed as an example of the ongoing nature of drug repositioning, especially in context of hypothesis-based CoLT scoring as well as the unbiased gene expression multi-parameter scoring system that included IPA and MS. In summary, this review outlined the various hypothesis and unbiased methods of drug repositioning using lupus as an example disease and B cells as an example cell type to demonstrate approaches to target identification and drug positioning and repositioning that may yield new therapies for SLE. Lupus 158

165 文献传递 Declaration of Conflicting Interests The author(s) declared no potential conflicts of interest with respect to the research, authorship, and/or publication of this article. Funding The author(s) disclosed receipt of the following financial support for the research, authorship, and/or publication of this article: The authors received financial support from the ALR/LRI (now the LRA) for crowd-sourcing/literature mining and from the John and Marcia Goldman Foundation for BigData analysis of gene expression. References 1 Lan Langedijk J, Mantel-Teeuwisse AK, Slijkerman DS, Schutjens MH. Drug repositioning and repurposing: terminology and definitions in literature. Drug Discov Today 2015; 20: Ashburn TT, Thor KB. Drug repositioning: identifying and developing new uses for existing drugs. Nat Rev Drug Discov 2004; 3: Roundtable on Translating Genomic-Based Research for Health, Board on Health Sciences Policy, Institute of Medicine. Drug repurposing and repositioning: workshop summary. Washington, DC: National Academies Press, Minie M, Chopra G, Sethi G, et al. CANDO and the infinite drug discovery frontier. Drug Discov Today 2014; 19: Bisgin H, Liu Z, Kelly R, Fang H, Xu X, Tong W. Investigating drug repositioning opportunities in FDA drug labels through topic modeling. BMC Bioinformatics 2012; 13(Suppl 15): S6. 6 Hurle MR, Yang L, Xie Q, Rajpal DK, Sanseau P, Agarwal P. Computational drug repositioning: from data to therapeutics. Clin Pharmacol Ther 2013; 93: Relle M, Weinmann-Menke J, Scorletti E, Cavagna L, Schwarting A. Genetics and novel aspects of therapies in systemic lupus erythematosus. Autoimmun Rev 2015; 14: Deng Y, Tsao BP. Advances in lupus genetics and epigenetics. Curr Opin Rheumatol 2014; 26: Marion TN, Postlethwaite AE. Chance, genetics, and the heterogeneity of disease and pathogenesis in systemic lupus erythematosus. Semin Immunopathol 2014; 36: Kyogoku C, Smiljanovic B, Gru n JR, et al. Cell-specific type I IFN signatures in autoimmunity and viral infection: what makes the difference? PLoS One 2013; 8: e Smiljanovic B, Gru n JR, Biesen R, et al. The multifaceted balance of TNF-a and type I/II interferon responses in SLE and RA: how monocytes manage the impact of cytokines. J Mol Med 2012; 90: Kennedy WP, Maciuca R, Wolslegel K, et al. Association of the interferon signature metric with serological disease manifestations but not global activity scores in multiple cohorts of patients with SLE. Lupus Sci Med 2015; 2: e Lauwerys BR, Hachulla E, Spertini F, et al. Down-regulation of interferon signature in systemic lupus erythematosus patients by active immunization with interferon a-kinoid. Arthritis Rheum 2013; 65: Chiche L, Jourde-Chiche N, Whalen E, et al. Modular transcriptional repertoire analyses of adults with systemic lupus erythematosus reveal distinct type I and type II interferon signatures. Arthritis Rheumatol 2014; 66: Identifying novel targets and drugs for SLE AC Grammer et al. 15 Jabbari A, Suárez-Farin as M, Fuentes-Duculan J, et al. Dominant Th1 and minimal Th17 skewing in discoid lupus revealed by transcriptomic comparison with psoriasis. J Invest Dermatol 2014; 134: Berthier CC, Bethunaickan R, Gonzalez-Rivera T, et al. Crossspecies transcriptional network analysis defines shared inflammatory responses in murine and human lupus nephritis. J Immunol 2012; 189: Nzeusseu Toukap A, Galant C, Theate I, et al. Identification of distinct gene expression profiles in the synovium of patients with systemic lupus erythematosus. Arthritis Rheum 2007; 56: Rai G, Rai R, Saeidian AH, Rai M. Microarray to deep sequencing: transcriptome and mirna profiling to elucidate molecular pathways in systemic lupus erythematosus. Immunol Res 2016; 64: Costa-Reis P, Russo PA, Zhang Z, et al. The role of micrornas and human epidermal growth factor receptor 2 in proliferative lupus nephritis. Arthritis Rheumatol 2015; 67: Chung SA, Nititham J, Elboudwarej E, et al. Genome-wide assessment of differential DNA methylation associated with autoantibody production in systemic lupus erythematosus. PLoS One 2015; 10: e Wu H, Zhao M, Tan L, Lu Q. The key culprit in the pathogenesis of systemic lupus erythematosus: aberrant DNA methylation. Autoimmun Rev 2016; 15: Avorn J. The $2.6 billion pill: methodologic and policy considerations. N Engl J Med 2015; 372: National Institute of Arthritis and Musculoskeletal and Skin Diseases (NIAMS). Handout on Health: Systemic Lupus Erythematosus. Available at: Info/Lupus/default.asp (February 2015). 24 Aldridge C, Moddares M. Celebrating world lupus day: gaining ground with effective policy. Available at: html (May 2014). 25 Grammer AC, Ryals M, Lipsky PE. A comprehensive approach to identify approved drugs and treatments for repositioning as therapies for systemic lupus erythematosus. Arthritis Res Ther 2014; 16(Suppl 1): A Lipsky PE, Ryals M, Grammer AC. A novel strategy to identify and evaluate approved drugs and treatments for repositioning as therapies for systemic lupus erythematosus (SLE). Arthritis Rheumatol 2014; 66: S294 S Robl R, Catalina M, Heuer S, et al. Identification of novel pathway abnormalities in B cells from SLE patients. In: FOCIS 2015, San Diego, CA, June 2015, paper no. W55. Federation of Clinical Immunology Societies. 28 Robl R, Heuer S, Catalina M, et al. Meta-analysis of SLE gene expression data identifies novel abnormalities in lymphocytes from the circulation, kidney, skin or synovium that define systemic networks of autoimmunity. Keystone Syst Immunol 2016; Grammer AC, Ryals MM, Catalina MD, Lipsky PE. Repositioning drugs for SLE. In: Tsokos G, Buyon J, Koike T, Lahita R (eds), Repositioning drugs for SLE. Systemic Lupus Erythematosus 2016; 5th ed Munos B new drug approvals hit 66-year high. Available at: (January 2016). 31 Munos B new drug approvals hit 66-year high. Available at: (January 2016). 32 Alliance for Lupus Research. New lupus clinical trial to study ustekinumab. Available at: V4QmgTkrLgo (April 2015). 33 Lu R, Munroe M, Guthridge J, et al. IFN-c (Th 1 ), IL4 (Th 2 ), and IL5 (Th 2 ) are elevated in pre-clinical SLE and predict transition to classified disease prior to appearance of autoantibodies or clinical criteria. Arthritis Rheumatol 2014; 66: S708 S Ichinose K, Arima K, Ushigusa T, et al. Distinguishing the cerebrospinal fluid cytokine profile in neuropsychiatric systemic lupus 1169 Lupus 159

166 大数据金融信息剪辑 1170 Identifying novel targets and drugs for SLE AC Grammer et al. erythematosus from other autoimmune neurological diseases. Clin Immunol 2015; 157: Watanabe H, Mamelak AJ, Weiss E, et al. Anti-vascular endothelial growth factor receptor-2 antibody accelerates renal disease in the NZB/W F1 murine systemic lupus erythematosus model. Clin Cancer Res 2005; 11: Vazgiourakis VM, Zervou MI, Eliopoulos E, et al. Implication of VEGFR2 in systemic lupus erythematosus: a combined genetic and structural biological approach. Clin Exp Rheumatol 2013; 31: Li H, Pauza CD. CD25(þ) Bcl6(low) T follicular helper cells provide help to maturing B cells in germinal centers of human tonsil. Eur J Immunol 2015; 45: Ding Y, Li J, Yang P, et al. Interleukin-21 promotes germinal center reaction by skewing the follicular regulatory T cell to follicular helper T cell balance in autoimmune BXD2 mice. Arthritis Rheumatol 2014; 66: Feng X, Wang D, Chen J, et al. Inhibition of aberrant circulating Tfh cell proportions by corticosteroids in patients with systemic lupus erythematosus. PLoS One 2012; 7: e Lugar PL, Love C, Grammer AC, Dave SS, Lipsky PE. Molecular characterization of circulating plasma cells in patients with active systemic lupus erythematosus. PLoS One 2012; 7: e Campain A, Yang YH. Comparison study of microarray metaanalysis methods. BMC Bioinformatics 2010; 11: Ramasamy A, Mondry A, Holmes CC, Altman DG. Key issues in conducting a meta-analysis of gene expression microarray datasets. PLoS Med 2008; 5: e Brainarray chip definition files (CDFs). Open source. Available at: (2016). 44 Ritchie ME, Phipson B, Wu D, et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res 2015; 43: e Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 2008; 9: De Souza A, Ali-Shaw T, Strober BE, Franks AG Jr. Successful treatment of subacute lupus erythematosus with ustekinumab. Arch Dermatol 2011; 147: Gharibi T, Majidi J, Kazemi T, Dehghanzadeh R, Motallebnezhad M, Babaloo Z. Biological effects of IL-21 on different immune cells and its role in autoimmune diseases. Immunobiology 2016; 221: I. Santos. Kadmon Corporation s lupus treatment candidate KD025 designated top priority. Available at: /01/09/kadmon-corporations-lupus-treatment-candidatedesignated-top-priority/ (January 2016). 49 Vugmeyster Y, Guay H, Szklut P, et al. In vitro potency, pharmacokinetic profiles, and pharmacological activity of optimized anti- IL-21R antibodies in a mouse model of lupus. MAbs 2010; 2: Herber D, Brown TP, Liang S, Young DA, Collins M, Dunussi- Joannopoulos K. IL-21 has a pathogenic role in a lupus-prone mouse model and its blockade with IL-21R.Fc reduces disease progression. J Immunol 2007; 178: Yang X, Yang J, Chu Y, et al. T follicular helper cells mediate expansion of regulatory B cells via IL-21 in Lupus-prone MRL/lpr mice. PLoS One 2013; 8: e Rankin AL, Guay H, Herber D, et al. IL-21 receptor is required for the systemic accumulation of activated B and T lymphocytes in MRL/MpJ-Fas(lpr/lpr)/J mice. J Immunol 2012; 188: Hsu HC, Yang P, Wang J, et al. Interleukin 17-producing T helper cells and interleukin 17 orchestrate autoreactive germinal center development in autoimmune BXD2 mice. Nat Immunol 2008; 9: Amarilyo G, Lourenc o EV, Shi FD, La Cava A. IL-17 promotes murine lupus. J Immunol 2014; 193: Wen Z, Xu L, Xu W, et al. Interleukin-17 expression positively correlates with disease severity of lupus nephritis by increasing anti-double-stranded DNA antibody production in a lupus model induced by activated lymphocyte derived DNA. PLoS One 2013; 8: e Lupus 160

167 文献传递 Copyright of Lupus is the property of Sage Publications, Ltd. and its content may not be copied or ed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or articles for individual use. 161

168 大数据金融信息剪辑 RESEARCH ARTICLE How Does National Scientific Funding Support Emerging Interdisciplinary Research: A Comparison Study of Big Data Research in the US and China Ying Huang 1, Yi Zhang 1,2, Jan Youtie 3, Alan L. Porter 4, Xuefeng Wang 1 * a School of Management and Economics, Beijing Institute of Technology, Beijing, , China, 2 Centre for Quantum Computation and Intelligent Systems, Faculty of Engineering and Information Technology, University of Technology, Sydney, NSW 2007, Australia, 3 Enterprise Innovation Institute, Georgia Institute of Technology, Atlanta, GA, 30332, United States of America, 4 School of Public Policy, Georgia Institute of Technology, Atlanta, GA, 30332, United States of America * wxf5122@gmail.com OPEN ACCESS Citation: Huang Y, Zhang Y, Youtie J, Porter AL, Wang X (2016) How Does National Scientific Funding Support Emerging Interdisciplinary Research: A Comparison Study of Big Data Research in the US and China. PLoS ONE 11(5): e doi: / journal.pone Editor: James Wilsdon, University of Sheffield, UNITED KINGDOM Received: August 11, 2015 Accepted: April 14, 2016 Published: May 24, 2016 Copyright: 2016 Huang et al. This is an open access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. Data Availability Statement: All relevant data are within the paper and its Supporting Information files. Funding: This research is supported by grants from the US National Science Foundation (award no ), the National High Technology Research and Development Program of China (grant no. 2014AA015105), the General Program of National Natural Science Foundation of China (grant no ). Besides, the authors are grateful for the scholarship provided by the China Scholarship Council (CSC Student ID ). The funders had no role in study design, data collection Abstract How do funding agencies ramp-up their capabilities to support research in a rapidly emerging area? This paper addresses this question through a comparison of research proposals awarded by the US National Science Foundation (NSF) and the National Natural Science Foundation of China (NSFC) in the field of Big Data. Big data is characterized by its size and difficulties in capturing, curating, managing and processing it in reasonable periods of time. Although Big Data has its legacy in longstanding information technology research, the field grew very rapidly over a short period. We find that the extent of interdisciplinarity is a key aspect in how these funding agencies address the rise of Big Data. Our results show that both agencies have been able to marshal funding to support Big Data research in multiple areas, but the NSF relies to a greater extent on multi-program funding from different fields. We discuss how these interdisciplinary approaches reflect the research hot-spots and innovation pathways in these two countries. Introduction Dramatic advances resulting from the rapid pace of technological developments and new interdisciplinary fields are on the horizon [1]. Science and engineering research continually evolves beyond the boundaries of single disciplines and offers employment opportunities that require not only depth of knowledge but also breadth of knowledge, integration, synthesis, and an array of skills. Interdisciplinary research (IDR), defined as work which integrates theories, methods, tools and/or concepts from multiple specialized knowledge bases, is often treated as proxy for research to advance fundamental understanding or to solve problems whose solutions are beyond the scope of a single discipline or area of research practice [2, 3]. Since IDR is increasingly prominent today, compiling reflections on its premises and issues could serve PLOS ONE DOI: /journal.pone May 24, /

169 文献传递 How Does Scientific Funding Support Interdisciplinary Research and analysis, decision to publish, or preparation of the manuscript. Competing Interests: The authors have declared that no competing interests exist. those engaged in R&D analysis, policy and management [4], and accelerate the process of scientific discoveries and societal problem solving. Interdisciplinarity has three distinct components that are typically taken into account: Variety, Balance and Disparity [5]. Shannon entropy [6] and Simpson [7] offered popular diversity indices in the ecological literature and more recently in the interdisciplinarity literature to capture both variety and balance of referenced disciplines. Furthermore, Rao [8] and Stirling [5] proposed disparity as the third dimension, and Rao-Stirling diversity was a composite measure of the three diversity components [5]. Further indicators, based on the above theoretical foundations, have been proposed to measure IDR, including network coherence [9], specialization scores [10], the integration score [11, 12], the diffusion score [13], and other improved indicators [14, 15]. However, most of bibliometric literatures on measuring IDR focuses on the outputs of science, or publications [16]. Less emphasis has been placed on inputs, such as research proposals, which typically contain broader information than research articles. Proposals reflect on academic individuals, networks, and evolutionary processes of science and directly indicate overarching research programs, which, if funded, can lead to multiple publications [17]. In general, research proposals are granted by national governments and aimed to support academic institutions and R&D departments to conduct basic research, the content of which focuses on new ideas, concepts, and potential innovative actions. Understanding of funding proposals could be considered as an express path to reveal how evolutionary R&D pathways work in given countries, regions, and research fields [18]. Scientific funding plays an essential role in individual scientific research, university discipline construction, and national innovation system patterns [19]. Previous research on scientific funding has focused on research investments [20], optimization design for peer review [21], and funding distribution [22]. In addition, evaluations of the social impact [23, 24] and performance [25, 26] of science funding reflect an evaluative perspective on funding research. As science increasingly deals with boundary-spanning problems, various policy and funding initiatives have been developed to encourage interdisciplinary research to push forward academic capability and accelerate scientific discovery. National scientific funding organizations specifically support research, including investigations of an interdisciplinary nature, through a variety of target methods [24]. As the two leading scientific funding organizations in the world, National Science Foundation (NSF) of the US and National Natural Science Foundation of China (NSFC) are noteworthy. NSFC, as the largest scientific funding agency in China, has made considerable efforts to promote basic and applied research [27]. NSFC not only supports cutting-edge ideas and projects in different disciplines, but also sponsors high-level strategic academic exchange platforms (e.g. Shuangqing Forum) to promote interdisciplinary studies and innovative cultures and create a favorable environment for research [28]. Dr. Wei Yang, the present president of NSFC, defined strengthening interdisciplinary interaction as one key mission of NSFC [29]. The US NSF supports research and education in non-medical fields of science and engineering, not only to produce leading edge research, but also to narrow the gap between science and society through the use of broader impacts criteria [30, 31]. NSF treats fostering IDR as its high priority and encourages researchers to conduct IDR research in novel and emerging areas extending beyond any particular current NSF programs to keep the US at the leading edge of discovery in a wide range of scientific areas [32]. We are especially interested in examining how these two agencies support research in a rapidly growing interdisciplinary domain. The domain of interest for this study is Big Data. In an increasingly complex economic and social environment, accessing vast amounts of data and information can help organizations and governments make better policies, predictions and decisions [33]. Big Data is the application of data technology to obtain valuable information from various types of extremely large data sets, which can come from social networks, images, PLOS ONE DOI: /journal.pone May 24, /

170 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research sensors, the web, or other unstructured sources [34]. Big Data has its legacy in information technology developments. However, its capacity and analytic capabilities promise to make an essential contribution in areas such as traffic management, logistics, health care, and education [35]. Big Data research can help further these scientific and societal benefits for governments, enterprises and academic institutions. Aiming to make the most of the fast-growing volume of digital data, the US government established a Big Data Research and Development Initiative program on March 29, 2012, which committed over $200 million in new funding through six agencies to extract knowledge and insights from large and complex collections of digital data [36]. The Chinese government has similarly targeted Big Data as a strategic area of research and development [37]. Since 2012, a large number of Big Data-related projects have been supported by the Ministry of Science and Technology, the National Development and Reform Commission, the Ministry of Industry and Information Technology, and other central governmental departments of China. Porter and his colleagues [38] figured out that Big Data scientific publications grew dramatically in 2013 and 2014, by more than four times the number of the papers published in They further reported that the leading countries based on author location were the US and China; these two countries accounted for more than half of all Big Data publications and nearly all of the top 30 author organizations. In this paper, we apply tech mining [i.e., text mining of science, technology & innovation (ST&I) information to generate useful intelligence] [39], network analysis, and interdisciplinary assessment methods to understand how NSF and NSFC have ramped-up their funding awards to address the rapid rise of Big Data research. Our particular focus is on research awards rather than scientific articles [40 43]. Our research addresses the following questions about how NSF and NSFC support research in rapidly emerging areas, based on a case study of the emergence of Big Data research: 1. How do NSF and NSFC differ in terms of the amount of funding resources allocated to Big Data research over time? 2. To what extent do NSF and NSFC fund similar or different subareas of Big Data research? 3. What are the disciplinary ranges and connections in Big Data funded proposals in the two organizations and how do they differ in the degree of interdisciplinarity of funding research? The remainder of this paper consists of four sections. Following this general introduction, the Methodology section describes the framework and methodology. The Results section presents comparative results of the research profiling and tech mining analyses. The Conclusion and Discussion section reviews our research, identifies research limitations, and indicates promising research opportunities to pursue in the future. Methodology Based on the aforementioned research questions, we retrieved a raw dataset of all funded research proposals relating to Big Data from the NSF official website ( and the NSFC s ISIS system (Internet-based Science Information System) ( ). The NSF website offers two different search types: (1) simple search: provides title, abstract, names, institutions, programs and other information associated with an award; and (2) consolidated advanced search: provides access to all fielded searches. In this paper, we chose the consolidated advanced search. PLOS ONE DOI: /journal.pone May 24, /

171 文献传递 How Does Scientific Funding Support Interdisciplinary Research The ISIS system was applied nationwide in 2003, and it has been well received and supports NSFC to implement managerial control to cope with China s rapidly growing research productivity [44]. In the ISIS system, users can retrieve the information by typing specific search terms in the query page, but only a few fields can be viewed: Awards Number, Disciplinary Application Code, Title, Principal Investigator, Affiliation, Sponsored Funds, Start Date and End Date. A key question is when to begin the search. First, we originally set the starting year at 2008, which is when a special issue of Nature, what Big Data sets mean for contemporary science [45], was published. However, there are no awards for the year 2008 in our retrieval of funded proposals. Thus, 2009 became our starting year. Second, we originally planned to use a topical search, which captures the occurrences of Big Data in titles, abstracts and keywords [46]. This approach worked for searching the NSF awards database. Ultimately, we obtained 921 records from NSF and 434 records from NSFC during the period of 2009 to However, because the NSFC data are in Chinese, we found that use of standard codes such as the NSFC s Disciplinary Application Code (DAC), was more effective than direct translation of topics during the analyzing process. We validated the DACs further by arranging native speakers to examine our approach and select NSFC funded proposal records to guarantee its comparability. We conducted a retrieval of publications from Web of Science ( webofknowledge.com/) to verify some conclusions and judgments about searching the funded proposal databases using an elementary search strategy of TS = Big Data. This approach resulted in 2815 records during the period of 2008 to 2015 (retrieved on January 8, 2016). We imported the data into the text-mining tool VantagePoint ( com/), and ascertained from the funding acknowledgements section of these papers that 272 publications were supported by NSFC, and 198 by NSF. They ranked as the top 2 national funding agencies, and occupied 22.48% and 16.36% respectively in all funded publications (1210 publications). All raw data of Big Data proposals funded by NSF and NSFC can be founded in S1 File. In addition to seeking to measure basic activity information, we also attempted to interpret the reasons and rules behind the activities of these two funding agencies. To this end we drew on the work of tech mining research [47, 48] to extract metadata for research profiling. We also introduced two indicators to measure the inequality of funding organization distribution and the degree of interdisciplinarity for a single granted project. The framework of this paper, comprising the data resources, research questions, and analytical methods, is diagramed below (Fig 1). Results Research Profling Analysis Fig 2 shows grant activity trends for Big Data supported by NSF and NSFC from 2009 to Looking at the counts of grant awards, both NSF and NSFC supported very limited Big Data research before For NSF, we can see an increase in 2012; a notable rise in both counts of Big Data awards and dollar amounts associated with these counts can be observed. For NSFC, the number of granted projects increased from only 1 record in 2009 to 61 records in 2013; these figures for NSF are 2 and 204. In regards to funds granted, NSF sponsored universities and other organizations with $45.82 million in 2012, 42 times more than NSFC did ($1.07 million dollars). NSF and NSFC both continued to increase funding, reaching $ million and $37.45 million in 2014, respectively. There is a slight downturn in NSFC award activity in 2015 which is not presented in the NSF award data. This downturn in NSFC award activity may not necessarily represent a decline in funding Big Data research in China. In China, nearly every PLOS ONE DOI: /journal.pone May 24, /

172 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research Fig 1. The Framework of Paper. doi: /journal.pone g001 province has its own science foundation (including Natural Science Foundation and Social Science Foundation). At the same time, several central departments also offer funding to support scientific research, such as the Ministry of Science and Technology of China, the Ministry of Education of China, and so on. While a parallel system exists for the US (through research funding by state governments, other federal agencies, and private non-profit organizations), the US system is not as extensive as is the case in China. Why was 2013 such a bellwether year for Big Data research proposals in both countries? We are not privy to all the reasons for this growth, but one factor is likely to be the White House s announcing the Big Data Research and Development Initiative in NSF subsequently announced its support of new research to extract knowledge and insights from large and complex collections of digital data, including developing new methods of deriving knowledge from data; constructing a new infrastructure to manage, curate and deliver data to communities; and forging new approaches for associated education and training [49]. Four specific programs were set up through the NSF s Computer and Information Science and Engineering Directorate Fig 2. Summary of Big Data Awards Supported by NSF and NSFC. Note: NSFC funds data are transformed by using the exchange rates in current year. doi: /journal.pone g002 PLOS ONE DOI: /journal.pone May 24, /

173 文献传递 How Does Scientific Funding Support Interdisciplinary Research Table 1. The Profile of Big Data- Related Shuangqing Forum. Workshop ID Topic Time Place Organizers 89th Challenging scientific problems in the fields of technologies and applications of Big Data 109th Big data and major basic problems on management and decisions March 26 27, th Multi-disciplinary methods for Big Data analysis and processing March 26 27, 2015 doi: /journal.pone t001 March 5 7, 2013 Shanghai NSFC, Tongji University Beijing Guangzhou NSFC NSFC, Sun Yat-sen University (CISE). One of the most important programs is the Critical Techniques and Technologies for Advancing Foundations and Applications of Big Data Science & Engineering (BIGDATA Program). Multiple NSF directorates and other federal agencies participated in this program. The research directions of NSFC are influenced by NSF to some extent. At the same time, NSFC began to organize the high-level Big Data-related Shuangqing Forum academic workshop in 2013 to focus on national strategic development. This workshop was repeated in subsequent years, which suggested NSFC s persistent value towards the Big Data area for strategic research investment (Table 1). These forums proposed several frontiers for crucial scientific problems and suggested policies and solutions associated with research on technologies and applications of Big Data [50]. Moreover, the topical focus progressed from an emphasis on problems in the Shanghai workshop in 2013 to methods two years later at the Guangzhou workshop. What type of projects resulted from these research investments? Table 2 indicates the proportion of granted projects by organization type in the US and China. Both NSF and NSFC tended to emphasize academic research, which accounted for 92.83% and 88.25% of the total number of funded proposals. This finding is not surprising given NSF and NSFC are the agencies with an orientation toward providing support for academic research [51]. At the same time, NSFC awards are less intensely focused on universities than are NSF s. This lesser focus lies in the importance of research institutes in the Chinese research and innovation system, particularly the Chinese Academy of Sciences. The Chinese Academy of Sciences is seen as the linchpin of China s drive to explore and harness high technology and the natural sciences for the benefit of China. Thus, it is not surprising that the Chinese Academy of Science would be prominent among institutions receiving awards from NSFC. About 11.29% of NSFC grants were granted to research institutes compared to only 2.28% for NSF. However, NSFC does not support research funding by individuals and corporations, so none of NSFC s funding went to Table 2. Grant Recipient Organizations: NSF and NSFC. Organization Type Academic University Numbers of NSF Awards % of Total NSF Big Data Awards Numbers of NSFC Awards % of Total NSFC Big Data Awards Research Institution Corporation Other Note: Academic University is the organization granting academic degrees in various subjects; Research Institution is an independent, nonprofit research institute; Corporation is a company or group of people authorized to purse profit-making rather than non-profit; Other includes individuals, hospitals and other research organizations. doi: /journal.pone t002 PLOS ONE DOI: /journal.pone May 24, /

174 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research the private sector. Nearly 4.23% of awards were conferred on individuals and corporations by NSF through grants, and cooperative agreements. We provided a further measure of the extent of concentration of the distribution of funding by NSF and NSFC. In this context, we applied a normalized Gini coefficient to measure the inequality of funding organization distribution, both in project counts and funding amounts. The Gini index was originally proposed to measure income inequality, but it also has been used to capture the inequality, unevenness, and imbalance of the distribution of references across involved disciplines. Higher Gini coefficients represent greater inequality, in this case, of scientific funding distribution across organizations. The normalized Gini coefficient can be calculated as [52]: X n G n ¼ i¼1 ðn 1Þ ð2i n 1ÞX i X n X i i¼1 ð1þ In the eq (1), n indicates the number of sponsored organizations and n>1, i is the ranking of n, and x i presents the number of projects or the amount of funds obtained by the i th organization. We applied this measure to the distribution of organizations receiving grants from the two agencies over the 2012-to-2015 period because the time after 2012 comprised the bulk of the grants. The results indicated different distributions for the number of grants (FundNum) and the amount of sponsored money (FundMoney) (Fig 3). In terms of the FundNum, NSF has a relatively lower Gini coefficient than does NSFC. NSFC s Gini coefficient was much lower in 2015 than in Furthermore, when one looks at the distribution of money, we can see that NSFC s Gini coefficient was slightly higher than NSF s in 2012, but coefficients associated with the two sponsors were relatively similar by NSF s coefficient associated with the distribution of money exhibited a slight decrease over the three years while NSFC s coefficient was decreasing more sharply. Fig 3. Gini Coefficient in Terms of the Number of Grants (FundNum) the Amount of Sponsored Money (FundMoney) of NSF and NSFC. doi: /journal.pone g003 PLOS ONE DOI: /journal.pone May 24, /

175 文献传递 How Does Scientific Funding Support Interdisciplinary Research Based on the Gini coefficient analysis, we can see that the Gini coefficients were very high in the early stages, in terms of granted numbers and funds, at both sponsoring agencies. It is inferred that in the beginning stage of emerging interdisciplinary research, relatively few organizations care about, or have considerable influence on, such newly-formed topics. From the overall trends of the Gini coefficient, the awards distribution became broader with the advance of Big Data studies, and the number of grants was more balanced between different organizations than the amount of sponsored money bestowed. Table 3. Disciplinary Composition of the Big Data Awards in NSF and NSFC. NSF Discipline Records % of Total NSF Big Data Awards Computer & Information Science & Engineering (CISE) Proposal Programmatic Concentration Analysis The extent to which funding is concentrated or spread among multiple disciplinary programs in a funding agency may well be an important factor in understanding the development of research in a rapidly emerging field. The NSF is organized into directorates that align with broad scientific disciplines: Biological Sciences (BIO), Computer & Information Science & Engineering (CISE), Education & Human Resources (EHR), Engineering (ENG), Geosciences (GEO), Mathematical & Physical Sciences (MPS), Social, Behavioral & Economic Sciences (SBE) and Other (non-disciplinary specific). Because MPS houses several markedly disparate disciplines, the MPS divisions (Astronomical Sciences, Chemistry, Material Sciences, Mathematics, and Physics) are often used instead [17]. In this paper, we treat the divisions under these directorates as different research areas and consider the NSF s detailed programs as a proxy for research fields. Similarly, in the NSFC, there are eight scientific departments: Mathematical and Physical Science (A), Chemical Sciences (B), Life Sciences (C), Earth Sciences (D), Engineering and Materials Sciences (E), Information Sciences (F), Management Sciences (G) and Medical Sciences (H) (The department of Medical Sciences in NSFC established in 2010). For each project, NSFC applicants must provide a DAC in order to select suitable peer reviewers and help classify the project in its evaluation. DAC is a three-level code indicating the detailed discipline to which an application belongs; it is composed of English characters and Arabic numerals. The English character is the code of a scientific department. The three levels of Arabic numerals denote research areas, research fields and research directions, respectively. The detailed research areas and their corresponding codes are shown in S1 Table. Although NSF and NSFC have different disciplinary categorizations, most of these categories can be matched. Table 3 indicates that the categories of Information Sciences and NSFC Discipline Records %of Total NSFC Big Data Awards Information Sciences (IS) Engineering (ENG) Management Sciences (MaS) Mathematical & Physical Sciences (MPS) Social, Behavioral & Economic Sciences (SBE) Engineering & Materials Sciences (EMS) Earth Sciences (ES) Education & Human Resources (EHR) Mathematical & Physical Sciences (MPS) Biological Sciences (BIO) Medical Sciences (MeS) Geosciences (GEO) Chemistry Sciences (CS) Other Life Sciences (LS) doi: /journal.pone t003 Other PLOS ONE DOI: /journal.pone May 24, /

176 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research Table 4. Research Areas and Main Research Fields of CISE in NSF. Research Areas and Main Research Fields Records % of Total NSF Big Data Awards Information & Intelligent Systems *Big Data Science & Engineering 60 - *Info Integration & Informatics 51 - *Information Technology Research 17 - Computing & Communication Foundations *Communication & Information Foundations 26 - *Algorithmic Foundations 21 - *Software & Hardware Foundation 18 - Computer & Network Systems *Computer Systems 31 - *Computing research infrastructure 10 - Advanced Cyberinfrastructure *Campus Cyberinfrastructure 37 - * indicates the research fields. doi: /journal.pone t004 Computer & Information Science & Engineering account for the largest number of proposed projects. Big Data has conventionally been considered as a part of information sciences since it is the process of mining potential information from voluminous amounts of structured, semistructured and/or unstructured data. Big Data also has a very close relationship with information and computer technologies, including data collection, storage, processing, and analysis/ visualization [53]. For NSF, the second ranking discipline is Engineering, but for NSFC, it is Management Sciences. This shows that US researchers cared more about practical applications in specialized engineering fields while Chinese scholars are more interested in strategic planning to improve decision-making in critical development areas, such as healthcare, social administration, environment protection and resource management. One factor underlying this difference is that China and US are at different stages of development, so Big Data is sometimes treated as a powerful tool to solve practical issues in the US but as a tool for management reform in China. In order to obtain insights into the specific research areas and their main research fields (more than 15 projects belong to a certain area) between Computer & Information Science & Engineering (CISE) of NSF and Information Sciences (IS) of NSFC, we organized them in Table 4 (for NSF) and Table 5 (for NSFC). For NSF, the main four research areas in CISE were Information & Intelligent Systems (189 records, 20.52%), Computing & Communication Foundations (114 records, 12.38%). Computer & Network Systems (107 records, 11.62%) and Advanced Cyberinfrastructure (101 records, 10.97%) and. The top research fields within these areas were Big Data Science & Engineering, Info Integration & Informatics, Campus Cyberinfrastructure and Computer Systems. Although we could not create a side-by-side comparison on research fields between NSF and NSFC, it was still possible to compare and contrast the top funding fields and hot-spots in Tables 4 and 5. As the comparison in topics relies heavily on the accuracy of the translations, we attempted to conduct this analysis for NSFC based on the DAC that included subject classification information, and then translated the main research fields corresponding to the DAC. The results indicate that NSFC primarily funds Big Data research out of the Computer Science area, which comprises nearly 39.17% of all Big Data awards. Another 10.83% of awards are conferred by the Automation area and 4.38% by the Electronics & Information System. Within PLOS ONE DOI: /journal.pone May 24, /

177 文献传递 How Does Scientific Funding Support Interdisciplinary Research Table 5. Research Areas and Main Research Fields of IS in NSFC. Research Areas and Main Research Fields Records % of Total NSFC Big Data Awards Computer Science *Computer Applications Technology 65 - *Computer Software 41 - *Computer Network 23 - *Computer Architecture 17 - Automation *Artificial Intelligence & Knowledge Engineering 18 - Electronics & Information System * indicates the research fields. doi: /journal.pone t005 the Computer Science area, NSFC has balanced the number of awards across several different scientific directions. Computer Applications Technology, Computer Software, Computer Network and Computer Architecture are important fields in the Computing Science research area. Additionally, other prominent research field is Artificial Intelligence & Knowledge Engineering (18 records) in the Automation area (47 records). When proposers apply for funding from the NSFC, they are required to provide project terms or keywords. As far as we know, keywords are not required for NSF proposals and are therefore not comparably available on the NSF website. To address the lack of investigator-provided keywords, we conducted Natural Language Processing (NLP) on the proposal title field. We used the title field, rather than the abstract field, because the terms in the title were more distinctive. We extracted phrases from the title by applying NLP with the support of the text-mining tool suite- VantagePoint. Phrases and terms retrieved in this way are large and "noisy," making them difficult to manually categorize. Using bibliometric and text mining techniques, this paper applied semi-automated "Term Clumping" to generate better term lists for achieving competitive technical intelligence [54]. For the NSFC awards information, we first extracted the title terms and uploaded them to the LTP-Cloud (Language Technology Platform Cloud) ( to process Chinese word segmentation. After obtaining a list of phrases, we imported these keywords into our own Chinese text analysis tools ItgInsight to help us conduct text cleaning. This process was comprised of four steps: (1) Common and basic term removal, e.g., instance, technology; (2) Fuzzy word matching (to combine terms with similar structures based on pattern commonality, such as stemming e.g., institute and institution, and combining singular and plural forms of English words, e.g., technology and technologies); (3) Extreme word removal [to remove very common (top 5%) and very rare (occurrence only in single records) terms]; (4) Combine term networks (to combine selected low-frequency phrases with the high-frequency phrases that appear in the same records, and sharing terms). We then translated the top 50 high-frequency Chinese phrases and invited some postgraduates with English language background or bachelor s degree to validate the translation. Before visualizing the semantic networks based on these keywords, we calculated the frequency of specific terms. The semantic networks of the 30 most frequently occurring terms in Big Data are shown in Fig 4 for NSF and Fig 5 for NSFC, which are mapped in the visualization and exploration software- Gephi ( The node size represents the frequency of a term in proposal titles, and the linkages among different terms are based on their co-occurrence in proposal titles. The color of the node is used to distinguish whether these nodes belong to the same cluster or not, and the cluster membership was obtained from the community detection algorithm [55]. PLOS ONE DOI: /journal.pone May 24, /

178 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research Fig 4. Semantic Network of 30 Most Frequently Occurring Terms in NSF Big Data Proposals. doi: /journal.pone g004 The 30 most frequently occurring terms in NSF granted proposals were clustered into four groups as follows (Fig 4): Green group represents the use of social network analysis in Big Data area; some related branch subjects and keywords are social networks, social sciences, social media, mathematical sciences, mathematics, computer science, big data applications ; Health Big Data and information science ; Purple group indicates some Big Data analytics techniques; keywords include: data mining, machine learning, architecture, big data analytics, data analysis, algorithms, decision making, healthcare and data collection ; Fig 5. Semantic Network of 30 Most Frequently Occurring Terms in NSFC Big Data Proposals. doi: /journal.pone g005 PLOS ONE DOI: /journal.pone May 24, / 20

179 文献传递 How Does Scientific Funding Support Interdisciplinary Research Blue group presents the problems and potential solutions in bioinformatics; key terms include: high-dimensional data, bioinformatics, genomics, big data problems and big data analysis ; Orange group displays public management factors in the context of Big Data through keywords such as big data management, complex systems, Internet, data analytics, analytics, government and data science. Following the above analytic logic, the 30 most frequently occurring terms in NSFC granted proposals were also clustered into four clusters (Fig 5): Orange cluster indicates the main theory and techniques in Big Data fields; the main phrases in this cluster are: algorithm, machine learning, computing, models, theory, knowledge and application ; Blue cluster layouts highlight technologies involved with Big Data analysis; related phrases include: optimization, processing, big data analytics, key technology, storage and distributed ; Green cluster presents the role of Big Data in complex environments through terms such as Internet, complex, activity, data analysis, modeling, prediction and risk ; Purple cluster illustrates the use of Big in management practice, through key terms such as information, data mining, management, intelligence, driven, decision making, knowledge, service, dynamic, mechanism and innovation. These results indicate that both NSF s and NSFC s proposals have considerable common research interests and foci on topics such as algorithms, Internet, data analysis, data mining, decision making and machine learning. At the same time, there are distinctions in that the US concentrates more on engineering and specialized applications while China shows more emphasis on Big Data theory and concepts in management-related domains. Based on the above proposal concentration analysis, we can see that the two countries share similar research topics for building up the Big Data field. However, since the two countries strategic goals and scientific development models may differ, the detailed concepts, techniques, and applications to which funding agencies pay attention are somewhat different. Proposal Interdisciplinarity Analysis IDR has become a significant thrust of NSF and other scientific agencies in recent years. Most bibliometric literatures on measuring IDR focus on examining the outputs of science publications [16]. Following this traditional evolution, we extracted the grant numbers from NSF s and NSFC s Big Data awards and retrieved the papers acknowledging them from the Web of Science. The results show that 428 publications were supported by NSF Big Data awards and 644 publications by NSFC (Retrieved on Jan 3, 2016). As an initial way to understand the disciplinary orientation of these publications, we analyzed the Web of Science Categories ( WCs ), which are assigned to journals based on a combination of cross-citation patterns and editorial judgment. WCs offer a standard in bibliometric analysis for representing disciplinary or field participation [4]. Table 6 shows the Top 10 WCs for Big Data publications supported by NSF and NSFC. Not surprisingly, most of the funded papers are in the Computer Science and Engineering, Electrical & Electronic areas. Multidisciplinary sciences and interdisciplinary studies are other foci in the funded papers. NSFC funded papers also pay attention to some management issues such as Operations Research & Management Science. PLOS ONE DOI: /journal.pone May 24, /

180 大数据金融信息剪辑 How Does Scientific Funding Support Interdisciplinary Research Table 6. Top 10 WCs for Big Data Publications Supported by NSF and NSF. WCs Records Supported by NSF WCs Records Supported by NSFC Engineering, Electrical & Electronic 118 Computer Science, Artificial Intelligence 174 Computer Science, Information Systems 65 Engineering, Electrical & Electronic 147 Statistics & Probability 50 Computer Science, Information Systems 130 Computer Science, Software Engineering 49 Telecommunications 71 Computer Science, Artificial Intelligence 46 Computer Science, Software Engineering 53 Computer Science, Hardware & 34 Computer Science, Interdisciplinary 51 Architecture Applications Computer Science, Theory & Methods 34 Computer Science, Theory & Methods 48 Telecommunications 31 Engineering, Multidisciplinary 41 Multidisciplinary Sciences 26 Mathematics, Interdisciplinary Applications 39 Mathematical & Computational Biology 25 Operations Research & Management Science 39 doi: /journal.pone t006 We are particularly interested in cross-field research knowledge transfer and overall discipline distribution. For such purposes the granularity of the WCs is effective i.e., some 224 WCs differentiate sub-fields, so we have applied science overlay mapping to visualize these differences [56] in Fig 6. and Fig 7. Again, not surprisingly, Big Data papers from NSF or NSFC funding are dominated by Computer Science, followed by Math Methods. But the pattern of widespread engagement is remarkable, suggesting that Big Data research is not bottled up in a Fig 6. Big Data Research across the Disciplines of Publications Supported by NSF. doi: /journal.pone g006 PLOS ONE DOI: /journal.pone May 24, /

成立于 2013 年 1 月 19 日, 是由中国人民大学与上海重阳投资管理有限公司联合创办的一所现代化智库 中国人民大学校长 央行货币委员会委员 金融学家陈雨露教授任院长 中国人民大学重阳金融研究院以 立足人大, 放眼世界 ; 把脉金融, 观览全局 ; 钻研学术, 关注现实 ; 建言国家, 服务大

成立于 2013 年 1 月 19 日, 是由中国人民大学与上海重阳投资管理有限公司联合创办的一所现代化智库 中国人民大学校长 央行货币委员会委员 金融学家陈雨露教授任院长 中国人民大学重阳金融研究院以 立足人大, 放眼世界 ; 把脉金融, 观览全局 ; 钻研学术, 关注现实 ; 建言国家, 服务大 金融改革与大数据金融 重阳论坛 1 成立于 2013 年 1 月 19 日, 是由中国人民大学与上海重阳投资管理有限公司联合创办的一所现代化智库 中国人民大学校长 央行货币委员会委员 金融学家陈雨露教授任院长 中国人民大学重阳金融研究院以 立足人大, 放眼世界 ; 把脉金融, 观览全局 ; 钻研学术, 关注现实 ; 建言国家, 服务大众 为宗旨, 力求为国家发展培养和输送高级金融人才, 立志打造一个以

More information

2014 10 October 2014 + ( 沈阳理工大学环境与化学工程学院, 辽宁沈阳 110165) 沈阳理工大学环境工程专业改革人才培养模式采取的措施及取得的成效在遵循 实施工程教育, 突出工程实践和 社会实践, 提高学生的创新能力 的人才培养模式的基础上, 通过教学模式改革优化课程设置校企结合建立工程实践能力四年连 续培养体系导师负责制的科研创新能力训练体系, 培养 创新 + 工程实践

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

昆明冶专 2016 年公开招聘笔试成绩 (7 月 2 日 ) 公告 各考生 : 根据云南省人力资源与社会保障厅考试中心的通知和下发的笔试考试结果, 我校现将 2016 年报考昆明冶金高等专科学校公开招聘考试人员笔试成绩公告如下 : 报名序 号 报考职位 考号 职业能力倾向测 验成绩 综合应用 能力成绩 091335 064366 041508 096243 011118 022096 008085

More information

郑杭生等 一 杭州市 社会复合主体 的组织创新

郑杭生等 一 杭州市 社会复合主体 的组织创新 年第 期 从社会复合主体到城市品牌网群 以组织创新推进社会管理创新的 杭州经验 郑杭生 杨 敏 多年来 以 让我们生活得更好 的价值共识作为共同行动的基础 杭州经验 通过连续不断的系列创新 对 中国经验 的内核 构建 国家 社会 新型关系 促进 政府 企业 社会 的三维合作 使社会资源和社会机会形成优化配置 给予了独特的探索 最近几年中 杭州经验 从社会复合主体到城市品牌网群的新跨越 对 政府 企业

More information

获奖类别及等级 : 完成单位 : 主要完成人员 : 主要内容及重要影响 : 22

获奖类别及等级 : 完成单位 : 主要完成人员 : 主要内容及重要影响 : 22 获奖类别及等级 : 完成单位 : 主要完成人员 : 主要内容及重要影响 : 21 获奖类别及等级 : 完成单位 : 主要完成人员 : 主要内容及重要影响 : 22 获奖类别及等级 : 完成单位 : 主要完成人员 : 主要内容及重要影响 : 23 五 论文和专利 六 新承担和在研的国家科研任务 序号 项目名称 总经费 ( 万元 ) 起止年限 项目种类 24 七 国际合作与区域交流 完成了第四次横断山区植物多样性科学考察

More information

引言

引言 利手与两半球的听觉词汇语义加工 蔡厚德 徐 艳 引言 方法 结果 讨论 结论 年度 江苏省生物多样性与生物技术重点实验室学术委员会会议暨学术研讨会 于 月 日在我校隆重召开 中国科学院昆明动物所张亚平院士 华东师范大学副校长王小明教授 中国科学院动物研究所魏辅文研究员 中国科学院微生物所周培瑾教授 中国药科大学李萍教授 南京师范大学周开亚教授 袁生教授 杨光教授 邵蔚蓝教授 计翔教授 丁小余教授等学术委员会的成员

More information

北京市招生情况一览表 专业 年份 专业名称 2014 招生计划 最高分 文 2015 最低分 史 平均分 招生计划 最高分 类 文 2016 最低分 史 平均分 招生计划 最高分 类 文 最低分 史 平均分 类 金融学 财政学

北京市招生情况一览表 专业 年份 专业名称 2014 招生计划 最高分 文 2015 最低分 史 平均分 招生计划 最高分 类 文 2016 最低分 史 平均分 招生计划 最高分 类 文 最低分 史 平均分 类 金融学 财政学 北京市招生情况一览表 名称 财政学 国际经济与贸易 市场营销 旅游管理 8 0. 农林经济管理 人力资源管理 化产业管理 法学 0 0 0 法学 经济法方向 0 8 广告学 新闻学 税收学 理 工 理 工 理 0 96 99 管理科学 工程管理 7 信息管理与信息系统 8 8 8 电子商务 7. 工商管理 物流管理 财务管理 7 7 7 金融数学 7 7 7 经济统计学 8 8 8 0 0 0 工

More information

一 我国部分研究型大学 大学生创新性实验计划 实施的现状 莙政基 莙政基金 外 在学生中有

一 我国部分研究型大学 大学生创新性实验计划 实施的现状 莙政基 莙政基金 外 在学生中有 高等教育研究 乔 连 全 厦门大学教育研究院 福建厦门 从调研情况来看 教育部 大学生创新性实验计划 的实施已取得一定的成效 但 也存在一些问题和不足 结合与国外类似项目的比较 各参与高校应从提高思想认识 创新管理模式 构建课程体系 拓展项目类型 加强项目评价 建立交流平台 落实激励措施等方面进 一步改进和完善 以更好地推动高校人才培养模式改革 培养高素质的创新型人才 研究型大学 创新型人才 本科生科研

More information

北京市人民政府关于 2013年度北京市科学技术奖励的决定 各区 县人民政府 市政府各委 办 局 各市属机构 为深入贯彻落实党的十八大和十八届三中全会精神 加快健全技术创新市场导向机 制 市政府决定 对在发展首都科技事业 促进首都经济社会发展中取得突出成绩的科 技人员和组织予以奖励 根据 北京市科学技

北京市人民政府关于 2013年度北京市科学技术奖励的决定 各区 县人民政府 市政府各委 办 局 各市属机构 为深入贯彻落实党的十八大和十八届三中全会精神 加快健全技术创新市场导向机 制 市政府决定 对在发展首都科技事业 促进首都经济社会发展中取得突出成绩的科 技人员和组织予以奖励 根据 北京市科学技 2013 年 北 京 市 科 学 技 术 奖 励 公 报 北 京 市 人 民 政 府 二 〇 一 四 年 一 月 1 北京市人民政府关于 2013年度北京市科学技术奖励的决定 各区 县人民政府 市政府各委 办 局 各市属机构 为深入贯彻落实党的十八大和十八届三中全会精神 加快健全技术创新市场导向机 制 市政府决定 对在发展首都科技事业 促进首都经济社会发展中取得突出成绩的科 技人员和组织予以奖励 根据

More information

经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 国际贸易学 非在职 经济管理学院 国

经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 国际贸易学 非在职 经济管理学院 国 考试编号 录取学院 录取专业 录取类别 100023111502601 林学院 林业 非在职 100023122409117 人文学院 马克思主义基本原理 非在职 100033005000092 环境科学与工程学院 环境工程 非在职 100033069001339 人文学院 哲学 非在职 100033069110101 人文学院 哲学 非在职 100033070108695 人文学院 哲学 非在职

More information

学院代码 学院名称专业代码专业名称学习方式 统考拟招生计划数 001 经济学院 政治经济学全日制 经济学院 经济史 全日制 经济学院 西方经济学 全日制 经济学院 世界经济 全日制 经济学院

学院代码 学院名称专业代码专业名称学习方式 统考拟招生计划数 001 经济学院 政治经济学全日制 经济学院 经济史 全日制 经济学院 西方经济学 全日制 经济学院 世界经济 全日制 经济学院 001 经济学院 020101 政治经济学全日制 14 001 经济学院 020103 经济史 全日制 3 001 经济学院 020104 西方经济学 全日制 14 001 经济学院 020105 世界经济 全日制 7 001 经济学院 0201Z2 发展经济学 全日制 0 001 经济学院 020201 国民经济学 全日制 4 001 经济学院 020202 区域经济学 全日制 4 002 财政税务学院

More information

(P37) 新华社评论员 : 加强队伍建设造就新闻人才 四论学习贯彻习近平总书记在党的新闻舆论工作座谈会上重要讲话精神 (P40) 人民日报 社论: 担负起新闻舆论工作的职责和使命 (P43) 人民日报 评论员: 从全局出发把握新闻舆论工作 一论学习贯彻习近平总书记新闻舆论工作座谈会重要讲话精神 (

(P37) 新华社评论员 : 加强队伍建设造就新闻人才 四论学习贯彻习近平总书记在党的新闻舆论工作座谈会上重要讲话精神 (P40) 人民日报 社论: 担负起新闻舆论工作的职责和使命 (P43) 人民日报 评论员: 从全局出发把握新闻舆论工作 一论学习贯彻习近平总书记新闻舆论工作座谈会重要讲话精神 ( 意识形态与宣传思想工作 学习资料汇编 党委宣传部 (2016 年 3 月 ) 习近平在全国宣传思想工作会议上发表重要讲话 : 胸怀大局把握大势着眼大事努力把宣传思想工作做得更好 (P1) 中共中央办公厅国务院办公厅 关于进一步加强和改进新形势下高校宣传思想工作的意见 (P8) 中共中央宣传部中共教育部党组 关于加强和改进高校宣传思想工作队伍建设的意见 (P17) 习近平在党的新闻舆论工作座谈会上发表重要讲话

More information

邀请函1

邀请函1 2015 企业级 IT 服务与软件应用创新峰会 上海市计算机用户协会 上海市通信学会 2015 企业级 IT 服务与软件应用创新峰会 主办单位 : 支持单位 : 承办单位 : 企业级 IT 服务与软件应用创新峰会 大会拟定日程安排 合作支持媒体 参加行业及人员 相关软件开发 系统集成 信息安全 数据中心建设与运营 电信运营公司 医疗机 构 教育科研 互联网 金融保险 制造业 能源 电力 石化 交通运输

More information

成教2014招生计划.xls

成教2014招生计划.xls 层次 学习形式 专业名称 考试科类 已编计划数 门类 学制 专升本 业余 国际经济与贸易 经济管理类 2 经济学 二年半 专升本 业余 法学 法学类 31 法学 二年半 专升本 业余 教育技术学 教育学类 3 教育学 二年半 专升本 业余 广播电视新闻学 文史 中医类 2 文学 二年半 专升本 业余 艺术设计 艺术类 3 文学 二年半 专升本 业余 机械设计制造及其自动化 理工类 17 工学 二年半

More information

表 1-2 师资队伍概况 单位 :( 人 教师 总计 598 其中 : 女 性 323 双师型 101 具有行业背景 89 其中 : 教 授 81 副 教 授 98 讲师 299 助教 114 无 6 博士 29 硕士 316 学士 246 无 7 35 岁及以下 ~45 岁 215 4

表 1-2 师资队伍概况 单位 :( 人 教师 总计 598 其中 : 女 性 323 双师型 101 具有行业背景 89 其中 : 教 授 81 副 教 授 98 讲师 299 助教 114 无 6 博士 29 硕士 316 学士 246 无 7 35 岁及以下 ~45 岁 215 4 http://www.x 师资队伍 表 1-1 校领导基本信息 校领导基本信息 编号姓名职务出生年月性别专业技术职务学历校内分管工作专业 学习和工作简 历 ( 链接 1 叶孟理党委书记 1953/05 男教授大学 纪委 党政办 公室 组织部 哲学 edu.cn/news_.php?sort_id &nav=2 人事处 财务 http://www.x 2 唐俊琪 院长 党委副书记 1955/12 男教授研究生

More information

习近平在北京市八一学校考察时强调 全面贯彻落实党的教育方针努力把我国基础教育越办越好 1

习近平在北京市八一学校考察时强调 全面贯彻落实党的教育方针努力把我国基础教育越办越好 1 浙江大学党支部理论学习 参考资料 2016 年第 9 期 党委宣传部编 2016 年 10 月 12 日 目录 学系列讲话 习近平在北京市八一学校考察时强调 全面贯彻落实党的教育方针努力把我国基础教育越办越好 1 2 3 4 习近平在参观 英雄史诗不朽丰碑 主题展览时强调 铭记红军丰功伟绩弘扬伟大长征精神 5 6 习近平在中共中央政治局第三十五次集体学习时强调 加强合作推动全球治理体系变革共同促进人类和平与发展崇高事业

More information

考试时间课程名称级人数考试地点 机械工程 17 级卓越 1 30 D-386 机械工程 17 级卓越 2 30 D-386 自动化 17 级 1 30 D-3108 自动化 17 级 2 30 D-3108 电子信息工程 17 级 1 32 C-170 电子信息工程 17 级 2 32 C-242

考试时间课程名称级人数考试地点 机械工程 17 级卓越 1 30 D-386 机械工程 17 级卓越 2 30 D-386 自动化 17 级 1 30 D-3108 自动化 17 级 2 30 D-3108 电子信息工程 17 级 1 32 C-170 电子信息工程 17 级 2 32 C-242 考试时间课程名称级人数考试地点 纺织工程 17 级 1 26 D-282 纺织工程 17 级 2 28 D-282 纺织工程 17 级 3 29 D-284 纺织工程 17 级 4 29 D-284 纺织工程 17 级 5 28 D-286 纺织工程 17 级 6 26 D-286 高分子材料与工程 17 级 1 31 C-142 非织造材料与工程 17 级 1 24 D-2108 纺织工程 17

More information

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工 厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 573 624 631 624 627.9 理工 562 634 655 634 640.7 北京 文史 524 567 620 567 592.5 理工 494 583 648 587 609.3 福建 文史 557 594 622 594 603.5 理工 539 602 650 602

More information

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管 海南热带海洋学院 2018 年普通高考招生计划录取数 专业省份 录取数 计划数 本科 4093 4093 安徽 132 132 普通本科 102 102 财务管理 3 3 电子商务 3 3 电子信息科学与技术 3 3 海事管理 3 3 海洋技术 3 3 海洋渔业科学与技术 3 3 海洋资源与环境 2 2 汉语言文学 3 3 化学 2 2 环境工程 4 4 会展经济与管理 3 3 计算机科学与技术 3

More information

高职教育资讯

高职教育资讯 高职教育资讯 目录... 1 鲁昕 : 努力提高服务经济社会发展能力和水平... 1 高职进入内涵式发展阶段 全国百余名高职校长透视职教发展... 2... 4 高职院校 三能 师资队伍建设的思考与实践... 4... 12 很不错 的老师... 12... 14 山东经贸职业学院践行 学做一体 真事真做 真岗真干 三阶实践教学模式改革... 14 鲁昕 : 努力提高服务经济社会发展能力和水平 全国教育发展规划工作会议召开

More information

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理 厦门大学 2006 年普高招生分省分专业录取分数统计表 省份 科类 本一线 出档线 人数 最高分 最低分 平均分 文 573 600 25 638 601 612.7 安徽 理 566 615 74 653 615 630.1 理 ( 国防生 ) 566 596 12 621 596 607.2 北京 文 516 574 24 605 574 586.3 理 528 593 59 646 596 610.7

More information

% % % CETV

% % % CETV 由北京师范大学纪录片中心和中国传媒大学传媒艺术与文化研究中心联合组成的中国纪录 片战略发展研究课题组, 对 2013 年中国纪录片发展现状进行了全面调研和研究, 并发布了 中国纪录片 发展研究报告 ( 2014) 课题由北京师范大学张同道教授与中国传媒大学胡智锋教授主持本文为该 报告的精华版 2013 2013 张同道胡智锋等 2013 ARTE 5 3 ARTE 138. 8 2012 2013

More information

宋守信 教授 杨书宏 教授级高工 傅 贵 教授 许开立 教授 高等工程教育专业认证委员会安全工程专业试点工作组 北京交通大学经济管理学院 北京 中国职业安全健康协会培训部 北京 中国矿业大学 北京 资源与安全工程学院 北京 东北大学资源与土木工程学院 沈阳 简要介绍我国高等工程教育专业认证试点的发展状况和主要做法 详细阐述安全工程专业认证以学生为本的指导思想和以质量保证及质量改进为出发点的基本特点

More information

石油炼化会后刊邮件版

石油炼化会后刊邮件版 2015 中国 ( 广饶 ) 2015 CHINA(GUANGRAO) INTERNATIONAL REFINING & PETROCHEMICAL EXPO 2015 中国 ( 广饶 ) 01/02 专刊 展会简介 展示范围 : 2015 中国 ( 广饶 ) 03/04 专刊 展会背景 2015 中国 ( 广饶 ) 05/06 专刊 领导致辞 2015 中国 ( 广饶 ) 07/08 专刊 领导视察及展会现场实况

More information

省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 专业成绩 美术学 ( 地方免费师范生 ) 综合成绩 提前艺术体育本 科 提前一批本科 体育 ( 文 ) 体育 ( 理 ) 文史 体育教育 ( 地方免费师范生 ) 专

省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 专业成绩 美术学 ( 地方免费师范生 ) 综合成绩 提前艺术体育本 科 提前一批本科 体育 ( 文 ) 体育 ( 理 ) 文史 体育教育 ( 地方免费师范生 ) 专 省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 31 81.1 专业成绩 美术学 ( 地方免费师范生 ) 30 593.7 综合成绩 提前艺术本 科 提前一批本科 ( 文 ) ( 理 ) 教育 ( 地方免费师范生 ) 12 67.4 专业成绩 社会指导与管理 5 67.4 专业成绩 教育 33 61.9 专业成绩 教育 ( 地方免费师范生 ) 15 68.9 专业成绩

More information

<4D F736F F D20B9FAB1EACEAFD7DBBACF3739BAC5A3A8B9D8D3DAD3A1B7A2A1B6B1EAD7BCBBAFCAC2D2B5B7A2D5B9A1B0CAAEB6FECEE5A1B1B9E6BBAEA1B7B5C4CDA8D6AAA3A9>

<4D F736F F D20B9FAB1EACEAFD7DBBACF3739BAC5A3A8B9D8D3DAD3A1B7A2A1B6B1EAD7BCBBAFCAC2D2B5B7A2D5B9A1B0CAAEB6FECEE5A1B1B9E6BBAEA1B7B5C4CDA8D6AAA3A9> 标准化事业发展 十二五 规划 〇 目 录 一 发展环境 1 2 二 指导思想和发展目标 ( 一 ) 指导思想 3 ( 二 ) 发展目标 4 三 推进现代农业标准化进程 5 6 四 提升制造业标准化水平 7 五 拓展服务业标准化领域 8 ( 一 ) 生产性服务业 9 10 ( 二 ) 生活性服务业 六 加强能源资源环境标准化工作 ( 一 ) 能源生产与利用 11 ( 二 ) 资源开发与综合利用 ( 三

More information

中国与欧洲关系 年

中国与欧洲关系 年 中国与欧洲关系 年 周 弘 本文全面回顾了中国与欧洲共同体 欧洲联盟及其成员国 年至 年间政治和经济关系的发展历程 分析了当前中欧关系取得的进展和存在的问题 作者认为 年来中国与欧洲关系的发展变化见证并体现了世界格局的演变以及中国和欧洲这两大很不相同的世界力量自身的发展变化 中欧之间不断深入和拓展的交往使双方都从中获益 而这种交往所创造出来的体制机制和方式方法也堪为人先 中欧关系能否在第二个 年中顺利发展

More information

数字电子技术 数字电子技术 数字电子技术 数字电子技术 数字电子技术 (A) (A) (A) (A) (A) 电力系统暂态分析 有机化学及实验 有机化学及实验 有机化学及实验 有机化学及实验 大学英语 大学英语 大学英语 大学英语 大学英语 大学英语 (1) 临潼校区重修上课安排

数字电子技术 数字电子技术 数字电子技术 数字电子技术 数字电子技术 (A) (A) (A) (A) (A) 电力系统暂态分析 有机化学及实验 有机化学及实验 有机化学及实验 有机化学及实验 大学英语 大学英语 大学英语 大学英语 大学英语 大学英语 (1) 临潼校区重修上课安排 机械原理包装工程 2015 上课 16 4 9-12 A-202 汪成龙 机械原理包装工程 2016 上课 16 4 9-12 A-202 汪成龙 机械原理 2015 上课 16 4 9-12 A-202 汪成龙 机械原理机械电子工程 2015 上课 16 4 9-12 A-202 汪成龙 机械原理 机械原理 机械原理 机械原理 电路原理 电路原理 电路原理 2015 上课 16 4 9-12 A-202

More information

课程设置—国民经济学

课程设置—国民经济学 课程设置 国民经济学 序号 课程类型 课程名称 学期 学分 总学时 授课语言 任课教师 ( 职称 ) 1 科学社会主义理论与实践 秋季学期 2 32 中文 学校统开 2 资本论 选读秋季学期 1.5 28 中文经院统开公共学位 3 经济思想史秋季学期 1.5 28 中文经院统开 4 英语 秋季 春季学期 4 64 英文 学校统开 5 高级宏观经济学 Ⅰ 秋季学期 3 56 中文 经院统开 6 高级计量经济学

More information

2006 2006 2006 3800 2005 300 8.6% 2005 268 289 5-1 2000 1000 2006 1600 2000 40.0% 2006 42.1% 19991300 2003 1570 2006 R&D 150.2 2005 13.7 10.1% R&D 122

2006 2006 2006 3800 2005 300 8.6% 2005 268 289 5-1 2000 1000 2006 1600 2000 40.0% 2006 42.1% 19991300 2003 1570 2006 R&D 150.2 2005 13.7 10.1% R&D 122 77 2006 2006 2006 3800 2005 300 8.6% 2005 268 289 5-1 2000 1000 2006 1600 2000 40.0% 2006 42.1% 19991300 2003 1570 2006 R&D 150.2 2005 13.7 10.1% R&D 122.4 9.4 %2000 2006 R&D R&D 62.9%R&D 76.1% 80% 5-2

More information

2007年石家庄铁道学院毕业生流向地域分析

2007年石家庄铁道学院毕业生流向地域分析 2015 届毕业生就业质量年度报告 二〇一五年十二月 5 毕业生分专业就业率统计表...6 三 毕业生就业流向...6 1 毕业生就业地域流向总体分布 ( 与该地域毕业生源数对比 )...7 2 毕业生省外就业地域流向分布...7 3 毕业生分专业就业地域流向...8 4 毕业生就业行业分布...8 5 毕业生就业单位性质情况...8 6 特殊身份毕业生 ( 学生党员 学生干部 少数民族学生 特困生

More information

CONTENTS

CONTENTS 江苏省三维打印产业技术创新战略联盟 江苏省三维打印产业技术创新战略联盟秘书处主办江苏省三维打印装备与制造重点实验室南京三维打印学会承办 CONTENTS 南京三维打印学会参加全国科普日科普活动 国家工信部副部长刘利华调研参观南京 3D 打印研究院 田宗军教授做 南京科协大讲堂 3D 打印专题讲座 1 3D 打印配合人工智能算法未来建筑业将被颠覆? 2 3 第四届亚洲 3D 打印展十月隆重召开 - 行业正进行大洗牌

More information

<4D F736F F D20B2CEBFBC3231C6DAD1A7CFB0D3EBCBBCBFBCC4DAD2B3>

<4D F736F F D20B2CEBFBC3231C6DAD1A7CFB0D3EBCBBCBFBCC4DAD2B3> - 1 - 学习 决定 应把握的十大看点和亮点 - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - - 9 - - 10 - - 11 - - 12 - - 13 - 开县新型城镇化建设的途径与对策初探 - 14 - - 15 - - 16 - - 17 - - 18 - 上接第 23 页 加快发展 推动 发展 - 19 - - 20 - - 21 - - 22 -

More information

中国科学技术大学 材料工程 05 校外调剂 0870 化学工程 吉林大学 应用化学 05 校外调剂 0870 化学工程 四川大学 制药

中国科学技术大学 材料工程 05 校外调剂 0870 化学工程 吉林大学 应用化学 05 校外调剂 0870 化学工程 四川大学 制药 045700000787 东北大学 07030 分析化学 05 校外调剂 07030 无机化学 68 66 94 04 34 063700000004 沈阳药科大学 07030 分析化学 04 校内跨专业调剂 070303 有机化学 73 56 9 00 30 0007008903 北京大学 0780Z 药学类 05 校外调剂 070303 有机化学 75 67 09 8 4 085750830 苏州大学

More information

文章首先对 云计算 环境下数字图书馆的概念 特点 原理等进行概述 然后根据 云计算 环境下图书馆数字资源安全性要求 对影响数字图书馆安全的诸多因素进行深入探讨 最后研究了云计算环境下数字图书馆数据安全 应用安全以及虚拟化安全面临的威胁及对策 云计算数字图书馆信息安全对策 本文系甘肃省教育厅 年度科研项目 移动计算环境下的数字图书馆建设研究 批准号 的研究成果之一 马晓亭 女 年生 兰州商学院信息工程学院副教授

More information

展会手册07

展会手册07 会议亮点 超过 5 万人次的参会人流, 为上海世界旅游博览会重点板块之一 您可以搭建自己国家或企业的个性化的专题展 为您提供商务会议与现场福利采购的洽谈平台 四十余家专业媒体宣传力度, 给您提供一个在中国聚焦展示的舞台 百余企业高管参与的高峰会议 千余专业人士观展和参与的主题宣传秀 是世界医疗旅游同行的大聚会, 是您拓展中国与全球市场的良机 为您搭建与全球医疗机构 医疗旅游服务商 发展商联系的窗口

More information

非营利组织专职人员专业化问题研究

非营利组织专职人员专业化问题研究 湖南师范大学硕士学位论文非营利组织专职人员专业化问题研究姓名 : 罗拾平申请学位级别 : 硕士专业 : 社会学指导教师 : 陈成文 20080501 非营利组织专职人员专业化问题研究 作者 : 罗拾平 学位授予单位 : 湖南师范大学 相似文献 (1 条

More information

坚持正确方向创新方法手段提高新闻舆论传播力引导力 1

坚持正确方向创新方法手段提高新闻舆论传播力引导力 1 浙江大学党支部理论学习 参考资料 2016 年第 3 期 党委宣传部编 2016 年 3 月 31 日 目录 坚持正确方向创新方法手段提高新闻舆论传播力引导力 1 2 3 4 5 6 重要评论 从全局出发把握新闻舆论工作 一论学习贯彻习近平总书记新闻舆论工作座谈会重要讲话精神 7 8 把坚持正确政治方向摆在首位 二论学习贯彻习近平总书记新闻舆论工作座谈会重要讲话精神 9 10 不断提高新闻舆论工作的能力和水平

More information

论高校薪酬制度改革与人才强校战略 三 实施薪酬制度改革的效果 分配制度的改革就是在提高广大职工收入水平的基础上 重点要提高拔 尖人才的工资性收入及各种福利待遇 自从实施薪酬制度改革以来 我校职 工的工资性收入普遍有了大幅度的提高 薪酬改革方案得到了广大教师的支 持和欢迎 根据我们的调查 自 1999 年薪酬制度改革以来我校职工的工资性 收入增长了近 3畅 5 倍 具体增长情况见下图 1 图 1 1999

More information

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批 厦门大学 2007 年本科招生录取分数一览表 省份 批次 文科 重点线出档线最高分最低分平均分 录取人数 重点线出档线最高分最低分平均分 录取人数 备注 北京 本一批 528 562 621 572 591.6 23 531 613 655 613 631.9 52 本一批 574 580 638 584 612 23 545 559 643 594 615 67 非西藏生 广西 源定向西 625

More information

<4D F736F F D20D7AAB7A2C7F8BCB6B1EDD5C3BEF6B6A8CDA8D6AA2E646F63>

<4D F736F F D20D7AAB7A2C7F8BCB6B1EDD5C3BEF6B6A8CDA8D6AA2E646F63> 玉市教函 2010 132 号 签发人 : 杨希初 各县 ( 市 区 ) 教育局, 市直各有关学校 : 现将自治区教育厅 关于表彰 2010 年度全区优秀学生 三好学生 优秀学生干部和先进班集体的决定 ( 桂教 2010 6 号 ) 转发给你们, 请你们及时在校内公布获得表彰的学生名单, 以资鼓励 希望受到表彰的个人和班集体谦虚谨慎, 戒骄戒躁, 再接再厉, 取得更优异的成绩 希望广大学生以受表彰的个人和集体为榜样,

More information

! % % % % % %!

! % % % % % %! 年 月 日 由中国社会科学院近代史研究所! 抗日战争研究 编辑部与哈尔滨师范大学社会与历史学院联合举办的 抗日战争与沦陷区问题研究 学术研讨会在哈尔滨师范 大学召开 来自中国社会科学院近代史研究所! 中国社会科学 杂志社 中国人民大学 南开大 学 南京第二历史档案馆! 民国档案 编辑部 南京大学 南京师范大学 河南大学! 史学月刊 编辑 部 安徽大学 河北师范大学 杭州师范大学 黑龙江省社会科学院等十多个高校和科研院所的

More information

从美国 加拿大 英国 澳大利亚 韩国和日本图书馆学情报学学院的发展历程入手 介绍并分析国外图书馆学情报学研究生教育的改革与重组 教学目标与教学方法 专业设置与课程体系 师资队伍与学生情况 入学资格与毕业条件 进而对我国的图书馆学情报学研究生教育制度提出一些改进意见 图书馆学 情报学 研究生 教育 作者简介 葛敬民 男 年生 教授 硕士生导师 刘荣华 女 年生 硕士生 王林 男 年生 硕士生

More information

牢牢把握 三个见实效 的目标要求 一论持续用力深化 三严三实 专题教育 1

牢牢把握 三个见实效 的目标要求 一论持续用力深化 三严三实 专题教育 1 浙江大学党支部理论学习 参考资料 2015 年第 12 期 党委宣传部编 2015 年 12 月 21 日 目录 牢牢把握 三个见实效 的目标要求 一论持续用力深化 三严三实 专题教育 1 2 抓好民主生活会这个 关键动作 二论持续用力深化 三严三实 专题教育 3 4 解决突出问题才有说服力 三论持续用力深化 三严三实 专题教育 5 6 用发展成果检验教育成效 四论持续用力深化 三严三实 专题教育

More information

男 计算机科学与技术 江苏路 男 计算机科学与技术 江苏路 男 计算机科学与技术 交大 女 计算机科学与技术 江苏路 男 计算机科学与技术 江苏路

男 计算机科学与技术 江苏路 男 计算机科学与技术 江苏路 男 计算机科学与技术 交大 女 计算机科学与技术 江苏路 男 计算机科学与技术 江苏路 公示根据学院学习指导手册 学历学生学籍管理暂行办法 第二十六条第 (4) 点规定, 学生有下列情况之一者应予退学 :(4) 学生在册时间超过有效学习期限者 下表中学生已经超过有效学习期限, 拟注销学信网学籍, 现予以公示 公示时间 :2016 年 12 月 7 日至 12 月 13 日 在公示期间, 如有异议, 可通过电子邮件形式向相关老师反映, 邮箱地址 :liuwen@sjtu.edu.cn.

More information

闽教职成〔2013〕33号

闽教职成〔2013〕33号 福建省示范性现代职业院校建设工程 项目建设规划 (2016-2020) 主管部门 学校名称 福建省教育厅 福建省邮电学校 联系人冯力 联系电话 13609596106 电子邮件 44537044@qq.com 编制日期 修订日期 2016 年 4 月 23 日 2016 年 5 月 30 日 一 建设基础... 1 ( 一 ) 学校概况... 1 ( 二 ) 建设基础... 1 ( 三 ) 存在问题...

More information

见图 二 社会主义改造时期 图

见图 二 社会主义改造时期 图 河北师范大学学报 蒋纯焦 通过采用计量研究 比较研究的方法 对 年以来中国东中西部高等教育区域差异的变迁作系统的梳理与分析 探讨形成和影响高等教育的区域差异的原因 揭示高等教育区域差异与社会变迁区域差异之间的互动关系 从而建立地方社会发展与高等教育发展之间的良性互动 实行区域推进策略 这是中国高等教育发展的应然选择 当代中国 东中西部 高等教育 区域差异 实证研究 一 建国初期 见图 见图 二 社会主义改造时期

More information

2017創形パンフ表1_表4

2017創形パンフ表1_表4 2017 SCHOOL GUIDE BOOK 2017 SOKEI ACADEMY OF FINE ART & DESIGN 关于创形美术学校? 创形美术学校是培育专业艺术家的摇篮 大家知道 : 用普通的教育课程来培育专业的艺术家是件困难的事 在我们创形, 从老师到办公人员, 大家全体都是专业的艺术家 在美术界, 设计界当中取得卓越成绩的艺术家们将为大家面对面地传授心得 我们重视的并不是通过指定的教学说明书来指导大家,

More information

学院文学院政法学院说明 吉林师范大学 学年度第一学期校历 教学周 月份 8 月 9 月 10 月 11 月 12 月 1 月 星期一

学院文学院政法学院说明 吉林师范大学 学年度第一学期校历 教学周 月份 8 月 9 月 10 月 11 月 12 月 1 月 星期一 文政法 吉林师范大学 2017 2018 学年度第一学期校历 2014 级汉语言文学 2016 级汉语言文学 ( 专升本 ) 2015 级汉语言文学 2016 级汉语言文学 2017 级汉语言文学 2017 级汉语言文学 ( 专升本 ) 2014 级汉语国际教育 2015 级汉语国际教育 2016 级汉语国际教育 2017 级汉语国际教育 2014 级思想政治教育 2014 级思想政治教育 ( 免师

More information

考试研究 % 第 卷第 期 # # # # #

考试研究 % 第 卷第 期 # # # # # 张亚群! 北京大学 清华大学自主招生是在高考基础上进行自主选拔 综合评价 降分录取的招生模式 它适应了建设一流大学和培养创新人才的要求 为全面发展或具有特长的考生提供了更多的入学选择机会 两校自主选拔竞争激烈 招生范围逐年扩大 取得了一定的成效 但也存在操作复杂 成本高 忽视弱势阶层考生 特长生优势不显著等不足 需要进一步改革与完善其选拔机制! 北京大学清华大学自主招生考试!!! 张亚群 教授 博士生导师

More information

2. 全球机器人大佬都是谁? 3. 我国的差距在哪里? 2

2. 全球机器人大佬都是谁? 3. 我国的差距在哪里? 2 上海市机器人行业协会信息 2016 年第 4 期 ( 总第 12 期 ) 机器人产业发展规划 (2016-2020 年 ) 解读 1. 发展现状 1 2. 全球机器人大佬都是谁? 3. 我国的差距在哪里? 2 4. 需求在哪, 机会就在哪 5. 领头品类是工业生产和公共服务 3 4 6. 在这些行业主力推广使用 7. 五类关键零部件 5 8. 创新平台, 标准体系, 检测认证, 一个都不能少 9.

More information

欧盟研究 二 治理与国际关系 三 治理与比较政治 欧盟研究中的 治理转向 四 欧盟研究中的 治理转向

欧盟研究 二 治理与国际关系 三 治理与比较政治 欧盟研究中的 治理转向 四 欧盟研究中的 治理转向 马克思主义与现实 双月刊 年第 期 一 治理 概念的历程 一 治理的概念化 欧盟研究 二 治理与国际关系 三 治理与比较政治 欧盟研究中的 治理转向 四 欧盟研究中的 治理转向 马克思主义与现实 双月刊 二 理解欧盟治理 一 欧盟治理的主要特征 年第 期 欧盟研究 二 规制国家的出现及其对治理的影响 欧盟研究中的 治理转向 三 新治理模式 马克思主义与现实 双月刊 年第 期 三 欧洲治理中民族国家的转型

More information

政府与企业的交换模式及其演变规律! &!!! & % % ( (

政府与企业的交换模式及其演变规律! &!!! & % % ( ( 政府与企业的交换模式 及其演变规律 观察腐败深层机制的微观视角 金太军 袁建军 以价值 资源 影响力 交换为核心要素的政府和企业交换关系分析的新框架可以深刻诠释我国政府与企业的微观互动 信息控制 自由裁量 制度供给和身份认定构成了转型时期政府和企业交换的基本模式 信息控制模式是政府与企业交换的神经网 自由裁量模式是政府与企业交换的特质 制度供给模式是政府与企业交换的保障 身份认定模式是政府与企业交换的助推剂

More information

二 义务教育阶段师资状况

二 义务教育阶段师资状况 以内蒙古东乌旗 青海省海晏县和广西省西林县为例 白文飞 西部民族地区农村义务教育的健康快速发展 对于提高西部地区经济的协调 发展和人口素质 构建和谐社会具有重要意义 本课题组旨在了解西部民族地区农村义务教育发展现状 发现制约西部民族地区农村义务教育的诸多因素 并提出相应对策和 建议 教育经费 师资 撤并校 辍学率 二 义务教育阶段师资状况 三 义务教育阶段学校布局调整状况 四 义务教育阶段学生辍学状况

More information

年度回眸 领航中国, 在民族复兴伟大征程上 十八大以来以习近平同志为总书记的党中央治国理政述评 1

年度回眸 领航中国, 在民族复兴伟大征程上 十八大以来以习近平同志为总书记的党中央治国理政述评 1 浙江大学党支部理论学习 参考资料 2015 年第 2 期 党委宣传部编 2015 年 1 月 13 日 年度回眸 目录 评论改革 党建工作 年度回眸 领航中国, 在民族复兴伟大征程上 十八大以来以习近平同志为总书记的党中央治国理政述评 1 2 3 4 5 6 7 8 9 10 11 12 13 为改革发展提供强大精神动力 二〇一四年宣传思想文化工作综述 14 15 16 17 18 19 教育改革打响攻坚战

More information

2015 级思想政治教育 2015 级思想政治教育 ( 免师 ) 2016 级思想政治教育 马克思主义学院 2017 级思想政治教育 2018 级思想政治教育 2015 级政治学与行政学 2016 级政治学与行政学 2017 级政治学与行政学 2018 级政治学与行政学 2015 级历史学 2016

2015 级思想政治教育 2015 级思想政治教育 ( 免师 ) 2016 级思想政治教育 马克思主义学院 2017 级思想政治教育 2018 级思想政治教育 2015 级政治学与行政学 2016 级政治学与行政学 2017 级政治学与行政学 2018 级政治学与行政学 2015 级历史学 2016 吉林师范大学 2018 2019 学年度第一学期校历 月份 8 月 9 月 10 月 2015 级汉语言文学 2017 级汉语言文学 ( 专升本 ) 文学院 2016 级汉语言文学 2017 级汉语言文学 2018 级汉语言文学 2018 级汉语言文学 ( 专升本 ) 2015 级汉语国际教育 2016 级汉语国际教育 2017 级汉语国际教育 2018 级汉语国际教育 2015 级数学与应用数学

More information

学院 教学周 月份 吉林师范大学 学年度第二学期校历 2 月 3 月 4 月 5 月 6 月 7 月 星期一

学院 教学周 月份 吉林师范大学 学年度第二学期校历 2 月 3 月 4 月 5 月 6 月 7 月 星期一 吉林师范大学 2018 2019 学年度第二学期校历 2015 级汉语言文学 2016 级汉语言文学 2017 级汉语言文学 2018 级汉语言文学 文 2017 级汉语言文学 ( 专升本 ) 2018 级汉语言文学 ( 专升本 ) 2015 级汉语国际教育 2016 级汉语国际教育 2017 级汉语国际教育 2018 级汉语国际教育 2015 级思想政治教育 2015 级思想政治教育 ( 免师 )

More information

气溶胶光学厚度 的测量原理 Ê

气溶胶光学厚度 的测量原理 Ê 肖钟湧 江洪 余树全 周国模 陈然 宋晓东 焦荔 洪盛茂 常杰 江波 南京大学国际地球系统科学研究所 南京 浙江林学院国际空间生态与生态系统生态研究中心 杭州 杭州市环境监测总站 杭州 浙江大学生命科学学院 杭州 浙江省林业科学研究院 杭州 气溶胶光学厚度 的测量原理 Ê 仪器和观测 实验场地 数据处理 气溶胶光学厚度的高光谱反演 浑浊度系数 波长指数 Ê Ê 精度检验 气溶胶光学厚度 浑浊度系数

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

表 年北京 伦敦 东京 纽约人口净迁移规模比较 图 1 伦敦 东京 纽约 北京净迁移率 (%) 比较 109

表 年北京 伦敦 东京 纽约人口净迁移规模比较 图 1 伦敦 东京 纽约 北京净迁移率 (%) 比较 109 刘长安 ( 首都经济贸易大学, 北京市 100070) 作为中国的首都和规模接近 2000 万的特大城市, 随着中国对外开放的深化, 以及中国加入世界经济一体化步伐的快步迈进, 北京正在日益向发达国家的国际大都市看齐通过对北京与国际大都市国内人口迁移和国际移民的现状比较研究, 了解北京与国际大都市的异同以及存在的差距, 并探索原因 ; 总结分析北京人口迁移的特点和发展趋势 人口迁移 ; 国际移民 ;

More information

厦门大学2003年陕西省本一批录取情况统计表

厦门大学2003年陕西省本一批录取情况统计表 厦门大学 2003 年各省分专业招生录取分数统计表 北京天津河北山西内蒙古辽宁吉林黑龙江 上海 江苏 浙江 安徽 江西 山东河南 湖北 湖南 陕西 甘肃 青海 宁夏 新疆广西 海南 重庆 四川 贵州 云南 厦门大学 2003 年北京市本一批录取情况统计表 科类专业录取人数最低分最高分平均分 文史 经济学 3 519 557 536.8 国际经济与贸易 2 528 532 530 ( 共 21 人 )

More information

二 年 医疗卫生公益性衰减

二 年 医疗卫生公益性衰减 年以来 中国的医改决策经历了医疗卫生公益性低水平发展 医疗卫生公 益性衰减 医疗卫生事业公益性回归的基本历程 为中国新时期医改决策留下了诸多宝贵的经验 要坚持正确的决策价值导向 要发扬决策民主 要走渐进改革的道路 要不断增强政 府的环境回应能力和政策学习能力 年以来 医改决策 医疗卫生事业 一 年以来中国医改决策的基本历程 一 年 政府主导的公益性低水平发展 钟裕民 南京师范大学公共管理学院讲师 南京大学政府管理学院行政管理专业博士研究生

More information

丁光训文集 研读札记 中国人民大学马克思主义学院 北京 丁光训是当代中国基督教的主要发言人和神学家 他结合新中国的国情 重 新思考了基督教传统教义 提出了一系列具有中国特色的基督教神学思想 他对上帝和基督 的根本特性做了新的界定 对神与人的关系以及人与世界的关系等问题做了符合中国传统文化和现实生活的诠释 他的思想反映了当代中国基督教发展的新道路和基督徒思想信仰的新 变化 丁光训神学思想 当代中国基督教

More information

浙江 云南 山西 学院 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 机械工程 能源与环境系统工程 机械设计制造及其自动化

浙江 云南 山西 学院 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 机械工程 能源与环境系统工程 机械设计制造及其自动化 2015 年上海工程技术大学本科分数线查询 学院 湖南辽宁新疆 最高分最低分一本线二本线最高分最低分一本线二本线最高分最低分一本线二本线 机械工程 468 458 446 381 能源与环境系统工程 504 501 500 419 449 444 446 381 机械设计制造及其自动化 ( 现代装备与控制工程 ) 计算机科学与技术 自动化 535 534 526 455 475 449 446 381

More information

政府公信力是指政府在施政过程中通过合理 有效地履行其功能和职责而取得公众信任的 能力 是政府的一种执政能力和执政资源 政府公信力问题涉及的方面很多 其中转变政府职能是提高 政府公信力的出发点和着力点 政府公信力的问题发轫于政府职能转变的过程中 而地方政府职能转变 不到位是导致政府公信力弱化的主要原因 提高政府公信力 要通过加快转变政府职能来实现 目前有 必要通过制度建设 政府建设 政策制定与管理创新

More information

赵燕菁 #!!!

赵燕菁 #!!! 赵燕菁 城市规划在灾后重建中对于工程技术的关注 很容易掩盖城市灾后重建中看不见的制度因素!!! 产权 城市最基本的制度 原型 # 就是公共产品交易的存在 城市 发达 # 与否 取决于公共产品提供的范围和水平 现代城市和传统城市的最大差别 就是可以以信用的方式 抵押未来的收益 获得公共产品建设所需要的原始资本 市场经济与计划经济最大的差别 就在于高度复杂的产权制度 因此 未来灾区规划中 产权的恢复和重建

More information

中北中学 ( 初中 ) 大寺中学 ( 初中 ) 富力中学 ( 初中 ) 富力中学 ( 初中 ) 06 中学历史教师 0 07 中学物理教师 0 08 中学信息技术教师 0 08 中学物理教师 0 中等专业学校 09 中学语文教师 0 中等专业学校 09 中学英语教师 0 中等专业学校 09 中学美术

中北中学 ( 初中 ) 大寺中学 ( 初中 ) 富力中学 ( 初中 ) 富力中学 ( 初中 ) 06 中学历史教师 0 07 中学物理教师 0 08 中学信息技术教师 0 08 中学物理教师 0 中等专业学校 09 中学语文教师 0 中等专业学校 09 中学英语教师 0 中等专业学校 09 中学美术 06 年天津市西青区教育系统事业单位公开招聘计划 杨柳青一中 ( 高中 ) 0 中学心理学教师 0 从事中学心理学教育工作 心理学 应用心理学 是组织专业考试 九十五中学 ( 高中 ) 张家窝中学 ( 完中 ) 张家窝中学 ( 完中 ) 张家窝中学 ( 完中 ) 杨柳青三中 ( 初中 ) 0 中学数学教师 0 0 中学语文教师 0 0 中学物理教师 0 0 中学化学教师 0 04 中学语文教师 0

More information

孙 蓝等 基于目标导向的研究生英语学习模式创新

孙 蓝等 基于目标导向的研究生英语学习模式创新 第 期 总第 期 年 月 研究生教育研究 以中国科技大学研究生英语学习公共服务平台建设为例 孙 蓝 陈纪梁 邢鸿飞 刘海清 万洪英 中国科学技术大学外语系 安徽合肥 中国科学技术大学研究生院 安徽合肥 研究生英语教学的使命是培养学生在当今多元社会中进行有效沟通的能力 英语语言教育者的任务不是去寻求更好的教学法 而是要探索一套能够满足学生需求且与学生学习体验相一致的教与学的策略 为此 有必要构建研究生英语学习公共服务平台

More information

附件:1-1

附件:1-1 2016 年环境与能源工程学院各学科 ( 小组 ) 复试方案 070304 物理化学 物理化学 一志愿上线考生, 另行通知 时间 3 月 25 日 8:00-9:20 3 教 414 时间 3 月 25 日 9:30-12:00 3 教 414 进行开卷 可以带参考书和字典, 但禁止使用手机 电脑和可上网的电子设备 时间 3 月 26 日 9:00-12:00 13:00-17:00 3 教 420

More information

新中国外交制度的演变与创新 一 外交制度的概念内涵及其研究视角 # # ) # +, #. % & / % & ) % & +. / % & % &

新中国外交制度的演变与创新 一 外交制度的概念内涵及其研究视角 # # ) # +, #. % & / % & ) % & +. / % & % & 中国外交 年第 期 新中国外交制度的演变与创新 白云真 中国外交制度的发展与创新应属当下中国外交新的转型的必要内涵和关键环节 外交制度的合理建构有助于促进中国外交健康且持续的发展 也有利于中国公民身份和国家 认同有效且理性的塑造 为此 笔者将尝试运用国家 社会关系的视角来诠释与理解中国外交 制度的创建 发展及其创新 以历史的视角回顾与审视中国外交制度建设的进程 从而能够更好 地为当下中国外交制度的创新提供某些重要的思考或启示

More information

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,,

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,, 刘中荣王平周长城 矿区作为一类特殊的社区, 它的发展所追求的不仅是矿产资源和经济效益的提 高, 而且是一种涉及社会各个方面的整体性进步 这种进步应以经济发展为基础, 以矿区职工和居民素质的提高 生活的改善为核心的经济与非经济方面的均衡发展 作者在对大冶市铜绿山铜铁矿深入调查的基础上, 分析了矿区人口与就业 教育与文 化 工农关系与社会治安 矿区管理体制以及社会保障制度等方面的现状和问题 文 章指出,

More information

2014 年度军队文职人员招聘信息

2014 年度军队文职人员招聘信息 序号 1 军事交通学院讲师 研究生 : 新闻传播学本科 : 新闻传播学类 天津 022-84657561 2 军事交通学院讲师 研究生 : 俄语语言文学本科 : 俄语 天津 022-84657561 3 军事交通学院讲师 1 硕研以上音乐与舞蹈学天津 022-84657561 4 军事交通学院药师 研究生 : 药学本科 : 药学类 天津 022-84657561 5 军事交通学院护师 3 大专以上

More information

学年第一学期临潼校区第二十周期末考试安排 ( 四 ) 考试时间 课程名称 班级 人数 考试地点 1 月 17 日 10:00-12:00 中级英语写作 Ⅰ 英语 17 级 1 班 29 D 月 17 日 10:00-12:00 英语阅读 Ⅰ 英语 18 级 1 班

学年第一学期临潼校区第二十周期末考试安排 ( 四 ) 考试时间 课程名称 班级 人数 考试地点 1 月 17 日 10:00-12:00 中级英语写作 Ⅰ 英语 17 级 1 班 29 D 月 17 日 10:00-12:00 英语阅读 Ⅰ 英语 18 级 1 班 1 月 17 日 10:00-12:00 中级英语写作 Ⅰ 英语 17 级 1 班 29 D-182 1 月 17 日 10:00-12:00 英语阅读 Ⅰ 英语 18 级 1 班 30 D-184 1 月 17 日 10:00-12:00 综合英语 Ⅲ 汉语国际教育 17 级 1 班 32 D-186 1 月 17 日 10:00-12:00 英语写作 (B) 汉语国际教育 16 级 1 班 38

More information

82.6 市公文交换中心 市公文交换中心 市公文交换中心 市公文交换中心 市公文交换中心

82.6 市公文交换中心 市公文交换中心 市公文交换中心 市公文交换中心 市公文交换中心 六安市直事业单位面试培训选中公! 咨询电话 :0564-3348989 报名地址 : 六安市解放路浙东商贸城 B 区 2016 年六安市直事业单位招聘笔试成绩排名 ( 中公版 ) 笔试成绩排名 报考部门 职位代码 准考证号 99 市公文交换中心 201601 2016010519 95 市公文交换中心 201601 2016010317 94.2 市公文交换中心 201601 2016010226

More information

无论中国的传统学术还是西方的大学制度 因 修道 之旨而生 教化 之需的轨迹是颇为相似的 正如中国的 小学 是为 大学 的读经作准备 欧洲中世纪大学的 人文学科 也是要帮助凡人理解神圣的文本 在西方 进一步使语言成为民族国家的根本标志 并通过强势族群与强势语言的共生互动 为后世的殖民扩张提供了基本 原型 中国早期教会大学对于语言的选用 当代西方国家的相关语言政策 也都可以成为语言标准之统治性力量的生动例证

More information

2019 年伊春市市直机关公务员公开遴选 ( 选调 ) 面试成绩 准考证号报考部门名称报考职位名称部门代码面试成绩 伊春市纪委监委 科员 伊春市纪委监委 科员 伊春市纪委监委 科员 2019

2019 年伊春市市直机关公务员公开遴选 ( 选调 ) 面试成绩 准考证号报考部门名称报考职位名称部门代码面试成绩 伊春市纪委监委 科员 伊春市纪委监委 科员 伊春市纪委监委 科员 2019 04130009 伊春市纪委监委 科员 20190002 80.4 04130013 伊春市纪委监委 科员 20190002 73.8 04130010 伊春市纪委监委 科员 20190002 74.8 04130038 伊春市纪委监委 科员 20190005 75.6 04130078 伊春市委组织部 科员 20190016 82.8 04130080 伊春市委组织部 科员 20190016 80.4

More information

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55 厦门大学 2008 年本科招生录取分数一览表 省份 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 北京 本一批 515 534 610 548 573.3 22 502 525 649 508 593.1 54 广东 本一批 570 603 639 603 617.3 24 564 590 642 596 613 65 本一批 528 577 610 577

More information

重大时事 1

重大时事 1 重大时事 1 DANG YUAN XUE XI YUAN DI 党员学习园地 2 重大时事 3 DANG YUAN XUE XI YUAN DI 党员学习园地 4 重大时事 5 DANG YUAN XUE XI YUAN DI 党员学习园地 6 重大时事 达沃斯特别致辞 7 DANG YUAN XUE XI YUAN DI 党员学习园地 8 重大时事 9 DANG YUAN XUE XI YUAN

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

2016 年金安区事业单位笔试成绩排名中公版 ( 不含加分 ) 笔试综合成绩准考证号报考岗位专业 金安区事业单位面试培训选中公! 64.15 2016100117 63.9 2016100208 63.2 2016100120 62.55 2016100101 61.55 2016100116 61.5 2016100212 61.45 2016100105 61.2 2016100102 61.15

More information

经济学动态 年第 期,,,,,, :,,,,, ( ),, ( ) :? ( ),, :, ` ', ( ),,,, : ` ',, ( ), :?, :,,,, ( ), : ( ),, -,,,,,,, ;,?,,,

经济学动态 年第 期,,,,,, :,,,,, ( ),, ( ) :? ( ),, :, ` ', ( ),,,, : ` ',, ( ), :?, :,,,, ( ), : ( ),, -,,,,,,, ;,?,,, 吴易风 : 本文考察了当前金融危机和经济危机背景下西方经济思潮的新动向 : 对资本主义 的反思和对 新资本主义 的构想 ; 对新自由主义的反思和对新国家干预主义的构想 ; 对自由市场经 济体制与政策体系的反思和对 市场与政府平衡 的市场经济体制与政策体系的构想 ; 对经济全球化的反思和对全球经济新秩序的构想 ; 对西方经济学的质疑和对马克思经济学的再认识 本文最 后对西方经济思潮的新动向作了分析和评论

More information

深圳市传感器器技术重点实验室(深圳大学)第一届学术委员会第一次会议于2009年9月7日在深圳召开

深圳市传感器器技术重点实验室(深圳大学)第一届学术委员会第一次会议于2009年9月7日在深圳召开 深圳大学科学技术部主办 科技简报 Science & Technology Briefing 2015 年第 3 期 ( 总第 27 期 ) 本期要目 科技要闻... - 1 - 我校工程学进入 ESI 排名全球前 1%... - 1 - 我校科技平台建设再获突破, 又增一个国家地方联合工程实验室... - 1 - 光电工程学院屈军乐教授成深大本土第三位 杰青... - 2 - 心理与社会学院李红教授被评为

More information

抗日战争研究! 年第 期 % & &!!!!

抗日战争研究! 年第 期 % & &!!!! 抗日战争时期贵州省赈济会的难民救济活动及其社会影响 周术槐 难民 是一种特殊社会现象 产生难民的原因是多方面的 其中 战争因素 是导致难民现象的重要原因之一 在抗日战争时期 中国国内因战争而形成的难民问题 成为当时中国 极其严重的社会问题 贵州作为中国西南地区支援全国抗战的战略大后方 每日都有大量来自沦 陷区的难民涌入 国民党政府因此不仅对难民救济机构进行了必要调整 同时 还制定了相应的难 民转移方案

More information

满怀信心迎接党的十八大人民日报评论员

满怀信心迎接党的十八大人民日报评论员 加强改进思想政治工作推进社会主义现代化建设 2012.4 满怀信心迎接党的十八大人民日报评论员 2012.4 集中精力把两会精神贯彻好人民日报评论员 2012.4 牢牢把握稳中求进的总基调人民日报评论员 2012.4 提振精气神决胜现代化 本刊记者常武显 2012.4 2012.4 2012.4 2012.4 2012.4 现代化进程中思想政治工作创新的昆山样本 江苏省昆山市委常委 宣传部长杭颖 2012.4

More information

????????

???????? 深度学习 项目简介 葛丽丽 译 西蒙菲沙大学 教育学院 富有想像力的教育研究中心 电邮 ierg-ed@sfu.ca 网址: http://www.ierg.net 基本思想 开学的第一个星期 每个学生都会接到一个任意布置的主题 从此将围绕这个主题 进行深度学习 这些主题可能包括 鸟 苹果 马戏团 火车 和 太阳系 等内容 在接下来的小学 初中以及高中阶段 除了基本课程以外 学 生将继续深入地学习指定的题目

More information

上海现代设计集团建筑协同设计平台研究与应用

上海现代设计集团建筑协同设计平台研究与应用 邓雪原 苏 昶 孙 朋 王国俭 上海交通大学土木工程系 上海 上海现代建筑设计 集团 有限公司 上海 本文首先分析了建筑 协同设计发展过程中存在的问题 指出建筑 协同设计的发展需要经过二维协同设计向三维协同设计的过渡 接着对适合于大型建筑设计企业的建筑 协同设计平台的关键问题进行了阐述 通过上海现代建筑设计集团一个实际工程项目 详细描述了建筑工程协同设计的方法与过程 然后对建筑协同设计的标准统一 工种协同等特点和高效沟通及超大项目的应用优势进行了讨论

More information

!!

!! 徐二明 陈 茵 以企业资源基础理论为基础 从企业吸收能力这一概念入手 剖析企业吸收能力与企业竞争优势的关系 研究组织管理机制对企业吸收能力构建和发展的影响 依据吸收能力经典文献对吸收能力的前因进行重新梳理和归类 对现有文献中各种思路有一定的整理和明示作用 通过研究两种吸收能力的 类影响因素 辨识出中国企业在吸收能力培养和发展方面的优势和弱势 通过实证方法全面衡量和验证潜在吸收能力与实际吸收能力两者之间以及两能力与企业竞争优势的关系

More information

对利益冲突问题及其危害性有比较清晰的认识 坚持政企分开原则 禁商为主旋律 适用对象的范围逐渐扩大

对利益冲突问题及其危害性有比较清晰的认识 坚持政企分开原则 禁商为主旋律 适用对象的范围逐渐扩大 我国防止公职人员利益冲突制度的变迁及完善 王琳瑜 杜治洲 北京航空航天大学公共管理学院 北京 改革开放三十余年来 中国防止公职人员利益冲突制度的变迁过程可以划分为探索 发展 加速推进三个阶段 呈现出制度建设的科学化水平不断提高 越来越注重制度的执行力 日趋国际化的发展趋势 进一步完善的制度建设应从四个方面入手 对防止公职人员利益冲突进行立法 重构现有制度并使其系统化 建立有效防止公职人员利益冲突的实施机制以提高制度执行力

More information

上海市机器人行业协会信息 2016 年第 10 期 ( 总第 18 期 ) 编者按 : 聚焦安全协作创新未来推动机器人产业健康发展 加快上海科创中心建设, 助力产业升级 打造上海机器人生态圈和产业升级高地的战略思考 ( 一 ) 创新驱动, 深入探索机器人产业发展新模式 ( 二 ) 协同创新, 实现核心零部件和高端产品重大突破 ( 三 ) 开发共享, 构建长三角机器人产业发展新高地 ( 四 )

More information

电子-12页

电子-12页 创建信息市场 实现智能城市价值挖掘 伸手触摸未来 中国车联网 发展现状与前瞻 序言 2 车联网掀开未来汽车新篇章 2013 2000 7% 2014 17.5 2016 2019 56 12,221 73.4% 76.8% 67.2% 48.3% 201 WeChat 39% 4.68 中国驾车者更加推崇个性化的联网服务 1 2 1. 2014 17.5 2014 1 21 2. 2014 06 04

More information

欧洲研究 年第 期 ¹ º ¹ º

欧洲研究 年第 期 ¹ º ¹ º 共和模式 的困境 ¹ 法国移民政策研究 李明欢 卡琳娜 盖哈西莫夫 今天的法国人中已有大约四分之一是移民及移民后裔 而具有不同文化背景的异族新移民仍源源不断进入法国 因此 移民接纳及移民政策的修订与实施 业已成为法国朝野密切关注的重要社会问题 本文首先介绍当代法国移民构成的基本状况 重点评介法国学术界关于法国移民政策研究的主要著述及观点 接着 本文结合 世纪下半叶法国社会的政治经济变迁 将法国战后移民政策分三个阶段进行剖析

More information

( 一 ) 外来农民进入城市的主要方式, %,,,,,, :., 1,, 2., ;,,,,,, 3.,,,,,, ;,,, ;.,,,,,,,,,,,,,,,,,,,,,, :,??,?? ( 二 ) 浙江村 概况.,,,,,, 1,, 2,, 3

( 一 ) 外来农民进入城市的主要方式, %,,,,,, :., 1,, 2., ;,,,,,, 3.,,,,,, ;,,, ;.,,,,,,,,,,,,,,,,,,,,,, :,??,?? ( 二 ) 浙江村 概况.,,,,,, 1,, 2,, 3 : 王汉生刘世定孙立平项飚 本文从农村人口进入城市的方式这一新的视角, 对北京著名的外来农村人口聚 居区 浙江村 的形成过程和基本状况进行了生动描述和深入分析 指出 : 浙江村的独特之处在于它不同于一般意义上的 劳动力 的流动, 它是带着综合性资源的 经营者的流动 浙江村村民进入城市的过程是不断寻找市场和开拓市场的过程, 并 在城市中形成了一个以聚居为基础的产业加工基地, 作者将这种类型的流动称为产

More information

国内高等医学院校基础医学二级学科评价结果(1)

国内高等医学院校基础医学二级学科评价结果(1) 国内高等校基础医学二级学科竞争力评价简介 北京大学医学图书馆参考国内外各项评价指标体系, 建立了一套基础医学二级学科竞争力评价指标体系 分别从人才队伍 科学研究和教学成果三方面一共涉及 34 项指标, 对全国 39 家校的 12 个基础医学二级学科进行了评价 我们已经连续做了 4 年的评价,2012 年度的评价结果见下表或 http://library.bjmu.edu.cn/ 名 次 2012 年度国内高等校基础医学二级学科评价结果

More information

蒋维乔思想研究

蒋维乔思想研究 湖南师范大学博士学位论文蒋维乔思想研究姓名 : 何宗旺申请学位级别 : 博士专业 : 中国近现代史指导教师 : 麻天祥 20031101 蒋维乔思想研究

More information

2016年苏州高新区公开招聘教师

2016年苏州高新区公开招聘教师 2018 年苏州高新区公开招聘教育专项编制教师 面试成绩及进入体检人员名单公告 根据 2018 年苏州高新区公开招聘教育专项编制教师简章 要求, 现将考生面试成绩及进入体检人员名单予以公布 请进入体检的人员于 2018 年 5 月 21 日 ( 周一 )~5 月 25 日 ( 周五 ) 上午 7:30 10:30 凭本人身份证原件到苏州市市立医院北区体检中心 ( 原苏州市第三人民医院 )( 地址 :

More information

80 1. 芬兰教育发展联盟

80 1. 芬兰教育发展联盟 范怡红 柯丹云 : 文章从芬兰高等教育概况 教师发展政策 组织机构三个方面描述了芬兰高校教师发展的背景与概 况, 并以赫尔辛基大学为案例, 从教师发展部门 教师发展理念 教师发展项目 评估措施 奖励机制等方面进行研 究, 归纳出赫尔辛基大学及芬兰大学教师发展的特色, 为我国的大学教师发展提供参考 : 传统文化 ; 现代文化 ; 连通性 :G65 : A : 1005-9245(2012)05-0079-08

More information