子 图 匹 配 任 务 就 是 在 一 张 大 图 G 中 找 出 与 给 定 的 查 询 图 q 同 构 的 所 有 子 图, 并 输 出 这 些 同 构 子 图 图 G 规 模 一 般 较 大, 在 子 图 匹 配 任 务 中 称 为 数 据 图 需 4 c 1 a b 2 d 3 3 d 1

Similar documents
说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

《C语言基础入门》课程教学大纲

 编号:

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )

2006年顺德区高中阶段学校招生录取分数线

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量

深圳市新亚电子制程股份有限公司


HSK( 一 级 ) 考 查 考 生 的 日 常 汉 语 应 用 能 力, 它 对 应 于 国 际 汉 语 能 力 标 准 一 级 欧 洲 语 言 共 同 参 考 框 架 (CEF) A1 级 通 过 HSK( 一 级 ) 的 考 生 可 以 理 解 并 使 用 一 些 非 常 简 单 的 汉 语

国债回购交易业务指引

评 委 : 李 炎 斌 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

Microsoft Word - 第7章 图表反转形态.doc

I

第2章 数据类型、常量与变量

教师上报成绩流程图

龚 亚 夫 在 重 新 思 考 基 础 教 育 英 语 教 学 的 理 念 一 文 中 援 引 的 观 点 认 为 当 跳 出 本 族 语 主 义 的 思 维 定 式 后 需 要 重 新 思 考 许 多 相 连 带 的 问 题 比 如 许 多 发 音 的 细 微 区 别 并 不 影 响 理 解 和

修改版-操作手册.doc

评 委 : 徐 岩 宇 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

定 位 和 描 述 : 程 序 设 计 / 办 公 软 件 高 级 应 用 级 考 核 内 容 包 括 计 算 机 语 言 与 基 础 程 序 设 计 能 力, 要 求 参 试 者 掌 握 一 门 计 算 机 语 言, 可 选 类 别 有 高 级 语 言 程 序 设 计 类 数 据 库 编 程 类

中 日 信 息 化 的 比 较 与 合 作 一 中 日 信 息 化 的 规 模 比 较

关于修订《沪市股票上网发行资金申购

<4D F736F F D20C6F3D2B5C5E0D1B5CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

附 件 : 上 海 市 建 筑 施 工 企 业 施 工 现 场 项 目 管 理 机 构 关 键 岗 位 人 员 配 备 指 南 二 一 四 年 九 月 十 一 日 2

上海证券交易所会议纪要

用节点法和网孔法进行电路分析

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

证券代码: 证券简称:长城电脑 公告编号:

目 录 关 于 图 标... 3 登 陆 主 界 面... 3 工 单 管 理... 5 工 单 列 表... 5 搜 索 工 单... 5 工 单 详 情... 6 创 建 工 单... 9 设 备 管 理 巡 检 计 划 查 询 详 情 销 售 管

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

第 一 部 分 MagiCAD for Revit 安 装 流 程

类 似 地, 又 可 定 义 变 下 限 的 定 积 分 : ( ). 与 ψ 统 称 为 变 限 积 分. f ( ) d f ( t) dt,, 注 在 变 限 积 分 (1) 与 () 中, 不 可 再 把 积 分 变 量 写 成 的 形 式 ( 例 如 ) 以 免 与 积 分 上 下 限 的

随着执业中医师资格考试制度的不断完善,本着为我校中医学专业认证服务的目的,本文通过对我校中医类毕业生参加2012年和2013年的中医执业医师考试成绩及通过率、掌握率进行分析,并与全国的平均水平进行差异比较分析,以此了解我校执业中医师考试的现状,进而反映我校中医类课程总体教学水平,发现考核知识模块教学中存在的不足,反馈给相关学院和教学管理部门,以此提高教学和管理水平。

一、资质申请

金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

珠江钢琴股东大会

(Microsoft Word - NCRE\314\345\317\265\265\367\325\37313\324\27221\272\3051.doc)

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

公 开 刊 物 须 有 国 内 统 一 刊 (CN), 发 表 文 章 的 刊 物 需 要 在 国 家 新 闻 出 版 广 电 总 局 ( 办 事 服 务 便 民 查 询 新 闻 出 版 机 构 查 询 ) 上 能 够 查 到 刊 凡 在 有 中 国 标 准 书 公 开

Microsoft Word - 资料分析练习题09.doc

导 数 和 微 分 的 概 念 导 数 的 几 何 意 义 和 物 理 意 义 函 数 的 可 导 性 与 连 续 性 之 间 的 关 系 平 面 曲 线 的 切 线 和 法 线 导 数 和 微 分 的 四 则 运 算 基 本 初 等 函 数 的 导 数 复 合 函 数 反 函 数 隐 函 数 以

登录、注册功能的测试用例设计.doc

正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 二 级 可 编 程 师 ( 具 备 以 下 条 件 之 一 者 ) (1) 连 续 从 事 本 职 业 工 作 13 年 以 上 (2) 取 得 本 职 业 三 级 职 业 资 格 证 书 后, 连 续 从 事 本 职 业

上证指数


目 录 一 系 统 访 问... 1 二 门 户 首 页 申 报 用 户 审 核 用 户... 2 三 系 统 登 录 用 户 名 密 码 登 录 新 用 户 注 册 用 户 登 录 已 注 册 用

Template BR_Rec_2005.dot

Microsoft Word - 第3章.doc

新, 各 地 各 部 门 ( 单 位 ) 各 文 化 事 业 单 位 要 高 度 重 视, 切 实 加 强 领 导, 精 心 组 织 实 施 要 根 据 事 业 单 位 岗 位 设 置 管 理 的 规 定 和 要 求, 在 深 入 调 查 研 究 广 泛 听 取 意 见 的 基 础 上, 研 究 提

<4D F736F F D C4EAB9A4B3CCCBB6CABFCAFDD1A7D7A8D2B5BFCEBFBCCAD4B4F3B8D9D3EBD2AAC7F3>

<4D F736F F D20B3D6B2D6CFDEB6EEB1EDB8F1D7EED6D52E646F63>

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

·岗位设置管理流程

工 程 勘 察 资 质 标 准 根 据 建 设 工 程 勘 察 设 计 管 理 条 例 和 建 设 工 程 勘 察 设 计 资 质 管 理 规 定, 制 定 本 标 准 一 总 则 ( 一 ) 本 标 准 包 括 工 程 勘 察 相 应 专 业 类 型 主 要 专 业 技 术 人 员 配 备 技 术

超 级 玛 丽 JAVA 小 游 戏 测 试 报 告 1. 导 言 1.1 编 写 目 的 该 文 档 的 目 的 是 描 述 超 级 玛 丽 JAVA 小 游 戏 的 系 统 测 试 的 总 结 报 告, 其 主 要 内 容 包 括 : 系 统 环 境 的 介 绍 功 能 的 实 现 的 测 试

合 并 计 算 配 售 对 象 持 有 多 个 证 券 账 户 的, 多 个 证 券 账 户 市 值 合 并 计 算 确 认 多 个 证 券 账 户 为 同 一 配 售 对 象 持 有 的 原 则 为 证 券 账 户 注 册 资 料 中 的 账 户 持 有 人 名 称 有 效 身 份 证 明 文 件

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

精 勤 求 学 自 强 不 息 Born to win! 解 析 : 由 极 限 的 保 号 性 知 存 在 U ( a) 当 a 时 f ( ) f ( a) 故 f ( ) 在 点 a 不 取 极 值 f ( ) f ( a) f ( ) f ( a) lim lim a a a a ( a)


<433A5C C6B73625C B746F705CB9FABCCAD6D0D2BDD2A9D7A8D2B5B8DFBCB6BCBCCAF5D6B0B3C6C6C0C9F3C9EAC7EBD6B8C4CFA3A CDA8D3C3B0E6A3A92E646F63>

第二讲 数列

课程类 别

关于2010年上半年(31次)全国计算机等级考试报名的通知

<4D F736F F D20D0A3B7A2A1B A1B BAC5B9D8D3DAD7E9D6AFBFAAD5B9C8ABD0A3BDCCD6B0B9A4B8DACEBBC6B8D3C3B1E4B6AFB9A4D7F7B5C4CDA8D6AA2E646F63>

i 1) 系 统 运 作 前 设 定 *1. [2.1 网 页 主 机 名 称 设 定 ] -- 设 定 校 务 系 统 的 主 机 IP 地 址, 以 供 其 他 个 人 电 脑 连 接 及 使 用 该 系 统 *2. [2.3.1 输 入 / 修 改 学 校 资 料 ] -- 输 入 系 统 使

国家职业标准:网络课件设计师

<443A5C6D B5C30312EB9A4D7F7CEC4B5B55C30322EBACFCDACCEC4B5B55C C30342EC8CBC9E7CCFC5C31332ECFEEC4BFC5E0D1B55C E30385C322EB2D9D7F7CAD6B2E12E646F63>

目 录 一 激 活 账 号... 2 二 忘 记 密 码 后 如 何 找 回 密 码?... 3 三 如 何 管 理 学 校 信 息 及 球 队 学 生 教 师 等 信 息... 6 四 如 何 发 布 本 校 校 园 文 化? 五 如 何 向 教 师 发 送 通 知? 六

第1篇 道路桥梁工程技术核心专业课程标准及学习绩效考评体系

马 克 思 主 义 公 正 观 的 基 本 向 度 及 方 法 论 原 则!! # #

采 取 行 动 的 机 会 90% 开 拓 成 功 的 道 路 2

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审


中 国 软 科 学 年 第 期!!!

Microsoft Word - 文件汇编.doc


国际财务报告准则第13号——公允价值计量


第 六 章 债 券 股 票 价 值 评 估 1 考 点 一 : 债 券 价 值 的 影 响 因 素 2

小 学 语 文 是 小 学 语 文 是 小 学 语 文 是 小 学 语 文

第 四 条 建 设 单 位 对 可 能 产 生 职 业 病 危 害 的 建 设 项 目, 应 当 依 照 本 办 法 向 安 全 生 产 监 督 管 理 部 门 申 请 职 业 卫 生 三 同 时 的 备 案 审 核 审 查 和 竣 工 验 收 建 设 项 目 职 业 卫 生 三 同 时 工 作 可

2.5 选 举 陈 晓 非 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.6 选 举 卢 婕 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.7 选 举 张 文 君 先 生 为 第 六 届 董 事 会 独 立 董 事 候 选 人 的 议 案

第 期 李 伟 等 用 方 法 对 中 国 历 史 气 温 数 据 插 值 可 行 性 讨 论

中 中 中 中 部 中 岗 位 条 件 历 其 它 历 史 师 地 理 师 生 物 师 体 与 健 康 师 从 事 中 历 史 工 从 事 中 地 理 工 从 事 中 生 物 工 从 事 中 体 与 健 康 工 2. 课 程 与 论 ( 历 史 ); 2. 科 ( 历 史 )

上海证券交易所会议纪要

附件1:

4 进 入 交 互 区 设 置 的 组 件 管 理, 在 组 件 管 理 中, 教 师 可 以 选 择 课 程 空 间 中 的 所 有 组 件, 并 通 过 点 击 启 用 或 不 启 用 选 定 组 件 在 课 程 空 间 中 的 显 示 5 进 入 工 作 室 管 理 的 工 作 室 首 页,

2016年南开大学MBA招生信息

物 流 从 业 人 员 职 业 能 力 等 级 证 书 分 为 四 个 级 别, 分 别 为 初 级 助 理 级 中 级 和 高 级 ; 采 购 从 业 人 员 职 业 能 力 等 级 证 书 分 为 三 个 级 别, 分 别 为 中 级 高 级 和 注 册 级 请 各 有 关 单 位 按 照 通

Microsoft Word - 第5章.doc

包 头 北 方 创 业 股 份 有 限 公 司 2016 年 第 二 次 临 时 股 东 大 会 会 议 须 知 为 维 护 股 东 合 法 权 益, 确 保 包 头 北 方 创 业 股 份 有 限 公 司 ( 以 下 简 称 公 司 )2016 年 第 二 次 临 时 股 东 大 会 ( 以 下

全国建筑市场注册执业人员不良行为记录认定标准(试行).doc

一 开 放 性 的 政 策 与 法 规 二 两 岸 共 同 的 文 化 传 承 三 两 岸 高 校 各 自 具 有 专 业 优 势 远 见 杂 志 年 月 日

试 制 度 的 科 学 性 及 合 理 性 问 题 的 调 查 上 具 有 较 强 的 代 表 性 一 我 国 注 册 资 产 评 估 师 考 试 制 度 合 理 性 的 调 查 分 析 为 了 解 被 调 查 者 对 我 国 目 前 注 册 资 产 评 估 师 考 试 制 度 合 理 性 的 评

世华财讯模拟操作手册

2 任 务 目 标 任 务 实 施 学 一 学 安 全 用 电 1. 安 全 用 电 的 意 义 2. 人 体 触 电 的 基 本 知 识 1 2 1mA 10 30mA 50mA 100mA 750ms Hz

北京信息科技大学本科学生成绩管理办法

2 熟 悉 Visual Basic 的 集 成 开 发 环 境 3 了 解 可 视 化 面 向 对 象 编 程 事 件 驱 动 交 互 式 开 发 等 基 本 概 念 4 了 解 Visual Basic 的 特 点 环 境 要 求 与 安 装 方 法 1 Visual Basic 开 发 应 用

Transcription:

技 能 赛 命 题 2 基 于 Spark 的 同 构 子 图 查 询 1 题 目 描 述 现 实 生 活 中 的 很 多 关 系, 例 如 社 交 网 络 互 联 网 网 页 超 链 关 系 语 义 网 生 物 作 用 网 络 等, 都 可 以 用 离 散 数 学 中 的 图 加 以 描 述 并 进 行 分 析 随 着 计 算 技 术 的 发 展, 现 实 世 界 产 生 的 图 数 据 规 模 越 来 越 大 Facebook 的 社 交 网 络 目 前 已 经 包 括 至 少 9 亿 日 常 活 跃 用 户, 每 个 用 户 平 均 有 130 个 朋 友 而 根 据 估 计, 目 前 互 联 网 网 页 的 数 目 已 经 超 过 48 亿 个 面 对 大 规 模 的 图 分 析 任 务, 单 机 处 理 已 经 力 不 从 心, 需 要 人 们 利 用 分 布 式 计 算 系 统 进 行 并 行 处 理 子 图 匹 配 是 图 分 析 中 的 一 个 基 础 操 作, 被 广 泛 应 用 于 蛋 白 相 互 作 用 网 络 分 析 知 识 库 程 序 分 析 等 应 用 中 本 题 目 希 望 选 手 利 用 Spark 平 台 并 行 化 子 图 匹 配 算 法, 使 子 图 匹 配 操 作 能 高 效 地 在 大 规 模 图 数 据 集 上 完 成 1.1 子 图 匹 配 问 题 定 义 在 本 题 目 中, 主 要 考 虑 带 标 签 (label) 的 子 图 匹 配 任 务 假 设 有 向 图 G 定 义 为 : G = (V, E, T, l G ) 其 中 V 是 顶 点 集,E 是 边 集,T 是 标 签 集,l G : V T 是 标 签 函 数,l G 为 每 一 个 顶 点 赋 予 标 签 集 合 T 中 的 一 个 标 签 1 1 图 中 的 标 签 主 要 用 来 对 图 的 顶 点 进 行 分 类 以 社 交 网 络 为 例, 社 交 网 络 图 中 的 顶 点 代 表 了 现 实 世 界 中 的 人, 我 们 可 以 用 人 的 性 别 属 性 给 顶 点 贴 上 标 签 ; 假 设 标 签 集 T={1,2} 分 别 代 表 男 性 和 女 性, 则 图 G 的 标 签 函 数 l G 就 标 明 了 每 个 顶 点 对 应 的 人 的 性 别 一 般 来 说, 图 的 标 签 集 规 模 很 小, 远 小 于 图 顶 点 的 数 量 当 图 的 标 签 集 中 只 有 一 个 标 签 时 ( 即 标 签 集 大 小 为 1), 表 示 图 中 所 有 的 顶 点 都 具 有 相 同 的 标 签, 此 时 该 图 就 退 化 成 了 一 个 无 标 签 图 ( 标 签 没 有 区 分 性, 等 价 于 所 有 顶 点 都 没 有 标 签 ) 1

子 图 匹 配 任 务 就 是 在 一 张 大 图 G 中 找 出 与 给 定 的 查 询 图 q 同 构 的 所 有 子 图, 并 输 出 这 些 同 构 子 图 图 G 规 模 一 般 较 大, 在 子 图 匹 配 任 务 中 称 为 数 据 图 需 4 c 1 a b 2 d 3 3 d 1 2 a a b c 4 5 b 6 (a) 查 询 图 q (b) 数 据 图 G 图 1 子 图 匹 配 操 作 示 例 蓝 色 边 标 识 出 了 其 中 一 个 匹 配 的 子 图 要 被 查 询 的 图 q 规 模 通 常 较 小, 在 子 图 匹 配 任 务 中 称 为 查 询 图 图 1 展 示 了 一 个 子 图 匹 配 的 例 子 图 1 (a) 中 是 需 要 被 查 询 的 查 询 图 q, 图 1 (b) 中 是 数 据 图 G 数 据 图 G 中 一 个 匹 配 q 的 子 图 已 经 用 蓝 色 边 标 识 出 来 了 下 面 给 出 子 图 匹 配 任 务 的 形 式 化 定 义 数 据 图 G 的 定 义 见 上 文 查 询 图 的 定 义, 和 子 图 匹 配 任 务 的 定 义 见 后 文 查 询 图 定 义 查 询 图 q = (V q, E q, T q, l q ) 其 中 V q 是 查 询 图 的 顶 点 集,E q 是 查 询 图 的 边 集,T q 是 标 签 集 l q : V q T q 是 标 签 函 数, 将 查 询 图 中 的 顶 点 映 射 到 标 签 集 T q 上 查 询 图 的 标 签 集 T q 可 以 确 保 是 数 据 图 标 签 集 T 的 子 集 子 图 匹 配 问 题 对 于 一 张 有 向 数 据 图 G = (V, E, T, l G ) 和 一 个 查 询 图 q = (V q, E q, T q, l q ), 子 图 匹 配 的 目 标 是 在 数 据 图 G 中, 找 出 所 有 满 足 如 下 三 个 条 件 的 子 图 g = (V g, E g ): 1. 子 图 条 件 V g V, E g E; 2. 规 模 匹 配 条 件 匹 配 到 的 子 图 的 点 集 边 集 大 小 必 须 与 查 询 图 点 集 边 集 大 小 相 同, 即 V q = V g 且 E q = E g, 其 中 V q 表 示 集 合 V q 的 元 素 个 数 ; 3. 同 构 匹 配 条 件 存 在 从 查 询 图 q 的 点 集 到 同 构 子 图 g 的 点 集 的 一 个 双 射 f: V q V g, 该 2

双 射 f 同 时 满 足 : a) 标 签 匹 配 对 应 顶 点 的 标 签 相 同, 即 v V q, l q (v) = l G (f(v)); b) 拓 扑 结 构 匹 配 e = (u, v) E q, (f(u), f(v)) E g 同 构 匹 配 条 件 中 的 映 射 f 指 定 了 查 询 图 q 的 顶 点 如 何 同 构 地 映 射 到 子 图 g 的 顶 点 上 不 同 的 f 对 应 着 不 同 的 子 图 映 射 图 1 展 示 了 一 个 子 图 匹 配 的 示 例 图 中 顶 点 圆 圈 内 的 英 文 字 母 表 示 顶 点 的 标 签, 顶 点 旁 的 数 字 表 示 顶 点 编 号 在 图 1 (b) 所 示 的 数 据 图 G 中 查 询 图 1 (a) 所 示 的 子 图 q, 将 得 到 两 个 匹 配 的 子 图 图 1 (b) 中 的 蓝 色 线 条 标 识 出 了 其 中 的 一 个 匹 配 子 图 (1,4,3,5) (1,4,3,5) 的 意 思 是 数 据 图 G 中 的 1 4 3 5 号 顶 点 构 成 了 一 个 查 询 图 q 的 同 构 子 图, 数 据 图 G 中 的 1 4 3 5 号 顶 点 依 次 映 射 为 查 询 图 q 中 的 1 2 3 4 号 顶 点 可 以 验 证 该 子 图 满 足 子 图 匹 配 的 三 个 条 件, 是 查 询 图 q 的 匹 配 子 图 除 了 (1,4,3,5) 构 成 的 子 图, 在 图 1 中 还 存 在 另 一 个 匹 配 子 图, 它 的 映 射 关 系 序 列 是 (2,4,3,5), 选 手 可 自 行 验 证 1.2 本 题 任 务 题 目 将 给 出 一 个 数 据 图 G 和 一 个 查 询 图 q 请 编 写 Spark 程 序, 在 数 据 图 G 中 完 成 子 图 匹 配 任 务, 输 出 与 查 询 图 q 同 构 的 所 有 子 图 1.3 输 入 数 据 集 本 题 目 将 提 供 三 个 不 同 规 模 的 输 入 数 据 集 供 选 手 调 试 程 序 和 评 测 性 能 三 个 数 据 集 的 数 据 图 G 的 规 模 如 表 格 1 所 示 在 每 个 输 入 数 据 集 中, 同 时 配 套 有 一 个 示 例 性 的 查 询 图 q 选 手 可 以 通 过 该 文 件 了 解 输 入 文 件 格 式 调 试 自 己 的 程 序 在 评 测 阶 段, 比 赛 组 委 会 将 根 据 所 有 选 手 的 答 题 情 况, 另 外 选 择 新 的 查 询 图 进 行 测 评 3

表 格 1 数 据 集 规 模 数 据 集 名 称 数 据 图 顶 点 数 数 据 图 边 数 标 签 集 规 模 Gnutella08 2 6,301 20,777 1 WordNet 3 76,853 132,537 5 US Patents 4 3,774,768 16,518,947 416 2 提 交 材 料 请 选 手 提 交 如 下 材 料 1. 程 序 源 代 码, 要 求 提 供 包 含 完 整 目 录 结 构 的 src 代 码 包, 并 且 提 供 编 译 方 法 说 明 如 用 Scala+sbt 实 现 时, 提 交 目 录 结 构 如 下 的 程 序 文 件 和 sbt 文 件./src main scala Main.scala 因 为 在 必 要 时, 会 重 新 编 译 选 手 程 序 进 行 评 测, 请 在 提 交 代 码 时 附 带 编 译 方 法 说 明 2. 程 序 可 执 行 jar 包,jar 包 将 会 以 前 述 命 令 运 行 评 测 3. 程 序 设 计 报 告 报 告 内 容 包 括 但 不 局 限 于 程 序 采 用 的 算 法 进 行 的 优 化 工 作 优 化 取 得 的 效 果 等 2 数 据 集 来 源 :https://snap.stanford.edu/data/p2p-gnutella08.html 3 数 据 集 来 源 :http://vlado.fmf.uni-lj.si/pub/networks/data/dic/wordnet/wordnet.htm 4 数 据 集 来 源 :http://vlado.fmf.uni-lj.si/pub/networks/data/patents/patents.htm 4

3 附 录 A 程 序 设 计 约 束 3.1 输 入 文 件 格 式 一 个 输 入 数 据 集 由 一 张 数 据 图 G 和 一 张 查 询 图 q 组 成 数 据 图 G 和 查 询 图 q 使 用 相 同 的 文 件 格 式 进 行 描 述 而 每 一 张 图 使 用 点 集 文 件 和 边 集 文 件 两 个 输 入 文 件 进 行 描 述 3.1.1 点 集 文 件 格 式 点 集 文 件 是 一 个 文 本 文 件, 由 若 干 行 组 成 每 一 行 均 由 两 个 以 英 文 空 格 分 隔 的 正 整 数 组 成 : Vid LabelID 第 一 个 整 数 Vid 是 顶 点 编 号 第 二 个 整 数 LabelID 是 顶 点 对 应 的 标 签 假 设 图 1 中 的 四 个 标 签 a,b,c,d 分 别 用 整 数 1,2,3,4 表 示, 那 么 图 1 中 数 据 图 G 的 点 集 文 件 为 : 1 1 2 1 3 4 4 2 5 3 6 2 图 1 中 查 询 图 q 的 点 集 文 件 为 : 1 1 2 2 3 4 4 3 3.1.2 边 集 文 件 格 式 边 集 文 件 也 是 一 个 文 本 文 件, 由 若 干 行 组 成 每 一 行 均 由 两 个 以 英 文 空 格 分 隔 的 正 整 数 组 成 : Vid1 Vid2 第 一 个 整 数 Vid1 是 有 向 边 起 始 顶 点 编 号 第 二 个 整 数 Vid2 是 有 向 边 终 点 顶 5

点 的 编 号 图 1 (b) 中 数 据 图 G 的 边 集 文 件 的 部 分 内 容 为 : 1 3 3 1 1 4 4 1 1 5 5 1 2 4 2 5 图 1 (b) 中 查 询 图 q 的 边 集 文 件 的 内 容 为 : 1 4 1 2 2 3 4 2 3.2 输 出 文 件 格 式 请 输 出 与 查 询 图 q 同 构 的 所 有 子 图 到 一 个 或 多 个 文 本 文 件 中 输 出 时, 每 个 同 构 的 子 图 在 输 出 文 件 中 占 据 一 行 该 行 内 容 用 以 说 明 匹 配 时 的 映 射 函 数 f 每 一 行 由 若 干 以 英 文 逗 号 分 隔 的 顶 点 编 号 组 成, 格 式 如 下 所 示 : Vid1,Vid2,Vid3,Vid4,,VidK 这 表 示 数 据 图 G 的 Vid1 号 顶 点 对 应 查 询 图 q 的 1 号 顶 点, 数 据 图 的 Vid2 号 顶 点 对 应 查 询 图 q 中 的 2 号 顶 点, 数 据 图 中 Vid3 号 顶 点 对 应 q 中 的 3 号 顶 点, 依 次 类 推 例 如 在 图 1 (b) 中 的 数 据 图 G 上, 对 图 1 (a) 所 示 的 查 询 图 q 进 行 子 图 匹 配 操 作, 一 共 可 以 找 到 2 个 同 构 的 子 图, 对 应 的 输 出 文 件 的 内 容 如 下 : 1,4,3,5 2,4,3,5 只 要 子 图 的 匹 配 映 射 函 数 f 不 同, 即 算 作 不 同 的 匹 配 子 图 例 如 在 图 2 所 示 的 示 例 中, 利 用 查 询 图 q 去 匹 配 数 据 图 G 时, 一 共 可 以 产 生 6 种 不 同 的 匹 配 方 6

案 映 射 序 列 (4,1,2) 和 (4,2,1) 对 应 的 匹 配 子 图 虽 然 有 相 同 的 点 集 和 边 集, 在 输 出 时, 请 当 作 不 同 的 映 射 序 列 处 理 b 1 1 a 3 a a (a) 查 询 图 q 2 图 2 对 称 匹 配 示 例 2 3 a b a 4 (b) 数 据 图 G 3.3 程 序 运 行 方 式 每 个 参 赛 组 提 交 的 程 序 jar 包 将 会 以 如 下 格 式 的 命 令 运 行 进 行 评 测 ( 请 严 格 按 照 题 目 要 求 的 环 境 来 编 写 和 测 试 程 序, 另 外 不 要 将 数 据 集 大 小,Spark 集 群 的 Master URI, 输 入 输 出 路 径,jar 包 路 径 等 参 数 写 死 在 程 序 里!): ${SPARK_HOME/bin}/spark-submit \ --master <test spark cluster master uri> \ --class subgraph.main \ --executor.memory 20G \ --driver.memory 20G \ <your jar file path> \ hdfs://< 数 据 图 点 集 文 件 路 径 > \ hdfs://< 数 据 图 边 集 文 件 路 径 > \ hdfs://< 查 询 图 点 集 文 件 路 径 > \ hdfs://< 查 询 图 边 集 文 件 路 径 > \ hdfs://< 匹 配 结 果 输 出 文 件 路 径 > \ hdfs://< 临 时 工 作 目 录 路 径 > 7

请 选 手 按 照 上 述 运 行 方 式 要 求 进 行 程 序 设 计 其 中 主 类 名 已 设 置 好, 如 选 手 想 选 用 其 他 名 称, 务 必 另 外 添 加 文 件 说 明 需 要 运 行 的 主 类 名 选 手 的 程 序 请 正 确 处 理 6 个 命 令 行 参 数, 输 入 输 出 文 件 的 存 储 位 置 将 由 这 些 命 令 行 参 数 指 定 请 选 手 注 意, 所 有 参 数 中 出 现 的 文 件 路 径 均 是 以 hdfs://xxxx/yyyy/zzzz 的 形 式 表 示 的 HDFS 路 径 所 有 输 入 输 出 文 件 都 要 保 存 在 HDFS 上 选 手 在 输 出 匹 配 结 果 时, 既 可 以 将 匹 配 结 果 写 入 单 个 文 本 文 件, 也 可 以 将 匹 配 结 果 写 到 一 个 文 件 夹 内, 文 件 夹 中 存 放 若 干 以 part-xxx 格 式 命 名 的 文 本 文 件, 在 评 测 时 评 测 系 统 会 自 动 将 part-xxx 格 式 命 名 的 文 件 合 并 成 一 个 单 一 的 文 件 进 行 评 测 输 出 文 件 / 文 件 夹 路 径 由 hdfs://< 匹 配 结 果 输 出 文 件 路 径 > 命 令 行 参 数 指 定 程 序 运 行 开 始 之 前, 这 个 路 径 并 不 存 在, 请 选 手 自 行 创 建 在 评 测 时, 评 测 系 统 会 为 选 手 提 供 一 个 临 时 的 HDFS 工 作 目 录, 该 目 录 路 径 由 命 令 行 参 数 hdfs://< 临 时 工 作 目 录 路 径 > 给 出 选 手 的 程 序 可 以 假 设 该 文 件 夹 路 径 已 经 存 在, 而 且 在 最 开 始 时 是 一 个 空 文 件 夹 选 手 的 程 序 可 以 在 该 文 件 夹 内 读 写 任 意 的 文 件 该 文 件 夹 主 要 供 选 手 保 存 处 理 中 间 结 果 禁 止 对 输 入 数 据 集 文 件 所 在 的 文 件 夹 进 行 写 入 操 作 禁 止 读 取 写 入 命 令 行 参 数 指 定 的 HDFS 路 径 之 外 的 其 他 HDFS 文 件 如 果 读 写 命 令 行 参 数 中 未 出 现 的 文 件 路 径 写 入 输 入 数 据 集 所 在 的 文 件 夹 自 行 读 写 本 地 文 件 系 统 的 文 件, 将 可 能 导 致 程 序 异 常 退 出, 异 常 退 出 的 程 序 将 没 有 分 数 4 附 录 B 程 序 评 测 4.1 评 测 标 准 评 测 时 将 综 合 考 虑 程 序 的 正 确 性 能 够 处 理 的 数 据 集 规 模 和 程 序 的 运 行 速 度 正 确 性 部 分 将 结 合 选 手 答 案 的 召 回 率 和 准 确 率 综 合 给 分 8

4.2 评 测 软 件 环 境 本 题 目 测 评 时 将 会 运 行 在 Apache Spark-1.4.0,Hadoop-2.4.1,JDK-1.7, Scala-2.10.4 环 境 下, 请 选 手 使 用 Java 或 者 Scala 进 行 编 程 开 发 评 测 用 集 群 硬 件 配 置 : Workers 16 Cores 384 Memory per node 20GB CPU per node Intel(R) Xeon(R) E5-2620 v2 @ 2.10GHz 2 4.3 友 情 提 醒 1. 评 测 用 的 环 境 如 前 所 述, 请 注 意 Spark JDK 和 Scala 的 版 本 如 果 选 手 使 用 高 版 本 的 JDK, 请 在 编 译 程 序 时, 编 译 为 JDK-1.7 兼 容 的 格 式 评 测 将 使 用 Spark-1.4.0 版 本, 更 高 级 版 本 的 Spark API 将 不 会 被 支 持 2. 评 测 将 使 用 程 序 自 动 化 地 运 行 选 手 程 序 判 断 结 果, 因 此 请 务 必 遵 守 前 文 所 述 的 各 种 运 行 要 求 和 文 件 格 式 不 符 合 格 式 要 求 的 输 出 文 件, 可 能 导 致 评 测 失 败 3. 请 附 带 源 代 码 的 编 译 说 明 在 jar 包 无 法 运 行 的 情 况 下, 评 测 人 员 会 尝 试 从 源 代 码 重 新 编 译 运 行 4. 选 手 可 先 使 用 小 数 据 集 来 调 试 程 序 的 正 确 性, 再 用 大 数 据 集 进 行 性 能 调 优 评 测 时 会 综 合 考 虑 选 手 程 序 的 正 确 性 和 性 能 9