Microsoft PowerPoint - 第8-3章-Network Module.pptx

Similar documents
PowerPoint Presentation

ENGG1410-F Tutorial 6

Untitled-3

Microsoft PowerPoint - Discovering Organizational Structure.pptx

Microsoft Word - p11.doc

彩色地图中道路的识别和提取

高中英文科教師甄試心得

Microsoft PowerPoint - Performance Analysis of Video Streaming over LTE using.pptx

4. 每 组 学 生 将 写 有 习 语 和 含 义 的 两 组 卡 片 分 别 洗 牌, 将 顺 序 打 乱, 然 后 将 两 组 卡 片 反 面 朝 上 置 于 课 桌 上 5. 学 生 依 次 从 两 组 卡 片 中 各 抽 取 一 张, 展 示 给 小 组 成 员, 并 大 声 朗 读 卡


Stochastic Processes (XI) Hanjun Zhang School of Mathematics and Computational Science, Xiangtan University 508 YiFu Lou talk 06/

Microsoft PowerPoint - Aqua-Sim.pptx

穨control.PDF

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 研 究 方 向 数 据 处 理 近 三 年 来

untitled

EM算法及其应用


Microsoft PowerPoint - NGDM07 Philip Yu.ppt

% % 34

東莞工商總會劉百樂中學

地質調査研究報告/Bulletin of the Geological Survey of Japan

<4D F736F F D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D C8B7B6A8B8E5>

第三章 国内外小组合作学习的应用情况

A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

Microsoft PowerPoint - STU_EC_Ch08.ppt

Microsoft Word doc

Microsoft PowerPoint _代工實例-1

Microsoft PowerPoint - CH 04 Techniques of Circuit Analysis

南華大學數位論文

Microsoft Word - ch05note_1210.doc

Introduction to Hamilton-Jacobi Equations and Periodic Homogenization

Microsoft Word - 专论综述1.doc

untitled

Microsoft Word - 08_科普作品選讀示例一_ doc

Open topic Bellman-Ford算法与负环

BC04 Module_antenna__ doc

The Development of Color Constancy and Calibration System

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

<4D F736F F D20A9DBA6ACB667A4BBBFB3BDECA470B2D5B2D5ADFB5F A67EABD7B2C431B4C15F2E444F43>

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 百 善 孝 為 先? 奉 養 父 母 與 接 受 子 女 奉 養 之 態 度 及 影 響 因 素 : 跨 時 趨 勢 分 析 Changes in attitude toward adult children's responsibilit

<4D F736F F F696E74202D20B5DAD2BBD5C228B4F2D3A1B0E6292E BBCE6C8DDC4A3CABD5D>

Analysis of Cultural Elements of Meinong s Paper Umbrella Painting Abstract Meinong paper umbrellas are a traditional industrial art for the Hakka peo

Theory of Groups is another course for undergraduates; and Module Theory will be a basic course of graduates). The main contents include the basic str

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

km km mm km m /s hpa 500 hpa E N 41 N 37 N 121

要 闻 摘 报 刘 伟 校 长 到 理 学 院 信 息 学 院 环 境 学 院 调 研 为 深 入 了 解 理 工 院 系 人 才 培 养 科 学 研 究 队 伍 建 设 学 科 发 展 等 情 况, 刘 伟 校 长 一 行 先 后 到 理 学 院 信 息 学 院 环 境 学 院 调 研, 体 现

穨6街舞對抗中正紀念堂_林伯勳張金鶚_.PDF

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

物理学报 Acta Phys. Sin. Vol. 62, No. 14 (2013) 叠 [4]. PET 设备最重要的部件就是探测器环, 探测 备重建图像具有减少数据插值的优势. 器环的性能直接影响 PET 的成像能力. 探头与探头 之间得到的符合直线叫做投影线. 所有的投影线在

目录 决策树 Adaptive Boosting (AdaBoost) Gradient Boost Decision Tree (GBDT) TreeBoost XGBoost 总结

: ( ),,

spss.doc

影響新產品開發成效之造型要素探討

Microsoft PowerPoint - NCBA_Cattlemens_College_Darrh_B


第三章 對農企業法人取得農地使用權源

目录 CONTENTS

46 數 學 傳 播 26 卷 3 期 民 91 年 9 月 表 演, 有 些 賭 場 還 每 小 時 發 遊 客 1 美 元, 可 連 發 7 小 時 一 個 目 的, 都 是 吸 引 遊 客 流 連 忘 返, 持 續 地 賭 開 賭 場 當 然 是 為 了 賺 錢, 利 用 機 率 來 設 計

%

m K K K K m Fig. 2 The plan layout of K K segment p

mode of puzzle-solving

Microsoft Word - 11月電子報1130.doc

受訪者編號:

Microsoft Word - ChineseSATII .doc

目 錄 (1) 我 們 的 學 校 學 校 簡 介 學 校 管 理 班 級 組 織 學 生 出 席 率 中 六 畢 業 生 狀 況 教 師 資 歷 教 學 經 驗 教 師 專 業 發 展 (2) 關 注 事 項 的 成 就 與 反 思 重 點 發 展 項 目 一 : 深 化 研 習 英 語 之 優

untitled

Product Type Batteries (only) Circuit Breatkers & Load Protection Connection Devices Contactors Ethernet Switches, Stratix Switches I/O Modules; PLC N

TI 3 TI TABLE 4 RANDBIN Research of Modern Basic Education

東方設計學院文化創意設計研究所

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

20

2811--T 東華三院盧幹庭紀念中學--幹線 (4期).indd

Product Type Batteries (only) Circuit Breakers & Load Protection Connection Devices Contactors Ethernet Switches, Stratix Switches I/O Modules; PLC Ne

Microsoft Word 定版

第 一 章 数 学 系 的 历 史 沿 革 第 一 节 数 学 系 的 渊 源 和 机 构 变 革 情 况 1949 年 6 月, 邸 耀 宗 厉 瑞 康 在 太 原 市 北 郊 上 兰 村 原 进 山 中 学 的 废 墟 上 筹 建 兵 工 职 业 学 校,1950 年 改 为 兵 工 高 级 职

Microsoft Word - 专论综述1.doc

成 大 中 文 學 報 第 二 十 二 期 Chang Kao-Ping Professor, Department of Chinese Literature, National Cheng Kung University Abstract Painting and poetry are comp

投影片 1

林教授2.PDF


Transcription:

第 8 3 章 :Network Module Definition Module detection Bayesian approach Markov clustering algorithm

Network Modular

Modularity Suppose we are given a candidate division of the vertices into some number of groups. The modularity of this division is defined to be the fraction of the edges that fall within the given groups minus the expected such fraction if edges were distributed at random. http://en.wikipedia.org/wiki/modularity_(networks)

Modularity A ij : adjacency matrix k i : degree m: total number of edges

Modularity For two class problem, let s i =1 of node I belongs to group1 and s i = 1 if it belongs to group 2,

Example 1 2 4 3 5

Spectrum Method The largest eigenvectors will gives the best grouping, positive entries corresponding to one class, and negative ones corresponding to another class. This can be achieved by power method where e=(1,1,,1) T

Example 对于上述矩阵 B, 可以计算出最大特征值为 10, 对应的特征向量 于是我们对节点的划分为 {1,2}; {3,4,5} 1 2 4 3 5

优化方法 既然现在有一个衡量划分 好坏 的量 Q, 那么一般的优化方法都可以使用 ; 1. 给定初始划分 2. 对于划分的某种修正, 计算 Q 的改变量 3. 依据一定的原则考虑是否接受这种修正, 重复步骤 2, 直到某种收敛条件满足 Greedy 方法 模拟退火方法

A Bayesian Approach to Network Modularity Slides for this part are mainly from Hofman s talk www.jakehofman.com/talks/apam_20071019.pdf

Overview: Modular Networks Given a network Assign nodes to modules? Determine number of modules(scale/complexity)?

Overview: Modular Networks With a generative model of modular networks, rules of probability tell us how to calculate model parameters (e.g. number of modules & assignments)

Generative Models Known model (parameters, assignment variables, complexity) Generate Synthetic data Inferred Model (parameters, latent variables, complexity) Observed real data

Generating Modular Networks For each node: Roll K sided die to determine z i =1,...,K, the (unobserved) module assignment for ith node For each pair of nodes (i,j): If z i =z j, flip in community coin with bias θ c to determine edge If z i z j, flip between communities coin with bias θ d to determine edge

Generating Modular Networks Die rolling, coin flipping, and priors:

Generating Modular Networks Edges within modules Non edges within modules Edges between modules Non edges between modules Nodes in each modules

Inferring Modular Networks From observed graph structure, infer distributions over module assignments, model parameters, and model complexity

Approximate Inference for Modular Networks Jensen s inequality (log of expected value bounds expected value of log) for any distribution q

Approximate Inference for Modular Networks F is a functional of q; find approximation to posterior by optimizing approximation to evidence Take q(z, π, θ)=q(z)q(π)q(θ); Q iμ is probability of node iin module μ

Variational Bayesian

Variational Bayesian Where the expected counts

Variational Bayesian Method 问题 : 给定数据 D, 缺失数据 Z={Z 1, Z 2,,Z k }, 极大化后验概率分布, 目标函数复杂, 很难得到 Close form. 策略寻找一个合适的近似分布 Q(Z)

如何近似 解决两个问题 如何度量 Q(Z) 和 P(Z D) 的差异 Kullback Leibler Divergence 如何得到简单的分布 Q(Z) 可分解分布 (Factorized Approximation)

Kullback Leibler Divergence 具有如下三个性质 不对称性 : 非负性 : 当且仅当 p=q 时为 0 不满足三角不等式

优化基础 故令 则

优化基础 另一方面 这里 log P(Z,D) 在物理上称之为能量, 而后者是 Q 的熵

平均场 (Mean Field) 近似 采用可分解分布进行近似

平均场近似下的优化算法 优化问题 约束条件

优化问题求解 可以证明, 上述优化问题的解 : 其中 C 为归一化因子. 表示除了 Z i 之外的其它隐变量

考虑 Z=(Z i, Z [ i] ) 优化公式推导

优化公式推导 定义其中 C 为 Q * 的归一化因子. Q* 定义了一个 Z i 上的新的概率分布 另一方面

优化公式推导 于是 上式作为 Q i 的泛函, 由变分原理得

优化公式推导 实际上, 直接由 KL 散度的非负性, 只有当散度为 0 时,L(Q) 取最大值, 即

变分原理 泛函 : 以函数为自变量的函数 泛函 J(y) 在 y=y(x) 极大值 : 对于 y 的任何一个扰动 y 从形式上看, 和 y 是普通变量的含义类似

变分原理 极大值的必要条件 : 一级变分为 0 带约束 J 0 (y) 极大值的必要条件 (Lagrange 乘子 ) 从形式上看, 和 y 是普通变量的含义类似

迭代算法

Markov Clustering Algorithm van Dongen. A cluster algorithm for graphs. Information Systems, 2000

K length Path Basic idea: dense regions in sparse graphs corresponding with regions in which the number of k length path is relatively large. Random walks can also be used to detect clusters in graphs, the idea is that the more closed is a subgraph, the largest the time a random walker need to escape from it.

K path Clustering Matrix manipulation: (N+I) 2

Markov Clustering Expansion: Through matrix manipulation (power), one obtains a matrix for a n steps connection. Inflation: Enhance intercluster passages by raising the elements to a certain power and then normalize

Markov Clustering Algorithm Iteratively running two operators Inflation: Column normalization Expansion:

MCL Running

MCL Running

MCL Running

MCL Running

A Heuristic for MCL We take a random walk on the graph described by the similarity matrix After each step we weaken the links between distant nodes and strengthen the links between nearby nodes Graphic from van Dongen, 2000

References Newman MEJ, Modularity and community structure in network. PNAS 103: 8577 8582, 2006. Hofman, JM and Wiggins, CH. Bayesian approach to network modularity. Physical Review Letters 100:258701, 2008. S. van Dongen. A cluster algorithm for graphs. CWI Report INS R0010, 2000. 侯琳, 邓明华. 网络聚类算法及其生物信息学应用. 数学建模及其生物信息学应用. Vol.2(2): 9 14, 2013. CharlesW. Fox, Stephen J. Roberts. A tutorial on variational Bayesian inference. Artif Intell Rev (2012) 38:85 95.DOI 10.1007/s10462 011 9236 8 C. M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006. ( 第 10 章 : 变分近似 )