数据挖掘之分类

Similar documents
Microsoft Word - 21??¡N??`?C?~??-1.doc, page Normalize ( Microsoft Word - 21ºÝ¤È¸`§C¦~¯Å-1.doc )

<4D F736F F D20A8CFA952A6A12DAED1ADB1B8EAAEC62E646F63>

海 南 冯 琳 峰 海 南 省 锅 炉 压 力 容 器 与 特 种 设 备 检 验 所 海 南 省 定 安 县 白 蒙 路 47 号 信 XC 内 蒙 古 冯 磊 赤 峰 市 特 种 设 备 检 验 所 内 蒙 古 赤 峰 市 红 山 区 八 里 铺 油 库 路

关于规范区委、区委办公室发文

Microsoft Word - ??山

Microsoft Word - 助理人員教育訓練-會計室.docx

灯型系列

朝陽科技大學八十八學年度招考碩士班簡章目錄

2014年大学生村官考试公共基础知识:社会革命和社会改革

团 学 要 闻 我 校 召 开 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 3 月 17 日, 我 校 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 在 行 政 办 公 楼 五 楼 会 议 室 举 行, 校 团 委 委 员 各 院 ( 系 ) 团 委 书 记 校 学 生

(Microsoft Word - 3\271\375\246\321\257R.doc)

大 台 北 與 桃 竹 苗 地 區 北 得 拉 曼 巨 木 步 道 新 竹 縣 尖 石 鄉 鎮 西 堡 巨 木 群 步 道 新 竹 縣 尖 石 鄉 鳥 嘴 山 登 山 步 道 苗 栗 縣 泰 安 鄉 加 里 山 登 山 步 道 苗 栗 縣 南 庄 鄉

比干洗店还专业 To:



礼仪玉和葬玉

Microsoft Word - 第三章第一節第二節.doc

untitled

Microsoft Word 箕æ−¥ï¼‹å®ı稿;

98年度即測即評學科測試與即測即評即發證技術士技能檢定簡章

< F20B4F2D3A1D7F7D2B5>

腊八粥的来历 南宋陆游诗云 今朝佛粥更相馈 反觉江村节 物新 说的就是腊八粥 可见 腊八节 吃 腊八 粥 的风俗 由来已久 每逢腊八这一天 不论是朝 廷 官府 寺院还是黎民百姓家都要做腊八粥 这一 天 人们还要祭祀祖先 众神并庆祝丰收 后来 逐 渐演变成吃腊八粥祝来年五谷丰登 对于腊八粥的来历说法也

bnb.PDF

Microsoft Word - 2B802內文.doc

東區校園中法治教育種子師資教學研習營

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童

Ps22Pdf



除外責任修正條文對照.doc

卫生监督信息2(12).FIT)

untitled



第 二 章 古 代 慢 慢 睁 开 眼 睛, 我 的 面 前 出 现 一 个 女 孩 子, 大 约 十 六 七 岁, 身 穿 淡 绿 色 布 裙, 头 上 两 个 小 圆 髻 特 别 娇 俏 可 爱 医 院 什 么 时 候 出 现 这 么 一 个 可 爱 的 古 装 护 士 啊! 这 医 院 真 有

直航北疆豪華10+1日 (贈東歸‧印象秀)

2

所 内 要 闻 ( 上 接 P1 ) 宾 馆 客 房?vs 手 术 室? 篁 园 市 场 附 近 一 家 小 宾 馆 的 客 房 内, 一 名 身 着 一 次 性 手 术 衣, 戴 着 一 次 性 口 罩 和 手 套 的 医 生, 正 在 床 边 像 模 像 样 地 为 一 名 女

Microsoft Word doc

郎 船 安 兩 槳, 儂 舸 動 雙 橈 掃 黛 開 宮 額, 裁 裙 約 楚 腰 乖 期 方 積 思, 臨 醉 欲 拼 嬌 莫 以 採 菱 唱, 欲 羨 秦 台 簫 相 和 歌 辭 王 昭 君 毛 延 壽 畫 欲 通 神, 忍 為 黃 金 不 為 人 馬 上 琵 琶 行 萬 里, 漢 宮 長 有


個 人 的 手, 拉 著 瞎 子 的 手 把 他 帶 往 村 外 的 時 候, 對 於 瞎 子 來 講, 那 個 人 的 手 和 耶 穌 的 手 有 沒 有 區 別? 沒 有! 為 什 麼 沒 有 區 別? 因 為 對 於 一 個 瞎 子 來 說, 手 和 耳 朵 就 是 他 接 觸 世 界, 瞭

<4D F736F F D20B9FABCD2B7F8C9E4B0B2C8ABC9EAB1A8CFB5CDB3C8EDBCFEB2D9D7F7CBB5C3F E646F63>

通 用 申 请 填 写 流 程 简 图 首 次 登 陆 已 注 册 用 户 登 录 ( 最 终 提 交 前 可 无 限 次 登 录 修 改 ) 注 册 账 户 College Search 中 添 加 New York University Common App 填 写 ( 包 含 两 篇 写 作

Ps22Pdf

养鸭实用技术(三)

新竹高中105學年度第1學期第2次教師甄選簡章

元 [ 所 ] IA27 ( D ) 下 列 何 項 情 況, 其 夫 妻 所 得 可 免 合 併 申 報? (A) 當 年 度 結 婚 (B) 當 年 度 離 婚 (C) 妻 58 歲, 夫 62 歲 無 所 得 受 其 子 扶 養 (D) 以 上 皆 是 [ 所 ]

认定编号

《拍案惊奇》(中)

5 功 能 选 择 键 10 电 源 指 示 灯 基 本 操 作 时 钟 设 置 时 钟 显 示 屏 闪 烁 说 明 没 有 显 示 正 确 的 时 间 通 过 以 下 步 骤 调 整 时 间 : 按 参 数 选 择 键 选 择 时 钟 图 标 ( 如 果 你 是 第 一 次 接 电 源 或 断 电

工业和信息化部 水利部 全国节约用水办公室

100年度工作報告

跨領域學位學程

校园之星

1012

untitled

untitled

untitled



ttian



廁所維護保養手冊

附件1-1

第 二 章 校 草 出 现 圣 迪 亚 学 院, 一 所 远 近 闻 名 的 贵 族 学 院 它 的 知 名 度 就 好 像 猪 的 知 名 度 一 样, 无 人 不 知 无 人 不 晓 是 所 有 人 都 向 往 的 学 校 圣 迪 亚 学 院 是 以 欧 式 建 筑 风 格 为 主 的 大 门

b2

全国主要流域重点断面水质自动监测周报

二 衛 生 所 環 境 介 紹 1F- 櫃 台 門 診 診 間 藥 局 糖 尿 病 衛 教 室 2F- 醫 檢 室 會 議 室 3F- 行 政 辦 公 室 正 門 1F 櫃 台 三 日 程 表 星 期 一 二 三 四 五 早 上 1. 環 境 介 紹 2.DM 衛 教 見 習 3. 藥 局 介 紹

2019大數據平台案例分享與統計輯要 封面+上光

【结构化面试名师精品班2ATY15K002】讲义.docx

人 物 : 大 帝 26 歲 立 翔 26 歲 小 智 25 歲 韓 茵 24 歲 舞 台 設 置 : 現 實 場 景 一 個 單 人 套 房, 一 廳 一 房, 舞 台 上 只 見 得 到 客 廳 的 部 分 簡 單 的 佈 置, 整 體 而 言 是 整 潔 和 中 規 中 矩 的 一 張 沙 發

<4D F736F F D20A454A142AFABB8DCBB50A4E5BEC7A650BEC7BDD7A4E5B6B05FA4A4A6E8AFABB8DCA4A4AABAC367BB402E646F63>

危險物與有害物標示及通識規則

( CIP ) /. - :, ( ) ISBN C CIP ( 2005 ) ( 1 : ) : / : ISB

一、概述

華梵大學

目 录 第 一 部 分 毕 业 设 计 / 毕 业 实 习 工 作 计 划 总 则 成 立 毕 业 设 计 毕 业 实 习 工 作 领 导 小 组 毕 业 设 计 时 间 安 排...4 第 二 部 分 毕 业 设 计 任 务 书 毕

Microsoft Word - ntss201001_a_sc.doc


产 权 市 场 蓝 皮 书 程 国 有 企 业 资 产 租 赁 交 易 工 作 流 程 实 物 资 产 交 易 规 则 试 行 实 物 资 产 转 让 动 态 报 价 实 施 办 法 实 物 资 产 转 让 拍 卖 实 施 办 法 ( 试 行 ) 实 物 资 产 转 让 网 络 竞 价 实 施 办

标题

資源班教材設計*性教育篇

勤 學 * 卓 越 * 快 樂 成 長 本 校 在 老 師 群 策 群 力 共 同 討 論 下, 型 塑 了 學 校 願 景 : 勤 學 卓 越 快 樂 成 長 ( 一 ) 勤 學 運 用 真 的 力 量 培 養 勤 學, 以 語 文 教 為 基 礎 紮 根 ( 二 ) 卓 越 利 用 美 的 感

Copyright c by Manabu Kano. All rights reserved. 1

2009三季报全文.doc

标题


Python a p p l e b e a r c Fruit Animal a p p l e b e a r c 2-2

Microsoft Word - 澎湖田調報告_璉謙組.doc

设 备 的 依 赖 程 度 低 的 产 业 劳 动 密 集 型 产 业 主 要 指 农 业 林 业 及 纺 织 服 装 玩 具 皮 革 家 具 等 制 造 业,B 项 说 法 错 误 ; C. 技 术 密 集 型 产 业 微 电 子 工 业 现 代 制 药 业,C 项 说 法 正 确 ; D. 资

諮 詢 / 吳 明 賢 ( 台 大 醫 院 健 康 管 理 中 心 主 任 台 大 醫 學 院 內 科 教 授 ) 撰 稿 / 伍 蓉 症 狀 多 樣 且 擾 人 胃 及 食 道 位 置 圓 胃 食 道 逆 流 分 典 型 症 狀 及 非 典 型 症 狀 典 型 症 狀 為 胃 酸 逆 流 胸 骨




Transcription:

whgong@zjut.edu.cn

ID3

5 4050

VS. (prediction)

(1)

(2)

NAME RANK YEARS TENURED Mike Assistant Prof 3 no Mary Assistant Prof 7 yes Bill Professor 2 yes Jim Associate Prof 7 yes Dave Assistant Prof 6 no Anne Associate Prof 3 no IF rank = professor OR years > 6 THEN tenured = yes

(Jeff, Professor, 4) NAME RANK YEARS TENURED Tom Assistant Prof 2 no Merlisa Associate Prof 7 no George Professor 5 yes Joseph Assistant Prof 7 yes Tenured?

VS.

age income student credit_rating buys_computer <=30 high no fair no <=30 high no excellent no 31 40 high no fair yes >40 medium no fair yes >40 low yes fair yes >40 low yes excellent no 31 40 low yes excellent yes <=30 medium no fair no <=30 low yes fair yes >40 medium yes fair yes <=30 medium yes excellent yes 31 40 medium no excellent yes 31 40 high yes fair yes >40 medium no excellent no

buys_computer age? <=30 overcast 30..40 >40 student? yes credit rating? no yes fair excellent no yes no yes

ID3 ID3

ID3(1) 1. 2. 3. 4.

ID3(2) 5. 6.

function ID3 (R:, C:, S: ) returns ; begin If S return Failure; If S return ; If R return S; // D = RGain(D,S); {dj j=1,2,.., m} = D; {Sj j=1,2,.., m} = SSjDdj Dd1, d2,.., dm ID3(R-{D}, C, S1), ID3(R-{D}, C, S2),.., ID3(R-{D}, C, Sm); end ID3;

ID3

1np 1/nLog 2 (n) 2nP=(p 1,p 2 p n ) P 3T C 1 C 2..C k T Info(T)=E(p)PC 1 C 2..C k P=( C 1 / T,.. C k / T )

4XT T 1,T 2 T n TT i Info(T i ) Info(X,T)= (( T i / T )Info(T i )) 5 T XT Gain(X,T)=Info(T)-Info(X,T)

SS = {E 1,...,E n }, P = {p 1,..., p n } I(e i ) = - log 2 p i

26 : I(e) = -log 2 (1/26) = 4.7 2500 I(e) = -log 2 (1/2500) = 11.3

1 Ssm mc i (i=1,,m)s i C i p i C i s i /s

2 Av{a1,a2,,av} ASv{S1,S2,,Sv}SiS AajA Ssij SjCiA

3

-- (Gain) =

--

-- 64 64 128 64 64 128 64 32 32 60 64 64 132 63 1

64 64 12 8 60 64 64 64 12 8 64 13 2 64 32 32 63 1 -- m s 1, s 2, s m s = s 1 + s 2 + +s m I(s 1, s 2, s m ) = -p i log 2 (p i ) p i = s i /s

64 64 128 60 64 64 64 128 64 132 64 32 32 63 1 -- (m=2): / s 1 = 641, s 2 = 383 s = s 1 + s 2 = 1024 p 1 = s 1 /s = 641/1024 = 0.6260 p 2 = s 2 /s = 383/1024 = 0.3740 I(s 1, s 2 ) = I(641, 383) = - (p 1 log 2 (p 1 ) + p 2 log 2 (p 2 )) = 0.9537

E 1. : I(128,256)=0.9183 : I(256,0)=0 : I(257,127)=0.9157 : (128+256)/1024=0.375 : 256/1024=0.25 : (257+127)/1024=0.375 E(= 0.375*0.9183 +0.25*0+0.375*0.9157 = 0.6877 Gain() = I(641, 383)-E() =0.9537 0.6877 = 0.2660 -- 64 64 128 64 64 128 64 32 32 60 64 64 132 63 1

2. : I(160,128)=0.9911 : I(289,191)=0.9697 : I(192,64)=0.8133 : 288/1024=0.2813 : 480/1024=0.4687 : 256/1024=0.25 E(= 0.2813 * 0.9911 + 0.4687 * 0.9697 + 0.25 * 0.8133 = 0.9361 Gain() = I(641, 383)-E() =0.9537 0.9361= 0.0176 -- 64 64 128 32 60 128 132 64 32 63 1 64 64 64 64

-- 3. : I(420,64)=0.5635 : I(221,319)=0.9761 : 484/1024=0.4727 : 540/1024=0.5273 E(= 0.4727 * 0.5635 + 0.5273 * 0.9761 = 0.7811 Gain() = I(641, 383)-E() =0.9537 0.7811= 0.1726 64 64 64 64 132 64 32 64 64 128 60 128 32 63 1

-- 4. : I(480,192)=0.8631 : I(161,191)=0.9948 : 672/1024=0.6563 : 352/1024=0.3437 E(= 0.6563 * 0.8631 + 0.3437 * 0.9948 = 0.9048 Gain() = I(641, 383)-E() =0.9537 0.9048= 0.0453 64 128 60 64 128 64 132 32 64 64 64 64 32 63 1

-- E(= 0.6877 Gain() = 0.2660 E(= 0.9361Gain() = 0.0176 E(= 0.7811Gain() = 0.1726 E(= 0.9048Gain() = 0.0453

-- 64 60 64 64 128 64 64 132 64 63 1 128 64 32 32

-- 64 64 128 64 64 60 64 64 132 63 1

-- 1. I(128,256) = 0.9183 64 64 12 8 64 64 64 64 128 64 64 I(0,128)=0 : 128/384=0.3333 I(64,128)=0.9183 : 192/384=0.5 I(64,0)=0 : 64/384=0.1667 E(= 0.3333 * 0 + 0.5 * 0.9183 + 0.1667 * 0 = 0.4592 Gain() = I(128, 256) - E()=0.9183 0.4592 = 0.4591

-- 2. I(128,256) = 0.9183 64 64 64 I(128,0)=0 : 128/384=0.3333 I(0,256)=0 : 256/384=0.6667 64 12 8 64 64 64 64 128 E(= 0.3333 * 0 + 0.6667 * 0 = 0 Gain() = I(128, 256) - E()=0.9183 0 = 0.9183 :

-- 60 64 64 132 64 64 128 64 64 63 1

-- 60 64 64 132 63 1

-- 1. I(257,127) = 0.9157 60 64 64 132 63 1 64 64 60 132 I(64,64)=1 : 128/384=0.3333 I(193,63)=0.8050 : 256/384=0.6667 63 1 E(= 0.3333 * 1 + 0.6667 * 0.8050 = 0.8700 Gain() = I(257, 127) - E()=0.9157 0.8700 = 0.0457

-- 2. I(257,127) = 0.9157 60 64 64 132 64 64 132 60 I(196,64)=0.8051 : 260/384=0.6771 I(61,63)=0.9998 : 124/384=0.3229 63 1 63 1 E(= 0.6771 * 0.8051 + 0.3229 * 0.9998 = 0.8680 Gain() = I(257, 127) - E()=0.9157 0.8680= 0.0477

-- 3. I(257,127) = 0.9157 60 64 64 132 63 1 60 64 132 64 63 1 I(256,0)=0 : 256/384=0.6667 I(1,127)=0.0659 : 128/384=0.3333 E(= 0.6667 * 0 + 0.3333 * 0.0659 = 0.0220 Gain() = I(257, 127) - E()=0.9157 0.0220 = 0.8937 :

-- 64 60 63 64 1 132

-- 64 63 1

age income student credit_rating buys_computer <=30 high no fair no <=30 high no excellent no 31 40 high no fair yes >40 medium no fair yes >40 low yes fair yes >40 low yes excellent no 31 40 low yes excellent yes <=30 medium no fair no <=30 low yes fair yes >40 medium yes fair yes <=30 medium yes excellent yes 31 40 medium no excellent yes 31 40 high yes fair yes >40 medium no excellent no

ID3 (1) 12 3 Gain(age)=0.246 Gain(income)=0.029 Gain(student)=0.151 Gain(credit_rating)=0.048

ID3 (2)

ID3 (3) age? <=30 overcast 30..40 >40 student? yes credit rating? no yes fair excellent no yes no yes

e.g.

IF-THEN -"IF" "THEN" IF-THEN IF age = <=30 AND student = no THEN buys_computer = no IF age = <=30 AND student = yes THEN buys_computer = yes IF age = 31 40 THEN buys_computer = yes IF age = >40 AND credit_rating = excellent THEN buys_computer = yes IF age = >40 AND credit_rating = fair THEN buys_computer = no

P ( h D) = P( D h) P( h) P( D) P(h) P(h D)

nx{x 1,x 2,,x n }x k A k mc 1,C 2,,C m C i P(C i X)>P(C j X) 1jm, ji XC i C i

P(x)P(X C i )P(C i ) P(C i )s i /ss i C i s P(x 1 C i ) P(x 2 C i ) P(x n C i ) P(x k C i )=s ik /s i 1kn s ik A k x k C i s i C i s

C1 C2 = 21 = = X={ = 21 = = }

P(X C 1 )P(C 1 )P(X C 2 )P(C 2 ) P(C1)=9/14=0.64 P(C2)=5/14=0.36 P( = <=30 C1)=2/9=0.22 P( = <=30 C2)=3/5=0.60 P( = C1)=6/9=0.67 P( = C2)=1/5=0.20 P( = C1)=6/9=0.67 P( = C2)=2/5=0.40 P(X C1)P(C1)=0.220.670.670.64=0.06 P(X C2)P(C2)=0.600.200.400.36=0.02 XC1

ID3 ID3 (1) (2)

(1) (2) (3) ID3 (4) ID3

(1) (2) (3)

k- k- kk