1 背 景 介 紹 許 多 應 用 科 學 牽 涉 到 從 資 料 (data) 中 分 析 出 所 需 要 ( 含 ) 的 資 訊 (information) 希 望 從 已 知 的 資 料 中 瞭 解 問 題 的 本 質, 進 而 能 控 制 或 做 出 預 測 這 些 資 料 通 常 有 兩



Similar documents
我 覺 得 流 病 的 各 單 元 之 間 常 常 都 有 相 連 的 觀 念, 中 間 要 是 有 觀 念 不 清 楚, 後 面 的 東 西 有 時 會 比 較 接 不 上 來 重 要 的 解 釋 名 詞 都 有 要 好 好 背, 容 易 考 的 申 論 題 要 整 理 成 筆 記 4. 衛 生

,,,, (,, - ;, ;, ;, ;, ;,, - ;, - ) (,, ~ ),,,, (, ),,,, ( ), () () ( ),,,,,,,.,, :.,. (,, ) : ( ), ;( ), ;( ) ;( ), :.,. %(,, ),,,,, (,, - ) :( ) ( )

山 东 大 学 信 号 与 系 统 和 数 字 信 号 处 理 (833) 考 研 内 部 精 华 资 料...27 山 东 大 学 信 号 与 系 统 和 数 字 信 号 处 理 (833)(70% 信 号 与 系 统,30% 数 字 信 号 处 理 不 含 滤 波 器 设 计 )/ 考 研 内

<4D F736F F D205BCAE9B0FCCDF85DC8FDC9FAC8FDCAC0CAAEC0EFCCD2BBA82E646F6378>

亮麗水顏

一 课 程 基 本 情 况 课 程 名 称 工 程 应 用 数 学 ( 计 算 机 类 ) 编 码 所 属 部 门 工 业 中 心 课 程 所 属 专 业 课 程 所 属 模 块 数 学 计 算 机 类 任 课 教 师 情 况 ( 人 数 ) 教 授 副 教 授 讲 师 助 教 3

幻灯片 1

Microsoft PowerPoint - ªA°È¾Ç²ß

写 花 都 区 新 型 农 村 合 作 医 疗 特 殊 情 况 报 销 申 请 表, 经 村 镇 区 三 级 审 核, 同 意 后 方 可 办 理 报 销 ; 在 医 疗 机 构 住 院 者, 出 院 后 3 个 月 内 仍 未 办 理 报 销, 不 再 予 以 办 理 报 销 2. 住 院 医 疗

kidney GCT

Microsoft Word - 广州市番禺区2014年新型农村合作医疗管理办法实施细则.doc

<4D F736F F D20C9FABBEED6D0C0B4B5C4BDA1BFB5CAD6B2E1A3A8D6D0A3A92E646F63>

Ⅰ Ⅱ Ⅲ Ⅳ

<4D F736F F D20A7F5A979BD40A6D1AE762DB9EFA741A66EAABAA8C62E646F63>


邻居啊 第二天 对门却悄无声息了 莫非昨夜的吵闹 仅是个幻觉 夜幕拉下时 寒风又吱溜溜地叫个不停 老婆 睡下后 我这只夜猫子 继续兴致勃勃地跟着福尔 摩斯去探案 白天的喧嚣退去了 周围格外安静 正 是读书的好时候 突然 响起了钟摆声 哒 哒 哒 节奏匀称 不疾不徐 声响却愈来愈大 格外突兀 了 原来

<4D F736F F D BAC520CAD7B6BCCAA6B7B6B4F3D1A C4EAD7A8D2B5BCBCCAF5D6B0CEF1C6C0C6B8B9A4D7F7D2E2BCFB2E646F63>

其 他 方 面 也 可 以 采 用 同 样 的 方 式, 这 样 又 可 以 锻 炼 除 语 文 方 面 的 其 他 能 力 了 而 英 语 方 面, 我 认 为 配 合 英 语 专 业 举 办 英 语 演 讲 比 赛 就 很 不 错 这 样 开 展 一 系 列 的 创 新 活 动, 锻 炼 多 方

第 六 条 办 法 第 五 条 ( 三 ) 协 会 考 评, 考 评 指 考 核 评 价 第 七 条 办 法 第 六 条 职 业 操 守 包 括 的 内 容 : 个 人 诚 信 不 做 假 账 不 偷 漏 税 不 贪 污 盗 窃 等 第 八 条 企 业 财 务 管 理 人 才 评 价 实 行 五 星

<4D F736F F D A67EABD7A4BAB3A1B1B1A8EEA8EEABD7A6DBA6E6B5FBA6F4AD70B5652E646F63>

统计工作情况汇报

他 随 身 带 有 二 三 十 张 古 方, 白 天 卖 药, 夜 晚 将 药 材 精 细 研 末, 按 方 配 制 对 于 病 人 服 药 后 反 应, 特 别 留 心 发 现 问 题, 就 近 向 老 医 生 老 药 贩 虚 心 求 教, 千 方 百 提 高 药 效 同 时 对 于 春 夏 秋

目 录 第 一 章 地 方 陪 同 导 游 人 员 服 务 程 序...1 第 一 节 地 方 陪 同 导 游 人 员 的 概 念 与 职 责...1 第 二 节 服 务 准 备...2 一 熟 悉 接 待 计 划...2 二 落 实 接 待 事 宜...5 三 物 质 和 知 识 的 准 备...

走 吧, 到 三 峡 去 : 那 里 是 我 们 先 人 用 生 命 之 血 打 造 的 家 园 走 吧, 到 三 峡 去 : 那 里 的 浪 涛 承 载 过 千 百 万 只 我 们 先 人 驶 向 今 天 的 航 船 走 吧, 到 三 峡 去 : 那 里 的 每 一 座 青 山 都 刻 满 了 我

6寸PDF生成工具

Microsoft Word - 送報伕2.doc

Microsoft Word - N011 斷翅天使

中 国 科 学 院 国 家 科 学 图 书 馆

申论写作套路万能模板

申 请 律 师 执 业 许 可 初 审 服 务 指 南 目 录 一 办 理 要 素 ( 一 ) 事 项 名 称 和 编 码 4 ( 二 ) 实 施 机 构 4 ( 三 ) 申 请 主 体 4 ( 四 ) 受 理 地 点 4 ( 五 ) 办 理 依 据 4 ( 六 ) 办 理 条 件 5 ( 七 )

( 地 ( ) 组 织 机 构 代 码 企 业 详 细 名 称 哈 密 地 伊 吾 新 疆 广 汇 新 能 源 有 限 公 司 玛 纳 斯 玛 纳 斯 祥 云 化 纤 有 限 公 司 玛 纳 斯 玛 纳 斯 澳 洋 科 技 有 限 责

图 文 聚 焦 国 培 计 划 (2013) 甘 肃 省 农 村 小 学 音 乐 骨 干 教 师 短 期 集 中 培 训 9 月 4 日 开 班 了, 学 员 老 师 们 从 甘 肃 省 各 个 县 市 州 汇 聚 湖 南 一 师, 开 始 了 为 期 14 天 的 培 训 学 习 : 鲜 明 的

申請機構基本資料

申請機構基本資料

Microsoft Word - 三方协议书与接收函的相关说明学生版.doc

环 境, 我 在 巩 固 在 校 期 间 所 学 习 的 理 论 知 识 的 同 时, 不 断 的 充 实 己, 利 用 业 余 时 间 主 动 学 习 专 业 知 识, 技 能, 把 理 论 联 系 到 工 作 实 践 中 作 为 一 名 工 作 生 活 中 的 党 员, 我 始 终 注 意 与

附件1

~2~

,,

untitled

·½Âù¤ë¥Z

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

untitled

國立屏東教育大學碩士班研究生共同修業要點

第一章

<4D F736F F D20CFEEC4BFB5B3C8BACDC5B9A4D7F7B2DFBBAED6B8B5BCCAD6B2E15F315F2E646F63>

课 程 结 构 : 一 规 章 制 度 撰 写 二 劳 动 合 同 订 立 变 更 三 工 作 内 容 绩 效 管 理 四 违 纪 违 规 问 题 员 工 处 理 2

然 而 打 开 目 前 市 场 上 流 行 的 任 意 一 款 智 能 输 入 法, 上 面 提 到 的 词 都 会 被 轻 轻 松 松 的 输 出 来 ; 不 仅 如 此, 所 有 的 智 能 输 入 法 都 支 持 用 户 短 句 级 别 以 及 句 子 级 别 的 输 入 方 法, 并 且 能

第 一 节 认 识 自 我 的 意 义 一 个 人 只 有 认 识 自 我, 才 能 够 正 确 地 认 识 到 自 己 的 优 劣 势, 找 出 自 己 的 职 业 亮 点, 为 自 己 的 顺 利 求 职 推 波 助 澜 ; 一 个 人 只 有 认 识 自 我, 才 能 在 求 职 中 保 持

由社會發展趨勢探討國人睡眠品質

Microsoft Word - prac_exp13.doc

附 件

BSAP_ConsultChi05_1.indd

C 佟 某 委 托 中 介 为 其 征 婚 D 海 盈 房 地 产 公 司 委 托 律 师 事 务 所 代 其 办 理 登 记 事 项 8 根 据 民 法 通 则, 施 工 单 位 的 项 目 经 理 属 于 施 工 单 位 的 ( ) A 委 托 代 理 人 B 法 定 代 理 人 C 指 定 代

5 1 文 书 原 件 优 先 的 原 则 和 例 外 兼 评 最 高 人 民 法 院 关 于 民 事 诉 讼 证 据 的 若 干 规 定 第 69 条 / 纪 格 非 论 点 与 思 考 5 3 优 先 受 偿 权 是 什 么 权? 浅 谈 建 筑 工 程 优 先 受 偿 权 的 性 质 及 价

早 期 療 育 教 保 人 員 應 具 備 下 列 資 格 之 一 : 一 專 科 以 上 學 校 醫 護 職 能 治 療 物 理 治 療 教 育 特 殊 教 育 早 期 療 育 幼 兒 教 育 幼 兒 保 育 社 會 社 會 福 利 社 會 工 作 心 理 輔 導 兒 童 及 少 年 福 利 或

陕 西 省 城 市 社 区 社 会 管 理 创 新 现 状 困 境 及 建 议 一 陕 西 省 城 市 社 区 管 理 现 状 分 析 ( 一 ) 社 区 社 会 管 理 创 新 的 重 要 举 措 1. 高 度 重 视 社 区 的 社 会 管 理, 积 极 探 索 总 结 经 验 自 2000 年

1-8章.indd

目 錄 大 會 歡 迎 詞 裁 判 長 的 話 選 手 賽 前 準 備 清 單 賽 事 日 程 表 選 手 報 到 比 賽 日 - 大 會 服 務 關 門 時 間 台 東 關 門 時 間 轉 換 區 須 知 台 東 轉 換 區 須 知 自 行 車 檢 錄 轉 換 袋 台 灣 游 泳 公 里 游 泳

事 業 單 位 改 組 或 轉 讓, 舊 勞 工 不 願 意 續 任 者, 可 否 請 求 資 遣 費? 工 或 與 勞 工 協 商 同 意 後 簽 訂 新 約, 以 穩 固 勞 雇 關 係 至 於 改 組 或 轉 讓 過 程 中, 被 商 定 留 用 之 勞 工, 如 因 其 勞 動 條 件 有

Microsoft Word - 江湖行帮趣话

人 員 分 配 完 畢 後, 分 配 訓 練 之 需 本 法 第 三 條 第 一 項 所 稱 分 發 機 關, 指 銓 敘 部 及 行 政 院 人 事 行 政 總 處 本 法 第 三 條 第 一 項 所 稱 定 期 依 序, 指 分 發 機 關 或 申 請 舉 辦 考 試 機 關 於 下 次 該 項

关于印发《实验室骨干教师评聘及管理办法》的通知

Microsoft Word - report.doc

2 2. ( 4 ) =? 在 電 子 計 算 器 之 最 適 當 操 作 過 程 為 ( 3 ) 乘 除 算 名 數 題 目 應 求 小 數 幾 位 以 下 四 捨 五 入 11 位 23 位 32 位 40 位 2 4. ( 3

<4D F736F F D20AAFEA5F333B4E5AA61B1D0BEC7BFC4A44AA655BBE2B0ECA544C3445FB5A3B8D6B3D0A740B1D0BEC72E646F63>

105年公務員申領或侵占小額款項

德 华 安 顾 人 寿 保 险 有 限 公 司 银 行 保 险 业 务 系 列 人 员 管 理 办 法 (2014 版 ) 目 录 第 一 章 第 二 章 第 三 章 第 四 章 第 五 章 第 六 章 第 七 章 第 八 章 总 则 人 力 编 制 及 岗 位 职 责 人 员 管 理 制 度 考

( 有 限 合 伙 )( 以 下 简 称 杭 州 金 葵 ) 和 杭 州 金 锋 投 资 管 理 合 伙 企 业 ( 有 限 合 伙 )( 以 下 简 称 杭 州 金 锋 )( 以 下 合 称 交 易 对 方 ) 购 买 其 持 有 的 卓 诚 兆 业 100% 股 份 ( 以 下 简 称 本 次

海大学字[2004]3号


第 1期 楼彩霞 价值链视角下北京光线传媒股份有限公司商业模式创新研究 101 竞争优势 二 商业模式理论与价值链理论的关系 什么是商业模式 国外学者 Dub n 2002 等 认 为 商 业 模 式 是 企 业 为 了 进 行 价 值 创 造 价 值 营销和价值提供所形成的企业结构及其合作伙伴网络

欧 洲 研 究 年 第 期! # % # %! #

年 第 期!! %! # # &! #! ( % & 余 牧 人 # 抗 战 八 年 来 的 中 国 教 会 # 基 督 教 丛 刊 第 期 年 月 第 页 参 见 刘 吉 西 等 编 # 四 川 基 督 教 巴 蜀 书 社 年 版 秦 和 平 # 基 督 宗 教 在 西 南 民 族 地 区 的 传

,,,,,,,,,,,, :?,,? ( )??,,??,,?,,? ( )?,?,,? ( ),? 阿 英 夜 半 的 尖 叫 已 经 持 续 了 一 个 月, 她 说 不 知 道 为 什 么 会 这 样, 也 控 制 不 了 听 到 人 家 的 谈 论, 我 很 不 开 心 我 根 本 不 知

近 代 史 研 究 % 年 第 期! # % # & % % % % % % % %

沦 陷 时 期 北 平 日 伪 的 金 融 体 系 及 掠 夺 手 段!!

( 附 件 一 ) 中 華 民 國 兒 童 教 保 聯 合 總 會 幼 兒 教 育 及 照 顧 法 第 十 八 條 修 正 草 案 建 議 對 照 教 育 部 版 條 文 教 保 服 務 人 員 條 例 第 19 條 草 案 本 法 施 行 前 已 於 私 立 托 兒 所 任 職, 於 本 法 施

目 录 一 重 要 提 示... 3 二 公 司 主 要 财 务 数 据 和 股 东 变 化... 3 三 重 要 事 项... 7 四 附 录 / 25

北京农学院2014年就业质量年度报告

!!! #! #!!!!

!!!!!!!

!!! #! #!

数 据 库!!

会 文 化 的 封 闭 隔 绝 政 治 的 对 立 与 社 会 制 度 的 差 异 迫 使 这 些 大 陆 迁 台 的 外 省 人 # 变 成 了 有 家 归 不 得 的 流 亡 者 与 故 乡 的 一 切 从 此 天 各 一 方 摆 荡 在 新 旧 环 境 的 焦 躁 中 这 些 跋 涉 过 动

# # # # # # #!# # 铏 描 写 的 这 个 故 事 当 然 是 出 于 想 象 # 和 傅 会 # 而 作 为 便 于 讨 论 相 关 问 题 我 们 有 必 要 先! %!! #!!!!!!!!!!!! #!! #! # # 鷟 的 游 仙 窟! 记 叙 其 与 崔 十 娘 五 嫂

Microsoft PowerPoint - 5-人事室-印手冊用

Microsoft Word - ¼¯±ô¤p«Ä.doc

壹 前 言 一. 研 究 動 機 學 者 指 出 轉 換 時 期 是 孩 子 飲 食 習 慣 建 立 的 關 鍵 時 期, 若 孩 子 累 積 不 好 得 經 驗, 到 兩 歲 時 可 能 會 出 現 偏 食 情 況 ( 張 雪 惠, ) 嬰 兒 的 副 食 品 是 邁 入 寶 寶

欧 洲 研 究 年 第 期!! # % & # ( ) ( ) % &

一 朝 鲜 人 移 居 中 国 东 北 的 过 程 及 主 要 政 治 因 素 关 于 朝 鲜 人 移 居 中 国 东 北 的 过 程 加 利 福 尼 亚 州 立 大 学 教 授 将 移 民 过 程 分 为 个 阶 段 即 第 一 阶 段 是 年 以 前 这 时 期 移 入 中 国 东 北 的 朝

!

# % % 狥 名 已 矣 心 斋 王 &

合 情 合 理 即 是 好 法 # # # # 鸣 珂 劳 远 望 展 纸 托 情 深 世 乱 关 河 隔 旅 怀 岁 月 侵 家 珍 次 第 数 好 句 短 长 吟 清 越 东 山 志 流 风 自 可 钦! 理 要 层 层 觅 情 须 一 往 深 常 存 春 夏 意 不 让 雪 霜 侵 越 石 霄

%!!

,,,,, ( ), ;,, ( ), ( ),, ( ), ( ),,,,,,,,,, ( ), (, );,,, (, ),,,,, (, : ) :,,,,, ( ),,,,,,,,,,,,,, ( ),,,,,,,,,,

中 国 社 会 科 学 年 第 期! % &! % & ( ( ( ( ) ) ( ( ( ( ) + ) (

侵 略 性 是 我 们 称 之 为 自 恋 的 认 同 模 式 的 相 关 倾 向 而 这 种 认 同 模 式 决 定 了 人 的 自 我 以 及 人 的 世 界 特 有 的 实 体 域 的 形 式 结 构


!!

Transcription:

群 組 分 類 線 性 迴 歸 與 最 小 平 方 法 last modified July 22, 2008 本 單 元 討 論 Supervised Learning 中 屬 於 類 別 ( 即 輸 出 變 數 Y 是 類 別 型 的 資 料 ) 資 料 的 群 組 分 辨, 並 且 著 重 在 最 簡 單 的 兩 群 組 (two classes) 資 料 判 別 透 過 幾 個 簡 單 典 型 的 方 法, 實 際 去 做 群 組 的 鑑 別 過 程 中 對 Matlab 程 式 設 計 的 技 巧 資 料 的 產 生 及 圖 形 的 繪 製 都 有 進 一 步 的 延 伸, 也 是 本 課 程 真 正 的 目 的 本 章 將 學 到 關 於 程 式 設 計 群 組 資 料 的 繪 製 技 巧 排 序 資 料 的 索 引 技 巧 及 最 小 平 方 法 的 矩 陣 計 算 方 式 本 章 關 於 MATLAB 的 指 令 與 語 法 指 令 :sort, set, gscatter, mvnrnd 1

1 背 景 介 紹 許 多 應 用 科 學 牽 涉 到 從 資 料 (data) 中 分 析 出 所 需 要 ( 含 ) 的 資 訊 (information) 希 望 從 已 知 的 資 料 中 瞭 解 問 題 的 本 質, 進 而 能 控 制 或 做 出 預 測 這 些 資 料 通 常 有 兩 種 型 態 ; 其 一, 包 含 特 性 (features) 資 料 及 結 果 (outcome) 資 料, 從 收 集 或 量 測 問 題 的 特 性 ( 或 特 徵 ) 資 料 及 相 對 的 結 果 資 料 分 析 出 兩 者 的 關 係, 並 進 一 步 計 算 相 關 的 參 數, 最 後 確 立 模 型 當 給 予 新 的 特 徵 資 料 時, 便 可 以 根 據 這 個 確 立 的 模 型 產 生 結 果 做 為 預 測 由 於 有 結 果 資 料 做 為 模 型 建 立 的 根 據, 這 些 問 題 歸 類 為 Supervised Learning 譬 如 圖 1 的 示 意 圖, 未 知 模 型 的 輸 入 變 數 X 1, X 2 代 表 特 徵 值, 輸 出 變 數 Y 代 表 對 應 的 組 別 圖 1: supervised Learning 其 二, 只 有 特 徵 資 料, 不 知 其 群 組 屬 性 由 於 沒 有 明 確 的 輸 出 結 果 做 為 對 照, 這 類 問 題 相 對 的 困 難, 稱 為 Unsupervised Learning, 通 常 要 先 從 特 徵 資 料 裡 去 找 出 隱 藏 的 群 組 關 係, 一 般 也 稱 為 Clustering 本 單 元 討 論 Supervised Learning 中 屬 於 類 別 ( 即 輸 出 變 數 Y 是 類 別 型 的 資 料 ) 資 料 的 群 組 分 辨, 1 並 且 著 重 在 最 簡 單 的 兩 群 組 (two classes) 資 料 判 別 透 過 幾 個 簡 單 典 型 的 方 法, 實 際 去 做 群 組 的 鑑 別 過 程 中 對 Matlab 程 式 設 計 的 技 巧 資 料 的 產 生 及 圖 形 的 繪 製 都 有 進 一 步 的 延 伸, 也 是 本 課 程 真 正 的 目 的 1 輸 出 資 料 概 分 兩 種 :quantitative 及 qualitative, 歸 類 問 題 的 屬 性 時 常 以 此 為 分 別 當 輸 出 是 quantitative 型 的 資 料, 屬 於 迴 歸 分 析 (regression) 的 範 疇, 當 輸 出 是 qualitative, 叫 做 分 類 (classification) 或 分 群 輸 入 資 料 當 然 也 有 不 同 的 類 型, 不 過 應 用 的 方 法 上 差 別 比 較 小 Regression 與 classification 在 方 法 上 也 有 許 多 類 似 之 處, 因 為 在 qualitative 資 料 的 表 達 上, 通 常 會 以 數 字 來 代 表, 譬 如 1 代 表 成 功, 0 代 表 失 敗 這 樣 一 來 兩 者 的 差 距 變 模 糊 了, regression 的 方 法 也 可 以 用 在 qualitative 的 資 料 上 2

為 求 簡 單 起 見, 假 設 輸 入 資 料 具 兩 個 維 度, 即 具 X 1, X 2 的 兩 個 特 徵 值, 且 每 一 筆 已 知 資 料 的 群 組 別 也 是 已 知 譬 如 圖 2 顯 示 200 筆 已 知 資 料, 包 含 輸 入 (X 1, X 2 ) 與 輸 出 ( 不 同 的 圖 示 及 顏 色 代 表 不 同 的 組 別 ), 其 關 係 亦 如 圖 1 所 示 而 面 臨 的 問 題 是, 當 給 予 一 組 未 知 群 組 別 的 資 料 時, 如 何 預 測 其 組 別? 圖 2: 每 群 各 有 100 筆 資 料 的 兩 個 群 組 圖 2 的 200 筆 資 料 明 顯 的 將 所 在 的 平 面 空 間 分 成 兩 半, 左 半 邊 屬 於 群 組 1, 右 半 邊 屬 群 組 2 當 一 筆 新 的 資 料 需 要 判 別 其 群 組 屬 性 時, 只 要 看 它 落 在 平 面 上 的 哪 一 邊, 即 可 判 定 但 問 題 是, 分 割 平 面 空 間 的 界 線 (separate line) 如 何 界 定? 這 條 線 將 做 為 資 料 群 組 預 測 的 根 據, 但 從 圖 3 來 看, 這 條 分 界 線 似 有 無 限 可 能, 不 同 的 方 法 形 成 的 分 隔 線 也 不 同, 將 如 何 判 斷 其 優 劣 呢? 要 在 兩 群 組 的 資 料 間 劃 上 一 條 適 當 的 分 界 線, 有 一 些 簡 單 的 方 法 要 在 這 個 單 元 介 紹, 並 以 理 論 與 實 作 並 進 的 方 式 逐 步 完 成 程 式 的 設 計 之 後 的 單 元 接 陸 續 介 紹 其 他 方 法 做 群 組 的 鑑 別, 本 單 元 介 紹 線 性 迴 歸 模 型 與 最 小 平 方 法 在 群 組 分 析 上 的 應 用 假 設 圖 1 的 輸 入 輸 出 關 係 為 線 性 迴 歸 模 式, 雖 然 輸 出 資 料 屬 於 類 別 資 料 (Class 1 及 3

圖 3: 兩 個 群 組 的 可 能 分 界 線 Class 2), 我 們 仍 可 以 假 設 當 輸 入 資 料 屬 於 群 組 1 (Class 1) 時, 輸 出 變 數 以 數 字 表 示, 譬 如 :Y = 0, 另 一 個 群 組 則 為 Y = 1 將 類 別 資 料 量 化 之 後 的 問 題, 便 可 以 直 接 套 入 以 下 的 線 性 迴 歸 模 式 (Linear Regression Model) 來 分 析, Y = β 0 + β 1 X 1 + β 2 X 2 (1) 根 據 N 筆 已 知 的 輸 入 輸 出 資 料, 迴 歸 係 數 β 0, β 1, β 2 以 最 小 平 方 法 求 得 的 最 佳 解 為 其 中 ˆβ = (X T X) 1 X T y (2) 4

ˆβ = ˆβ 0 ˆβ 1 ˆβ 2, X = 1 x 1 (1) x 2 (1) 1 x 1 (2) x 2 (2)... 1 x 1 (N) x 2 (N), y = y(1) y(2). y(n) (3) 分 別 代 表 迴 歸 模 型 模 型 的 參 數 估 計 輸 入 及 輸 出 資 料 式 (2) 假 設 (X T X) 1 存 在, 而 每 個 輸 出 值 y(k) 根 據 其 類 別, 非 0 即 1 群 組 判 別 : 當 給 予 一 個 新 的 輸 入 資 料 x = (x 1, x 2 ), 根 據 迴 歸 模 型 (1), 其 輸 出 ( 擬 合 值 ) 為 : Ŷ = x T ˆβ (4) 其 中 x T = [1 x 1 x 2 ] 如 何 從 這 個 輸 出 值 判 斷 資 料 得 群 組 屬 性 呢? 在 迴 歸 模 型 下 的 擬 合 值 不 一 定 剛 好 是 0 或 1, 它 可 以 是 任 何 數 值, 但 作 為 類 別 判 斷 時, 可 以 依 下 列 規 則 判 別 : 假 設 G 代 表 判 定 的 類 別 : CLASS1 if Ŷ 0.5 G = CLASS2 if Ŷ > 0.5 換 句 話 說, 以 Ŷ = x T ˆβ = 0.5 做 為 平 面 空 間 中 兩 個 群 組 的 分 界 線, 將 R 2 平 面 一 分 為 二, 線 的 一 邊 表 示 為 集 合 {x x T ˆβ 0.5} 為 CLASS1, 另 一 邊 則 為 CLASS2 很 明 顯 的, 這 條 分 界 線 的 形 成 受 到 下 列 因 素 的 影 響 : 已 知 資 料 X 與 y 迴 歸 模 式 (1) 最 小 平 方 法 ( ˆβ 的 估 計 ) 以 下 練 習 協 助 初 學 者 如 何 計 算 ˆβ 值 與 畫 出 群 組 分 佈 圖 及 分 界 線 5

2 練 習 舉 兩 組 資 料 為 例 ( 從 網 頁 下 載 la 1.txt, mix.mat 兩 組 資 料 ), 如 圖 4 所 示 (a) (b) 圖 4: 群 組 資 料 在 計 算 出 分 界 線 之 前, 通 常 會 先 將 資 料 畫 出 來 觀 察 其 群 組 關 係 當 然 這 僅 限 於 兩 個 輸 入 變 數 以 下 的 情 況 左 邊 的 資 料 (la 1.txt) 是 模 擬 出 來 的, 右 邊 (mix.mat) 則 來 自 參 考 文 獻 [1] 的 提 供 的 資 料 以 下 練 習 可 以 協 助 畫 出 上 面 的 圖 範 例 1: 根 據 輸 出 資 料 Y 的 類 別, 在 X1-X2 平 面 上 以 不 同 顏 色 或 符 號 描 繪 出 群 組 的 樣 子, 如 上 面 看 到 的 兩 張 圖 在 實 際 的 應 用 上, 資 料 的 來 源 常 不 是 自 己 可 以 控 制 的, 因 此 必 要 的 時 候 必 須 做 調 整, 才 能 讓 寫 好 的 程 式 順 利 執 行 這 裡 特 別 設 計 不 同 的 資 料 la 1.txt mix.mat 對 輸 出 類 別 資 料 的 安 排 不 一 樣, 程 式 的 寫 作 也 因 之 有 所 不 同 mix.mat 的 資 料 已 經 按 類 別 排 序 好, 內 含 兩 個 變 數 資 料 共 200 筆 資 料, 分 別 是 輸 入 的 特 徵 資 料 x 與 輸 出 的 群 組 資 料 y, 其 中 y 前 100 筆 值 為 0 代 表 群 組 1, 後 100 筆 值 為 1 代 表 群 組 2 下 列 指 令 以 散 佈 圖 的 方 式 畫 出 圖 4(b) 6

load mix x1=x(:,1); x2=x(:,2); plot(x1(1:100),x2(1:100), * ) hold on plot(x1(101:200),x2(101:200), or ) hold off 第 2 個 plot 指 令 的 第 三 個 參 數 or 代 表 以 紅 色 (r) 英 文 字 母 o 為 符 號 描 點 另 外, 圖 4(a) 呈 現 模 擬 資 料 la 1.txt 的 散 佈 圖 資 料 la 1.txt 是 一 個 200 4 的 矩 陣, 前 兩 行 代 表 兩 個 輸 入 的 特 徵 值, 後 兩 行 代 表 輸 出 的 群 組 值 由 於 la 1.txt 資 料 不 按 輸 出 類 別 資 料 排 序, 作 圖 時 可 以 1. 先 根 據 類 別 排 序 ( 指 令 :[Y,I]=sort(y)), 記 得 輸 入 資 料 x1,x2 也 必 須 跟 著 排 序 ( 程 式 第 3 行 ), 譬 如 D =load( la 1.txt ); [ Y,I ]=sort(d(:,3)); % 按 第 3 行 排 序, 由 小 到 大 D=D(I,:); % 根 據 排 序 的 索 引 值 I, 重 新 排 列 原 資 料 矩 陣 x1=d(:,1); % 排 列 後 的 輸 入 資 料 x2=d(:,2); plot(x1(1:100),x2(1:100), * ) hold on plot(x1(101:200),x2(101:200), or ) hold off 2. 完 全 不 排 序, 根 據 輸 入 的 群 組 別, 直 接 寫 一 個 迴 圈 將 每 一 筆 資 料 畫 上 去 繪 製 如 圖 4 的 散 佈 圖, 方 式 很 多, 主 要 是 藉 由 不 同 的 符 號 或 顏 色 來 區 分 群 組 若 要 呈 現 如 (a) 圖 有 顏 色 的 數 字, 可 以 利 用 text 指 令 取 代 plot 7

axis([min(x1)-1 max(x1)+1 min(x2)-1 max(x2)-1]) H=text(x1(1:100),x2(1:100), 1 ); set(h, color, blue ) H=text(x1(101:200),x2(101:200), 2 ); set(h, color, red ) 指 令 text 適 用 在 圖 形 上 做 標 記 或 文 字 說 明, 不 能 單 獨 使 用, 因 此 第 一 行 的 axis 指 令 用 來 產 生 空 白 圖 形, 方 便 text 的 使 用 指 令 axis 的 四 個 參 數 分 別 設 定 X 軸 與 Y 軸 的 範 圍 有 了 空 白 圖 形, text 根 據 前 兩 個 參 數 (x1, x2) 代 表 的 平 面 的 座 標 位 置, 印 出 第 三 個 參 數 的 文 字, 譬 如 1 當 x1,x2 是 1 N 或 N 1 的 向 量 變 數 時, 可 以 同 時 在 N 個 座 標 位 置 根 據 第 三 個 參 數 印 上 相 同 或 不 同 的 文 字 指 令 中 的 H 代 表 圖 形 上 的 物 件 (Object Handle), 利 用 set 指 令 可 以 改 變 其 外 觀, 尚 有 更 多 的 外 觀 選 項 可 以 參 考 該 指 令 的 說 明 MATLAB 也 提 供 了 一 個 方 便 的 指 令 gscatter(d(:,1),d(:,2),d(:,3), br, *o ) 這 個 指 令 畫 出 兩 組 資 料 的 散 佈 圖, 其 參 數 的 順 序 與 意 義 分 別 是 : 前 兩 個 參 數 代 表 資 料 第 三 個 參 數 以 0, 1 代 表 每 筆 資 料 不 同 的 群 組, 第 四 個 參 數 代 表 兩 個 顏 色, 第 五 個 參 數 則 是 散 佈 圖 的 兩 個 符 號 gscatter 簡 單 明 瞭, 符 合 一 般 的 需 求, 是 MATLAB 使 用 者 第 一 個 選 擇 範 例 2: 根 據 範 例 1 的 資 料, 計 算 迴 歸 模 型 的 參 數 (2) 並 畫 出 式 (4) 中, Ŷ = 0.5 的 迴 歸 線, 也 就 是 兩 群 組 間 的 分 界 線 計 算 式 (2) 的 ˆβ 比 較 簡 單, 先 從 原 始 資 料 建 構 資 料 矩 陣 X 與 y, 再 套 入 反 矩 陣 的 指 令 inv 即 可 接 續 之 前 的 指 令, ˆβ 的 估 計 可 以 寫 成 X=[ones(N,1);D(:,1:2)]; y=d(:,3); beta hat=inv(x *X)*X *y; 8

要 畫 出 兩 群 組 間 的 分 界 線 Ŷ = 0.5, 需 要 琢 磨 一 下 這 條 分 界 線 的 方 程 式 可 以 表 示 為 為 繪 圖 方 便, 可 以 轉 換 為 ˆβ 0 + ˆβ 1 x 1 + ˆβ 2 x 2 = 0.5 x 2 = 0.5 ˆβ 0 ˆβ 2 ˆβ 1 ˆβ 2 x 1 再 來 就 是 直 線 繪 圖 的 問 題 了 圖 5 展 示 這 兩 組 資 料 的 迴 歸 分 界 線 (a) (b) 圖 5: 群 組 分 界 線 3 觀 察 1. 當 分 界 線 劃 上 去 之 後, 有 多 少 資 料 被 錯 置 組 別 呢? 錯 置 的 資 料 愈 多, 代 表 什 麼 意 義? 當 兩 個 群 組 部 分 交 錯 時, 資 料 的 錯 置 是 否 不 可 避 免? 有 更 好 的 分 界 線 可 以 讓 錯 置 的 情 況 降 低 嗎? 2. 使 用 已 知 的 資 料 做 出 一 條 分 界 線, 企 圖 將 原 母 體 在 空 間 中 的 範 圍 切 割 出 來 這 個 切 割 的 好 壞 當 然 取 決 於 已 知 資 料 的 品 質 及 分 界 線 的 決 定 方 式 試 試 看 給 予 一 些 新 的 資 料 ( 從 原 母 體 去 產 生 ), 測 試 一 下 這 條 分 割 線 能 否 對 新 的 資 料 做 出 正 確 的 組 別 判 斷? 譬 如 100 個 新 資 料 有 多 少 比 率 被 正 確 辨 別? 3. 由 於 資 料 的 取 得 誤 差 或 樣 本 數 不 夠, 群 組 的 區 隔 有 時 候 不 是 很 明 顯, 當 然 也 可 能 是 群 組 本 身 就 非 常 靠 近 圖 5(a) 的 資 料 看 起 來 分 離 的 很 好, 直 覺 上 比 較 容 易 作 9

區 域 的 切 割, 如 中 間 的 那 一 條 分 界 線 而 圖 5(b) 的 兩 個 群 組 相 對 緊 密, 即 使 能 劃 上 一 條 分 隔 線, 也 可 能 必 須 選 擇 曲 線 比 較 能 滿 足 現 有 資 料 能 提 供 的 訊 息 而 根 據 有 限 的 資 料 做 出 最 好 的 判 斷, 就 是 這 門 學 問 的 精 神 所 在 嗎 4. 當 群 組 數 量 大 於 2 時, 分 界 線 將 如 何 切 割? 想 一 想 手 癢 的 話 就 動 手 做 看 看 吧! 5. 本 單 元 的 資 料 模 擬 自 Bivariate Normal Data, 而 且 兩 個 變 數 是 獨 立 的 如 果 變 數 間 有 相 依 性, 本 單 元 的 方 法 還 是 可 行 嗎? 如 何 去 模 擬 具 相 依 性 的 資 料 呢? 參 考 MATLAB 關 於 多 變 量 常 態 亂 數 產 生 器 mvnrnd 的 使 用 方 式 4 作 業 1. 證 明 式 (2) 是 迴 歸 模 型 (1) 的 最 小 平 方 法 解, 即 2. 畫 出 範 例 2 的 分 界 線 ˆβ. = min β Xβ y 2 3. 同 上 題, 決 定 出 分 界 線 後, 寫 一 段 程 式 判 斷 一 筆 新 的 資 料 該 屬 於 那 個 群 組? 新 資 料 的 輸 入 方 式 以 指 令 input 在 程 式 執 行 時 取 得 4. 同 上 題, 寫 一 支 程 式 計 算 分 界 線 錯 置 群 組 的 比 例 譬 如 圖 5(a) 做 出 分 界 線 後, 劃 定 右 方 為 群 組 1 的 區 域, 但 仍 有 部 分 屬 於 群 組 2 的 資 料 落 於 分 界 線 的 右 邊, 換 句 話 說, 這 條 分 界 線 並 不 能 完 全 隔 離 這 兩 個 群 組 的 資 料, 本 題 所 謂 錯 置 群 組 的 比 例 便 是 計 算 這 些 原 本 該 屬 於 群 組 1(2) 的 資 料, 卻 被 分 界 線 劃 定 在 群 組 2(1) 的 區 域, 佔 原 群 組 的 比 例 5. 將 式 (1) 的 迴 歸 模 型, 擴 展 為 所 謂 的 Augmented Regression Model, Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 1 X 2 + β 4 X 2 1 + β 5 X 2 2 (5) 同 樣 利 用 如 式 (2) 的 最 小 平 方 法 解, 其 分 界 線 可 以 表 示 為 { (X 1, X 2 ) ˆβ 0 + ˆβ 1 X 1 + ˆβ 2 X 2 + ˆβ 3 X 1 X 2 + ˆβ 4 X1 2 + ˆβ } 5 X2 2 = 0.5 10

在 X 1 X 2 平 面 上 這 是 一 條 如 圖 6 所 示 的 曲 線 繪 製 這 條 曲 線 的 技 巧, 可 以 將 下 列 的 雙 變 量 方 程 式, 以 等 高 線 圖 繪 製 高 度 0.5 的 這 條 線, 即 Z = ˆβ 0 + ˆβ 1 X 1 + ˆβ 2 X 2 + ˆβ 3 X 1 X 2 + ˆβ 4 X 2 1 + ˆβ 5 X 2 2 繪 製 Z = 0.5 的 等 高 線 即 為 分 界 線 指 令 如 contour(x1,x2,z,[0.5 0.5]) 圖 6: Augmented Regression Model 群 組 分 界 線 參 考 文 獻 [1] T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning:Data Mining, Inference, and Prediction, Springer. [2] A.G. Rencher, Multivariate Statistical Inference and Applications, John Wiely & Sons, INC. 11