葉政維 在開始本筆記之前, 我想先做個簡單的 我介紹和寫作動機 本 是 前就讀台 經濟碩班的學, 葉政維 接觸 已經將近 年, 也將 利 在研究上 是 款非常容易上 的統計軟體, 即使對於有程式基礎的, 也是 來完成實證研究的好 具之 然, 要能適當地運 於研究或任何的專案上, 卻也需要 些經驗 本

Similar documents
0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

6-1-1極限的概念

Chapter 3 Camera Raw Step negative clarity +25 ] P / Step 4 0 ( 下一頁 ) Camera Raw Chapter 3 089

<4D F736F F D20B3E6A4B830312D2D2DBCC6BD75BB50BEE3BCC6AABAA55BB4EEB942BAE22E646F6378>

CONTENTS 訓 練 內 容 設 計 法 056 淡 季 期 的 訓 練 058 旺 季 期 的 訓 練 060 針 對 爬 坡 賽 的 訓 練 內 容 062 賽 後 的 資 料 分 析 PART4/ 鏑 木 毅 先 生 的 建 言 活 用 於 越 野 路 跑 的 心 跳 訓

研究一:n人以『剪刀、石頭、布』猜拳法猜拳一次,決定一人勝

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

Microsoft PowerPoint - C_Structure.ppt

10-2 SCJP SCJD 10.1 昇陽認證 Java 系統開發工程師 的認證程序 Java IT SCJD

CU0594.pdf


Microsoft Word - 第四章.doc

第 6. 節 不 定 積 分 的 基 本 公 式 我 們 可 以 把 已 經 知 道 反 導 函 數 之 所 有 函 數 都 視 為 不 定 積 分 的 基 本 公 式 基 本 公 式 涵 蓋 的 範 圍 愈 大, 我 們 求 解 積 分 就 愈 容 易, 但 有 記 憶 不 易 的 情 事 研 讀

奇 妙 的 24 摘 要 從 撲 克 牌 中 隨 機 抽 取 4 張 牌 可 以 有 1820 種 牌 組, 在 這 1820 種 牌 組 中, 有 1362 組 可 經 由 四 則 運 算 的 方 式, 算 出 24 點, 有 458 組 無 解 快 速 求 解 的 方 法 有 相 加 法 因 數

證 券 簡 易 下 單 :2121 證 券 簡 易 下 單 1. 主 工 具 列 的 視 窗 搜 尋 器 直 接 輸 入 點 擊 主 選 單 證 券 專 區 下 單 特 殊 下 單 2121 證 券 簡 易 下 單 畫 面 說 明 1. 下 單 區 2. 個 股 行 情 資 訊 與

所 3 學 分 課 程, 及 兩 門 跨 領 域 課 程 共 6 學 分 以 上 課 程 學 生 在 修 課 前, 必 須 填 寫 課 程 修 課 認 定 表, 經 班 主 任 或 指 導 教 授 簽 名 後 始 認 定 此 課 程 學 分 ) 10. 本 規 章 未 盡 事 宜, 悉 依 學 位

Microsoft Word - Draft circular on Sub Leg Apr (chi)_Traditional

NCKU elearning Manual

肆 研 究 方 法 進 行 本 研 究 前, 我 們 首 先 對 研 究 中 所 用 到 名 詞 作 定 義 定 義 : 牌 數 : 玩 牌 時 所 使 用 到 撲 克 牌 數 次 數 : 進 行 猜 心 術 遊 戲 時, 重 複 分 牌 次 數 數 : 進 行 猜 心 術 遊 戲 時, 每 次 分

e-Submission System Quick Reference Guide for Publication Related Matters (Chinese version)

投影片 1

理性真的普遍嗎 注意力的爭奪戰 科學發展 2012 年 12 月,480 期 13

二 兒 歌 選 用 情 形 ( ) 2 ( ) ( )

Microsoft Word - ACI chapter00-1ed.docx

HSBC Holdings plc Interim Report Chinese

(Microsoft Word - MOODLE990201\266i\266\245\244\342\245U )

Microsoft PowerPoint - 資料庫正規化(ccchen).ppt

章節

Microsoft Word doc

目 錄 項 目 內 容 頁 數 1 手 機 要 求 3 2 登 記 程 序 3 3 登 入 程 序 4 4 輸 入 買 賣 指 示 6 5 更 改 指 示 14 6 取 消 指 示 18 7 查 詢 股 票 結 存 21 8 查 詢 買 賣 指 示 23 9 更 改 密 碼 查 詢 股

投影片 1

life930106

《數學奠基活動模組示例》

可持续发展报告摘要2013

Microsoft Word - ACL chapter02-5ed.docx



75 叁 積 木 遊 戲 的 教 學 功 能 一 促 進 體 能 發 展 二 發 展 社 會 技 巧 Ramsey 1991 Beaty 1995 ( ) ( ) ( ) 三 學 習 情 緒 處 理 國 教 之 友 第 59 卷 第 3 期 19

如何正確使用自己所擁有的正版音樂光碟?

取 食 多 樣 性 與 效 應

支 持 機 構 : 社 會 文 化 司 主 辦 機 構 : 澳 門 學 聯 澳 門 青 年 研 究 協 會 電 話 : 傳 真 : 網 址 : 報 告 主 筆 : 李 略 博 士 數 據 錄


二零零六至零七年施政報告

128 提 示 樞 紐 分 析 表 的 用 途 樞 紐 分 析 表 是 指 可 以 用 來 快 速 合 併 和 比 較 大 量 資 料 的 互 動 式 表 格, 透 過 它 可 以 詳 細 分 析 數 值 資 料, 特 別 適 用 於 下 列 情 況 : 需 要 從 含 有 大 量 資 料 的 清

PROSPECT EXPLORATION 壹 前 言 第 9 卷 第 2 期 中 華 民 國 100 年 2 月


目 錄 壹 題 目 1: 新 增 商 品 ( 商 品 名 稱 為 玉 井 芒 果 乾 禮 盒 )... 3 貳 題 目 2: 新 增 商 品 ( 商 品 名 稱 為 紅 磚 布 丁 精 選 禮 盒 )... 5 參 題 目 3: 新 增 商 品 ( 商 品 名 稱 為 晶 鑽 XO 醬 禮 盒 ).


01 用 ActionScript 3.0 開始認識 Flash CS3 Flash 是應用在網路上非常流行且高互動性的多媒體技術, 由於擁有向量圖像體積小的優點, 而且 Flash Player 也很小巧精緻, 很快的有趣的 Flash 動畫透過設計師的創意紅遍了整個網際網路 雖然很多人都對 Fl

計 算 機 概 論 Computer Siene ))) 8- 啟 動 與 認 識 PowerPoint [ 開 始 ] \ [ 所 有 程 式 ] \ [Mirosoft Offie] \ [Mirosoft Offie PowerPoint 200] PowerPoint [ 新 增 ] \ [

X6-04_How_do_I_write_a_com_port_communicate_program_of_XPAC_tc

實德證券網上交易系統示範

CEDAW HK_item_rev05_ _singlepageartboard

九 -2 國 中 數 學 基 本 學 習 內 容 補 救 教 材 第 六 冊 主 題 二 機 率 的 計 算 二 機 率 怎 麼 算? 想 一 想 : (1) 投 擲 一 枚 公 正 硬 幣 一 次, 會 出 現 哪 幾 種 情 形? 這 些 情 形 各 自 發 生 的 機 率 是 多 少? 會 不

前 項 第 三 款 所 定 有 機 農 產 品 及 有 機 農 產 加 工 品 驗 證 基 準, 如 附 件 一 第 七 條 驗 證 機 構 受 理 有 機 農 產 品 及 有 機 農 產 加 工 品 之 驗 證, 應 辦 理 書 面 審 查 實 地 查 驗 產 品 檢 驗 及 驗 證 決 定 之

二次曲線 人們對於曲線的使用及欣賞 比曲線被視為一種數學題材來探討要早 得多 各種曲線中 在日常生活常接觸的 當然比較容易引起人們的興趣 比如 投擲籃球的路徑是拋物線 盤子的形狀有圓形或橢圓形 雙曲線 是較不常見的 然而根據科學家的研究 彗星的運行軌道是雙曲線的一部 分 我們將拋物線 圓與橢圓 雙曲


sle cover 1

ACI pdf

100 青 年 作 家

答客問

國中數學基本學習內容補救教材 第二冊

目 錄 一 系 統 登 入... 2 ( 一 ) 系 統 登 入 畫 面... 2 ( 二 ) 首 次 登 入 請 先 註 冊... 3 ( 三 ) 忘 記 單 位 帳 號... 8 ( 四 ) 忘 記 密 碼 ( 五 ) 健 保 卡 更 換 ( 六 ) 重 寄 確 認 信.

戒菸實務個案自助手冊105年Ver.2

目 錄 引 言 P 署 長 陳 鴻 祥 先 生 講 辭 P.6 10 副 署 長 營 運 服 務 吳 啟 明 先 生 講 辭 穩 步 求 進 P An Invisible Man Meets the Mummy 副 署 長 規 管 服 務 陳 帆

268 別 行 政 區 所 以, 全 國 人 民 代 表 大 會 根 據 憲 法 第 31 條 規 定 設 立 了 特 別 行 政 區 沒 有 憲 法 第 31 條 的 規 定, 就 沒 有 特 別 行 政 區 制 度 存 在 的 合 法 性 基 礎 62 正 如 上 述, 憲 法 為 特 別 行

16

寫 作 背 景 導 讀 [98] L Lyman Frank Baum

1. 安 裝 1.1 手 機 端 安 裝 檔 (cab 檔 ) 請 您 將 下 載 的 cab 檔 案 複 製 到 手 機 內 任 一 資 料 夾, 在 手 機 上 點 擊 cab 檔 案 後 即 可 開 始 安 裝 點 擊 本 檔 案 即 可 開 始 安 裝 請 於 您 的 手 機 上 繼 續 安

chapter1.indd

iziggi

(Microsoft Word - wes _\246p\246\363\250\317\245\316LED\277O\305\343\245\334\252\254\272A.doc)

untitled

五 四 五 說 ( 代 序 ) 李 澤 厚 劉 再 復 I I II IV V VII 第 一 篇 五 四 新 文 化 運 動 批 評 提 綱 附 論 一 中 國 貴 族 精 神 的 命 運 ( 提 綱 )

進 入 系 統 1. 請 於 首 頁 右 側 使 用 者 登 入 輸 入 帳 號 密 碼 驗 證 碼 後, 點 選 登 入 進 入 系 統 2. 直 接 點 選 右 側 的 進 入 系 統, 直 接 進 入 題 目 檢 索 頁 面 直 接 進 入 系 統 後, 您 仍 可 瀏 覽 選 擇 您 所 需

02 2 成立 Facebook 粉絲專頁 Facebook Facebook Facebook 1, Facebook Facebook 1 Facebook 2-21

作 品 名 稱 : 永 遠 都 是 一 條 龍 摘 要 本 文 的 研 究 是 根 據 特 定 規 則 下, 如 何 將 撲 克 牌 翻 出 一 條 龍? 的 問 題, 進 行 不 同 方 法 的 研 究, 以 不 同 解 題 方 式 觀 察 問 題 解 決 問 題 壹 研 究 動 機 每 隔 一

輕鬆學 Dreamweaver CS5 網頁設計..\Example\Ch0\ \.html..\example\ch0\ \mouse.txt..\example\ch0\ \ _Ok.html 學習重點 JavaScript 複製程式碼 mouse.txt Ctrl+C Ctrl+C 0-4

「家加關愛在長青」計劃完成表現及評估報告

Microsoft Word - _m30.doc

Microsoft Word - 02-黃昭元.doc

簽 呈

主程式 : public class Main3Activity extends AppCompatActivity { ListView listview; // 先整理資料來源,listitem.xml 需要傳入三種資料 : 圖片 狗狗名字 狗狗生日 // 狗狗圖片 int[] pic =new

內文教學區 ( ) ( ) ( ) ( )

心 五 四 運 動 二 十 一 世 紀 的 生 活 主 張

Microsoft PowerPoint - chap5

的 課 程 計 畫 多 數 是 書 商 而 不 是 老 師 規 畫 的, 老 師 只 做 上 傳 的 動 作, 所 以 沒 人 會 去 看 這 份 計 畫! 但 是 我 發 現 日 本 的 教 學 指 導 ( 含 計 畫 與 教 案 ) 也 是 現 成 的 是 理 科 研 究 會 ( 民 間 的 理

投影片 1

Guji Guji (Peter Pan Prize) NSO NSO& 2014 Guji Guji 20

1

<4D F736F F D20AB6EAAF9B0EAA470BCC6BEC7ACEC2E646F63>

AutoCAD 用戶如何使用 ArchiCAD


題 目 : 箭 在 弦 上 -- 弓 箭 祕 密 再 探 究 摘 要 在 上 的 研 究 之 中, 我 們 列 舉 出 仍 未 探 討 的 題 目 及 問 題, 利 用 這 的 研 究 課 程 加 以 驗 證 在 實 驗 結 果 中 發 現, 加 入 箭 頭 有 助 於 落 點 的 集 中, 而 加

Microsoft PowerPoint - F263-CH10.ppt [相容模式]

內 政 統 計 通 報

骨 折 別 日 數 表 1. 鼻 骨 眶 骨 ( 含 顴 骨 ) 14 天 11. 骨 盤 ( 包 括 腸 骨 恥 骨 坐 骨 薦 骨 ) 40 天 2. 掌 骨 指 骨 14 天 12. 臂 骨 40 天 3. 蹠 骨 趾 骨 14 天 13. 橈 骨 與 尺 骨 40 天 4. 下 顎 ( 齒

BSP 烤箱 - 封面-2

單步除錯 (1/10) 打開 Android Studio, 點選 Start a new Android Studio project 建立專案 Application name 輸入 BMI 點下 Next 2 P a g e

人 們 在 為 生 活 空 間 中 的 物 品 選 擇 色 彩 時, 不 自 覺 地 會 反 應 出 大 腦 對 色 彩 的 解 釋, 設 計 師 若 能 掌 握 色 彩 所 隱 藏 的 訊 息, 便 可 以 充 分 利 用 並 創 造 出 極 具 魅 力 的 產 品 視 覺 對 知 覺 的 影 響

Transcription:

葉政維 在開始本筆記之前, 我想先做個簡單的 我介紹和寫作動機 本 是 前就讀台 經濟碩班的學, 葉政維 接觸 已經將近 年, 也將 利 在研究上 是 款非常容易上 的統計軟體, 即使對於有程式基礎的, 也是 來完成實證研究的好 具之 然, 要能適當地運 於研究或任何的專案上, 卻也需要 些經驗 本 不敢說是 的專家, 但也 認對於基本功能熟悉, 也累積了 些經驗, 因此好 也算是 隻善於剝香蕉的猴 本筆記正是本 學習 的 些經驗整理 雖說網路上可能有許多更詳細的 教學, 但我會試著以精簡 消化過的 式呈現, 並適時強調 些重要的做法與觀念, 尤其是在研究上的應 倘若這些經驗 也就是本筆記, 能加速 的學習, 抑或讓 更順暢地應 於往後的研究, 這會是令我開 的 貢獻 這個筆記並不預設讀者接觸過統計軟體或是程式語, 也不預設讀者處理過任何資料 筆記內 會盡可能的簡潔 正如 的風格, 介紹的指令也會盡量聚焦於常 與實 的那些 如果想深入了解每個指令還有哪些選項 參數可以調整, 非常建議可以再去參考 的 本筆記希望能作為 個 引路, 也儘可能提供 個 概略但全 的導覽 筆記的組織如下: 第 節會進 些初步的介紹, 包括 的介 基本的語法結構等 ; 第 節則介紹 些基本的 指令, 這邊的指令 多會和探索資料與簡單的操作資料有關 ; 第三章會進 步談到更多操作資料相關的指令, 以及談到在 上清理資料的例 ; 第四章會談到使 做 些簡單的統計與計量分析 ; 剩下的章節預計討論繪圖 特殊資料格式的操作 隨機與模擬等 以下是 些 說明 : 以 標, 如 : 指令下的引數 以 標 多可以縮寫, 因此本筆記 多呈現縮寫 必要時我會寫出 全名並以底線標註縮寫 指令中 最後, 感謝 的幫忙

本節會從 本 的介紹談起, 接著簡介 的介, 最後說明 相關的檔案類 型 讀者需要先確認 是否正確安裝且使 以上的版本 是 個商 統計軟體, 同時 援圖形化介 與程式指令 也許讀者有使 處理資料, 或是聽說過其他統計軟體與程式語, 像是 等 那麼為何我們要 呢? 先, 不論利 何種 具進 實證研究, 經常都需要有 個腳本 把所有流程給記錄下來 這不僅是 便管理, 更是 便他 能重現我們的成果 相較之下, 純 的 具就顯得 分不便, 這也是為何 不會是 個做研究或專案的 主要 具 再來, 在眾多可以寫程式的統計軟體中, 的指令相對簡單易學 多數的指令都相當直觀, 就像是把步驟 精簡的 字記錄下 已 這樣的優點在 些比較複雜的資料操作上尤其明顯, 比如說 : 群組別操作 合併資料 彙整並 成變數等 圖 提供 執 的程式碼比較, 各位可以猜猜看這是在執 哪些功能 當然, 也並非沒有侷限 如果需要 刻最新的計量 法時, 也許 會是個比較好的選擇 此外, 的語法也不像程式語 那麼有彈性 這可能是因為程式語 有許多好 的資料結構或物件可以操作 其他統計軟體也有各 的長處, 像 就廣為業界所使, 也和資料庫語 有良好的相性, 不喜歡寫程式的 也可以參考 的 版本 最後, 或是 都是免費開源的語, 除了 途廣泛功能強 外, 也都有相當龐 的社群在維護與開發 事實上 也可以像其他程式 樣寫函式, 但有需求的 通常都直接 了

圖 為 的主要介 主要呈現指令輸出的圖或報表 ; 可以 來鍵入 的指令 ; 會顯 前 讀取資料的變數欄位 標籤以及 些細節 點選不同變數, 就可以在右下 的 看到更多細節 若點選變數前的 箭頭, 則可以直接將變數貼 左列是, 來記錄執 過的指令, 有 的指令會呈現紅字 在此點擊指令可以將其貼 ; 雙擊之則可以直接再次執 上有各種功能 右側的 可以終 現有程序, 其旁邊的 則可以讓 持續呈現回報的結果 當結果太多時, 並不會 氣都呈現在 上 倘若不希望持續點擊, 可以在 輸入 中間的 可以直接瀏覽或修改資料 這兩者分別能藉由 指令呼叫 在之後檢查資料或檢查指令是否正確執 時非常有, 則較少使 正中間的 相當重要, 可以說是利 做研究或專案的核 點擊之可以開啟 的介 具體來說, 我們可以在 中, 鍵入許多指令然後 氣執 此外, 記錄在 中的指令可以輸出成 檔, 這相當於在 執 指令的腳本, 也就是讓你的同事或他 可以重現你分析流程的依據 圖 提供了 的介, 於 些執 上的觀念則會在下 節說明, 最後提 下各種和 相關的檔案格式 除了上述 來記錄指令的 檔 之外,

有 獨特的資料格式, 檔 此外還有 來記錄所有發 的 事 包括 訊息 的 檔 前為, 我們都還沒有任何和 指令相關的介紹 下 條列 與其 的 些註記, 關於 的部分, 各位可以參考 圖 來對照看看, 和許多軟體或程式不同, 次只能在記憶體中讀取 份資料 寫有別 和 不同 般, 指令為, 例如, 可以拆解為, 分別代指令的幾個元素 ( 嚴謹 點的話, 是不同的, 形式也不完全 樣 ) 是, 其後的所有指令都不會被執 這通常 來註記或說明當前的指令 除了是乘法運算 外, 置於指令最前 時也有 的功能 前述 只對單 有效, 如果要 多, 可以使 來包夾內容 在 尾使, 可以在次 接續前後指令, 這在輸出圖表這類設定繁多的指令時 很長 尤其好 在 中, 可以藉由點擊右上 的 來執 指令 前者會 安靜地 執 指令, 也就是不在 呈現任何結果 ; 相較之下後者則會

吵雜地 呈現所有結果 有趣地, 我們可以在指令前 加上 來覆寫呈現上的設定 在 中, 可以藉由反 特定區域, 再按 來執 特定的指令 最後也是最重要的, 如果不認識指令或想了解更多, 可以嘗試 來檢閱指令的說明 件 這邊整理 下 先, 由於 次只能讀取 份資料, 我們常會需要暫存檔案, 因此檔案的命名 存放的管理就需要多花 些巧思 乍看之下這是 的侷限, 但習慣的話基本上不是什麼困擾 再來, 在管理檔案時, 通常會建立 個樹狀的路徑結構 圖, 分 別類地來存放原始資料 中繼資料 分析程式碼 檔 以及結果 等 這麼做能讓檢索 讀取上更明確且更有邏輯 這點同樣也適 於其他的統計軟體上 最後, 在 上也有 些放諸四海的好習慣 比如說, 易讀性與可擴充性等 易讀的 的是要讓你的同事, 甚 是幾個 之後的你, 看得懂你在幹什麼 此外, 也能很快地在 中 找到 想要進 的操作 易讀往往反映在良好的排版 適當空 縮排與運 命名 與 上 可擴充性則可以是指程式碼是否可以適 到許多任務上, 或只需要微幅的修改即可 比如說, 藉由適當的 變數 迴圈, 讓 的迴歸指令可以適 到許多模型與設定上 這裡收集了 些好 的參考連結 的 教學 研究 官 整理的學習資源 有時候 中並沒有, 這時可以右鍵點擊 再點選客製化

這節開始會介紹 的語法 本筆記中, 部分的 都以 般化的形式表, 也就是說各位需要 把 替換成 需要的值, 或是適當地增減 與條件 列舉的 語法結構 先前有提到可以 檔紀錄 的指令, 因此我很推薦各位把消化過的指令記錄在 檔之中 此外也強烈建議讀者們好好保管 的 檔, 這除了是各位的 之外, 也會是之後參考 抄 的依據 在開始各 節開始前, 很重要地, 讀取資料的變數 或是欄位 致上可以區分成 數值 字串 兩 類型, 其中的字串在 中以紅字表 不同類型有不同的操作 式, 此外, 如同許多程式慣例, 來標注字串, 如 : 最後, 數值變數的遺失值在 中以 表, 並且在邏輯運算上代表無限 各位不妨在各 節留意這些資訊 下 各 節會利 內的資料 或是 輸入的 造資料說明之, 但我也推薦各位可以使 比較複雜的資料實際演練 如果不能讓 存取檔案的話, 那就什麼也做不了了 雖說先前 直強調在 上紀錄指令的重要性, 但是在存取檔案時, 個 是習慣先透過 在 上產 程式碼, 後再貼到 上 先, 我想各位需要先開啟 份 圖 是 個 常 的樣貌, 包括讀取資料以及 些事前準備, 下 先就事前準備的部分逐 說明之, 將現有的資料與儲存的變數全部清除, 關閉現有的 檔, 其中的 可以強制忽略, 在此可以避免因為 檔不存在所產 的問題, 讓 可以持續印出結果 注意, 這只對同 次的執 有效, 如果希望可以在後續的執 都維持此設定, 可以補上 還可以進 更多設定, 像是指派 多少記憶體 設定矩陣 等, 即, 可以 來設定 作路徑, 各位可以藉由 來做確認 設定好 作路徑後, 存取任何檔案就可以依照 作路徑的相對路徑讀取 圖 將 作路徑設在, 如果我們想讀取 圖 的路徑樹, 讀取路徑就會是, 可以開啟 檔並指定儲存位置, 則可以覆寫現有的檔案 事實上, 有所謂的, 但 少對我 並不常, 也有許多替代 案, 應該會在安裝 時 併附上, 或是可以嘗試 順帶 提, 路徑中的 可以返回上 層, ~ 可以返回根 錄

關於讀取資料, 如果是 的 檔的話, 可以點選左上 的, 或是執, 可以在讀取的同時先清除當前的檔案 記得 次只能讀 份資料? 也 援許多不同的資料檔案類型 等, 如果要讀取 檔以外的類型, 可以點選右上 的, 從中挑選適合的檔案類型並按指 完成讀取 除上述的讀取 式之外, 也可以直接在 輸入資料 圖, 儘管這種 式實務上不常使, 但在需要 創造 些簡單資料的場合 如教學 尤其 便 如先前提到的, 字串變數 值 需要透過 來標注 此外, 那 需要輸入變數名稱, 變數類型是被預設為數值 其中的, 因此若要輸入字串的話, 需要在變數名稱前加上 其中的 是指字串的最 長度 請注意, 中 字串的長度不等於 字數, 這部分請去查閱 中 編碼 若要將資料存成 檔, 可以非常直觀地點擊 左側的, 或是輸入 要存成其他檔案類型則可以點選 最後做個簡單的總結 利 輔助讀取資料, 再將指令紀錄於 讀資料時加上, 存資料時加上 做任何形式的分析前, 經常需要先進 探索式分析 在不充分了解資料的情形下進 分析幾乎無異於瞎 摸象 下 介紹幾個有幫助的指令, 等, 會概略地描述資料與變數 事實上我們也可以在右下 的 找到更多資訊

, 可以查看變數的細節 依變數類型 有異, 如 : 變數類型 等, 可以對 數值 變數進 常 的敘述統計, 加上 則會進 步輸出如百分位 偏峰度等統計量 上述的幾個指令都可以只使 在幾個選定的變數上, 例如 如果去查閱 使, 會發現有許多指令後 都可以選擇性地加上, 也就是變數清單, 如同上列的 的輸出結果如 圖 所, 各位不妨觀察 下有哪些資訊 除了 所提供的敘述統計量之外, 我們有時也關 變數值的次數分佈, 尤其是對於類別變數, 可以顯 變數 的次數 比例 累積比例, 則會 併統計遺失值 的次數 這個 並非預設, 但個 是習慣 定要加上, 畢竟很多時候 是值得留意的訊息 若我們想對兩個變數做 聯合 次數分佈時 比如說 :, 可以使 如果想進 步去看聯合比例 條件比例的話, 可以加入 這些 這些指令除了有助於了解資料外, 有時候也可以 來確認 成變數的流程是否正確 比如說 : 我們會 來確認新變數的次數分佈是否合理 是否有不想要的遺失值, 或是藉由 來看看新變數是否確實依想要的 式被 成 上述是 些最常 的指令, 以下再條列 些也很實 的指令, 在 中瀏覽 所挑選的變數 忽略 時則是會瀏覽全部的變數, 這相當於直接點選 上的 建議讀者在取得新資料時都先 下, 對該資料有 些基本的概念, 依照不同 通常是類別變數

的值回報 的統計量 這個指令可以視為 的活, 些 細節 如統計量的名稱 在 都有詳細的紀錄, 相關係數矩陣 則可以回報共變異數矩陣 若要認識資料, 繪製圖表也是很好的 法 如, 我會在 提到 些最基本的繪圖 最後強調 下, 我無法在此把每個功能都交代清楚 更何況有些我 從來沒 過 想深入了解或查詢特定功能的話, 還是請多參考 這 節會談到如何操作 成 些變數 部分 成變數時都是對 做 的操作 我們可以使 來 成變數, 以 及將 替換為 來修改現有的變數 以下是 些說明與簡單的範例 所謂 的操作是指 就向量或某種清單來說, 將同樣位置的元素進 操作 如 : 加減乘除 在資料上, 也就是操作同 個樣本點上不同變數的值 是由變數和運算 組成, 如 : ^, 將每個樣本點的 值加總, 成 個新變數 想要多瞭解 繪圖的話, 可以參考

, 加總消費 投資 政府 出 淨出, 取代 掉現有的變數 除了常 的加減乘除與 運算 外, 也提供許多內建的函式, 如 等 然 有時候我們想 成的變數涉及到某個變數的匯總 如 標準化, 或者我們需要對好幾個變數做 的彙整 這時候, 提供了相當多樣的功能, 下 以幾個常 的 說明之, 成 個變數來記錄統計成績的平均, 成 個變數來記錄每個 最 分的成績, 計算有多少樣本符合條件 ( 會在下 節說明 ) 先前提到的標準化的指令如 圖 我在此是使 來處理, 也就是先 成變數來 儲存, 再透過 進 的操作 最後, 下 再補充 些和 成變 數相關的實 指令, 依照樣本排序給予從 開始的, 回傳總樣本數, 將 字串 變數 變成 數值 變數 請注意, 只有 看起來像數值 的字串變數可以進 轉換 此外, 則可以進 反向操作, 將字串變數轉成 類別化 的數值變數 例 的 是兩個有趣的表 法, 分別反應樣本點 與樣本數 關於例, 由於字串與數值變數只能各 進 特定的操作, 我們很常需要先做轉換 例 和 的操作不同, 涉及到了跨樣本點的操作 之後的章節, 我則是會執 並從這個指令的 來索取 彙整的值 也可以被活 來 成等差 等比數列, 些更 般化的數列則可以參考 底下的 函數

的 可以 來切換變數類型 例 中的 會將變數類別化 在 中呈藍字, 我們經常會依照不同的條件 有不同的操作 最常 的條件是由 開頭, 再加上由變數 數值 運算 與邏輯運算 圖 組成的 的邏輯運算 和許多程式的慣例 樣, 此外許多條件也可以利 且 或 組合在 起 多了條件式後, 就能進 更多特定的操作 下 搭配先前提過的幾個指令舉實例說明, 對經濟系女 做學分數的次數分佈, 將滿 條件的 的 改為, 對於 歲以上且年齡非遺失的, 成 個變數來標註年老 這裡有幾點要注意 先, 請留意指定值 和等值 間的差異 ; 其次, 指定字串變數值時, 需要加上 如 圖 中的輸入字串值 ; 最後, 如在本節開始前提到的, 數值資料的遺失值, 在 中是被視為無限 各位可以想想看如果少掉 會發 什麼事 除此之外, 條件式本 也有許多應, 如篩選資料或檢查樣本點是否符合條件, 以下介紹 些指令與條件式的搭配, 丟掉符合特定條件的樣本點, 成符合條件的 符合為, 不符合為

, 檢查條件是否成立 除了丟掉特定樣本點外, 也可以藉由 刪去特定變數 此外, 指令 的 法和 樣, 只差在功能完全相反 看名字應該就能理解 例 在 成 時非常 便 當然, 我們也可以分別寫, 然 這樣的 法需要特別注意 具體來說, 他會 成 與非, 但 非 有時候不 定是我們想要的, 例如當 代表 歲以下時, 非 就會是 歲以上以及 最後, 例 在清理與檢查資料的過程非常實 比如說, 我們可以檢查是否體重有負值與遺失值, 迴圈 可能是程式中最具代表性的基本 具之, 好的迴圈不僅簡潔易讀, 也可以很 便地進 修改 的迴圈主要有對數值的, 以及對 的 兩者的結構基本上 樣, 圖 各舉了 些簡單的範例與輸出結果 簡單來說, 迴圈就是在指定的範圍內,, 依序將值帶入迴圈變數 中, 然後進 指令, 如圖中的 印出值的簡單指令 注意, 迴圈內的指令是使 包起來, 迴圈內的迴圈變數需要利 ` 包起來 ` 相較於, 很多時候是 來對 個 進 迴圈, 例如 圖 對 堆變數 的標準化 我們其實也可以在迴圈內再包迴圈, 但請把每 層的迴圈變數與 的對象給註記清楚 好的迴圈可以讓 更簡潔, 但若缺乏適當的排版 命名與 的話, 反 容易造成許多困惑 最後補充 下, 也可以寫其他程式常 的 迴圈以及 些迴圈 上的習慣 : 迴圈內的指令縮排 ; 有意義的變數命名, 如 圖 中的

條件式, 但多數時候 就很夠 了 這 節會談到變數標籤 類別變數以及變數的命名 這些東 也許不會直接和清理與分析資料有關, 但可以讓閱讀資料時更明確易懂 標籤的概念是這樣的 : 先, 每個變數都可以有標籤, 這可以在 中查看 除此之外, 我們也可以給變數的 值 標籤, 或是說定義 個值對應到標籤的 有趣的是, 這樣的 也有 個名稱 下稱值標籤 將這個 套 到變數 上就可以完成類別化 在 中呈藍字 類別化後的變數在 以及許多指令的輸出結果中, 將以值標籤呈現, 但其本質上 運算上 仍然是數值 下 做 些簡單的整理, 將 標籤上, 定義值標籤 其中的, 是這個 的名稱, 將定義的值標籤 套 在 上, 查看值標籤, 列出值與標籤的 其實也可以是, 即列出 中所有 的值與標籤, 這些差異還是老話 句 : 請參考, 丟掉定義的 請注意, 值標籤的值只適 於 整數 與 某些遺失值, 因此若想適 於字串變數時, 可以直接利 先前提到的 完成類別化 對於某些數值變數, 尤其是連續變數, 我們需要先將其轉變為整數 的數值變數, 再進 類別化 此外, 各位也不妨確認 下, 如果 沒有在變數 上完整定義的話, 會怎麼被處理 圖 利 個 造資料來間單地展 些 的實例與結果 幾個可以注意的地 : 的 在 時是怎麼被處理的 由 可以得知, 我們產 了兩個值標籤 右下 的, 是以值標籤 顯 分組 是如何建立值標籤 的呢 除了標籤, 變數命名也是 件值得花 思的事 好的命名邏輯可以省下許多查詢甚 的時間, 尤其是我們可以利 來 氣呼叫 堆變數 些修改變數名以及利 的 法列舉如下, 可以將 改名為 代表的是 變數 ; 下 括號 要獨 我們有 以及條件式, 所以這件事其實不難 如果各位感到 煩, 可以進 步參考 以及 底下的函 的值標籤就是原本的 字串值, 且值標籤 的名稱就是 變數名稱

, 氣更改許多變數的名稱, 可以呼叫所有以 開頭的變數, 可以呼叫 到 例 的 有很多 便的運, 像是 因此, 命名時不妨考慮幾點 : 名稱能清楚反應變數內涵 ; 概念類似的變數可以加上同樣的 或, 以 便利 ; 名稱如果是 短句 詞 的話, 可以 寫或 來分隔單字, 如 如果有別的程式經驗的話, 群組別的操作常常需要花上不少 氣, 但在 中, 只要利 就可以輕鬆完成這項任務 可以幫助我們完成群組別的操作, 也就是依 的值分組別執 請注意: 並非所有指令都能搭配 使 在使 前, 需要先將變數進 的指令很簡單, 以下條列說明之 可以讓樣本樣本點依照 進 升冪 或字 別 的排序 是 個更 般化的, 透過在變數前 加上正負號可以設定排序 向 可以 成 個排序順序的 有序, 但距離無意義 則可以設定是否將 排在最前 最後, 在 之前, 請留意 的過程是否 內有個清楚的例, 以 及後續的指令是否會因此 受影響

回到, 事實上, 可以直接和 結合成 圖 展 了 些 的運, 其左上 右上分別是組別操作前後的資料, 以下條列說明之, 先, 然後對 進 群組操作, 先, 但是只對 進 群組操作 關於 圖 的幾個例 例 在算組平均, 這 類 的搭配非常常 例 在算組樣本數, 提到的 在這裡就相當實 當然, 我們也可以 來產 組內的, 只要資料的排序是符合預期的 例 試圖找出組內的第 筆成績值 請注意, 我利 來確保組內排序正確後, 再利 取出第 筆成績值 各位不妨猜猜看 會跑出什麼呢? 例 試圖計算每 次嘗試 前後的成績差異 記得 可以回傳當前的 嗎? 當例 的指令套 在每個樣本點時, 就會是當前的成績值減去 組內前 個樣本點 的成績值, 也就是說, 當在某組第 個樣本點時, 就會計算, 這也是為什麼在各組第 個樣本點時會產 例 想要取出 第幾次 的成績最好 沒有呈現結果 雖然這無法 次到位, 但善 現有指令的話並不困難 善 可以幫忙省下許多功夫, 但有時候 好懂比起省空間更重要 如果各位不喜歡 和 起做的話 像是覺得第 點的寫法令 困惑, 改 各位也可以想像我們在分組跑迴圈

成 與 兩 來寫絕對不會有問題 還有很多實 的運, 像是搭配 底下的 來計算組內符合條件的個數 最後, 有時候產 的結果並不直觀, 尤其是與條件式 起使 時, 這時可以利 之類的指令檢查, 抑或是瀏覽 前為, 我把 最基本的操作都帶過了 從存取資料 探索與 成變數, 接著進 步利 條件式與迴圈完成或簡化特定的操作 我們也學會把利 標籤以及 來輔助閱讀與操作, 最後我們學會群組別的操作 希望 前為, 我能夠說服各位 真的很好學, 且也是個實 的 具 我們常常在 中執 數個指令已完成某個步驟或程序, 在其中我們經常性地會提到某個數值 例如年齡在 歲以下 或是某個變數 想使 的依變數 當想要更動這些值時, 逐 檢查並取代可能不是明智之舉, 畢竟這很 煩 可能會出錯 比較好的 法將這些經常被提到的值參數化, 也就是設成 中的 變數來表, 這樣往後只要更動 變數所指涉的值即可 以下條列說明之 可以將 指定給 變數 在之後的指令, 可以透過 ` 呼叫 變數 變數可以是數值 某變數 字串或者是變數清單 變數的呼叫僅對當次的 有效 如果想要 個在關閉 前都有效的變數, 可以使 變數 : 將指令中的 改為 即可 變數可以使 呼叫之 補個例 的各項指令事實上很像程式語 的函數 : 執 之後會對資料進 某種操作 印出某些結果以及回傳 某些訊息 在操作某些指令之後, 可以透過 來查查看該指令是否有留下 些實 的資訊給我們 像是我們執 之後, 可以透過 來取得 的平均值 在之後的第四節, 還有個針對估計型指令的, 這對於取得 些常 的統計量 2 非常 便 的繪圖與字串函數有許多功能, 也因此值得 個章節好好介紹 但其中許多基本的功能就已經相當實 了, 因此這 節會先 簡略地 做些說明 最後, 我會補充 些先前沒提到, 但也很實 的指令 各位想必在統計課, 甚 是國 中的數學課就接觸到許多將資料以圖表表達的 法 比較潮的說法是資料視覺化 點擊 左上 的 就可以發現許多繪圖 具 我 如果各位 頭霧 的話, 有可能是我的舉例與說明不夠好, 但也推薦各位多 資料試著做中學, 以及多參考 以及利

個 很建議繪圖時善 的, 也就是靠點擊圖形化介 來完成複雜的圖表設定, 然再將 上的 複製到 上 然, 對於簡單的圖表, 也不妨稍微留意 下相關的指令 圖 利, 來展 些結果, 雖然不 定有什麼具體意義就是了 笑, 以 為 軸 為 軸繪製, 以 為 軸 為 軸繪製, 會以 的排序繪製 分別可以指定圖表的上標題 軸名稱 軸名稱, 可以在 軸變數為 的地 標上參考線, 依 的值來繪製, 依 的值分組繪製 統計量 的長條圖 這其實就是 提到的 的圖形化版本 可以對 的次數分佈繪製直 圖, 可以 來調整柱寬, 則會附上常態分佈的機率密度 依 的

的繪圖功能還有許多細節可以設定, 以下條列 些功能, 有興趣的 可以善 網路 資源查詢之 更改 如 圖中的標記 軸與 軸的刻度與顯 式 等 分群繪製在同 張圖上 非以 的 式分開呈現, 並且以客製化的 來標 群組 將不同的繪圖 式呈現在同 張圖上, 如 與 將多張圖合併在 張 圖底下 在圖的左右側分別呈現不同的刻度 字串變數其實相當常, 舉凡國家名稱 住址 分證字號等都是 但字串變數很明顯地無法進 常 的數學運算, 因此我們常常會需要先從這些字串中取出訊息, 然後將這些訊息以數值變數 類別 表, 比如說 : 從住址中取出縣市 從 分證字號中取出第 碼 反映性別 以下條列 些字串處理上的概念以及其函式 字串變數的 是, 然 在 中, 眼所 的空 並不 定是, 也不 定反映同樣值 我們所 的空 可能是 堆 或是 或是兩者的組合 函式 可以去除字串前後的空, 例如將 變成 可以從字串 中截取第 個字 開始, 長度為 的片段 倘若我們要擷取 分證中的第 碼, 可以利 會回傳字串 在 中 次出現的位置, 例如 就會是 若 不存在於 之中就會回傳, 因此這也可以 來檢查特定字串是否存在於某字串之中 請注意, 如果我們處理的是中 字, 那麼 長度 第幾個 的概念就不能直接適, 但通常可以查到 版本的函式使, 例如, 將字串變數 依 切成片段, 並儲存成數個以 開頭變數 例如變數 期 的某個值, 以 切成片段就會被存成三個值分別為 的變數 這些字串函數基本上都可以套 在字串變數 上, 只要將其中的字串 換成字串變數 即可 結果就會是對字串變數的每個樣本點上的值做操作 當然, 此例也許 時間相關的函數處理更 便 請參考 等時間函式

為了從 字中取得資訊, 當然就有需多對應的字串函數可以使, 甚 也可以利 正規表達式 沒有 隨時都記得這些指令, 但熟悉 些常 的功能有助於快速在 或 上找到對應的指令 最後, 由於本 的怠惰, 以及不知道該如何歸類部分指令, 因此我把 些也很實 的指令與相關說明收集於此, 依照 的順序從頭排序變數, 可以選擇從何開始排序, 依照 重新指派變數值 查看 可以發現所謂的 可以有很多形式, 像是 就是將 到 的值重新指派為 可以省下寫很多 的空間 但要要注意幾點, 請 氣完成, 否則可能會有新的 把剛更新的值 取代掉的情形 ; 請 在某些 之下, 原邊界值到底會被分到哪 個新值, 在 上列出樣本點 的 有時候會比 更 便, 其後的條件, 是指前 個樣本點 的字串函數 對於連續變數, 我們可能會擔, 這個問題可以參考看看

根據 的定義, 是指將 轉換成適合後續分析的形式, 這可能涉及到將非結構化資料結構化 清理資料 合併資料等 也許有些 會認為這些步驟相較於分析, 不過是苦 與勞 密集的 作罷了 但我認為這個步驟比起分析更無跡可尋 學, 也不容易建立 個明確的 作流程 準確來說, 這是 個相當吃經驗的步驟 不僅需要了解 以及分析需求, 也需要有 個易懂 容易調整與反饋的 作流程 尤其對於處理巨量資料 ( 雖然本 沒有相關經驗 ), 不恰當的步驟可能就會需要花上相當 的時間成本 這 節會介紹如何合併不同資料 合併資料基本上可以分成垂直合併與 平合併, 分 別可以使 的 來完成 圖 利 兩年成績的 造資料簡單地展 下, 下 條列 些說明, 將現有資料與 上的檔案垂直合併 兩筆 要進 平合併時, 需要確認 變數名稱是否 致 變數類型是否 致 本例中顯然兩條件都不符合, 也因此我們透過 改名與轉換變數類型 在合併資料前, 我先在各資料中創造了變數 來標注資料的年份, 各位可以想想看不標年份就垂直合併可能造成的混淆 合併後的資料經過 整理, 最後藉由 確認 是否可以 這個垂直合併後的資料 現在的資料可能有非常多種形式, 如影像 字 聲 等, 將這些資料轉換為像 中的表格 或稱 就是資料結構化 ; 此外, 清理資料顧名思義就是掃除資料中骯髒 妨礙分析的部分, 包括異常值 遺失值等

最後提到的 資料是個重要的概念, 也就是 組變數 的值 是否在資料中是唯 的, 這組變數 稱, 例如 圖 中 以及 的 當然, 作為 的變數也要有意義 : 說明樣本點的 份 可以連結 其他資料等 處理不同資料時, 我們需要時時銘記哪 組變數是, 這點在各種資料的操作上都很重要 圖 接續先前垂直合併後的成績資料, 接著要嘗試將其利 變數 和個 背景資料 平合併 下 條列 些說明, 將現有記憶體中的資料 稱 和 上的資料 稱 合併 與 中具有相同 值的樣本點 本例中的 會被 平合併 當然, 我們需要好好確認 的名稱和變數類型是否在 與 中 致 是 來說明 的值在 與 中是否唯, 若非唯 則標, 因此 與 依序標 是否為 可以分成四個種類, 本例中的 在 是唯 的, 但在 中並不是, 因此 標 為 旦樣本點沒有出現在 或 之中, 就無法藉由 進 對應的 平合併 本例的 中缺乏, 中缺乏, 因此這些樣本點就會在 或 的變數上呈現 平合併後 成的類別變數 正是 來記錄這些情形 平合併後, 我把 元變數 重新彙整成 個類別變數, 算是 個 的應 第 點可以再進 步說明 : 在 平合併時是預設包括那些僅出現在 或 也就是 中 的概念

的樣本點, 如 圖 范式圖右下 所呈現的 如果需要別種合併 法, 我們其實可以很 便地利 變數 丟去不想要的樣本點即可 然, 再丟去樣本點之前, 最好要先想想看樣本點在 或 中遺失的原因, 以及這樣的遺失是否會影響後續的分析與推論 最後, 可以 來選擇需要合併哪些 中的變數, 當我們 的 和 的 致時, 事實上我們就只是在檢查樣本點在 與 出現的情形 前 節有提到 的概念: 某 組變數是 是指其值在資料中是唯 的, 像是 圖 中的 這樣的 組變數 或是這個資料本 可以想成是 個層狀的結構, 像是我們會說 : 明 的 如何等等 假設這些變數有某種排序, 如, 排序中的每個變數都是 個 層級, 前 的變數是較 的層級 其他變數也有層級的概念, 像是個 背景就是在 這 層: 其值對於 以下的層級是固定的 於成績就是 的層級 或是, 如果層級的排序明確的話, 也可以說是 這個低層級 這 節我們會談到 些和層級有關的指令 : 彙整變數 較 層級 將低層級資料重新以 層級表 或反之 這些分別可以利 的 實現 圖 利 造的成績資料說明如何彙整變數 層級, 這邊我們假設 是較 層級, 也是我們想彙整到的 標層級 下 條列說明之, 將變 數 等依統計量 彙整 的層級上 或說, 以 這些多樣的合併 式參考 的 的順序反過來也說得通, 但有些例 就會有比較明顯的排序, 如 : 等

為組別的彙整 換句話說, 這個指令可以同時彙整 許多變數 的 許多統計量 較 的層級, 如本例中的 如果不 的 式指派新舊變數名稱, 也可以只在統計量 後 輸入變數名, 如本例中的, 這樣彙整後的變數還會是原本的名字, 但請 彙整不同統計量時新變數名稱衝突的情形 這個指令可能會很長, 請善 以及縮排 關於這個指令, 各位也不妨想想看幾件事 : 是否可以利 做到 樣的 事 彙整後的資料似乎遺失了學科的資訊 尤其是對於最 最 值, 如果我希望彙整 後能保有這些資訊該怎麼做呢? 有時候基於運算或是展 等理由, 我們希望將低層級的資料改以 堆變數欄位表, 或是相反地, 將 堆內涵類似但種類不同的變數, 依其種類堆疊成 新 的 低層級, 也就是所謂的 說穿了, 本質上並沒有改變 資料內容, 不過是像七巧板 樣地重新組合 些資料中的元素罷了 在開始解說前, 不 妨先留意 些資料中的元素 : 層級變數 低層級變數的名稱與值 分析變數的 名稱與值 圖 個簡單的例 來展 與 以及 的指令, 我將其中 同樣的元素 同樣的顏 框起來 下 條列說明之 縮排的 的通常是要表 段指令還沒結束, 像是迴圈內的指令也常會縮排表 這兩可都可以利 的群組別彙整處理 也許無法 次到位, 然後在捨去重複或不必要的變數與樣本點 字解釋也許很難理解, 但看 些實例 圖 或是 通常就可以抓到 些概念 如果你認真把 當成七巧版操作, 那麼你會發現 少了低層變數名稱, 也因此轉換回 時, 要在 中把低層變數名稱還回去

, 將資料轉換為 其中的 分別是 層級 與低層級變數, 是現有的 想要分析的變數 注意, 新的變數名稱是, 也就是本例的, 將資料轉換為 是 個新 成的變數, 代表新 成的低層級變數名稱 則是 來標註分析變數 們 共有的, 這個 也將做為 中分析變數的名稱 最後, 之後的部分則會作為低層級變數的值 分析變數 也可以是 個, 但請留意, 在 時, 同 組分析變數需要有清楚對應的 當低層變數類型是字串時, 需要加上 時除了代表不同層級的變數以及分析變數之外, 其他變數的處理規則如下 : 時, 層級變數會被很 然地帶到 中, 但如果低層級變數沒有放到 中的話, 就會產 ; 時, 其他變數必定是 層級變數, 因此也會很 然地被帶到 之中 中, 有時候 層變數底下不 定包括所有低層變數的唯 值 本例中的, 若轉換成, 仍會產 組對應低層變數唯 值的變數, 但其中有些值就會是 各位可以想像 圖 刪去某些樣本點後, 有些 就會缺乏某些學科 的資訊

觀察 的指令, 可以看到 巧妙的利 變數名稱以及 作為切換依據 的 些規則看似複雜, 但實際操作過後會發現這並不難理解 最後有 個 建 議 : 前盡可能地簡化資料, 丟去沒必要的變數 這 節會介紹 系列的指令以及再訪 很多時候我們明確的知道資料應該是在某 個層級, 或是某 組變數應該作為 可以幫我們偵查這些情形, 找出不合理的重複值 於 的部分, 我在 已經說明了 值在邏輯運算中如何被操作, 但這邊會再把相關的概念重新整理 次, 並且舉例 在 些指令中的影響 當我們清理資料時, 很常需要去檢查重複值與遺失值, 也因此這些指令相當實 下 以 圖 為例, 條列說明 系列的指令, 回報 重複的情形 圖 左下 展 了回報的結果 : 重複次 次的樣本點共有 筆, 也就是有 筆是多餘的 ; 重複 次的樣本點共有 筆, 也就是有 筆是多餘的 6 (6/3), 對於 值重複的樣本點, 利 標記重複次數, 即圖中的, 對於重複的樣本點 所有變數值 樣, 只留下 第 筆 重複的樣本點, 對於 值重複的樣本點, 只留下 第 筆 重複的樣本點 本例中, 我們認為 應該要 這組資料, 並決定只留下成績最 的那筆, 因此我們先 排序, 讓想留下來的樣本點排在重複

樣本點中的 第 筆 最後, 關於, 以下做 些整理 數值與字串變數的 分別為, 當然有些時候其他值的意義也是, 像是 或是, 因此我們需要細 地檢查資料, 比如說透過 以及繪圖來觀察變數的唯 值或是分佈, 並適時將某些值改成 在數值變數的邏輯運算上被視為無限 有趣的是, 底下的 會排除 如果各位覺得這些規則煩瑣 應該還好, 還是 個老建議 : 有疑惑時就查閱 條件 可以輕易地幫我們挑出 如果不喜歡 長串的 表 的話, 也可以試試看, 如 :, 只要 任 變數有 無論變數類型 就會被挑出來 最簡單 可能也是最常 處理 的 式就是逐列刪除, 即完全捨去該樣本點 然, 這麼做的風險就是忽略 本 可能隱含的資訊 也許, 並不是隨機的 有些時候我們可能會補值或是將變數類別化 包括 類別 右上的圖 僅停在, 後續的 就請 嘗試 這些可能導因於觀測時的失誤 比如說測量 的儀器測不出接近 的值 或是資料提供者的處理 補值的 法可以是取變數的平均, 或是利 其他變數建立模型去預測遺失值 有些機器學習的 法也可以 應 在此, 如 : 等等

利 做計量分析或實證很簡單, 你只要會 就夠了 開玩笑的 這節會談到在 上執 計量 法 如 : 線性迴歸 等 相關的檢定以及輸出結果 重點還是會放在 的操作上, 但也許會附帶地提到 些計量的概念 最後, 也許我應該強調 下 : 對計量或實證, 上的操作終究只是 具 已, 清楚地了解 在估計什麼, 有邏輯地選擇 法與詮釋比起跑了幾百幾千條迴歸更重要 學過統計的 想必對線性迴歸 不陌, 再開始談 上線性迴歸的 操作時, 不妨先想想看線性迴歸是什麼? 線性迴歸是 種以極 化 的 式來 在某些假設之下, 線性迴歸的參數可以 致地 估計出我們所想像的 與 的關係 從幾何與線性代數上看來, 迴歸不過是把向量 y 長度為, 投影到樣本矩陣 X n,k 的 維欄空間上 從 上看來, 迴歸不過是 罷了 其中的 是依變數, 則是 變數 般來說, 的指令基本上沒什麼困難, 但我們仍然可以在推論 或檢定 時做 些調整, 像是使 另外, 有時候我們的 需要包括 元或類別變數, 或者是變數間的交乘項 些 便的 可以幫我們達成這些 的, 不需要花時間 成變數 以下條列 些說明 或 可以使 異質變異數 的標準誤於 ˆβ 上 可以忽略掉迴歸中的常數項 請注意, 再沒有常數項的情形下, R 2 的定義可能和平常的不太 樣 在 之中, 等同於將 類別化之後放入迴歸式 當然, 會 動幫我們挑 組作為 以避免 此外, 可以更改 為 稱, 在放入 時, 如果在迴歸指令前 加上, 就會順便依照 的每個類別 成 可以 成 與 所組合出來的類別 或說, 與 的主效果以及交互作 其中 個交成的變數是連續型的話, 可以使

基本上會 動處理, 也就是會 動 掉多餘的變數 當跑完迴歸後, 也許我們最常做的就是各種假設檢定 如果只是要看某個參數是否顯著的話, 回傳的報表就已經有了 但我們可以再利 或是 來檢定 些線性的限制條件, 例如 H 0 : β 1 + β 2 = 0; β 3 = 1 此外, 我們還可以根據剛跑出來, 熱騰騰的迴歸模型去做 當然, 不 定要 在同 組資料上, 也就是回傳每個樣本點的預測值 相關說明條列於下, 可以同時檢定 中的每個 是否為零, 可以同時檢定數個線性的限制式, 可以是某種, 例如, 可以檢定某 個 線性的限制式, 但這邊的 要表 為 : 限制式等號左邊為 時, 等號右半邊的部分, 例如 :, 使 現有的模型來 樣本點 是 來存 的新變數, 則是要 的 標, 比如說 就是 ŷ, 則是 殘差項 û 請注意, 上述這些指令都需要在估計指令 如 之後使 如果重新跑了新的迴歸, 舊的結果就會被覆蓋掉 線性迴歸也就差不多如此了, 最後再補充 些取得迴歸資訊的好 法 有提到多數指令執 之後, 會有 個 來記錄 些訊息 對於那些 估計指令 來說, 有 個 來記估計模型的 些資訊, 例如參數的估計值與變異數矩陣 等 除了 之外 我們還可以藉由, 來取得某 變數 的估計係數與標準誤 這 節會談到如何將迴歸結果輸出成 上的圖表, 或者是像 等形式 就我 所知, 是最常使 的兩個輸出圖表 的套件, 前者較為簡單, 後 者使 上比較彈性 有興趣想看看怎麼暫存或叫回先前估計結果的, 可以參考 系列的指令