建立 / 編輯資料檔 2-1 2-10 / 2-2 / 2-11 2-3 2-12 2-4 2-13 2-5 2-14 2-6 2-15 2-7 2-16 2-8 2-17 2-9
雖然, 我們已於前章建立過一個 學生成績 資料檔 但其內仍有許多相關的細部設定與操作未曾述及, 將於本章作一完整的介紹 2-1 定義變數 通常, 於進行資料輸入之前, 我們會先定義各欄變數之名稱 ; 否則,SPSS 將依欄位順序給予 var00001 var00002 var00003 之欄名 這樣, 畢竟還是有點不好辨識 要定義各欄變數之名稱, 得於 SPSS 資料編輯程式 畫面之 資料檢視, 執行 檢視 (V)/ 變數 ( 或按左下角之標籤 ) 來切換到 變數檢視 畫面 : 其內一列即用來定義一個欄變數之名稱 類型 寬度 小數 註解 數值 遺漏 欄 對齊與測量等項目 茲逐一說明於後 要輸入變數名稱, 只須於 名稱 欄之空白文字方塊內直接輸入即可 但變數名稱必須符合下列規則 : 必須以中文或英文字母開始, 其餘的字元可以是任何中文 英文字母 數字或 @ # _ 或 $ 符號 長度不可超過 8 個字元 ( 每個中文算 2 個字元, 若全部使用中文, 最長可使用 4 個中文字而已 ) 2-2
不可使用空格和!? ' * 特殊字元 不可以點號 (.) 作為結束字元 不可使用 SPSS 的保留字 :ALL AND BY EQ GE GT LE LT NE NOT OR TO WITH 必須是唯一的 ( 不能重複 ) 變數名稱不區分大小寫 將變數名稱定成中文或英文單字, 使人一看就知道其意義, 固然很好 但因為字數的限制, 故有時也有其困難性, 大半亦僅能以簡短之縮寫字來命名 且一份問卷通常有很多題目, 為方便分析時容易辨認 所以, 也經常只以題號為變數欄之名稱 如, 第一題命名為 q1 第二題命名為 q2 命妥變數之名稱後,SPSS 會自動將此變數之類型, 預設為 數字的 : 大部份情況也不須重新設定, 因為我們通常會將問卷之答題結果, 轉為數字, 以進行輸入 SPSS 可用之資料類型有三大類 : 數字 日期 ( 含時間 ) 與字串 其中, 數字隨其外觀之格式又細分為 : 逗號 (1,234.5) 點(1.234,5) 科學記號(1.8E2) 貨幣 ($1,234) 等幾種變型 實務上, 還真的很少去改變其顯示的格式, 因為那不是統計分析的重點 若真的要變更其類型, 可點按 類型 欄下之 數字的 處, 其右側將有一按鈕 : 2-3
按 鈕, 將轉入 去安排資料類型, 同時也可以一併設定其寬度與小數位數 其中, 若安排為日期, 並不用設定寬度與小數, 但得選擇其格式應為日期 時間或兩者 : 若安排為字串, 則可用來輸入所指定長度 ( 上限 255 個字元 ) 之文字內容, 如 : 男 女 此類型之資料是無法用來計算其均數 標準差 等數值性之統計量 : 2-4
數字性之資料預設寬度為 8; 小數位數預設為 2 要修改時, 可直接鍵入新值或按其右側之箭頭進行調整 : 問卷上的資料, 若為選擇題, 通常是用不到小數的, 故可將小數設定為 0 若要同時定義寬度與小數位, 應注意寬度至少要比小數位數多 1 如, 總寬度為 2, 其小數位最多只能為 1( 因為還得保留 1 位之寬度來安置點號 ) 否則, 會出現下示之錯誤 : 註解即變數於輸出報表上的文字標籤, 若未曾設定 註解,SPSS 之預設狀況為使用變數名稱當報表上的文字標籤 如, 下表之 SEX:( 請開啟 SPSS 範例 \Ch02\ 註解.sav 進行練習) 2-5
有時, 受限於變數名稱可用之字數 ( 英文 8 中文 4), 標題經常是縮寫的內容 例如, 僅使用題號 :q1 q2 q3 如不對照原問卷, 就更不易看懂其標題為何? 故可於 註解 處, 加入較詳細之中英文, 當作輸出報表上的文字標籤, 以提高其閱讀上的便利性 如, 將 SEX 改為 受訪者之性別 : 同樣的次數分配表輸出, 再執行一次, 其標題將由 SEX 改為 受訪者之性別 : 同樣以上一個輸出為例, 最左邊一欄, 僅出現 1 2 而已 沒人知道 1 2 分別代表何種性別? 除非拿問卷出來對照 特別是問卷上的選項較多時, 即便拿問卷來對照, 於撰寫報告時, 還是會經常出錯! 此時, 就可於 數值 欄處, 分別對此變數之所有數字所代表的意義, 加以設定 亦即, 要設定答案內容的數值註解 設定時, 先以滑鼠點按 數值 欄下之 沒有框線 處, 其右側將有一按鈕 :( 請開啟 SPSS 範例 \Ch02\ 數值.sav 進行練習 ) 2-6
按 鈕, 可轉入 於 數值 (U) 後之文字方塊, 輸入 :1; 續於 數值註解 (E) 後之文字方塊, 輸入 : 男 表示答案為 1 即表示為男性 : 接著, 按鈕, 將前述之設定, 移到下方之方塊 : 然後, 再以相同之定義方式 將 2 設定為女 : 2-7
最後, 按設定內容 : 鈕, 完成數值註解之設定 於 數值 欄可看到一部份之 同樣的次數分配表, 原僅出現 1 2 而已, 並無法分辨何者為男? 再執行一次, 將可改為男 / 女字串, 比較容易閱讀報表內容 : 由於, 問卷題目及其可選之項目通常很多 若不加上適當之變數標籤及答案內容的數值標題, 幾乎是無法避免誤讀的! 所以, 再怎麼辛苦, 也要把這兩個部份, 定義得清清楚楚 否則, 一時的偷懶, 導致分析錯誤, 會使整個問卷調查之努力, 完全泡湯, 那將是嚴重的得不償失! 所為 遺漏 (missing value), 是指問卷上未填答之內容, 由於無資料, 當然也無法進行電腦分析 ; 或是, 雖輸入有資料, 但其內容是錯誤的, 我們亦不想將其納入到分析中 由於, 問卷調查之資料得來不易 得經由設計問卷, 多次的試訪與修改, 才將問卷定稿 然後, 還得辛苦的進行訪查 ( 電話訪查 實地訪查 ), 才可得到一份調查結果 所以, 對問卷內的每一題, 均應詳細勾填其訪問結果, 勿使其有未填答之空白情況 且將其資料輸入到電腦中時, 也應輸入正確之答案, 不可錯打 ( 如, 答 2 卻打成 3) 或誤打 ( 將第 4 題之答案輸到第 3 題之欄位 ) 2-8
若於輸入資料或分析時, 發現有空白未填或打錯之資料, 均應儘可能找出原始問卷, 將其資料補上或更正 但若真的無法補或更正 ( 如 : 找不到原始問卷 ), 也只好忍痛將其放棄了! 但這些空白或錯誤的資料, 會影響我們的分析結果 如 :( 請開啟 SPSS 範例 \Ch02\ 遺漏值.sav 進行練習) 性別 欄中第 3 與 5 筆並無資料 輸入時, 將其輸入為 0 而第 2 筆則錯打為 5 其次數分配表的結果為: 統計量 處顯示,15 筆觀察值均為有效 ; 並無遺漏值 但於 次數分配表 上 : 卻可看到答案有 0 與 5, 兩個不合理之數字 其後之次數結果與百分比, 當然也就不對了! 所以, 應將答案 0 與 5, 定義為遺漏值, 將其排除掉 設定時, 先以滑鼠點按 遺漏 欄下之 沒有框線 處, 其右側將有一按鈕 : 2-9
按 鈕, 可轉入 由於, 我們不想要的資料為 0 與 5, 並非連續性之數字 故選 離散遺漏值 (D), 續於其下輸入 0 與 5: 最後, 按鈕, 完成遺漏值之設定 於 遺漏 欄可看到設定內容 : 再執行一次 次數分配, 可將答案為 0 與 5 者, 排除於分析之外 : 統計量 處顯示, 有效觀察值為 12 筆 ; 另有 3 筆為遺漏值 2-10
底下之 次數分配表 的上半部, 為這 12 筆有效觀察值的分析結果 :6 男 6 女 答案為 0 與 5 者, 則納入到 遺漏值 百分比 欄下之數字, 仍以包括 遺漏值 的總筆數 15 為分母所計算之結果, 這當然不是我們所要的正確結果! 再右邊一欄之 有效百分比 欄下之數字, 才是以將 遺漏值 排除後之總筆數 12 為分母, 所計算之正確結果 : 男性佔 50.0%(6/12); 女性佔 50.0%(6/12) 除了使用者所定義之 遺漏值 外 ; 還有一種是系統預設之 遺漏值 如 : 數字欄內之空白, 其外觀將為一個點號 茲將原第 1 筆之內容, 以鍵將其刪除, 它就是系統預設之 遺漏值 :( 請開啟 SPSS 範例 \Ch02\ 系統遺漏值.sav 進行練習) 再執行一次 次數分配, 可將答案為 0 5 及 系統遺漏值 之空白, 均排除於分析之外 : 2-11
統計量 處顯示, 有效觀察值為 11 筆 ; 另有 4 筆為遺漏值 ( 答案為 0 5 與 系統遺漏值 之空白, 均納入到 遺漏值 ) 其 系統界定的遺漏 指的就是第 1 筆的空白 前述之 寬度, 係用以定義資料可存放之最大位數 ; 而此處之 欄 則是在定義此欄於資料表顯示時的欄寬 如, 將其定義為 20:( 請開啟 SPSS 範例 \Ch02\ 欄寬.sav 進行練習) 將以下示之寬度等待輸入資料 : 但是, 其允許輸入之資料最大位數, 仍然是 寬度 所定義之 5 位數字而已 不過, 不管目前之欄寬多少? 我們還是可以滑鼠拖曳欄名標題之右側框邊 ( 滑鼠指標將轉為雙向箭頭 ), 來調整其欄寬 而 變數檢視 處, 欄 的寬度亦將隨之自動調整 此處是在定義資料的對齊方式, 左靠 置中或右靠 : 2-12
此處是在定義資料的屬性 : 量尺 次序的 名義的 連續變數, 如 : 成績 年齡 所得 長度 距離 體重 身高 智力 溫度 等 其間有大小及倍數之關係, 如 :95>90,150 為 50 之 3 倍 偏好順序或等級, 如 : 於甲 乙 丙三種品牌中, 以 1~3 來填答其偏好順序 (1 表最偏好 ); 其間只有順序關係, 但無大小或倍數之關係 假定, 其答案為甲 1 乙 3 丙 2 只可以說, 此位受訪者偏好之品牌依序為 : 甲 丙 乙 並無法說偏好甲的程度為乙的幾倍? 或超過多少? 間斷變數 類別變數或質變數, 如 : 性別 手機品牌 班級 政黨別 宗教信仰 社團 喜好之運動 最常飲用之飲料類別 等 例如, 男或女, 只是描述性別的現象 將男性標示為 1; 或將女性標示 2 僅是為了方便電腦處理, 並無任何大小或倍數之關係 不過, 現階段, 這些定義並不會影響 SPSS 的執行或分析結果 定了也不起任何作用! 所以, 我們通常就不理他, 讓其維持於原預設之 量尺 2-2 增 / 刪變數 若要於資料檔的最後, 增加新的變數, 則於 變數檢視 最下方之空白列, 輸入有關新變數之定義內容即可 若是要於某變數之前插入一新變數, 可以下示步驟進行 :( 請開啟 SPSS 範例 \Ch02\ 增刪變數.sav 進行練習) 2-13
轉入 變數檢視, 點選要插入新變數之位置的列號按鈕 ( 滑鼠指標將轉為向右箭頭 ), 將該列選取 執行 資料 (D)/ 插入新變數 (V) ( 或按一新列, 預設之變數名稱為 var00001 插入新變數 鈕 ), 可插入 更改新列之名稱及其餘相關設定 ( 本例將其名稱改為 班級 ) 若是要刪除某變數, 可以下示步驟進行 : 轉入 變數檢視, 點選要刪除之變數的列號按鈕, 將該列選取 執行 編輯 (E)/ 清除 (E) ( 或按 鍵 ), 即可刪除該變數之定義 2-14