一 統計學概論 共 5 題單選題, 佔 50% 1. 以下敘述何者為次級資料? (A) 行政院主計處公布的每年出生嬰兒, 男生與女生比值 (B) 學生利用網路問卷收集手機廠牌的市佔率 (C) 行政主計處執行的人口普查資料 (D) 台灣民眾門診健保資料. 以下何種衡量尺度的資料, 能計算平均數 標準差 偏態 峰態等所有數值量數? (A) 名目 順序 區間 比率等衡量尺度皆可 (B) 除了名目尺度之外, 順序 區間 比率等衡量尺度皆可 (C) 除了名目與順序尺度之外, 區間與比率尺度皆可 (D) 只有比率尺度資料才可以計算所有數值量數 3. 以下哪一因素, 最不可能影響簡單隨機抽樣的成敗? (A) 抽樣架構 (Sampling Frame) 是否明確 (B) 母體的定義是否明確 (C) 受訪對象的可接近性 (D) 母體的大小 4. 以下何者對於整理資料時, 判斷應該要使用哪一種統計分析方法的影響最小? (A) 變數的個數 (B) 資料的衡量尺度 (C) 蒐集資料時所使用的抽樣方法 (D) 研究議題的自變數與應變數 5. 下列何者不屬於量化資料整理之範疇? (A) 計算敘述統計量 (B) 定分群組數 (C) 計算全距 組距 組限 (D) 將各單一資料值, 以劃記法歸類至其應屬之類別組 6. 當樣本數愈大也愈靠近母體規模的時候, 各組的相對次數愈接近下列何者? (A) 母體平均數 (B) 母體標準差 (C) 母體機率分配 (D) 常態分配 第 1 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 7. 若隨機變數 x 的平均數為 15, 標準差為 4, 若 y=x,z=x+15, 以下何者正確? (A) x 與 z 之相關係數小於一 (B) z 之變異數等於 x 之變異數 (C) y 之標準差最小 (D) y 之平均數大於 z 之平均數 8. 隨機抽取若干行業, 其平均週薪 ( 美元 ) 如下 :753 87 399 816 91 487 639 311, 下列統計量數, 何者錯誤? (A) Q1= 487 (B) Q= 715 (C) Q3=816 (D) 四分位間距 =319 9. 以下有關隨機變數 X 之期望值 (Expected Values) 的敘述, 何者錯誤? (A) 是隨機變數 X 之加權平均數, 以樣本點之機率為權重 (B) 是研究者基於經驗所做的預測 (C) 是重複無限次隨機實驗 (Experiment) 後,X 之觀察值的平均數 (D) 連續變數與間斷變數皆可計算期望值 10. 若 A B 兩事件獨立, 且 P(A)=0.3, P(B)=0.7, 求 A 事件或者 B 事件發生的機率 (A) 低於 85% (B) 介於 85% 到 90% 之間 (C) 介於 90% 到 95% 之間 (D) 大於 95% 11. 若獨立之柏努力實驗 (Bernoulli Experiment)15 次 若 X 為成功次數,Y 為失敗次數, 請問下列敘述何者為真? (A) P(<X<=5)=P(10<=Y<13) (B) P(<X<=5)=P(10<Y<=13) (C) P(<X<=5)=P(13<=Y<10) (D) P(<X<=5)=P(13<Y<=10) 第 頁, 共 1 頁
1. 已知大學生使用智慧型手機之比例為 0.4; 今隨機選取 300 位大學生, 調查使用智慧型手機者之比例, 其中至少 ( 含 ) 有 139 位大學生使用智慧型手機之機率為何? (A) 0.3146 (B) 0.146 (C) 0.1146 (D) 0.0146 13. 若 X 服從標準常態分配, 令 a= Pr(X < -1.645) + Pr(X<1.96). 請問以下何者正確? (A) 1 < a (B) 0.975 < a < 1 (C) 0.05 < a < 0.5 (D) 0 < a < 0.075 14. 設常態隨機變數 X~N(µ,σ), 則 P(µ-σ<X<µ+σ)=? (A) 0.8087 (B) 0.8185 (C) 0.834 (D) 0.857 15. 下列有關中央極限定理之敘述, 何者為真? (A) 抽樣時, 可藉由增加樣本量, 來達到降低抽樣誤差的目的 (B) 根據中央極限定理, 不論變數之分配為何, 其平均值之分配皆會趨近常態 (C)90% 之信賴區間比 99% 之信賴區間窄 ; 若要提高信賴水準, 需縮小區間範圍 (D) 根據中央極限定理, 當樣本量超過 30 時, 此樣本平均數的抽樣分配, 其平均數會等於原母體分配之平均數 ; 其變異數是原母體分配變異數的 n 倍 16. 考慮某次總統大選期間的民意調查, 其主要目的是預測某個候選人的得票率 今欲決定抽樣的樣本數, 請問以下何者可以使得所需樣本數變小? (A) 降低信心水準 (B) 加大能容忍的抽樣誤差 (C) 確定此候選人的得票率少於 0.4 (D) 以上皆是 第 3 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 17. 內政部的自有房屋住宅報告指出台北目前每戶平均占地面積為 40 坪, 標準差為 0 坪 從台北市居民中隨機抽取 5 戶, 請問樣本平均數的平均值與標準差為何? ( 假設自有房屋住宅面積為常態分配 ) (A) (40,0) (B) (40,4) (C) (1.5,0) (D) (1.5,4) 18. 100 位高中生挑選新舊制服試穿, 其中 63 人喜歡新制服的設計,37 人喜歡舊制服的設計, 喜歡新制服之比例的 90% 信賴區間為? (A) (0.90, 0.449) (B) (0.339, 0.501) (C) (0.483, 0.677) (D) (0.550, 0.709) 19. 一項研究調查 10 個社群網站, 發現訪客數的月平均值為 5.( 百萬 ) 人次, 標準差為 0.5( 百萬 ) 人次 已知訪客數為常態分配, 試求訪客數之月平均值的 90% 信賴區間? (A) (4.901,5.499) (B) (4.906,5.494) (C) (4.910,5.490) (D) (4.914,5.486) 0. 假設有一組資料來自常態分配, 研究者欲檢定此組資料是否來自常態分配, 檢定結果顯示無法拒絕虛無假設 ( 資料來自常態分配 ). 請問該決策的結果為何? (A) 決策正確 (B) 犯型一過誤 (C) 犯型二過誤 (D) 無法得知決策是否正確 1. 下列有關檢定步驟之敘述, 何者錯誤? (A) 針對研究目的, 建立適當之虛無假設與對立假設 (B) 計算檢定統計量 (C) 依檢定統計量之分配, 查表可得臨界值 (D) 若檢定統計量大於臨界值, 則拒絕虛無假設 第 4 頁, 共 1 頁
. 下列有關 α=p( 型 I 錯誤 ),β=p( 型 II 錯誤 ) 與 n= 樣本數之間關係的敘述, 何者為真? (A)n 固定不動時,α 增加,β 就減少, 反之亦然 (B)n 固定不動時,α 增加,β 就增加, 反之亦然 (C)n 增加時,α 與 β 同時增加 (D)n 增加時,α 增加,β 減少 3. 假設 X1,, Xn 為來自於母體平均數為 μ, 母體變異數為 σ 的一組隨機樣本, 下列敘述何者不正確 : n (A) X = ( X ) n 是 μ 的不偏估計量 i =1 i / n i= i (B) S = ( X X ) / ( n 1) 是 σ 的不偏估計量 1 (C) S = S 是 σ 的不偏估計量 (D) X n i =1 i / = ( X ) n 是 μ 的一致估計量 4. 一複迴歸模式加入一個與反應變數有負關係之解釋變數, 則下列何者正確? (A) SSR 減少,SSE 增加,SSTO 不變 (B) SSR 減少,SSE 不變,SSTO 減少 (C) SSR 增加,SSE 增加,SSTO 增加 (D) SSR 增加,SSE 減少,SSTO 不變 5. 配適一條簡單迴歸模式 Y=β0+β1X+ε, 共取得 150 筆資料, 並得 : ( X X ) = 0, ( Y Y ) = 000, X = 150, Y = 85, ( X X )( Y Y ) = 180 ANOVA 表為下 : SOURCE DF SS MS F-VALUE P-VALUE MODEL a SSR MSR F <0.0001 ERROR b SSE MSE TOTAL c 000 此迴歸線之截距與斜率之估計值, 分別為? (A)-165, -9 (B)1435, -9 (C)-50, 0.9 (D)0, -0.9 第 5 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 二 統計學實務 共 5 題單選題, 佔 50% 6. 教育部長想知道大學生教科書的費用, 他的部屬蒐集一些資料, 請問他的部屬想做的是 : (A) 推論統計 (B) 實驗設計 (C) 參數估計 (D) 假設檢定 7. 小文從事網拍工作一個月, 總共有了 1000 位客戶其中男女各半 為了聽取客戶對於網拍產品的意見, 於是隨機從男客戶中抽取了 10 位客戶, 從女客戶中抽取了 10 位客戶, 小文親自打電話去詢問這 0 位客戶的意見 請問小文用了以下何種抽樣方法? (A) 簡單隨機抽樣 (B) 系統抽樣 (C) 集區抽樣 (D) 以上皆非 8. 在進行資料編碼的時候, 將 婚姻狀態 的選項定義為 1= 未婚,= 已婚,3= 離婚 請問以下有關 婚姻狀態 這個變數的敍述, 何者正確? (A) 可以計算眾數 (Mode) (B) 可以計算中位數 (Median) (C) 可以計算平均數 (Mean) (D) 以上皆正確 9. 市售白米的品質依照中華民國國家標準可分為一等 二等 三等三個等級 據此, 某製米工廠生產的包裝米, 最適合以何種圖形呈現品質分佈狀況? (A) 長條圖 (B) 直方圖 (C) 折線圖 (D) 散佈圖 第 6 頁, 共 1 頁
30. 小陳使用李克特五等量表, 設計 0 道生活型態題項, 若受訪者對於這 0 道題項都勾選相同的答案, 則視為無效問卷 換言之, 當特定受訪者的 0 筆資料符合下列何種情況時, 就應該被視為無效問卷? (A) 平均數等於 3 (B) 四分位距等於 0 (C) 全距等於 0 (D) 標準差等於 1 31. 以下為某一次畢業生就業調查的資料 碩士生比大學生的平均每月薪資高多少? 每月薪資 大學生人數 (f ii ) 碩士生人數 (y ii ) 30000 以下 17 15 30000~60000 56 113 60000~90000 47 89 90000 以上 1 5 (A)714 (B)9865 (C)1078 (D)19173 3. 假設根據資料, 台灣之百貨商店屬連鎖商店之機率為 0.6; 若你環島台灣, 途中總共隨機停過 10 家百貨商店 ; 若 X 代表 10 家百貨商店中連鎖商店之家數, 則下列敘述, 何者錯誤? (A) 連鎖商店之家數 (X) 屬於二項分配 (B) 停過 10 家中完全沒有連鎖商店之機率為 (0.4) 10 (C) 上述機率屬實證機率 (D) 若每次環島途中, 均隨機停過 10 家百貨商店, 則平均有 4 家是連鎖商店 33. 投擲一公平骰子, 依所擲點數, 每 1 點可得 3 元, 但每擲 1 次需付 10 元, 若玩 100 次, 請問可預期獲利多少? (A)30 (B)40 (C)50 (D)60 第 7 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 34. 一統計學課程獲得成績 A 的同學每週 ( 以五天計 ) 花在讀統計學的時間服從常態分配, 平均數為 9 小時, 標準差為 1.5 小時 成績 A 的同學有 10% 每週讀統計學的時間不到 a 小時, 另有 10% 每週讀書時間超過 b 小時, 請問 (a, b) 的值為何? (A)(7.18,10.8) (B)(7.08,10.9) (C)(6.98,11.0) (D)(6.88,11.1) 35. 某醫學檢驗中心正在進行愛滋病的例行檢驗, 該中心對於健康民眾的檢出率為 95%, 對愛滋病帶原者的檢出率為 99% 假設愛滋病帶原者的比率為 0.6% 某位民眾的檢查呈陽性, 請問他是愛滋病帶原者的機率為何? (A)10.0% (B)10.5% (C)10.7% (D)10.8% 36. 假設自工廠隨機挑出 100 個零件, 其中為不良品的件數服從二項分配 若不良率為 0.1, 則不良品件數的期望值與標準差分別為何? (A) 10,9 (B) 9,10 (C) 10,3 (D) 3,10 37. 若某一次統計學期中考之成績 X~N(35, 4), 其中 4 為標準差 若老師想以公式 Y=aX+b 將成績之分配改為 Y~N(80, ), 則 a=?,b=? (A) a=0.5,b=6.5 (B) a=0.8,b=97.5 (C) a=1.5,b=8.5 (D) a=.5,b=8.5 38. 假設市售大杯手搖茶每杯容量服從常態分配, 且平均容量是 700cc, 標準差是 10cc 若今天小明買了一杯大杯手搖茶, 請問此杯茶的實際容量大於 70cc 的機率約有多高? (A) 約為 0.5 (B) 約為 0.1 (C) 約為 0.05 (D) 約為 0.05 第 8 頁, 共 1 頁
39. 若班上共有 100 位同學, 某次考試分數遵循常態分配, 平均數是 68 分, 標準差是 10 分 請問考 85 分的同學在班上的排名最接近下列何者? (A) 第 5 名 (B) 第 10 名 (C) 第 15 名 (D) 第 0 名 40. 資產的變異數愈大則代表風險愈大, 反之若變異數愈小則風險愈小 ; 但是高風險則高報酬, 低風險則低報酬 小明根據此概念挑選投資組合, 並希望變異數能夠控制在一定的水準, 於是在常態假設下計算出一個有關變異數的信賴區間 請問下列敍述何者有誤? (A) 信賴區間的正中央剛好等於樣本變異數 (B) 信賴區間的計算是根據卡方分配 (C) 資料必需來自常態 (D) 信賴區間的下界不會比 0 小 41. 假設某隨機變數 X 服從平均數為 5 的波松分配 (Poisson Distribution) 今自此一分配隨機抽取 100 個觀察值, 構成一樣本平均數, 請問此統計量的標準誤為下列何者? (A) 5 (B) 5 (C) 0.5 (D) 0.5 4. 在 95% 的信心水準下, 某航空公司每天取消航班的比率信賴區間是 (.5%, 3.9%), 試問每天取消航班比率的點估計值為何 ( 假設為大樣本調查 )? (A) 0.05 (B) 0.03 (C) 0.03 (D) 0.039 第 9 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 43. 為教導幼兒認識性別, 某位幼稚園的老師提出一份教材, 該師於實驗前先擬好一 份認識性別問卷給受試幼兒填寫, 再於教授課程後給這群幼兒再做一次相同的問卷, 問卷中問及 誰可以幫忙家裡倒垃圾的工作, 在沒有任何先驗資料下, 若要建置答對率的 95% 信賴區間, 假設邊際誤差為 0.1, 則至少所需的樣本大小為何? (A) 3 (B) 48 (C) 69 (D) 97 44. 欲瞭解晶圓廠的生產狀況, 遂進行調查, 已知晶圓每小時生產量成常態分配 晶圓廠的品管師, 隨機選取 0 個工作小時, 得其晶圓每小時平均生產 150 個, 樣本標準差為 5 個 根據此次的取樣, 試推論所有晶圓每小時平均生產量之 99% 區間估計為何? (A)(146.801,153.199) (B)(136.84,143.181) (C)(166.145,53.563) (D)(16.840,150.6) 45. 要估計台灣地區國小六年級男同學的平均體重, 先隨機抽取 30 位台灣地區國小六 年級男同學作測試調查, 若測試學童體重之樣本變異數為 S = 56, 則台灣地區國小六年級男同學體重變異數的 95% 信賴區間為 :( 小數第 位以下四捨五入 ) (A) [158.03, 44.15] (B) [16.37, 46.64] (C) [174.45, 401.56] (D) [163.48, 457.39] 46. 網路購物公司欲以 α=0.05, 檢定不同地區之消費者, 對其產品退貨服務滿意之比 例是否相同, 隨機由三大地區各抽取 100 位消費者調查其滿意情形, 資料如下 (α=0.05), 則以下敘述, 何者錯誤? 退貨服務滿意度 台北 台中 高雄 總合 滿意 50 70 90 10 不滿意 50 30 10 90 總合 100 100 100 300 (A) 為齊一性檢定,H0: 不同地區之消費者對其產品退貨服務滿意之比例相同 (B) 臨界值 X 0.05,=5.991 (C) X 檢定值 =19.085 (D) 結論為拒絕 H0 第 10 頁, 共 1 頁
47. 為了解價格對銷售量的影響, 乃進行一項試銷實驗, 得銷售量如下 : 價位 銷售量 平均 變異數 高價格 50 43 45 46 13 中價格 44 46 51 47 13 低價格 70 65 63 66 13 若檢定在高 中 低價格中之平均銷售量是否有差異 (α=0.05), 下列相關敘 述, 何者錯誤? (A) 虛無假設為 H0: 高 中 低價格下之平均銷售量無差異 (B) 此檢定的查表值 ( 臨界值 ) 為 F=7.598 (C) 檢定結果為拒絕 H0 (D) 結論為高 中 低三組價格中, 其中至少有二組之平均銷售量存有差異 ; 尤其低價格之平均銷售量顯著與高 中二組價格之平均銷售量有差異 48. 某手機公司欲瞭解消費者對新產品之購買, 是否會受促銷方案影響, 以下為去年以原價推出, 以及今年採購機優惠方案之銷售量 ( 單位 : 萬支 ), 資料如下 : 方案 月份 一 二 三 四 五 六 七 八 九 十 十一 十二 去年原價 9 10 9 8 7 8 11 15 1 11 10 9 今年優惠價 1 14 13 1 11 13 15 0 15 14 13 1 若以 α=0.05 檢定, 公司今年採行購機優惠方案, 是否對手機銷售具有促銷成效, 下列何者錯誤? (A) 虛無假設為 H0: 今年採行購機優惠方案之平均銷售量, 大於去年以原價推出之平均銷售量 (B) 本檢定應採用雙樣本成對檢定法 (C) 檢定統計量為 t=.863 (D) 拒絕 H0, 結論為 今年採行購機優惠方案之平均銷售量, 大於去年以原價推出之平均銷售量 49. 消費者基金會抽查市面上兩種品牌之飲料的容量在顯著水準為 0.05 時是否有差異 第一個品牌隨機抽取 100 個樣本, 平均數 X 1=.5, 變異數 s 1 =4.04 第二個品牌隨 機抽取 60 個樣本, 平均數 X =1.88, 變異數 s =4.87 下列哪一敘述是正確的 (A) 對立假設 (Alternative Hypothesis) 為 µ 1 µ = 0 (B) 在以 t 統計量進行檢定前, 應先以 F 統計量檢定兩母體之變異數是否有顯著差異, 以計算混合變異數 (Pooled Estimate of the Variance) (C) 檢定統計量之標準差為 0.43 (D) 兩母體平均數之差異檢定的標準化臨界值為 ±1.645 第 11 頁, 共 1 頁
中華應用統計學會 016 年第一回資料科學專業能力認證 50. 為教導幼兒認識性別, 某位幼稚園的老師提出一份教材, 該師於實驗前先擬好一 份認識性別問卷給受試幼兒填寫, 再於教授課程後給這群幼兒再做一次相同的問卷, 問卷中有問及 性別人我關係 指標, 令 µ 1 及 µ 分別表示性別人我指標的前測與後測平均值, 以下對於推論敘述何者正確? (A)H 0 : µ 1 = µ 與 H aa : µ 1 < µ, 對應檢定 p 值 <0.0001, 拒絕 H 0 表示性別人我指標的後測平均值沒有比較大 (B) H 0 : µ 1 = µ 與 H aa : µ 1 < µ, 對應檢定 p 值 <0.0001, 拒絕 H 0 表示性別人我指標的後測平均值明顯較大 (C) H 0 : µ 1 = µ 與 H aa : µ 1 µ, 對應檢定 p 值 <0.0001, 拒絕 H 0 表示性別人我指標的前測與後測平均值相似 (D) H 0 : µ 1 = µ 與 H aa : µ 1 µ, 對應檢定 p 值 <0.0001, 拒絕 H 0 表示性別人我指標的後測平均值明顯不同 第 1 頁, 共 1 頁
016 年第一回 CASA 資料科學專業能力認證統計分析能力證照試題解答 第一節科目 : 統計學分析與應用 1 3 4 5 6 7 8 9 10 (A) (C) (D) (C) (A) (C) (B) (D) (B) (A) 11 1 13 14 15 16 17 18 19 0 (A) (D) (A) (B) (A) (D) (B) (D) (C) (A) 1 3 4 5 6 7 8 9 30 (D) (A) (C) (D) (B) (A) (C) (A) (A) (C) 31 3 33 34 35 36 37 38 39 40 (D) (D) (C) (B) (C) (C) (A) (D) (A) (A) 41 4 43 44 45 46 47 48 49 50 (C) (C) (D) (A) (B) (C) (B) (A) (C) (D) 第 13 頁, 共 1 頁