教育學報31-2期.indd

Similar documents
11-3-Cover-1

Developing an Item Bank of Fraction Concepts Jyun-Ji Lin Ph. D. Candidate, Department of Psychology, National Chung Cheng University Yuh-Yin Wu Profes

92南師學術研討會

Journal of Curriculum Studies September, 2013, Vol. 8, No. 2, pp A Study of the Relationship between Senior High School Curriculum and the Mult

inter - rater intra - rater 101

作 主 动 追 求 知 识 获 取 技 能, 在 心 理 和 生 理 上 都 非 常 积 极 的 个 体 (Zimmerman & Pons, 1986) 在 此 期 间, 自 我 效 能 感 (self-efficacy) 自 我 控 制 (self-control) 自 我 管 理 (self-

66 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract This study aimed to analyze the implementing outcomes of ability grouping practice for freshman English at a u

Microsoft Word - z-vc85-王暄博

發 行 人 許 健 將 總 編 輯 許 健 將 編 輯 委 員 一 教 育 基 礎 與 理 論 領 域 黃 藿 國 立 中 央 大 學 法 律 與 政 府 研 究 所 教 授 馮 朝 霖 國 立 政 治 大 學 教 育 學 系 暨 幼 兒 教 育 研 究 所 教 授 姜 得 勝 國 立 嘉 義 大

第一章

13-4-Cover-1

STEAM STEAM STEAM ( ) STEAM STEAM ( ) 1977 [13] [10] STEM STEM 2. [11] [14] ( )STEAM [15] [16] STEAM [12] ( ) STEAM STEAM [17] STEAM STEAM STEA

20

從實驗教材到官方課程──小學社會科板橋模式教材與改編本教科書的發展

考試學刊第10期-內文.indd

國立中山大學學位論文典藏.PDF

2. 文 獻 探 討 2.1 大 眾 運 輸 之 特 性 大 眾 運 輸 有 兩 項 營 運 目 的 : 第 一 是 減 少 使 用 私 人 運 輸 工 具, 以 抒 解 交 通 壅 塞 的 現 象 ; 第 二 是 藉 此 達 到 所 得 重 分 配 的 效 果 [2] 根 據 Lovelock [

Microsoft Word doc

A study on the counseling psychologist examination qualification of examinees with foreign school records Chia-Hsin Lin Abstract Due to the increasing

Microsoft Word - A doc

59 1 MSLQ 2. MSLQ 2. 1 被 试 Kuhl 1987 Corno & Kanfer 1993 D rnyei % 111 commitment control strategies 37% 65 21% % metac

<4D F736F F D20322EA764AC57C0732DA668B443C5E9B1D0BEC7A4E8AED7B9EFB0EAA470B4BCAFE0BBD9C3AABEC7A5CDAEC9B6A1B7A7A9C0BEC7B2DFA6A8AEC4A4A7BC76C5545FA7EF32>

目 录

A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

<4D F736F F D D DA4E9AA76AEC9B4C1BB4FC657AAECB5A5BEC7AED5BDD2ABE1B8C9B2DFB867C5E7AAECB1B42E646F63>

金 鹏 等 体 育 锻 炼 缓 解 公 务 员 心 理 压 力 相 关 量 表 的 编 制 及 常 模 的 建 立 89 此, 本 文 从 探 索 性 研 究 入 手, 对 体 育 锻 炼 缓 解 公 务 员 心 理 压 力 展 开 研 究, 尝 试 编 制 一 个 基 于 本 土 化, 具 有 良

FOREIGN LANGUAGE RESEARCH 2018 No. 1 Serial No. 200 * H319 A DOI /j. cnki /h

穨423.PDF

Microsoft Word - 04-內文-02.doc

R1_C_V5.PDF

ming.PDF

语篇中指代词的分布规律与心理机制*

小組工作定義 (Lee, 1999)

Leisure Participation Type Differences And Leisure Satisfaction Differences Between Various Body Mass Indices: A Correlation Study To Taiwan s College


Avision

Microsoft Word doc

謝 誌 猶 記 得 六 年 前 初 入 教 育 界 如 誤 闖 叢 林 的 小 白 兔 般, 深 感 自 己 對 教 育 的 徬 徨 與 不 足, 因 而 毅 然 決 然 踏 入 碩 士 學 問 窄 門 課 堂 上 浩 瀚 的 知 識, 引 領 著 我, 同 時 也 備 感 挫 折 ; 寫 論 文

( s y s t e m ) ( s t r e s s ) (stress model) ( s y s t e m ) [ ] [ 5 ] C o x [ 3 ] 1 [ 1, 2 ] [ 6-8 ] [ 9 ] Tw Fam Med Res 2003 Vol.1 No.1 23

表演藝術團體網站內容分析之研究

cover.PDF

六 到 八 歲 兒 童, 設 計 並 發 展 一 套 以 van Hiele 幾 何 思 考 層 次 理 論 為 基 礎 的 悅 趣 化 學 習 數 位 教 材, 取 名 為 米 德 玩 形 狀, 同 時 探 討 低 年 級 學 童 在 使 用 本 數 位 教 材 之 後, 在 平 面 幾 何 的

,,,,, :IRT ; ; ; ( CIP ) /. :,2002 () ISBN H CIP (2002) ( ) : : : 890mm1240mm 1/ 32 :

第二部分

三、四級日文讀解試題之分析及其教學啟示

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

計 畫 案, 本 系 預 計 三 場 校 外 參 訪 活 動, 簡 述 如 下 : 參 訪 日 期 :3 月 28 日 ( 三 ), 參 訪 地 點 : 暨 南 大 學 集 集 小 鎮 參 訪 日 期 :4 月 27 日 ( 五 ), 參 訪 地 點 : 大 里 國 際 兒 童 英 語 村 國 立

58 特 殊 教 育 與 復 健 學 報 壹 研 究 動 機 與 背 景 教 育 成 敗, 繫 於 師 資 之 良 窳 教 育 部 於 2010 年 8 月 召 開 第 八 次 全 國 教 育 會 議 中, 師 資 培 育 與 專 業 發 展 為 一 項 重 要 的 討 論 議 題, 其 中 研 修

. 弘 光 學 報 65 期. 壹 前 言 脊 髓 損 傷 (spinal cord injury) 是 人 生 遭 遇 的 一 項 重 大 災 難 事 件, 常 與 意 外 伴 隨 發 生 例 如 車 禍 高 處 跌 落 等 ( 周 陳 賴,2008), 台 灣 每 年 約 有 一 千 兩 百 人

Microsoft Word - 01李惠玲ok.doc

穨CY03519.PDF

世界各國為追求經濟發展及提升競爭力致力於教育改革,以提高教育品質,教師在椒玉品質中具有關鍵性的地位,各國為確保師資品質一致無不進行師資培育改革政策的推動

日本、新加坡、中國大陸與台灣中小學教師評鑑制度比較研究

Microsoft Word - 89竹師學術2.doc

44(1) (1) (4) (4) 63-88TSSCI Liu, W. Y., & Teele S. (2009). A study on the intelligence profile

Vol. 16 No Λ1 1 1) 2;3) 4) 5;6) 6) Λ

度 身 體 活 動 量 ; 芬 蘭 幼 兒 呈 現 中 度 身 體 活 動 量 之 比 例 高 於 臺 灣 幼 兒 (5) 幼 兒 在 投 入 度 方 面 亦 達 顯 著 差 異 (χ²=185.35, p <.001), 芬 蘭 與 臺 灣 幼 兒 多 半 表 現 出 中 度 投 入 與 高 度

2011年南臺灣教育論壇

1

2 特 殊 教 育 與 復 健 學 報 緒 論 每 到 身 心 障 礙 學 生 升 學 大 專 校 院 甄 試 的 簡 章 公 佈 時, 高 中 職 老 師 都 可 以 聽 到 身 心 障 礙 學 生 問 : 為 什 麼 學 系 這 麼 少? 部 分 學 生 因 選 擇 少 而 不 參 加 甄 試

~ Capability Maturity Model Integration, CMMI CMMI

11-4-人文封面

Microsoft Word - 06会计学( ).doc

Microsoft Word - 4羅筱芬.doc

Haven of Hope Chrristian Service_inside_final.indd

Microsoft Word - 1-編者的話

EXAMINATIONS RESEARCH No General No. 37 姚 霞 本文在分析 PISA TIMSS 和 NEAP 三项国际学生科学素养测评现状 的基础上, 提出对我国科学素养测评的启示 : 1. 明确测评目标和测试框架, 在深入研究课程教材的

教 育 科 學 期 刊

續論

第一章 緒論

1

優 秀 的 構 圖 設 計 可 以 引 起 眾 的 注 意, 書 籍 封 面 的 構 圖 影 響 消 費 者 的 購 買 意 願 海 報 設 計 的 構 圖 影 響 的 傳 達 效 益 照 片 的 構 圖 影 響 美 感 的 表 現 與 傳 遞 經 典 名 作 在 構 圖 上 皆 有 細 膩 的 安

成 果 報 告 行 政 院 國 家 科 學 委 員 會 補 助 專 題 研 究 計 畫 期 中 進 度 報 告 九 年 一 貫 課 程 自 然 與 生 活 科 技 領 域 科 學 探 究 能 力 之 培 養 研 究 - 子 計 畫 二 : 科 學 探 究 能 力 之 評 量 (III) 計 畫 類

(單位名稱)大事記---96學年度(96

84 國 家 圖 書 館 館 刊 一 二 年 第 二 期 ( ) 一 前 言 在 知 識 經 濟 的 時 代, 閱 讀 力 是 提 升 國 家 競 爭 力 的 關 鍵, 是 一 個 人 有 文 化 涵 養 重 要 標 誌 洪 蘭 曾 志 朗 認 為 面 對 二 十 一 世 紀 資 訊 爆

Microsoft Word - 33-p skyd8.doc

a a a 1. 4 Izumi et al Izumi & Bigelow b

Transcription:

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 TIMSS 2007 * ** TIMSS 2007 TIMSS 2007 287 R 2.13.1 Excel 2003 SPSS 12.0 ConQuest 2.0 PCM TIMSS DOI: 10.3966/199679772014123102003 2013 12 31 2014 3 252014 4 10 * E-mail: aguri.su@gmail.com ** 67

新竹教育大學教育學報 第三十一卷第二期 classical test theory, CTT Gullikson, 1987; Lord & Novick, 1968 true score model modern test theory Lord, 1980 item response theory, IRT 1991 Embretson & Reise, 2000 Trends in International Mathematics and Science Study, TIMSS International Association for the Evaluation of Educational Achievement, IEA TIMSS 2007 TIMSS 68

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 TIMSS 2007 TIMSS 2007 TIMSS 2007 TIMSS 2007 1. 2. 69

新竹教育大學教育學報 第三十一卷第二期 1999 Embretson & Reise, 2000 2006 Embretson Reise 2000 1 1 Item response theory for psychologists, by S. E. Embretson & S. Reise, Mahwah, NJ: Lawrence Erlbaum Associates. 70

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 1 Rasch model Linear logistic test model, LLTM 1 2006 Embretson & Reise, 2000 71

新竹教育大學教育學報 第三十一卷第二期 American Educational Research Association American Psychological Association National Council on Measurement in Education [AERA, APA, NCME] 1999 1999 Lord 1980 standard error, SE IRT 2006 1992b 72

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 Embretson & Reise, 2000 Bond Fox 2007 Raschinfit outfit outfit infit 11 1±0.3 logit joint maximum likelihood, JML marginal maximum likelihood, MML conditional maximum likelihood, CML Embretson Reise 2000 1992a 73

新竹教育大學教育學報 第三十一卷第二期 TIMSS TIMSS 2007 1 74

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 TIMSS 2007 TIMSS 2007 1 1 TIMSS 2007 TIMSS 2007 4,046 13.5 150 1 2 75

新竹教育大學教育學報 第三十一卷第二期 booklet 1 287 M01 M02 M01 TIMSS 2003 13 M02 TIMSS 200716 29 45 2 2 TIMSS 2007 M01 M02 M01 M02 M01 M02 M01 M02 M01 M02 2 2 1 2 0 1 0 1 3 6 4 3 0 0 4 1 1 2 9 6 0 0 0 2 1 1 0 1 1 4 6 5 1 4 5 3 1 4 29 1 0 16 1 0 21 0 9 4 1329 TIMSS 2007TIMSS http://timss.bc.edu/index.html 76

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 TIMSS 2007 0 R CTT Excel 2003 R erm SPSS 12.0 Excel 2003 ConQuest 2.0 Wu, Adams, & Wilson, 2007 287 partial credit model, PCM Masters, 1982 θi x x = 0,,m i i m i +1 x = j P ix (θ)= exp[ x j =0 (θ - δ ij )] [ mi exp[ r j =0 (θ- δ ij )] r=0 1 0 j =0 (θ - δ ij ) 0 δ ij j = 1,, m i jstep difficulty Embretson & Reise, 2000 θ i j 77

新竹教育大學教育學報 第三十一卷第二期 δ ij 0 1 2 SPSS 12.0 R erm infit outfit erm 2006 Rasch Rasch erm ConQuest 2.0eRm [p' i (θ)] 2 I i θ= i=1,,n 2 P i (θ) Q i (θ) 2 I i (θ) i θ p' i (θ) θ P i (θ)p i (θ) θ i Q i (θ)=1-p i (θ) 1992b standard error, SE 2006θ θ 1992b 1 78

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 Cronbach's alpha 0.90 Cronbach's alpha 0.90 2 10 2 79

新竹教育大學教育學報 第三十一卷第二期 1999 2006Cronbach s alpha Embretson Reise 2000 1991 TIMSS 2007 Olson, Martin, & Mullis, 2008 TIMSS & PIRLS International Study Center Science and Mathematics Item Review Committee [SMIRC] TIMSS 2007 Crocker Algina 1986 3 80

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 3 TIMSS 2007 Crocker & Algina 1986 Crocker Algina 1986 TIMSS 2007 1. 2. National Research Coordinators [NRC] 3. 4. NRC 5. SMIRC NRC 6. 45 25 7. 8. 9. NRC 429 10. 1. TIMSS 2007 2. 3. NRC 4. NRC SMIRC 81

新竹教育大學教育學報 第三十一卷第二期 TIMSS Crocker Algina 1986 Bartlett 2,918.64 p =.000 17 9.1431.51% 1.344.64% 3 3 Reckase 1979 3 6.82 3 Reckase 1979 Hattie 1985 82

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 Cronbach's alpha 0.90 4 4 Outfit MSQ Infit MSQ Outfit MSQ Infit MSQ M022043 1.69* 1.30 M042018 0.64* 0.89 M022046 0.87 0.99 M042055 0.97 1.01 M022049 1.44* 1.29 M042039 1.31* 1.31* M022050 0.85 0.93 M042199 0.42* 0.81 M022055 0.81 0.81 M042301A 0.93 1.05 M022057 1.47* 1.35* M042301B 0.64* 0.79 M022257 0.61* 0.82 M042301C 0.53* 0.62* M022062 0.97 0.91 M042263 0.84 0.87 M022066 0.33* 0.70 M042265 1.13 1.11 M022232 1.17 0.95 M042137 0.90 1.02 M022234A 1.06 1.01 M042148 0.70 0.93 M022234B 0.91 1.01 M042254 0.76 0.98 M022243 0.74 0.80 M042250 0.38* 0.85 M042003 1.70* 1.16 M042220 1.47* 1.20 M042079 0.78 0.82 * 1±0.3 4 Outfit MSQ Infit MSQ 1 1 0.7~1.3 Bond & Fox, 2007 M022057 M042039 M042301C 4 6 4M022057 0.7~1.3 6 M042039 5 M042301C 5 0.70.7 83

新竹教育大學教育學報 第三十一卷第二期 4 M022057 5 M042301C 6 M042039 4 6 84

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 1991 weak assumption strong assumptions IRT 2006 1 29 140.80 14 0.60~0.80 M022232 0.30 1999 0.50 2928 0.3 1 M022049 0.3 5 85

新竹教育大學教育學報 第三十一卷第二期 5 TIMSS 2007 1 2 1 2 M042250-2.89 M042137-0.49 M042254-2.04 M042301B -0.44 M022066-1.62 M042301C -0.17 M042199-1.58 M022243-0.12 M022046-1.53 M042265-0.03 M042079-1.44 M022050 0.16 M042148-1.44 M022055 0.36 M042003-1.20 M042263 0.39 M022049-1.02 M022057 0.49 M042018-0.92 M042039 0.51 M042301A -0.92 M022232* 2.14 4.32-0.05 M022257-0.82 M022234A* 0.83 1.88-0.22 M042055-0.79 M022234B* 0.69 2.45-1.08 M022043-0.67 M042220* 0.22 2.37-1.92 M022062-0.52 * 0 1 2 0 1 5-3 ~ 0.5 logit 0 ~ 2 logit 1 1 7 10 Wu Adams 2007 1 TIMSS 2007 86

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 1 Generalized partial credit model, GPCM Muraki, 1992-0.96 7 M022232 8 M022234A 9 M022234B 10 M042220 87

新竹教育大學教育學報 第三十一卷第二期 2006 IRT IRT 11 12 6 88

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 M022057 Content domain number Cognitive domain applying Maximum points 1 key C 1426 15% (A) 200 (B) 300 (C) 1200 (D) 1600 (E) 1700 11 M022057 TIMSS 2007 http://www.dorise.info/der/01_timss_2007_html/index. html M042039 Content domain number Cognitive domain applying Maximum points 1 key A 60 30% (A) 18 (B) 24 (C) 30 (D) 42 12 M042039 TIMSS 2007 http://www.dorise.info/der/01_timss_2007_html/index. html 89

新竹教育大學教育學報 第三十一卷第二期 6 TIMSS 2007 M022057 A 0.17 0.25 0.00 B 0.15 0.03 0.00 C* 0.40 0.67 1.00 D 0.22 0.02 0.00 X 0.06 0.02 0.00 M042039 A* 0.45 0.62 1.00 B 0.06 0.01 0.00 C 0.27 0.02 0.00 D 0.22 0.35 0.00 X 0.00 0.00 0.00 1. X 2. * M022057 M042039 M022057 A M042039 D M022057 A M042039 D 13 14 90

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 13 M22057 14 M042039 ConQuest 2.0 11 12 M022057 15% AM042039 D 91

新竹教育大學教育學報 第三十一卷第二期 7 7 TIMSS 2007 3-3.01 0.64 19 0.13 0.37 5-2.34 0.53 20 0.27 0.37 6-2.08 0.49 21 0.41 0.38 7-1.85 0.47 22 0.56 0.38 8-1.64 0.45 23 0.71 0.39 9-1.44 0.44 24 0.86 0.40 10-1.26 0.42 25 1.02 0.41 11-1.08 0.41 26 1.20 0.43 12-0.91 0.41 27 1.40 0.45 13-0.75 0.40 28 1.62 0.48 14-0.59 0.39 29 1.87 0.52 15-0.44 0.39 30 2.17 0.58 16-0.29 0.38 31 2.55 0.67 17-0.15 0.38 32 3.16 0.93 18-0.01 0.38 33 3.82 NA NA 7 92

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 8 8 Cronbach's alpha Cronbach's alpha M022057 M042039 M042301C 0.6 1 M022057 M042039 M022232 M022234A M022234B M042220 M022057 M042039 93

新竹教育大學教育學報 第三十一卷第二期 Cronbach's alpha 0.90Cronbach's alpha 0.90 TIMSS 2007 0.6 M022057 M042039 M022057 M042039 M042301C M042301C -3 ~ 0.5 logit 1 M022232 M022234A M022234B M042220 1 M022057 M042039 94

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 2011 Embretson & Reise, 2000 95

新竹教育大學教育學報 第三十一卷第二期 M022057 M042039 M022232 0.3 IRT 2.14 0 69% 1 3% 2 28% 0.64~0.9 IRT -1.62~0.51 215 M022232 Content domain number Cognitive domain applying Maximum points 2 95 70 5 95 90 90 85 85 80 80 75 75 70 2 10 3 19 4 48 6 55 9 43 95 70 15 M022232 TIMSS 2007 http://www.dorise.info/der/01_timss_2007_html/index. html 96

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 number sense National Council of teachers of Mathematics, NCTM 1989 1997 2006 Gurganus 2004 Gurganus 97

新竹教育大學教育學報 第三十一卷第二期 M022057 M042039 M022232 TIMSS 98

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 GPCM General Partial Credit Model Muraki, 1992 Olson et al., 2008 Testlet Response Theory, TRT NSC103-2911-I-003-301 99

新竹教育大學教育學報 第三十一卷第二期 1997 8 83-116 1991 8(6) 13-18 1992a 9(1) 5-9 1992b 9(6) 5-9 200646(3) 101-110 1999 2006 http://www. rcpet.ntnu.edu.tw/irt%e5%9c%a8%e9%87%8f%e8%a1%a8%e7 %B7%A8%E8%A3%BD%E4%B8%8A%E7%9A%84%E6%87%89% E7%94%A8(%E4%B8%8B)95.1.2.doc 2011 American Educational Research Association, American Psychological Association, National Council on Measurement in Education [AERA, APA, NCME] (1999). Standards for educational and psychological testing. Washington, DC: American Educational Research Association, American Psychological Association, National Council on Measurement in Education. Bond, T. G., & Fox, C. M. (2007). Applying the Rasch model: Fundamental measurement in the human sciences (2nd ed.). Mahwah, NJ: Lawrence Erlbaum Associates. Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory. New York, NY: Holt, Rinehart and Winston. Embretson, S. E., & Reise, S. (2000). Item response theory for psychologists. Mahwah, NJ: Lawrence Erlbaum Associates. 100

從 TIMSS 2007 臺灣八年級學生數學科作答反應檢視古典測驗理論和試題反應理論特性和測驗分析結果 Gullikson, H. (1987). Theory of mental tests. Hillsdale, NJ: Lawrence Erlbaum Associates. Gurganus, S. (2004). Promote number sense. Intervention in School and Clinic, 40(1), 55-58. Hattie, J. (1985). Methodology review: Assessing unidimensionality of tests and items. Applied Psychological Measurement, 9, 139-164. Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbawn Associates. Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley. Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47, 149-174. Muraki, E. (1992). A generalized partial credit model: Application of an EM algorithm. Applied Psychological Measurement, 16, 159-176. Olson, J. F., Martin, M. O., & Mullis, I. V. S. (Eds.). (2008). TIMSS 2007 Technical Report. International Study Center, Boston College, Chestnut Hill, MA: TIMSS & PIRLS. Reckase, M. D. (1979). Unifactor latent trait models applied to multifactor tests: Results and implications. Journal of Educational Statistics, 4, 207-230. Wu, M., & Adams, R. (2007). Applying the Rasch model to psycho-social measurement: A practical approach. Melbourne, Australia: Educational Measurement Solutions. Wu, M. L., Adams, R. J., & Wilson, M. R. (2007). ACER ConQuest: Generalized item response modeling software (2nd ed.). Hawthorn, Australia: Australia Council for Educational Research. 101

新竹教育大學教育學報 第三十一卷第二期 Inspecting the Characteristics of the Classical Test Theory and Item Response Theory by Using Test Analysis Results and the Responses of Taiwanese Eighth-Grade Students in the TIMSS 2007 Database Hsu- Lin Su* Po-Hsi Chen** Abstract The purpose of this study was to investigate the characteristics of classical test theory (CTT) and item response theory (IRT) by using the responses given by eighth-grade Taiwanese students in the TIMSS 2007 database to conduct test and item analysis from 2 distinct test perspectives, to provide benefit for test design and education settings. A total of 287 students were included in the research, and Booklet 1 was selected as the research tool. Software such as R 2.13.1, Excel 2003, SPSS 12.0, and ConQuest 2.0 were used during data analysis and curve drawing. The results showed that the test difficulty ranged from medium to easy, and the 2 distractors embedded respectively in the 2 items showed that the proportion of average students was more than that of below-average students, according to the aforementioned theories. Moreover, item characteristic curves of 4 multiplechoice items were not ordered. In general, the test quality was high, despite slight flaws meaning that some items could not differentiate average students. However, items were easy for students. The reliability, construct validity, item parameters, category analysis, and overall scores of the test takers in CTT corresponded to concepts of test information function, construct validity, and model fit assessing, item parameters, item and category characteristic curves, abilities of participants in the IRT. The relative strengths of the IRT lie in test information function, latent trait assumption, and parameter invariance and test equating. Regarding the test design and educational implications, we suggest modifying presentations of 2 distractors and making connection to number sense education owing to a specific difficult item. Keywords: classical test theory (CTT), item response theory (IRT), PCM, TIMSS DOI: 10.3966/199679772014123102003 Section editor: Shwu-Ching Young Received: December 31, 2013; Modified: March 25, 2014; Accepted: April 10, 2014 * Hsu-Lin Su, Doctoral student, Department of Educational Psychology and Counseling, National Taiwan Normal University, E-mail: aguri.su@gmail.com ** Po-Hsi Chen, Associate Professor, Department of Educational Psychology and Counseling, National Taiwan Normal University 102