碩博士論文授權書

Similar documents

% %! # % & ( ) % # + # # % # # & & % ( #,. %


! Ν! Ν Ν & ] # Α. 7 Α ) Σ ),, Σ 87 ) Ψ ) +Ε 1)Ε Τ 7 4, <) < Ε : ), > 8 7

!! # % & ( )!!! # + %!!! &!!, # ( + #. ) % )/ # & /.

%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

01.dvi

! # % & # % & ( ) % % %# # %+ %% % & + %, ( % % &, & #!.,/, % &, ) ) ( % %/ ) %# / + & + (! ) &, & % & ( ) % % (% 2 & % ( & 3 % /, 4 ) %+ %( %!

! # %& ( %! & & + %!, ( Α Α Α Α Χ Χ Α Χ Α Α Χ Α Α Α Α

&! +! # ## % & #( ) % % % () ) ( %

. /!Ι Γ 3 ϑκ, / Ι Ι Ι Λ, Λ +Ι Λ +Ι

Ρ Τ Π Υ 8 ). /0+ 1, 234) ς Ω! Ω! # Ω Ξ %& Π 8 Δ, + 8 ),. Ψ4) (. / 0+ 1, > + 1, / : ( 2 : / < Α : / %& %& Ζ Θ Π Π 4 Π Τ > [ [ Ζ ] ] %& Τ Τ Ζ Ζ Π

& & ) ( +( #, # &,! # +., ) # % # # % ( #

國立中山大學學位論文典藏.PDF

., /,, 0!, + & )!. + + (, &, & 1 & ) ) 2 2 ) 1! 2 2

) & ( +,! (# ) +. + / & 6!!!.! (!,! (! & 7 6!. 8 / ! (! & 0 6! (9 & 2 7 6!! 3 : ; 5 7 6! ) % (. ()

,!! #! > 1? = 4!! > = 5 4? 2 Α Α!.= = 54? Β. : 2>7 2 1 Χ! # % % ( ) +,. /0, , ) 7. 2

: ; # 7 ( 8 7

, ( 6 7 8! 9! (, 4 : : ; 0.<. = (>!? Α% ), Β 0< Χ 0< Χ 2 Δ Ε Φ( 7 Γ Β Δ Η7 (7 Ι + ) ϑ!, 4 0 / / 2 / / < 5 02

4= 8 4 < 4 ϑ = 4 ϑ ; 4 4= = 8 : 4 < : 4 < Κ : 4 ϑ ; : = 4 4 : ;

# # # #!! % &! # % 6 & () ) &+ & ( & +, () + 0. / & / &1 / &1, & ( ( & +. 4 / &1 5,

! /. /. /> /. / Ε Χ /. 2 5 /. /. / /. 5 / Φ0 5 7 Γ Η Ε 9 5 /


, & % # & # # & % & + # & # # # & # % #,

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

: ; 8 Β < : Β Δ Ο Λ Δ!! Μ Ν : ; < 8 Λ Δ Π Θ 9 : Θ = < : ; Δ < 46 < Λ Ρ 0Σ < Λ 0 Σ % Θ : ;? : : ; < < <Δ Θ Ν Τ Μ Ν? Λ Λ< Θ Ν Τ Μ Ν : ; ; 6 < Λ 0Σ 0Σ >

Β 8 Α ) ; %! #?! > 8 8 Χ Δ Ε ΦΦ Ε Γ Δ Ε Η Η Ι Ε ϑ 8 9 :! 9 9 & ϑ Κ & ϑ Λ &! &!! 4!! Μ Α!! ϑ Β & Ν Λ Κ Λ Ο Λ 8! % & Π Θ Φ & Ρ Θ & Θ & Σ ΠΕ # & Θ Θ Σ Ε

/ Ν #, Ο / ( = Π 2Θ Ε2 Ρ Σ Π 2 Θ Ε Θ Ρ Π 2Θ ϑ2 Ρ Π 2 Θ ϑ2 Ρ Π 23 8 Ρ Π 2 Θϑ 2 Ρ Σ Σ Μ Π 2 Θ 3 Θ Ρ Κ2 Σ Π 2 Θ 3 Θ Ρ Κ Η Σ Π 2 ϑ Η 2 Ρ Π Ρ Π 2 ϑ Θ Κ Ρ Π

) Μ <Κ 1 > < # % & ( ) % > Χ < > Δ Χ < > < > / 7 ϑ Ν < Δ 7 ϑ Ν > < 8 ) %2 ): > < Ο Ε 4 Π : 2 Θ >? / Γ Ι) = =? Γ Α Ι Ρ ;2 < 7 Σ6 )> Ι= Η < Λ 2 % & 1 &

!!! #! )! ( %!! #!%! % + % & & ( )) % & & #! & )! ( %! ),,, )

# #! ) ( ( +,! %,! ( # # %& % ( ) +! +, +. /

8 9 8 Δ 9 = 1 Η Ι4 ϑ< Κ Λ 3ϑ 3 >1Ε Μ Ε 8 > = 8 9 =

8 9 < ; ; = < ; : < ;! 8 9 % ; ϑ 8 9 <; < 8 9 <! 89! Ε Χ ϑ! ϑ! ϑ < ϑ 8 9 : ϑ ϑ 89 9 ϑ ϑ! ϑ! < ϑ < = 8 9 Χ ϑ!! <! 8 9 ΧΧ ϑ! < < < < = 8 9 <! = 8 9 <! <

( ) (! +)! #! () % + + %, +,!#! # # % + +!

! + +, ) % %.!&!, /! 0! 0 # ( ( # (,, # ( % 1 2 ) (, ( 4! 0 & 2 /, # # ( &

现代天文学7.ppt

3?! ΑΑΑΑ 7 ) 7 3

> # ) Β Χ Χ 7 Δ Ε Φ Γ 5 Η Γ + Ι + ϑ Κ 7 # + 7 Φ 0 Ε Φ # Ε + Φ, Κ + ( Λ # Γ Κ Γ # Κ Μ 0 Ν Ο Κ Ι Π, Ι Π Θ Κ Ι Π ; 4 # Ι Π Η Κ Ι Π. Ο Κ Ι ;. Ο Κ Ι Π 2 Η

2 2 Λ ϑ Δ Χ Δ Ι> 5 Λ Λ Χ Δ 5 Β. Δ Ι > Ε!!Χ ϑ : Χ Ε ϑ! ϑ Β Β Β ϑ Χ Β! Β Χ 5 ϑ Λ ϑ % < Μ / 4 Ν < 7 :. /. Ο 9 4 < / = Π 7 4 Η 7 4 =

4 # = # 4 Γ = 4 0 = 4 = 4 = Η, 6 3 Ι ; 9 Β Δ : 8 9 Χ Χ ϑ 6 Κ Δ ) Χ 8 Λ 6 ;3 Ι 6 Χ Δ : Χ 9 Χ Χ ϑ 6 Κ

9!!!! #!! : ;!! <! #! # & # (! )! & ( # # #+

= Υ Ξ & 9 = ) %. Ο) Δ Υ Ψ &Ο. 05 3; Ι Ι + 4) &Υ ϑ% Ο ) Χ Υ &! 7) &Ξ) Ζ) 9 [ )!! Τ 9 = Δ Υ Δ Υ Ψ (

!! )!!! +,./ 0 1 +, 2 3 4, # 8,2 6, 2 6,,2 6, 2 6 3,2 6 5, 2 6 3, 2 6 9!, , 2 6 9, 2 3 9, 2 6 9,

%% &% %% %% %% % () (! #! %!!!!!!!%! # %& ( % & ) +, # (.. /,) %& 0

Microsoft Word - ACL chapter02-5ed.docx

Microsoft Word - _m30.doc

4

6-1-1極限的概念

Α 3 Α 2Η # # > # 8 6 5# Ι + ϑ Κ Ι Ι Ι Η Β Β Β Β Β Β ΔΕ Β Β Γ 8 < Φ Α Α # >, 0 Η Λ Μ Ν Ο Β 8 1 Β Π Θ 1 Π Β 0 Λ Μ 1 Ρ 0 Μ ϑ Σ ϑ Τ Ο Λ 8 ϑ

< < ; : % & < % & > & % &? > & 5 % & ( ; & & % & Α Β + 8 ; Α9 Χ Δ () Χ Δ Ε 41 Φ # (Β % Γ : 9 Χ Δ Η +9 Χ Δ 2 9 Χ Δ 2 0 /? % & Ι 1 ϑ Κ 3 % & % & + 9 Β 9

《分析化学辞典》_数据处理条目_1.DOC

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

zt


M ( ) K F ( ) A M ( ) 1815 (probable error) F W ( ) J ( ) n! M ( ) T ( ) L ( ) T (171

# # 4 + % ( ) ( /! 3 (0 0 (012 0 # (,!./ %

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

《分析化学辞典》_数据处理条目_2.DOC

Β Χ Χ Α Β Φ Φ ; < # 9 Φ ; < # < % Γ & (,,,, Η Ι + / > ϑ Κ ( < % & Λ Μ # ΝΟ 3 = Ν3 Ο Μ ΠΟ Θ Ρ Μ 0 Π ( % ; % > 3 Κ ( < % >ϑ Κ ( ; 7

ϑ 3 : Α 3 Η ϑ 1 Ι Η Ι + Ι 5 Κ ϑ Λ Α ΜΛ Ν Ν Ν Ν Α Γ Β 1 Α Ο Α : Α 3. / Π Ο 3 Π Θ

! # %! #! #! # % + &, % % ) %. /! # 0 1

& &((. ) ( & ) 6 0 &6,: & ) ; ; < 7 ; = = ;# > <# > 7 # 0 7#? Α <7 7 < = ; <

PowerPoint 簡報

Φ2,.. + Φ5Β( 31 (+ 4, 2 (+, Η, 8 ( (2 3.,7,Χ,) 3 :9, 4 (. 3 9 (+, 52, 2 (1 7 8 ΙΜ 12 (5 4 5? ), 7, Χ, ) 3 :9, 4( > (+,,3, ( 1 Η 34 3 )7 1 )? 54

9! >: Ε Φ Ε Ε Φ 6 Φ 8! & (, ( ) ( & & 4 %! # +! ; Γ / : ; : < =. ; > = >?.>? < Α. = =.> Β Α > Χ. = > / Δ = 9 5.


% & :?8 & : 3 ; Λ 3 3 # % & ( ) + ) # ( ), ( ) ). ) / & /:. + ( ;< / 0 ( + / = > = =? 2 & /:. + ( ; < % >=? ) 2 5 > =? 2 Α 1 Β 1 + Α

Microsoft PowerPoint - 概率统计Ch02.ppt [Compatibility Mode]

untitled

Ψ! Θ! Χ Σ! Υ Χ Ω Σ Ξ Ψ Χ Ξ Ζ Κ < < Κ Ζ [Ψ Σ Ξ [ Σ Ξ Χ!! Σ > _ Κ 5 6!< < < 6!< < α Χ Σ β,! Χ! Σ ; _!! Χ! Χ Ζ Σ < Ω <!! ; _!! Χ Υ! Σ!!!! ββ /β χ <

?.! #! % 66! & () 6 98: +,. / / 0 & & < > = +5 <. ( < Α. 1

! Β Β? Β ( >?? >? %? Γ Β? %? % % %? Χ Η Ιϑ Κ 5 8 Λ 9. Μ Ν Ο Χ? Π Β # % Χ Χ Θ Ρ% Ρ% Θ!??? % < & Θ

APA Preliminaries Text Reference 1. Cover Page 2. Title Page 3. Signature Page 4. Advisor s recommendation letter 5. Approval page 6. Copyri

9 : : ; 7 % 8

% % %/ + ) &,. ) ) (!

; < 5 6 => 6 % = 5

8 8 Β Β : ; Χ; ; ; 8 : && Δ Ε 3 4Φ 3 4Φ Ε Δ Ε > Β & Γ 3 Γ 3 Ε3Δ 3 3 3? Ε Δ Δ Δ Δ > Δ # Χ 3 Η Ι Ι ϑ 3 Γ 6! # # % % # ( % ( ) + ( # ( %, & ( #,.


Β Χ + Δ Ε /4 10 ) > : > 8 / 332 > 2 / 4 + Φ + Γ 0 4 Η / 8 / 332 / 2 / 4 + # + Ι + ϑ /) 5 >8 /3 2>2 / 4 + ( )( + 8 ; 8 / 8. 8 :

Ε? Φ ) ( % &! # +. 2 ( (,

= Β Χ Δ

7 6 Η : Δ >! % 4 Τ & Β( Β) 5 &! Α Υ Υ 2 Η 7 %! Φ! Β! 7 : 7 9 Λ 9 :? : 9 Λ Λ 7 Φ! : > 9 : 7Δ 2 Η : 7 ΛΔ := ς : Ν 7 Λ Δ = Ν : Ν 7 ΛΔ : = Λ ς :9 Λ 7 Λ! Λ

Microsoft Word - ACI chapter00-1ed.docx

1#

1 <9= <?/:Χ 9 /% Α 9 Δ Ε Α : 9 Δ 1 8: ; Δ : ; Α Δ : Β Α Α Α 9 : Β Α Δ Α Δ : / Ε /? Δ 1 Δ ; Δ Α Δ : /6Φ 6 Δ

!,! = Α ΒΑ 9 9 : 9 Α ) Χ Α : < ΒΑ # < # Χ 8 Δ Α 6 Φ Ε Φ Ε Γ 9 % : Η < 9Χ : Ι # 8 9Χ :Ι 9:Ι Δ 9: Φ 7 : Δ = = 7! Δ ; Χ ΒΑ! < # ; % > Χ = Η 9: ϑ Α ϑ Η! 9

Α? Β / Χ 3 Δ Ε/ Ε 4? 4 Ε Φ? ΧΕ Γ Χ Η ΙΙ ϑ % Η < 3 Ε Φ Γ ΕΙΙ 3 Χ 3 Φ 4 Κ? 4 3 Χ Λ Μ 3 Γ Ε Φ ) Μ Ε Φ? 5 : < 6 5 % Λ < 6 5< > 6! 8 8 8! 9 9 9! 9 =! = 9!

9 < 9 Α Α < < < Β= =9 Χ 9Β 78! = = 9 ΦΑ Γ Η8 :Ι < < ϑ<; Β Β! 9 Χ! Β Χ Δ Ε <Β Α Α = Α Α Ι Α Α %8 Β < 8 7 8! 8 =

Ρ 2 % Ε Φ 1 Φ Δ 5 Γ Η Ε Ι ϑ 1 Κ Δ ϑ Ι 5 Δ Ε Κ Β 1 2 Ι 5 Κ Ι 78 Χ > > = > Λ= =!? Λ Λ!???!? Λ?? Χ # > Λ= = >?= =!? Λ?!?!? Λ Λ Α =? Α &<&. >!= = = = = Α

ACI pdf

; 9 : ; ; 4 9 : > ; : = ; ; :4 ; : ; 9: ; 9 : 9 : 54 =? = ; ; ; : ;

untitled

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

:::: : : : :::: :: :: :::::: :::: < ; 7 7 ; ; % < = = > = / =?? Α Β.. Β Χ (. 7 > 5 / Δ 6 Ε. Φ Δ 5 / 6 Ε. Φ 1 Γ 5 / 6 7 Η (. >5 Ι Δ 6 Φ ϑ

! ΑΒ 9 9 Χ! Δ? Δ 9 7 Χ = Δ ( 9 9! Δ! Δ! Δ! 8 Δ! 7 7 Δ Δ 2! Χ Δ = Χ! Δ!! =! ; 9 7 Χ Χ Χ <? < Χ 8! Ε (9 Φ Γ 9 7! 9 Δ 99 Φ Γ Χ 9 Δ 9 9 Φ Γ = Δ 9 2

第壹拾篇

! # Χ Η Ι 8 ϑ 8 5 Χ ΚΗ /8 Η/. 6 / Λ. /. Η /. Α Α + Α 0. Η 56 + Α : Α Μ / Η +9 Δ /. : Α : ϑ. Η. /5 % Χ

3 4 Ψ Ζ Ζ [, Β 7 7>, Θ0 >8 : Β0 >, 4 Ε2 Ε;, ] Ε 0, 7; :3 7;,.2.;, _ & αε Θ:. 3 8:,, ), β & Φ Η Δ?.. 0?. χ 7 9 Ε >, Δ? Β7 >7 0, Τ 0 ΚΚ 0 χ 79 Ε >, Α Ε

Transcription:

國立 央大學 統計研究所 碩士論文 拔靴法 (Bootstrap) 之探討及其應用 研究生 : 周心怡 指導教授 : 呂理裕博士 華民國九十㆔年六月

國立 央大學圖書館碩博士論文電子檔授權書 (93 年 5 月最新修正版 ) 本授權書所授權之論文全文電子檔, 為本 於國立 央大學, 撰寫之碩 / 博士學位論文 ( 以 請擇㆒勾選 ) (! ) 同意 ( 立即開放 ) ( ) 同意 ( ㆒年後開放 ), 原因是 : ( ) 同意 ( ㆓年後開放 ), 原因是 : ( ) 不同意, 原因是 : 以非專屬 無償授權國立 央大學圖書館與國家圖書館, 基於推動讀者間 資源共享 互惠合作 之理念, 於回饋社會與學術研究之目的, 得不限 域 時間與次數, 以紙本 微縮 光碟及其它各種方法將 列論文收錄 重製 公開陳列 與發行, 或再授權他 以各種方法重製與利用, 並得將數位化之 列論文與論文電子檔以 載網路方式, 提供讀者基於個 非營利性質之線 檢索 閱覽 載或列印 研究生簽名 : 論文名稱 : 周心怡 拔靴法 (Bootstrap) 之探討及其應用 指導教授姓名 : 呂理裕 系所 : 統計所 " 博士 # 碩士班 學號 : 92250 日期 : 民國 93 年 6 月 5 日 備註 :. 本授權書請填寫並親筆簽名後, 裝訂於各紙本論文封面後之次頁 ( 全文電子檔內之授權書簽名, 可用電腦打字代替 ) 2. 請加印㆒份單張之授權書, 填寫並親筆簽名後, 於辦理離校時交圖書館 ( 以統㆒代轉寄給國家圖書館 ) 3. 讀者基於個 非營利性質之線 檢索 閱覽 載或列印 列論文, 應依著作權法相關規定辦理

摘要拔靴法是㆒項應用電腦的統計分析方法, 在資料來源分配未知的情況, 可運用拔靴法去作估計及統計推論, ㆒般而言, 拔靴所提供的近似會比常用的極限近似來得精確 因此, 拔靴法在 979 年由 Efro 提出後, 即大量的被用於統計分析 在本文, 以拔靴法為基礎利用 Bootstrap ormal,bootstrap percetile,basic,bootstrap-t, BC percetile 以及 BCa percetile 法等六種方法對指數分配, 伽瑪分配, 及韋伯分配之參數建構其信賴區間 另外, 再介紹兩種修正方法 Balaced 及 Double 法, 以期增加信賴區間的精確度 最後則是以覆蓋機率, 信賴區間平均長度及信賴區間長度變異量這㆔項評量標準來選擇出最佳的信賴區間估計法 研究 發現, 有母數拔靴法之區間估計較無母數拔靴法之區間估計為佳 而在六種信賴區間的方法, 以 Bootstrap-t,BC percetile 及 BCa percetile 法有較好的結果 但在兩個修正方法, 則在這㆔個例子, 並無表現出明顯的效果

目錄 第㆒章緒論.... 研究動機與文獻回顧....2 本文架構...2 第㆓章拔靴法之信賴區間估計方法...3 2. 拔靴法簡介...3 2.2 Bootstrap ormal 法...6 2.3 Bootstrap percetile 法...8 2.4 Basic 法... 0 2.5 Bootstrap-t 法... 2.6 修正之 Bootstrap percetile 法... 3 第㆔章拔靴法之改進...8 3. Balaced 法... 8 3.2 Double 法... 20 第㆕章信賴區間模擬範例...25 4. 指數分配參數的最大概似估計量... 25 4.2 伽瑪分配參數的最大概似估計量... 29 4.3 韋伯分配參數的最大概似估計量... 35 4.4 信賴區間的方法比較... 4 第五章結論...58 參考文獻...6

第㆒章緒論. 研究動機與文獻回顧 拔靴法 (Bootstrap) 為㆒種運用電腦工具的統計分析方法, 是非常實用的計量技術 它可用來估計樣本統計量的準確性 (accuracy) 應用範圍包涵估計與統計推論等種種問題 拔靴法由 Efro 在 979 年所提出, 其概念為經由資料的重新抽樣 (re-samplig), 藉以估計統計量的分配 而且, 在通常的情況, 拔靴法所提供的近似會比常用的極限近似來得精確 這項原因, 輔以其方便操作, 使得拔靴法技術大量用於實證研究, 其重要性已不亞於極限近似 拔靴法是利用觀察到的樣本推估母體, 進而以所估計的母體重新抽樣來做我們所感興趣的統計推論 若樣本來自已知分配, 則我們以樣本估計分配的參數, 再以此估計參數的分配作為重新抽樣的母體, 此法稱為有母數拔靴法 (Parametric ) 若樣本來自未知分配, 則以經驗分布函數 (Empirical distributio fuctio) 作為重新抽樣的母體, 此法稱為無母數拔靴法 (Noparametric ) 在接 來的章節, 將以拔靴法為基礎建造信賴區間, 介紹六種不同的方法以求取信賴區間, 之後再以更有效率的拔靴法來改進, 最後則以例子來加以說明, 比較這幾個方法的優劣

.2 本文架構 本文 的數值模擬結果, 是使用 Visual Fortra 軟體 5 筆資料產生方式是利用 Visual Fortra 軟體 的 IMSL 生成, 分別從 Exp (3), Gamma (5, 2) 及 We ibull(2,5) 產生來進行數值模擬 打字工具為 Microsoft Word 軟體 我們討論的重點在於不同的求取信賴區間的方法, 包括了 Bootstrap ormal,bootstrap percetile,basic, Bootstrap-t 以及修正之 Boobstrap percetile 法 並以覆蓋機率, 信賴區間平均長度及長度變異量作為評量標準, 藉以選擇出較佳的信賴區間估計法 本文內容主要分為五章, 第㆒章為緒論, 在緒論 對 方法的背景, 用處及優點稍作介紹 第㆓章即對有興趣的不同拔靴法之信賴區間求法做詳盡的介紹, 並建構其演算法 第㆔章則對拔靴法本身做修正, 介紹 Balaced 及 Double 法以期得到更佳的信賴區間 第㆕章則以㆔個模擬範例 Exp (3), Gamma(5, 2), Weibull(2,5) 的參數最大概似估計量, 來討論第㆓章及第㆔章所提供的方法之優劣 第五章將就之前所探討的各種不同求取信賴區間的方法做出結論 2

第㆓章拔靴法之信賴區間估計方法 2. 拔靴法簡介 2.. 無母數拔靴法 首先, 若㆒組可觀測到的資料 x= ( x, x2,..., x ) 來自㆒個未知分配 F, θ = tf ( ) 是我們有興趣去估計的參數, 則可由 x 計算出 θ 的估計量 θ ˆ = sx ( ) 令 ˆF 為㆒經驗分配 (empirical distributio), 也就是 ˆF 為㆒離散 分配, 在每㆒個點,i=,2,,, 的機率值都是 /, 以此 ˆF 去估計 x i * * * 未知分配 F 從 ˆF 生成㆒組大小為 的樣本 x = ( x, x *,..., x ), 此樣本稱 為 Bootstrap 樣本, 換句話說,Bootstrap 樣本 的樣本點都是由原始 2 資料 x= ( x, x 2,..., x ) 重覆抽取得來的 選出 B 組獨立的 Bootstrap 樣 * *2 *B *b 本 x, x,..., x, 每㆒組 Bootstrap 樣本 x 都可計算出 Bootstrap replicatio θˆ * ( b) = s( x * b ), b=,2,,b 有了這些 Bootstrap replicatios, 我們就可以就我們有興趣的統計推論來作討論 例如, 估計值 θˆ 的標 準差可由拔靴法來估計, B * ˆ ˆ* ˆ* 2 ˆ ( ) = { [ ( b) ()] /( B )} * * σ θ θ θ, 其 θˆ () ˆ = θ ( b)/ B b= 2 B b= 3

2..2 有母數拔靴法 若可觀測到的資料 x= ( x, x2,..., x ) 來自㆒個已知分配 F, 則以觀 察到的樣本估計已知分配 F 的參數, 和無母數拔靴法不同的 方在於採用以此估計參數為參數的分配 ˆF 來估計分配 F 從 ˆF 生成 B 組大小為 的 Bootstrap 樣本, 再計算出 B 個 Bootstrap replicatios 值後, 即可對有興趣的問題做統計推論 在 2.. 及 2..2 節, 介紹了無母數及有母數拔靴法, 在運用拔靴法作估計及統計推論時, 在不同的情況, 所需要的 Bootstrap 樣本個數 B 也會不同 例如, 在估計參數標準差時, 不需要太多的樣本個數, 將 B 值定為 200 即可得到㆒個好的標準差估計值 但是, 因為百分位數是由 θˆ* 分配之極端尾巴的值決定, 也就是較少樣本產 生的 方, 所以在作信賴區間估計時, 若 B 值取太小, 會使得結果 不準確, 最好是能將 B 值的大小控制在 500 以 4

2..3 拔靴法之演算法 () 選取 B 組獨立的 Bootstrap 樣本 (2) 根據這 B 組 Bootstrap 樣本, 計算出每㆒組的 Bootstrap replicatio (3) 利用這 B 組 Bootstrap replicatios 做拔靴法之估計量以解決我們的問題 在後面章節, 是以無母數拔靴法及有母數拔靴法這兩種方法為基礎所作的探討及其比較 5

2.2 Bootstrap ormal 法 在開始討論信賴區間前, 我們先必須以拔靴法建構出 的百分位 數 根據拔靴法的演算法, 可得到 B 個 Bootstrap replicatios, ˆ* ˆ* ˆ* *( α ) θ (), θ (2),..., θ ( B),00 α 百分位數 θ 為 ˆ* ˆ* ( α ) #{ θ ( b) θ }/ B=α. 是先將 B 個 Bootstrap replicatios 由小到大作排列, 第 K 個數即為所求的 *( α ) 百分位數 θ, 在這裡 K 為小於 (B+) α 的最大整數 ˆB ˆB 現在, 我們想要估計 θ 的 00( 2 α)% 信賴區間 考慮近似常 2 態分配的統計量 θ ˆ N ( θ + bias ( θˆ),σ ), 可得到近似 00( 2 α)% 信賴區間 B θˆ* [ θˆ ( θˆ) σ, ˆ θ ( ˆ θ) ( α) ( α) bias z bias z σ] (2.0) ( ) z α 為標準常態分配 N(0,) 之 00 α 百分位數 其 偏誤 bias( θ ˆ ) 及標準差 σ 可用拔靴法建構出來, 也就是 * * bias ( θˆ) = θˆ () θˆ, (2.02) B 2 * ˆ ˆ* ˆ* 2 ˆ ( ) = { [ ( b) ()] /( B )} σ θ θ θ, (2.03) b= B * * θˆ () ˆ = θ ( b)/ B (2.04) b= 則 Bootstrap ormal 信賴區間為 ˆ * ˆ ( α) * ˆ ˆ * ˆ ( α ) * [ θ bias ( θ) z ˆ σ ( θ), θ bias ( θ) z ˆ σ ( θˆ)] (2.05) 6

演算法 [ 步驟 ]: 根據已知資料 x= ( x, x2,..., x ), 計算出統計量 θ ˆ = sx ( ) *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap replicatio ˆ * ( ) ( * b θ b = s x ) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 ˆ ˆ ˆ * *2 * B x, x,..., x 及 Bootstrap replicatios θ * (), θ * (2),..., θ * ( B) [ 步驟 4]: 將 θˆ * (), θˆ * (2),..., ˆ θ * ( B) 加起來平均得到 ˆ θ * (), 再計算 * ˆ ˆ* bias ( θ) = θ () θ ˆ 及 B 2 * ˆ ˆ* ˆ* 2 ˆ ( ) = { [ ( b) ()] /( B )} σ θ θ θ b= [ 步驟 5]: 欲建構 θ 的 00( 2 α)% 信賴區間以 ˆ * ˆ ( α ) * θ bias ( θ) z σˆ ( θ ˆ ) 為信賴區間 界, * ( ) * θˆ bias ( θˆ) z α σˆ ( θˆ) 為信賴區間 界 7

2.3 Bootstrap percetile 法 Efro 在 A Itroductio to the Bootstrap ㆒書 提到, 考慮參數 θ 之估計值 θˆ 及其估計標準差 σˆ, 其標準常態信賴區間為 ˆ ( α) ( z α ) [ θ z σˆ, θˆ σˆ], (2.06) 則此區間的端點可由拔靴法計算出來, 設 θˆ* 為㆒隨機變數具 ˆ 2 N( θσ, ˆ ) ˆ ˆ ˆ * 2 ( α ) 分配, 也就是 θ N( θ, σ ), 則可得到 界 L= θ z σˆ 及 ˆ ˆ 界 ˆ ( ) U = θˆ z α σˆ 分別為 θˆ* 分配的 00 α 及 00 ( α) 百分位數, 換句話說, ˆ*( α ) ˆL = θ * = θˆ 分配的 00 α 百分位數 Uˆ ˆ*( ) * = θ α = θˆ 分配的 00 ( α) 百分位數 而 Bootstrap percetile 法根據以 的結論, 找出 00 α 百分位數當 作信賴 界及 00 ( α) 百分位數當作信賴 界, 則 Bootstrap percetile 信賴區間為 [ θˆ, ˆ θ *( α) *( α) ] 8

演算法 [ 步驟 ]: 根據已知資料 x= ( x, x,..., x ), 計算出統計量 θ ˆ = sx ( ) 2 *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap replicatio ˆ * ( ) ( * b θ b = s x ) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 ˆ ˆ ˆ * *2 * B x, x,..., x 及 Bootstrap replicatios θ * (), θ * (2),..., θ * ( B) [ 步驟 4]: 令 k = [( B+ ) α], k = [( B+ )( α)],( 其 [] 為高斯符號 ), 2 欲建構 θ 的 00( 2 α)% 信賴區間, 需將 * * * θˆ (), θˆ ( 2),..., θˆ ( B) 依序排列後, 取第 k 個數為信賴區間 界, 取第 k 2 個數為信賴區間 界 9

2.4 Basic 法 考慮用 θˆ* θˆ 的分配來代替 θˆ θ 的分配, 可得到 * PL ( θˆ θ U) PL ( θˆ θˆ U) = 2α (2.07) 利用拔靴法估計 界 ˆL * 及 界 Uˆ * * ˆ*( α ) ˆL = θ θˆ, (2.08) Uˆ = θˆ α θˆ, (2.09) * *( ) 則 * * * ˆ ˆ * PL ( θˆ θ U) PL ( ˆ θˆ θ Uˆ ) = P( θˆ Uˆ θ θ L ), 由此可知 Basic 信賴區間為 ˆ ˆ *( (2 α),2 ˆ ˆ *( α θ θ θ θ ) ) 演算法 [ 步驟 ]: 根據已知資料 x= ( x, x2,..., x ), 計算出統計量 θ ˆ = sx ( ) *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap replicatio ˆ * ( ) ( * b θ b = s x ) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 ˆ ˆ ˆ * *2 * B x, x,..., x 及 Bootstrap replicatios θ * (), θ * (2),..., θ * ( B) [ 步驟 4]: 令 k = [( B+ ) α], k = [( B + )( α)],( 其 [] 為高斯符號 ), 2 * * * 欲建構 θ 的 00( 2 α)% 信賴區間, 需將 θˆ (), θˆ (2),..., ˆ θ ( B) 依 序排列, 則 2θˆ 減第個數為信賴區間 界, 2θˆ 減第 k 2 k 個數為信賴區間 界 0

2.5 Bootstrap-t 法 若 x= ( x, x2,..., x ) 代表來自於母體 F 的㆒組樣本, θ ˆ = sx ( ) 為有興趣 ˆ 的估計量, 定義統計量 Z θ = θ, σˆ 代表標準差的估計量, 則在大樣本時, σˆ Z 會近似於標準常態分配 在這裡以這樣的概念為基礎, 但摒棄標準常態分配當作 Z 的近似分配, 改以利用拔靴法估計 Z 的分配, 並藉此求出信賴區間 θˆ θ 首先考慮關鍵式 t = t, (2.0) σθ ˆ( ˆ) 可得到信賴區間為 ˆ ( α) ˆ ˆ ( α) [ θ t σˆ( θ), θ t ˆ( σ θˆ)] (2.) Bootstrap-t 方法是先生成 B 組獨立的 Bootstrap 樣本 x, x,..., x * *2 * B *b, 根據每㆒組 Bootstrap 樣本 x 算出 ˆ * ( ) ( * b θ b = s x ) 及 θˆ* 的估計標準差 * σˆ ( b), 代回關鍵式得到 * θˆ ( b) θˆ tˆ* ( b) =, 再依 2.2 * σˆ ( b) * 節 求百分位數的方法求得 tˆ ( b) 的 00 α 百分位數 ˆt *( α ) 及 00 ( α) 百分位數 ˆt *( α ), 則 Bootstrap-t 信賴區間為 ˆ ˆ*( α) [ θ t σ( ˆ ˆ *( α) ˆ θ), θ ˆt σˆ( θˆ)] * 在很多情況, 的估計標準差 θˆ * ˆ ( b) σ, 並不是那麼容易求得的, 所以在使用這個方法時必須考慮到 這㆒點

演算法 [ 步驟 ]: 根據已知資料 x= ( x, x,..., x ), 計算出統計量 θ ˆ = sx ( ) 及其 估計標準差 ˆ( σθ ˆ ) 2 *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap ˆ ( ) ( ) * * b * replicatio θ b = s x 及其估計標準差 ˆ σ ( b) [ 步驟 3]: 計算 ˆ * ( ) t b ˆ* θ ( b) θˆ = σ * ˆ ( b) [ 步驟 4]: 重覆 [ 步驟 2] 及 [ 步驟 3] B 次, 可得 tˆ * (), t ˆ * (2),..., tˆ * ( B) [ 步驟 5]: 令 k = [( B+ ) α], k = [( B+ )( α)],( 其 [] 為高斯符號 ) 2 * * * tˆ (), tˆ (2),..., tˆ ( B) 依序排列後, 取第 k 個數為 ˆt *( α ), 取 第 k 個數為 ˆt *( α ) 2 [ 步驟 6]: 欲建構 θ 的 00( 2 α)% 信賴區間則 ˆ *( α ) θ tˆ ˆ( σ ˆ θ) 為信賴區間 界, ˆ *( α ) θ tˆ ˆ( σ θˆ) 為信賴區間 界 2

2.6 修正之 Bootstrap percetile 法 在 2.6 節 將介紹兩個方法,BC(bias-corrected) percetile 法和 BCa (bias-correctio acceleratio) percetile 法, 這兩個方法是將 Bootstrap percetile 法做修正, 改變選取的百分位數, 藉以增加所求 信賴區間的準確性 選取 Bias-correct 因子 w 及 Acceleratio 因子 a 兩因子當作考慮的因素, 首先定義 U = h(θˆ ) 及 φ = h( θ) 使得 U 具常態分配, U N w 2 ( φ σ( φ), σ( φ) ), (2.2) 其 σφ ( ) = + aφ, 做這樣的定義在於先求出 φ 的信賴區間, 再利用 θ ˆ 的 Bootstrap 分配, 轉換回去求出 θ 的信賴區間 假設 w 及 a 已知, 且 U = φ + ( + aφ)( Z w), (2.3) ( ) 其 Z 具標準常態分配 N(0,), z α 為 Z 的 00 α 百分位數, 可推得 log( + au ) = log( + aφ ) + log{ + a( Z w)} (2.4) ( ) 且此方程式為 φ 的單調遞增函數, 以 z α 代替 Z 及 u 代替 U, ( ) 求得 φ 的 00 α 百分位數 φˆ α 為 w+ z ( α ) ˆ ( α ) = u+ σ( u) ( ( α ) aw+ z ) φ, (2.5) ( ) ˆ α 則 θ 的 00 α 百分位數 θˆ α 為 ˆ ( α) ( ) θ = h ( φ ), 但是因為 h() 為㆒ ( ) 未知函數, 所以利用 θˆ 的 Bootstrap 分配函數 Ĝ 來求 θ ˆ α 3

ˆ( α) ( α) ˆ ˆ( α) * ˆ* ˆ( α) ˆ * * ˆ( α) φ u w+ z G( θ ) = P ( θ < θ θ) = P ( U < φ u) =Φ ( + w) =Φ ( w+ ) ( α ) σ ( u) a( w + z ) 可得故 ( α ) ˆ( α ) ˆ w+ z G { ( w )} ( α ) θ θˆ = Φ + aw ( + z ) = θˆ ( α) *( " α, ( α ) ) w+ z, " α =Φ ( w + ) (2.6) ( α ) aw ( + z ) 在剛剛的假設, w 及 a 是已知常數, 但實際 w 及 a 是未知的, 所以接 來我們還必須就 w 及 a 的值做估計 ˆ ˆ ˆ * * * * 因為 P ( θ < θ θ) = P ( U < u u) = P( U < φ φ) =Φ( w) (2.7) 所以 w=φ { Gˆ( ˆ θ )} (2.8) 則 w ˆ* ˆ #{ θ ( b) < θ} 的估計值 wˆ =Φ ( ) B (2.9) 2 因為 U N( φ wσ( φ), σ( φ) ), 其 σφ ( ) = + aφ, 定義 l( φ ) 為 log likelihood 及 l# ( φ) 為㆒次微分, 可得到 則 El# var{ l# ( φ)} 3 El {( # θ )} var{ l# ( θ )} 3 {( φ)} 3 2 3 2 = 6a = 6a # ˆ 之後可得到 a = (2.20) * * 3 E { l ( θ ) } * * 3 6 var { l# ( θˆ )} 2 有很多方法可以去估計 a, 在這裡我們選用了㆒個最簡單快速的方 法, 利用 Jackkife 的技巧, 得到 a 的估計值 aˆ = ˆ 3 ( θ () ()) i θ = i ˆ ˆ 2 6{ ( θ () θ() i ) } i= ˆ 3 2, (2.2) 其 ˆ ( ), 而 (,,...,,... ) 為 Jackkife θ () i = sx() i x() i = x x2 xi xi+ x sample, θˆ = θˆ / () () i i= 4

若只考慮 Bias-correct 因子 w, 也就是 Acceleratio 因子 a =0, 此法稱為 BC(bias-corrected) percetile 法, ˆ *( ) ˆ* ( ) α α2 BC percetile 信賴區間為 [ θ, θ ] 其 α =Φ (2 w+ z ( α ) ), ˆ α ( α ) ˆ 2 =Φ (2 w+ z ) ˆ* ˆ #{ θ ( b) < θ} wˆ =Φ ( ) B 若 Bias-correct 因子 w 及 Acceleratio 因子 a 都考慮進去, 此法稱為 BCa (bias-correctio acceleratio) percetile 法, ˆ ˆ* BCa percetile 信賴區間為 *( α ) ( α2 [ θ, θ ) ], 其 ( α ) ( α ) wˆ + z wˆ + z α ˆ =Φ ( w + ), α ( α ) 2 =Φ ( wˆ + ) aw ˆ( ˆ + ( ) z ) α aw ˆ( ˆ + z ) ˆ* ˆ #{ θ ( b) < θ} wˆ =Φ ( ) B aˆ = ˆ 3 ( θ () ()) i θ = i ˆ ˆ 2 6{ ( θ () θ() i ) } i= ˆ 3 2 在這㆒節, 所介紹的兩個方法 BC percetile 法及 BCa percetile 法都是改變所選取的百分位數, 但這會有個潛在的問題 當你利用 Bias-correct 因子 w 及 Acceleratio 因子 a 作修正而得到的 α, α 值有可能很靠近 0 及, 則 ( B + ) α 2 的整數部份會等於 0, 而 ( B + ) α 的整數部份會等於 B+, 在這情況, 若 B 的值無法增加, 2 則將 α 定為 /(B+), α 定為 B/(B+) 藉以解決此問題 2 5

演算法 BC percetile 法 [ 步驟 ]: 根據已知資料 x= ( x, x,..., x ), 計算出統計量 θ ˆ = sx ( ) 2 *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap replicatio ˆ * ( ) ( * b θ b = s x ) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 x, x,..., x * *2 * B * * * 及 Bootstrap replicatios θˆ (), θˆ (2),..., θˆ ( B) [ 步驟 4]: 計算 ˆ* ˆ #{ θ ( b) < θ} wˆ =Φ ( ), Φ 為標準常態分配 N(0,) 的 B 累積分佈函數 [ 步驟 5]: 計算 (2 w z ( α ) ( α ) ( ) α =Φ + ), α =Φ (2 w+ z ), z α 為標準常態 ˆ 2 ˆ 分配 N(0,) 之 00 α 百分位數 [ 步驟 6]: 令 k = [( B+ ) α ], k = [( B+ ) α ],( 其 [] 為高斯符號 ), 2 2 若 k = 0, 則將 k 定為, 若 k = B+, 則將 k 定為 B, 2 2 欲建構 θ 的 00( 2 α)% 信賴區間, 需將 * * * θˆ (), θˆ ( 2),..., θˆ ( B) 依序排列後, 取第 k 個數為信賴區間 界, 取第 k 2 個數為信賴區間 界 6

演算法 BCa percetile 法 [ 步驟 ]: 根據已知資料 x= ( x, x,..., x ), 計算出統計量 θ ˆ = sx ( ) 2 *b [ 步驟 2]: 再利用拔靴法生成 Bootstrap 樣本 x 及計算 Bootstrap replicatio ˆ * ( ) ( * b θ b = s x ) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 x, x,..., x * *2 * B * * * 及 Bootstrap replicatios θˆ (), θˆ (2),..., θˆ ( B) [ 步驟 4]: 計算 ˆ* ˆ #{ θ ( b) < θ} wˆ =Φ ( ),Φ 為標準常態分配 N(0,) 的 B 累積分佈函數 [ 步驟 5]: 根據 x= ( x, x,..., x ), 利用 Jackkife 法生成 Jackkife 2 samples x(), x(2),..., x ( ), 其 x() i = ( x, x2,... xi, xi+,... x) 3 ( θˆ ˆ [ 步驟 6]: 計算 θ ˆ () i = sx ( () i ), ˆ ˆ () ()) i θ = i θ() = θ() i / 及 aˆ = 2 3 2 i= 6{ ( θˆ θˆ ) } [ 步驟 7]: 計算 ( α ) wˆ + z α ˆ =Φ ( w + ), α ( α ) aw ˆ( ˆ + z ) i= () () i ( α ) wˆ + z =Φ ( wˆ + ), z aw ˆ( ˆ + z ) 2 ( α ) 為標準常態分配 N(0,) 的 00 α 百分位數 [ 步驟 8]: 令 k = [( B+ ) α ], k = [( B+ ) α ],( 其 [] 為高斯符號 ), 2 2 ( α ) 若 k = 0, 則將 k 定為, 若 k = B+, 則將 k 定為 B, 2 2 * * * 欲建構 θ 的 00( 2 α)% 信賴區間, 需將 θˆ (), θˆ (2),..., ˆ θ ( B) 依序排列後, 取第 k 個數為信賴區間 界, 取第 k 個 2 數為信賴區間 界 7

第㆔章拔靴法之改進 我們想要改進用拔靴法所求得的信賴區間, 除了在信賴區間的求法 改進, 我們還可以考慮到接 來兩節的方法 在 3. 節, 我們希望讓每㆒筆資料在重抽 B 次後被抽到的總次數都能㆒樣, 使得重抽能達到㆒個公平的狀態, 藉這個方法增加信賴區間的準確性 在 3.2 節, 則是利用兩層的拔靴法, 來降低信賴區間的誤差 3. Balaced 法 若㆒組可觀測到的資料 x= ( x, x2,..., x ), 欲使其在重抽 B 次後, 每㆒筆資料被抽到的次數相同, 可將資料 x, x2,..., x 排成㆒列, 重覆 這個動作 B 次, 即可得到㆒列共 B 個數的數列 x, x,..., x, x, x,..., x,..., x, x,..., 2 2 2 x, 然後讓此數列作重排, 取前 個數 當作第㆒組的 Bootstrap 樣本, 再取第 + 個數到第 2 個數當作第㆓組的 Bootstrap 樣本, 則依前述方法, 共可取得 B 組的 Bootstrap 樣本, 而每㆒筆資料被抽到的次數皆是 B 次, 使得重抽這項動作達到公平的狀態, 信賴區間的準確性自然會增加 但是, 前述方法在電腦 運作會相當耗時, 因此, 在運用電腦作此運算時, 我們稍微的將前述 方法作修正 首先, 將 筆資料 x, x,..., x 2 標 號碼 ~, 再來將 數字 ~B 排成㆒列後作重新排列, 對於每㆒個位置 的數都除以 8

取餘數, 取前 個數, 若餘數為 0 則代表選取號碼為 的資料, 若餘數為 則代表選取號碼為 2 的資料, 以此類推, 若餘數為 -, 則代表選取號碼為 的資料, 則前 個數即可取出第㆒組的 Bootstrap 樣本, 接 來再取第 + 到第 2 個數, 同樣利用餘數選取所代表的資料, 重覆此步驟 B 次, 即可得 B 組 Bootstrap 樣本 演算法 [ 步驟 ]: 將 筆資料 x, x,..., x 對應到數字 ~ 2 [ 步驟 2]: 將數字 ~B 排成㆒列之後重新排列, 再除以 取餘數可得到㆒個新的數列, 其 數字為 0~- [ 步驟 3]: 將此數列 每個數字加, 依序取 個數為㆒組, 並將其對 應回資料 x, x,..., x 2, 即可得 B 組的 Balaced 樣本 9

3.2 Double 法 Bootstrap Methods ad Their Applicatio 這本書 提到了 Double 法, 因此在這㆒小節, 會介紹如何將 Double 法應用在 Bootstrap percetile 法,Basic 法及 Bootstrap-t 法這㆔種方法 若從㆒組可觀測到的資料 x= ( x, x2,..., x ), 選取 B 組 Bootstrap * *2 * B 樣本 x, x,..., x, 可得到對應的 θˆ*, σˆ ( θ) 及 ˆt * 值, 對於每㆒組 *2 ˆ Bootstrap 樣本 *b x, b=,2,,b, 再依拔靴法再選取 M 組的 Bootstrap 樣本 x, x,..., x ** b ** b2 ** bm, b=,2,,b, 這些稱為 Double **2 樣本, 同樣的也可得到對應的 θˆ** 及 σˆ ( ˆ θ) 及 ˆt ** 值 在 * Basic 法 用 θˆ θˆ 的分配來代替 θˆ θ 的分配, 而在 ** * Double 法, 則再以 θˆ θˆ 的分配來代替 θˆ* θ ˆ 的分配 接 來, 將以 Bootstrap-t 法來對 Double 法做說明 ; 考慮 *( ) P( θ > ˆ θ t α σˆ ( θˆ)) = α, (3.0) 可找到 q( α) 使得 ˆ *( q( α )) P( θ > θ t ˆ σ( ˆ θ) x) = α, (3.02) 用 Double 估計 q( α) 得到 qˆ( α), 則 ˆ ˆ* **( qˆ ( α )) * ˆ * P( θ > θ t ˆ σ ( θ) x, x ) = α 20

i.e. i.e. P θˆ θˆ σˆ θˆ < t x x = α * * **( qˆ ( α )) * (( ) / ( ), ) * **( qˆ ( α )) * (, ) Pt < t xx =α i.e. * ** Pt ( < F ( qˆ ( α)) xx, * ) = α, 其 ** ( ) ** F x 為 t 的累積機率分佈 (cdf), t = ( θˆ θˆ )/ σˆ ( θˆ) 而 ** ** * ** ** * * 而後, 可得到 PF ( ( t) < qˆ ( α) xx, ) =α (3.03) ** * 所以 qˆ( α) 為 F ( t ) 的 00 α 百分位數 由以 可知, 將 Double 應用在 Bootstrap-t 法, 可得到信賴區間為 ˆ ˆ ˆ ˆ*( q( α)) ˆ ˆ ˆ*( q( α)) [ θ t σˆ( θ), θ t ˆ( σ θˆ)], (3.04) * 其 qˆ( α) 及 qˆ( α) 為 u 的 00 α 及 00 ( α) 百分位數, 而 u = M * b * m= I ˆ * b ( t ( m) tˆ* b )/ M,m=,2,,M,b=,2,,B 同理, 可知 Double 應用在 Bootstrap percetile 法 可得到信賴區間為 [ θˆ, θˆ *( qˆ( α)) *( qˆ( )) α ], (3.05) * 其 qˆ( α) 及 qˆ( α) 為 u 的 00 α 及 00 ( α) 百分位數, 而 u = M * b * m= I ˆ * b ( θ ( m) θˆ)/ M,m=,2,,M,b=,2,,B 同理, 亦可知 Double 應用在 Basic 法, 可 得到信賴區間為 2

θˆ θˆ ˆ θ ˆ θ *( qˆ ( α [2 )),2 *( ˆq ( α )) ], (3.06) * 其 qˆ( α) 及 qˆ( α) 為 u 的 00 α 及 00 ( α) 百分位數, 而 u M * b * b b I ˆ * ˆ* = ( θ ( m) 2θ θˆ ) / M m=,m=,2,,m,b=,2,,b 由於 Double 運用了兩層的拔靴法, 則需計算的總樣本之個數為 BM 個, 通常 Bootstrap 模擬的次數 B 都在 000 左右, 若 M 的值太大, 會造成電腦在計算時的負擔, 所以, 較理想的 M 值為 249, 因此在第㆕章所作之模擬, 將 B 定為 999 及 M 定為 249 次 Double 的運用, 和修正之 Bootstrap percetile 法有共同的特 性, 皆是改變了百分位數的選取, 同樣的也會產生所選取之 α 及 α 2 會使 ( B + ) α 的整數部份等於 0, ( B + ) α 的整數部份會等於 B+, 2 因此同樣的將 α 定為 /(B+), α 定為 B/(B+) 藉以解決問題 2 22

演算法 [ 步驟 ]: 根據已知資料 x= ( x, x,..., x ), 計算出統計量 θ ˆ = sx ( ) 及其 估計標準差 ˆ( σθ ˆ ) 2 *b [ 步驟 2]: 利用拔靴法生成 Bootstrap 樣本 x, 計算 Bootstrap replicatio ˆ * ( ) ( * b b s x ) θ =, 及 ˆ * ( ) t b ˆ* θ ( b) θˆ = σ * ˆ ( b) [ 步驟 3]: 重覆 [ 步驟 2] B 次, 得到 B 組 Bootstrap 樣本 x, x,..., x * *2 * B,Bootstrap replicatios ˆ* ˆ* ˆ* θ (), θ (2),..., θ ( B) 及 * * * tˆ (), tˆ (2),..., tˆ ( B ) *b [ 步驟 4]: 根據每㆒組的 Bootstrap 樣本 x, 再㆒次利用拔靴法生成 M 組的 Double 樣本 x, x,..., x ** b ** b2 ** bm, 計算出 Bootstrap replicatios θˆ (), θˆ ** b ** b (2),..., ˆ** θ b ( M ) 及 ** b ** b ** b tˆ (), tˆ (2),..., tˆ ( M) *b [ 步驟 5]: 定義 u,b=,2,,b () 若應用在 Bootstrap percetile 法, 則 M * b ˆ** b u = I( θ ( m) θˆ)/ M m=,b=,2,,b (2) 若應用在 Basic 法, 則 M * b ˆ** b ˆ* b u = I( θ ( m) 2 θ θˆ)/ M m=,b=,2,,b (3) 若應用在 Bootstrap-t 法, 則 M * b ˆ** b ˆ* b u = I( t ( m) t )/ M,b=,2,,B m= 23

[ 步驟 6]: 令 k = [( B+ ) α], k = [( B+ )( α)],( 其 [] 為高斯符號 ), 2 若 k = 0, 則將 k 定為, 若 k = B+, 則將 k 定為 B, 2 2 * *2 * B 將 u, u,..., u 依序排列後, 取第 k 個數為 qˆ( α), 取第 k 個數為 qˆ( α ) 2 [ 步驟 7]: 則 () Double 應用在 Bootstrap percetile 法 之信賴區間為 ˆ*( qˆ( α)) ˆ*( qˆ( α)) [ θ, θ ] (2) Double 應用在 Basic 法 之信賴區間為 ˆ ˆ *( qˆ ( α )) ˆ ˆ *( qˆ ( α [2 θ θ,2 θ θ )) ] (3) Double 應用在 Bootstrap-t 法 之信賴區間為 ˆ ˆ ˆ ˆ*( q( α)) ˆ ˆ ˆ*( q( α)) [ θ t σˆ( θ), θ t ˆ σ( ˆ θ)] 其 θˆ *( qˆ ( α )) ˆ 及 θˆ *( q( α )) * 為 θˆ 分配之 00 qˆ( α) 及 00 qˆ ( α) 百分位數, 而 ˆ *( qˆ ( α )) ˆ t 及 ˆ *( q( α t )) * 為 ˆt 分配之 00 qˆ ( α) 及 00 qˆ( α) 百分位數 24

第㆕章信賴區間模擬範例 在模擬範例, 將以指數分配 Exp( β ), 伽瑪分配 Gamma( ν, β) 及 韋伯分配 Weibull( ν, β) 之參數的最大概似估計量的信賴區間來作討 論 以 ㆔個分配的最大概似估量之求得是參考 Zacks, S. 在 992 年的著作 Itroductio to Reliability:Probability Models ad Statistical Methods 在 4.,4.2 及 4.3 節, 我們就以 ㆔個分配求取其參數的最大概似估計量, 在 4.4 節, 將針對第㆓章及第㆔章所介紹的不同信賴區間求法作比較 4. 指數分配參數的最大概似估計量 若樣本 X, X,..., X 服從指數分配 Exp( β ), 其機率密度函數為 2 f( x β) = exp( x/ β),0 x <, β > 0, (4.0) β 則可得到其概似函數 L( β; x) = β exp( xi / β) = i, (4.02) 進而得到 β 的最大概似估計量 ˆ β = x = x i (4.03) i= 在 Bootstrap-t 方法, 必須知道統計量的標準差才能求得關鍵式, 而在此 ˆβ 的標準差為 SD( ˆ β) = β / (4.04) 指數函數參數 β 的 00( 2 α)% 信賴區間為 2x 2x [, ], (2 ) (2 ) 2 2 χ α χα 25

2 若考慮 ˆβ 的近似分佈函數 N( β, β / ), ( ) ( ) 則可得到近似的信賴區間為 ˆ α [ ˆ/, ˆ α β z β β + z ˆ β / ] 26

模擬範例 : 指數分配 Exp( β ) 參數的最大概似估計量 由 Exp(3) 生成 5 筆資料, 參數 β 最大概似估計量 ˆβ = 2.935 β 的 95% 信賴區間 = [.8743, 5.244 ], 區間長度 =3.3698 β 的 95% 近似信賴區間 = [.4498, 4.4204], 區間長度 = 2.9707 () 無母數 法 ( 表 ) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal.6980 4.850 2.4870 2.Bootstrap percetile.788 4.3233 2.5352 3.Basic.5469 4.082 2.5352.9927 4.878 2.8252 5.BC percetile.8542 4.447 2.5604 6.BCa percetile.9633 4.553 2.559 Balaced.Bootstrap ormal.762 4.540 2.4377 2.Bootstrap percetile.7929 4.2486 2.4557 3.Basic.626 4.0773 2.4557 2.0277 4.8049 2.7772 5.BC percetile.840 4.3037 2.4897 6.BCa percetile.9090 4.4423 2.5333 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile.7505 5.056 3.3055 3.Basic.794 4.4892 2.7699.8775 4.7675 2.8900 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 27

(2) 有母數 法 ( 表 2) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal.4498 4.4222 2.9724 2.Bootstrap percetile.5999 4.6696 3.0697 3.Basic.2006 4.2703 3.0697.8449 5.3845 3.5397 5.BC percetile.7049 4.8662 3.63 6.BCa percetile.8327 5.24 3.294 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile.8369 5.409 3.5650 3.Basic.8729 4.6774 2.8044.7703 5.7833 4.030 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 28

4.2 伽瑪分配參數的最大概似估計量 若樣本 X, X,..., X 服從伽瑪分配 Gamma( ν, β), 其機率密度函數為 2 則可得到其概似函數 f x x x Γ( ν) β ν ( ν, β) = exp( / β) ν,0 x <, ν, β > 0,(4.05) v ( xi ) i= ( ν, β; ) = exp( i / β) ν Γ ( ν) β i= L x x, (4.06) 進而得到 ν 及 β 的最大概似估計量 ˆ β = x / ˆ ν, (4.07) exp( ψν ( )) = G / x (4.08) ν νˆ 為 (4.08) 之解 其, G = exp( l xi ), ψ ( ν) = l Γ( ν) ν i = 由於 ν 的最大概似估計量不容易求得, 所以改由 列公式來得到 ν 的近似最大概似估計量, 其, Y = l( x/ G ) 2 若 0 < Y <.5772, ˆ ν [.500088 +.64885 Y.054427Y ],(4.09) Y 2 8.89899 + 9.05995 Y +.977537Y 若.5772 Y < 7., ˆ ν, (4.0) 2 Y [7.79728 +.968477 Y + Y ] 同樣的, 必須知道統計量 ˆ ν, ˆβ 的標準差才能使用 Bootstrap-t 方法找信賴區間, 由於 ˆ ν, ˆβ 的標準差不易求得, 所以, 用近似方法求得 ˆ ν, ˆβ 的近似標準差 29

ν ASD{} ˆ ν = [ ] ' νψ ( ν ) ' ˆ β ψ ( ν) ASD{ β} = [ ] ' νψ ( ν ) 2 2, (4.), (4.2) 其, ψ ' ( ν ) 為 digamma 函數 ψ ( ν ) 的㆒階微分函數 若 ν 2 且 0, 2 2 χ( α) ( ) χ( α) ( ) 則伽瑪函數參數 ν 的 00( 2 α)% 信賴區間為 [, ], 2Y 2Y 參數 β 的 00( 2 α)% 信賴區間為 2x 2x ], χ (2 [ ν ] ) χ (2 [ ν ]) [, 2 2 ( α) U + ( α) 其, [ν U ] 及 [ν L ] 為 ν 之 界及 界的整數部份 L 若考慮 ˆ ν 的近似函數 ν N( ν, [ ]) ' νψ ( ν ), 則參數 ν 的 00( 2 α)% 近似信賴區間為 若考慮 ˆβ ( α) ˆ ν ( ) ˆ ν [ ˆ ν z ( ), + ( ' ˆ νψ ( ˆ ν ) ˆ νψ ( ˆ ν ) 的近似分佈函數 2 α 2 ˆ ν z ' ) ] 2 ' β ψ ( ν) N( β, [ ]) ( ) ' νψ ν, 則參數 β 的 00( 2 α)% 近似信賴區間為 ˆ ' ˆ ' ˆ ( α) β ψ ( ˆ ν) ˆ ( ) β ψ ( ˆ ν) [ β z [ ], + [ ' ˆ νψ ( ˆ ν ) ˆ νψ ( ˆ ν ) 2 α 2 β z ' ] ] 30

模擬範例 2: 伽瑪分配 Gamma( ν, β) 參數的最大概似估計量 由 Gamma(5, 2) 生成 5 筆資料, 參數 ν 最大概似估計量 ˆ ν =5.7869 ν ν 的 95% 信賴區間 = [ 2., 9.7962 ], 區間長度 =7.685 的 95% 近似信賴區間 = [.7590, 9.849 ], 區間長度 =8.0560 () 無母數 法 ( 表 3) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 3.57 5.3554.8437 2.Bootstrap percetile -0.9989 9.9483 0.9472 3.Basic -3.785 8.0622.8437 2.2478 9.600 7.3524 5.BC percetile 2.9046.047 8.426 6.BCa percetile 2.9046 0.7929 7.8883 Balaced.Bootstrap ormal 3.6972 3.2556 9.5584 2.Bootstrap percetile 0.25 9.2649 9.523 3.Basic -.686 7.8767 9.5584 -.2334 9.5629 0.7963 5.BC percetile 3.2489 9.925 6.6762 6.BCa percetile 3.2489 9.480 6.690 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 2.9046.060 8.555 3.Basic.7435 8.6694 6.9258 2.6.6775 9.564 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 3

(2) 有母數 法 ( 表 4) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 3.742 3.7329 9.996 2.Bootstrap percetile -.0849 9.6703 0.7552 3.Basic -2.589 7.8327 9.996 2.4902 8.9968 6.5066 5.BC percetile 2.5345 0.8 7.6466 6.BCa percetile 2.5345 9.5949 7.0604 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 2.5345 9.5949 7.0604 3.Basic.9790 9.0394 7.0604 2.652 8.6984 6.0832 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 32

參數 β 最大概似估計量 ˆβ =.796 β 的 95% 信賴區間 = [ 0.962, 7.8227 ], 區間長度 = 6.9065 β 的 95% 近似信賴區間 = [ 0.4692, 2.970 ], 區間長度 = 2.5009 () 無母數 法 ( 表 5) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 0.6860 2.9466 2.2606 2.Bootstrap percetile 0.7023 3.0388 2.3365 3.Basic 0.4006 2.7370 2.3365 0.98 4.2326 3.256 5.BC percetile 0.845 3.3257 2.4806 6.BCa percetile 0.903 3.5087 2.6056 Balaced.Bootstrap ormal 0.7883 2.893 2.049 2.Bootstrap percetile 0.7283 2.6864.9582 3.Basic 0.7529 2.7.9582.035 2.9423.8387 5.BC percetile 0.9503 3.598 2.5695 6.BCa percetile.075 3.598 2.5023 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.8269 3.5087 2.688 3.Basic 0.322 2.986 2.8493 0.856 4.8404 3.9888 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 33

(2) 有母數 法 ( 表 6) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 0.7967 3.0034 2.2066 2.Bootstrap percetile 0.6307 2.848 2.84 3.Basic 0.6245 2.8086 2.84.0585 4.7244 3.6659 5.BC percetile 0.8695 3.3897 2.5202 6.BCa percetile 0.9204 3.3897 2.4693 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.9206 3.3897 2.469 3.Basic.65 2.8675.7024.2324 4.7244 3.4920 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 34

4.3 韋伯分配參數的最大概似估計量 若樣本 X, X,..., X 服從韋伯分配 Weibull( ν, β), 其機率密度函數為 2 ν x ν x ν f( x ν, β) = ( )( ) exp( ( ) ),0 x <, ν, β > 0, (4.3) β β β 則可得到其概似函數 ν L x x ν i ν ( ν, β; ) = ( i ) exp( ( ) ) ν β i= i= β x, (4.4) 進而得到 ν 及 β 的最大概似估計量 ˆ β ( ˆ ν x ˆ ν = ), (4.5) i= i ˆ ν xi l xi i= l xi ], (4.6) ˆ ν i= xi i= ˆ ν = [ ( ) ( j ) ˆ ν xi l xi xi ˆ xi i= ˆ [ j i ν + = = ( j ) ν i= l ] (4.7) 為了求得參數的最大概似估計量, 必須使用迭代法, 首先, 令初始值 (0) ˆ ν =, 代入 (4.7) 式, 將所得到的值再㆒次代回 (4.7) 式, 直到其值收斂, 即為 ν 的最大概似估計量 ˆ ν, 再將此值代回 (4.5) 式, 即可得到 β 的最大概似估計量 ˆβ 由於 ˆ ν, ˆβ 的標準差無法求得, 只能求得 ˆ ν, ˆβ 的近似標準差, 若考慮 νˆ 2 ˆ β ( ψ(2)) ASD β = + = ' ν ψ () ν ' ASD{ ˆ} ( ()) 2 ν ν = ψ = 0.78 的近似函數 { } ( ) 2.053 ν ν, 2 N(,(0.78 ) ) ν β, (4.8) (4.9) 35

則參數 ν 的 00( 2 α)% 近似信賴區間為 若考慮 ˆβ ˆ ν ( α) ( ) [ ˆ ν 0.78 z, ˆ ν + 0.78 z ] 的近似分佈函數 α νˆ β 2 N( β,(.053 ) ) ν, 則參數 β 的 00( 2 α)% 近似信賴區間為 ˆ ˆ β ˆ ν ˆ ˆ β ˆ ν ( α) ( α) [ β.053 z, β +.053 z ] 36

模擬範例 3: 韋伯分配 Weibull( ν, β) 參數的最大概似估計量 由 We ibull(2,5) 生成 5 筆資料, 參數 ν 最大概似估計量 ˆ ν = 2.680 ν ν 的 95% 信賴區間 = [.2508, 3.028 ], 區間長度 =.7773 的 95% 近似信賴區間 = [.323, 3.0239 ], 區間長度 =.76 () 無母數 法 ( 表 7) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 0.9755 3.005 2.0350 2.Bootstrap percetile.6556 3.5975.949 3.Basic 0.7387 2.6805.949.3066 2.839.5325 5.BC percetile.5977 3.3467.7490 6.BCa percetile.5369 3.2386.706 Balaced.Bootstrap ormal 0.9980 3.0093 2.03 2.Bootstrap percetile.695 3.6224 2.0029 3.Basic 0.738 2.767 2.0029.4246 2.5875.629 5.BC percetile.558 3.233.6795 6.BCa percetile.5032 3.035.6004 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile.5358 3.2594.7236 3.Basic.4492 2.8505.403.2906 2.9285.6379 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 37

(2) 有母數 法 ( 表 8) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 0.8890 3.0077 2.87 2.Bootstrap percetile.5964 3.625 2.0287 3.Basic 0.70 2.7397 2.0287.2967 2.9445.6478 5.BC percetile.3579 3.98.8402 6.BCa percetile.2998 3.0683.7686 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile.253 2.9326.6795 3.Basic.289 3.0002.784.297 2.9637.6720 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 38

參數 β 最大概似估計量 ˆβ = 5.202 β 的 95% 信賴區間 = [ 3.8553, 7.0347 ], 區間長度 =3.794 β 的 95% 近似信賴區間 = [ 3.9296, 6.4909 ], 區間長度 =2.562 () 無母數 法 ( 表 9) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 3.9845 6.4450 2.4605 2.Bootstrap percetile 3.9276 6.3445 2.469 3.Basic 4.076 6.4930 2.469 3.730 6.6787 2.9658 5.BC percetile 3.8950 6.3284 2.4335 6.BCa percetile 3.8950 6.3284 2.4335 Balaced.Bootstrap ormal 3.9850 6.4747 2.4896 2.Bootstrap percetile 3.9004 6.3690 2.4686 3.Basic 4.055 6.520 2.4686 4.689 6.3243 2.554 5.BC percetile 3.8988 6.3690 2.4702 6.BCa percetile 3.8757 6.3526 2.4769 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.8540 6.4023 2.5483 3.Basic 3.6628 7.2302 3.5674 3.630 6.7668 3.367 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 39

(2) 有母數 法 ( 表 0) Origial 方法 信賴區間 信賴區間 信賴區間 界 界 長度.Bootstrap ormal 3.9703 6.4948 2.5245 2.Bootstrap percetile 4.0384 6.490 2.3807 3.Basic 4.005 6.382 2.3807 3.8945 6.7505 2.8560 5.BC percetile 4.085 6.566 2.436 6.BCa percetile 4.085 6.5043 2.493 Double.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.9556 7.653 3.2097 3.Basic 3.9265 6.7620 2.8356 3.8839 6.728 2.8442 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 40

4.4 信賴區間的方法比較 在這㆒小節, 會先就 4. 節,4.2 節及 4.3 節 範例重覆做模擬, 再以覆蓋機率, 信賴區間平均長度及信賴區間長度標準差來作為評量不同信賴區間求法的優劣 在此, 覆蓋機率指的是經由每㆒次模擬的 B 組 Bootstrap samples 所得到的信賴區間, 計數覆蓋到參數真實值的信賴區間次數, 再除以模擬次數 ; 信賴區間平均長度指的是計數覆蓋到參數真實值的信賴區間次數, 將有覆蓋到參數真實值的區間長度加總後, 除以覆蓋到參數真實值的信賴區間次數 ; 信賴區間長度標準差則是指得到信賴區間平均長度後, 根據每㆒個覆蓋到參數真實值的信賴區間, 計算出信賴區間平均長度標準差 以 的模擬範例,Bootstrap 樣本的個數 B=999,Double 樣本的個數 M=249, 覆蓋機率由 400 次的蒙 卡羅模擬求得 4

模擬範例 : 指數分配 Exp( β ) 參數的最大概似估計量 由 Exp(3) 生成 5 筆資料, 參數 β 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9475 3.2678.0802 0.9200 2.8870.0869 () 無母數 法 ( 表 ) Origial Balaced Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.8825 2.5892.288 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile.bootstrap ormal 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8850 2.5464.252 0.8600 2.52.303 0.8950 2.9836.5788 0.8900 2.663.2830 0.8925 2.735.3887 0.8875 2.602.2749 0.8725 2.5338.2842 0.8675 2.5348.2957 0.9025 3.022.5594 0.8825 2.634.356 0.8900 2.7466.4275.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9400 3.3749.532 0.975 2.906.292 0.9375 4.242 2.844 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 42

(2) 有母數 法 ( 表 2) Origial Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.950 2.8747.54 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.9250 2.8583.0667 0.8975 2.804.659 0.9425 3.2643.363 0.9350 2.9938.0696 0.9350 3.046.27.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9500 3.3890.2269 0.9200 2.725.049 0.9200 3.426.389 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=499 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 43

由 Exp(3) 生成 5 筆資料, 參數 β 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9575 3.2495.0239 0.950 2.8574.07 () 無母數 法 ( 表 3) Origial Balaced Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.8825 2.550.2355 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile.bootstrap ormal 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8875 2.574.884 0.8700 2.4972.25 0.9000 2.9539.4905 0.8825 2.552.2387 0.9025 2.72.390 0.8825 2.5627.2482 0.8950 2.5373.760 0.8725 2.5048.2526 0.9000 2.9688.50 0.8975 2.5896.2059 0.8950 2.704.3450.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9375 3.4970.5823 0.9250 2.978.2004 0.9350 4.080 2.6530 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 44

(2) 有母數 法 ( 表 4) Origial Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.975 2.8649.039 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.9225 2.8355.0580 0.8950 2.84.87 0.9575 3.2687.0447 0.9475 2.975.0000 0.9550 3.358.0245.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9575 3.3540.557 0.9225 2.7854.0353 0.9225 3.2987.2579 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 45

由 Exp(3) 生成 5 筆資料, 參數 β 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9500 3.2400.0844 0.900 2.8360.245 () 無母數 法 ( 表 5) Origial Balaced Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.8850 2.6069.3229 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile.bootstrap ormal 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8925 2.5874.2747 0.8750 2.5567.383 0.8975 2.967.5723 0.9000 2.6455.2934 0.8975 2.7852.4560 0.8850 2.6077.3257 0.8925 2.5893.283 0.8750 2.5578.3232 0.9025 2.9884.5845 0.8875 2.622.3264 0.8925 2.7842.4874.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9375 3.5245.7078 0.9225 2.9754.2594 0.9450 4.256 2.7400 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 46

(2) 有母數 法 ( 表 6) Origial Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.9075 2.8452.55 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.9225 2.842.0783 0.8850 2.7775.22 0.9525 3.2592.0837 0.9350 2.9389.059 0.9425 3.8.0992.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9575 3.3553.80 0.9300 2.7895.0245 0.9300 3.3059.233 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=499 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 47

模擬範例 2: 伽瑪分配 Gamma( ν, β) 參數的最大概似估計量 由 Gamma(5, 2) 生成 5 筆資料 參數 ν 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9575 7.454 3.2252 0.9800 8.2497 3.6929 () 無母數 法 ( 表 7) Origial Balaced Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.9900 3.659 8.79 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile.bootstrap ormal 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8325 8.8995 6.2567 0.8650.5944 8.6667 0.975 6.4749 3.53 0.8650 6.9255 4.527 0.8850 6.390 3.6789 0.9900 3.7430 8.9485 0.8250 8.848 6.333 0.8675.5892 8.4279 0.9300 3.6345.7272 0.8600 6.8926 4.5786 0.8725 6.2985 3.7583.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.8800 6.8543 4.2826 0.8900 7.2202 5.5422 0.9375 7.9460 4.870 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 48

(2) 有母數 法 ( 表 8) Origial Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.9400 5.2888 4.6052 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.9950 2.9893 6.37 0.8725 9.2628 4.5227 0.9000.7034 6.6636 0.9600 7.4395 3.862 0.9300 7.6066 3.3250.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9525 7.593 3.3393 0.9575 7.3054 3.2270 0.9425 6.7397 3.306 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 49

參數 β 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9875 2.367 6.450 0.8600 2.5779.344 () 無母數 法 ( 表 9) Origial Balaced Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.8500 2.253.2580 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile.bootstrap ormal 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8325 2.48.2386 0.8425 2.554.2224 0.975 3.8349 2.3057 0.8550 2.363.3055 0.8750 2.5595.45 0.8500 2.238.2585 0.8325 2.474.2458 0.8400 2.498.2287 0.8500 2.4276.6488 0.8575 2.399.3040 0.8500 2.253.2580.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.8750 2.5557.462 0.8925 2.8296.5340 0.8650 2.5223.3296 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 50

(2) 有母數 法 ( 表 20) Origial Double 方法 覆蓋機率 信賴區間 信賴區間 平均長度 長度標準差.Bootstrap ormal 0.9600 7.697 3.3274 2.Bootstrap percetile 3.Basic 5.BC percetile 6.BCa percetile 0.8675 2.5050.2556 0.8600 2.4535.2532 0.8400 2.4207.2949 0.9550 3.9379.6038 0.950 2.975.346.Bootstrap ormal --- --- --- 2.Bootstrap percetile 3.Basic 0.9475 3.6856.648 0.8575 2.543.0949 0.9525 4.083.7287 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 5

模擬範例 3: 韋伯分配 Weibull( ν, β) 參數的最大概似估計量 由 Weibull(2,5) 生成 5 筆資料, 參數 ν 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9300.6468 0.5565 0.9275.5793 0.5390 () 無母數 法 ( 表 2) Origial Balaced Double 方法 覆蓋機率 信賴區間平均長度 信賴區間長度標準差.Bootstrap ormal 0.9675 2.3678 0.873 2.Bootstrap percetile 0.9000 2.027 0.94 3.Basic 0.8950 2.832 0.9759 0.9225.725 0.6846 5.BC percetile 0.9225.8508 0.7778 6.BCa percetile 0.9275.7694 0.7005.Bootstrap ormal 0.9675 2.3653 0.8276 2.Bootstrap percetile 0.9025 2.0343 0.937 3.Basic 0.8975 2.885 0.9802 0.8425.2300 0.6945 5.BC percetile 0.925.8395 0.8045 6.BCa percetile 0.9250.767 0.7099.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.9575.9938 0.7293 3.Basic 0.9425.9269 0.94 0.9550 2.489 0.8942 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 52

(2) 有母數 法 ( 表 22) Origial Double 方法 覆蓋機率 信賴區間平均長度 信賴區間長度標準差.Bootstrap ormal 0.9450 2.0543 0.6679 2.Bootstrap percetile 0.8900.7725 0.734 3.Basic 0.8975.9608 0.7845 0.975.5798 0.5692 5.BC percetile 0.9350.69 0.5352 6.BCa percetile 0.9325.6302 0.5583.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.9200.5969 0.583 3.Basic 0.9425.737 0.6299 0.9225.630 0.589 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 53

參數 β 的 95% 信賴區間及近似信賴區間之 覆蓋機率信賴區間平均長度信賴區間長度標準差 0.9575 3.0904 0.970 0.9025 2.3624 0.9460 () 無母數 法 ( 表 23) Origial Balaced Double 方法 覆蓋機率 信賴區間平均長度 信賴區間長度標準差.Bootstrap ormal 0.9000 2.292 0.9262 2.Bootstrap percetile 0.9050 2.2878 0.9066 3.Basic 0.8975 2.2638 0.9265 0.9325 2.8505.0236 5.BC percetile 0.9000 2.2865 0.9248 6.BCa percetile 0.9025 2.2995 0.998.Bootstrap ormal 0.9025 2.2958 0.9206 2.Bootstrap percetile 0.9050 2.2908 0.907 3.Basic 0.8950 2.256 0.9366 0.8550.9788.0836 5.BC percetile 0.9025 2.2907 0.925 6.BCa percetile 0.9025 2.2976 0.9233.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.9250 2.6655 0.984 3.Basic 0.9600 3.3373.0858 0.9500 3.0408.0267 5.BC percetile --- --- --- 6.BCa percetile --- --- --- 54

(2) 有母數 法 ( 表 24) Origial Double 方法 覆蓋機率 信賴區間平均長度 信賴區間長度標準差.Bootstrap ormal 0.9075 2.359 0.928 2.Bootstrap percetile 0.9050 2.3495 0.9358 3.Basic 0.9025 2.34 0.9435 0.9400 2.8807 0.9936 5.BC percetile 0.925 2.3792 0.9237 6.BCa percetile 0.900 2.3745 0.9326.Bootstrap ormal --- --- --- 2.Bootstrap percetile 0.9450 2.9286.0030 3.Basic 0.9400 3.0052.043 0.9475 2.9904.08 5.BC percetile --- --- --- 6.BCa percetile --- --- --- Bootstrap 樣本的個數 B=999 Double 樣本的個數 M=249 覆蓋機率由 400 次的蒙 卡羅模擬求得 55

在範例, 是求取指數分配參數之最大概似估計量的信賴區間 在這例子, 特 改變 Bootstrap 樣本的個數, 來探討其 Bootstrap 樣本個數是否會影響其結果 當選取 B=499,B=999 及 B=499 ㆔個不同 B 值來作模擬, 由其結果, 可以發現 Bootstrap 樣本之個數對結果並不會影響太多 由於㆒般在以 Bootstrap 法來求取信賴區間時, 會建議 Bootstrap 樣本數不要太小, 因此, 在範例 2 及範例 3, 選取了 B=999 來作模擬 在範例 2, 是求取伽瑪分配參數之最大概似估計量的信賴區間, 範例 3 則是求取韋伯分配參數之最大概似估計量的信賴區間 由範例, 範例 2, 及範例 3 整體看來, 在無母數拔靴法的情況, 使用 Bootstrap ormal,bootstrap percetile,basic, Bootstrap-t,BC percetile 以及 BCa percetile 法, 其覆蓋機率皆可達到 82% 以, 且其信賴區間平均長度及信賴區間長度標準差在大部份的情況, 都比運用已知分配之信賴區間公式所求得的信賴區間平均長度及信賴區間長度標準差要小 而在使用 Balaced 法去修正後, 可以很清楚的發現, 其影響之程度非常小 但在使用 Double 法去修正後, 其覆蓋機率增加很多, 幾乎都比原始之 Bootstrap 法所求得之覆蓋機率大, 但相對的, 其信賴區間平均長度及信賴區間長度標準差也增大很多 由此, 可以得知, 無論有無做 56

Balaced 修正, 對其結果影響不大, 而 Double 修正雖然讓覆蓋機率增大, 但其信賴區間的長度也相對增大, 也就是此修正方法亦不是㆒個好的手法 在有母數拔靴法的情況, 無法使用 Balaced 法來做修正, 只能以 Double 法來修正, 而其結果和無母數拔靴法所產生之結果相同 但就無母數之區間估計及有母數之區間估計來看, 很明顯的可以知道, 在信賴區間平均長度及信賴區間長度標準差並沒有很大的差別, 其覆蓋機率有母數的優於無母數 57

第五章結論 本文主要是在探討如何應用無母數拔靴法及有母數拔靴法去建構信賴區間, 應用了六種不同方法, 包括了 Bootstrap ormal,bootstrap percetile,basic,bootstrap-t,bc percetile 以及 BCa percetile 法, 去求取信賴區間, 更進㆒步利用 Balaced 及 Double 法去修正六種的 Bootstrap 信賴區間 首先, 得了解這樣㆒個事實, 拔靴法是㆒種必須運用到電腦的技術, 而在求取參數的信賴區間, 會花費大量的電腦計算時間 在本文例子, 韋伯參數的最大概似估計量必須以收斂的方法求得, 再加 運用了 Double 方法, 相當於模擬了 BM 個 Bootstrap 樣本, 其電腦計算時間相當長 因此, 雖然在拔靴法,Bootstrap 樣本數 B 愈大, 會得到愈好的結果, 我們卻不能讓 B 值過大, 在電腦計算時間的衡量之, 訂定 Bootstrap 樣本數 B 值為 999,Double 樣本數 M 值為 249, 其結果已經是可信的 在拔靴法, 有㆒個非常重要的特性必須將其提出討論的 在㆒般情況, 平均數之估計有很多很好的性質及公式可以去運用 例如其標準差之計算, 若是 位數之估計, 要算其標準差則是很困難 但利用拔靴法, 可以很簡單的解決此問題 在本文, 範例 是求取指數分配參數最大概似估計量之信賴區間, 其最大概似估計量即為 58

平均數, 有相當好的公式可以去計算其信賴區間 但範例 2, 伽瑪分配參數最大概似估計量及範例 3, 韋伯分配參數最大概似估計量都是近似值 在 4.2 節及 4.3 節 所討論之信賴區間的公式亦都是近似的, 因此將拔靴法應用在範例 2 及範例 3 不見得是不適合的 由此可知拔靴法在任何情況, 只要有㆒筆資料再加 其所要討論之參數估計, 即可求出其信賴區間, 不必仰賴參數估計值之特性 由 4.4 節之 3 個範例, 可以知道求取信賴區間時, 在資料來源分配已知的情形, 使用有母數拔靴法比無母數拔靴法要好, 若資料來源分配未知, 就只能使用無母數拔靴法 而六種不同的 Bootstrap 信賴區間, 其差別並不是那麼的大 但依然可從模擬範例 比較得知, 在 Bootstrap-t 法相對其他方法可得到的較高的覆蓋機率, 雖然其信賴區間平均長度也較長, 可是並沒有差別太大 而在使用 Bootstrap-t 法還得知道參數估計值之標準差, 這也是很多時候在使用 Bootstrap-t 法會遇到的困難 另外, 修正過後的 Bootstrap percetile 法,BC percetile 及 BCa percetile 法, 也較原始的 Bootstrap percetile 法平均來說有較高的覆蓋機率, 但其差別並沒有那麼明顯 在第㆔章所提到的兩個修正方法, 在這㆔個範例, 並無特別好的㆒個結果產生 在使用 Balaced 方法去修正信賴區間, 和原始方法並無差別, 因為 Balaced 方法在求取信賴區間, 所要求的 59

Bootstrap 樣本數不會太小, 也就是當 Bootstrap 樣本數大時, 其實樣本就可以達到㆒個平衡狀態, 並不需要再用 Balaced 方法來修正 利用 Double 法來修正, 雖然覆蓋機率可以達到 90% 以, 但是相對的其信賴區間的平均長度也增長很多, 其信賴區間的長度標準差也增大 由於 Double 法會相當消粍電腦資源, 所以, 若不是很要求覆蓋機率, 其實用原始的 Bootstrap 法即可得到不錯的信賴區間 60

參考文獻 Daviso, A. C., Hikley, D.V. (997). Bootstrap Methods ad Their Applicatio. Cambridge Uiversity Press. Efro, B. (979a). Bootstrap Methods:Aother Look at the Jackkife. Aals of Statist. 7,-26. Efro, B. (98). The Jackkife, the Bootstrap, ad Other Resamplig Plas. SIAM, Philadelphia. Efro, B. (987).Better Bootstrap Cofidece Itervals. J. Amer. Statist. Assoc. 82, 7-85. Efro, B., Tibshirai, R.J. (993). A Itroductio to the Bootstrap. Chapma & Hall, New York. J.S. Milto, J.C. Arold, (995). Itroductio to Probability ad Statistics. New York:McGraw-Hill. Shao, J. ad Tu, D. (995). The Jackkife ad Bootstrap. Spriger-Verlag, New York. Zacks, S. (992). Itroductio to Reliability:Probability Models ad Statistical Methods. Spriger-Verlag, New York. 6