國立台灣大學圖書資訊學系四十週年系慶學術研討會論文格式

Size: px
Start display at page:

Download "國立台灣大學圖書資訊學系四十週年系慶學術研討會論文格式"

Transcription

1 Automatic Time Alignment for a Taiwanese Read Speech Corpus and its Application to Constructing Audiobooks with Text-Speech Synchronization % Youtube (force alignment) 214

2 [3] Wav 1.21G Sample rate 16kHz ForPA Transcriber HTK (Syllable) Transcriber HTK HTK 95% 1. tsoh-sit 215

3 2. e-thôo-lâng 3. kah but 4. kah tīnn-khó-x tsoh-site-thôo-lâng buttīnn-khó-x kah kah kah ô â ī Unicode Ascii/Big5 : TL ForPA 1. ' sing5 ' [' ', ' ', ' ', ' ', ' ', ' ', ' ', 'sing5', ' ', ' ', ' ', ' ', ' ', ' '] (regular expression) python re.split('([ - ] [a-za-z]+\d*)', ) re Python regularexpress Python unicode \u4e00 unicode \ufa2d Python >>> jj=' sing5 ' >>> re.split('([ - ] [a-za-z]+\d*)',jj) ['', ' ', '', ' ', '', ' ', '', ' ', '', ' ', '', ' ', ' ', 'sing5', ' ', ' ', '', ' ', '', ' ', '', ' ', ' '] ( ) 216

4 >>> ii=' sîng ' >>> re.split('([ - ] [a-za-z]+\d*)',ii) ['', ' ', '', ' ', ' ', 's', 'î', 'ng', ' ', ' ', '', ' ', '', ' ', '', ' ', ' '] sîng Python (LGO.py) hunhl [2] >>> ii=' sîng ' >>> hunhl(ii) [' ', ' ', ' ', ' ', ' ', ' ', ' ', 'sîng', ' ', ' ', ' ', ' ', ' ', ' '] sîng 2. e-thôo-lâng e1-thoo5-lang5 = 'ô â a ō î' = 'o a a o i' = ' ' >>> tobsr('siâ') 'sia5' >>> tobsr('dâ') 'da5' 3. ForPA TL ForPA (1) (Python hunsu) (2) ( Python Dict ) TL 'thoo5' ForPA >>> s,u,d = splitsud( thoo5') #S,U,D >>> [S2S.get(s,s), U2U.get(u,u), D2D.get(d,d)] 'to5' 217

5 splitsud S2S, U2U, D2D Python (Python dict) (2.1) re.split('([aeiou][a-za-z]*)(\d*)',syllable) syllable = song4 => ['s', 'ong', '4', ''] ForPA TL ForPA TL m ng m ng hm bng png mng hm png phng mng dng tng nng tng thng nng gng kng hng kng khng hng zng cng sng chng chhng sng ()(ng m) (2.2) >>> splitsud('song4') ['s', 'ong', '4'] >>> splitsud('siong2') ['s', 'iong', '2'] >>> splitsud('sng5') ['s', 'ng', '5'] >>> splitsud('sng') ['s', 'ng', ''] >>> splitsud('ng') ['', 'ng', ''] >>> splitsud('oai') ['', 'oai', ''] >>> splitsud('oe2') ['', 'oe', '2'] >>> splitsud('dfgsfd3') ['', 'dfgsfd', '3'] >>> splitsud(' ') ['', ' ', ''] ForPA ForPA Python dict 218

6 Python S2S = {k:v for k,v in zip(tlsvor, ForPaSVOR)} U2U = {k:v for k,v in zip(tluvor, ForPaUVOR)} D2D = {k:v for k,v in zip(tldiau, ForPaDiau)} #dict{...} will map from key to value >>> [S2S.get(S,S), U2U.get(U,U), D2D.get(D,D)] Python ['th', 'oo','5'] Python Dict ['to5'] 219

7 (2.3)(2.4) (2.3) TL TL ForPA ts ch z tsh chh c oe ue ue oa ua ua oai uai uai Python S2S.update({'ts':'z','tsh':'c'}) U2U.update({'oe':'ue','oa':'ua','oai':'uai'}) (2.4) ( ) ForPA soo oo so o so o ser er mo o mo o no o no o ngo o ngo o o o er mo/no/ngo mer/ner/nger Python S,U,D = splitsud(syllable) if S in {'m n ng'.split()} and U is 'o': rr = [S,U,D] else : rr = [S2S.get(S,S), U2U.get(U,U), D2D.get(D,D)] 220

8 Transcriber HTK Python CguAlign 1~10 (Combine001)[3] 221

9 txt mp3 HTK HTK wav Audacity[6] mp3 wav Sample rate 16000Hz txt wav Transcriber[5] trs CguAlign CguAlign CguAlign trs wav Output trs lrc sbv CguAlign 1.HTK 2. CguAlign 1. HTK[1] 222

10 (1) trs lab trs sil (2) lab lab (3) HtkTool 7 hled.led hled00.led hcopy.conf hinit.conf hrest.conf herest.conf hvite.conf (4) mlf HTK hled scp hled lst mlf mlf scp mlf dic hled mlf (Biphone) dic (5) lab mfc mfc HTK HTK hcopy hopy mfc scp hcopy wav mfc hcopy windows windows shift hcopy.conf hcopy os.system('hcopy -A -C hcopy.conf -S spwav2mfc.scp') mfc HMM HTK HCompV os.system('hcompv -A -C HCompV.conf -S spmfc.scp -m -I splab_p.mlf -M hmms_p/ -o '+m+' myhmmpro') mfc HCompV HMM splab_p.mlf (lab) spmfc.scp myhmmpro Mixture State HTK HERest mfc HERest HMM Phone 5 N=5 (6) HTK HVite HVite (Forced alignment) 223

11 SN0.mfc de_it_pinn_sil_qu_hi lab splab_p.mlf HVite mfc mlf HVite Input Output lab hled hcopy HCompV HERest HVite 224

12 CguAlign.py HTK 2. function( lrc sbv ) function lrc sbv lrc sbv output.lab.lab lab lrc sbv Transcriber Transcriber 1280 x

13 Transcriber HTK HTK μ = HTK N K N-K 226

14 HTK HTK HTK CguAlign CguAlign ( ) 78.67% ( ) 82.93% CguAlign Works CguAlign 227

15 Youtube (CguTASync) Youtube[4] Youtube Combine001( 1~10 ) CC Combine001 Youtube CguTASync(CguTextAudioSynchronization) Firefox 228

16 kalaok Youtube fft CguTASync 229

17 UTF8 Transcriber 140 HTK Transcriber HTK % YouTube [1] S. Young, G. Evermann, D. Kershaw, G. Moore, J. Odell, D. Ollason,D. Povey, V. Valtchev, and P. Woodland, The HTK book(for HTK version 3.4.1), Cambridge University Engineering Department,Tech. Rep., March [2] (2011). Python ( LGO.py) [3] [4] Youtube [5] Transcriber [6] Audacity 230

á à è á à í ú á è é ì á ò ò ú ó ì à í ù à à ó á ú è è à á ì à ó é ì é íí ù á ì ú ó è à è è è ú ú è è á ì à ò ù à ú ò é è à à è ì è ì à í à ó

More information

ttian

ttian á è è é à ú á óè á ú ù ù úú á é é á à ì è í ò á ù à è è ó ù ò é é ó íú ì à ù ù ì ì ò á ó á é ú ú è à à à ù é ú é ì ì à í ú ú ú à à á í é é í è é é ú éè ù á á ù á ó ú à ì ú á à ó è á úú á á ú à á è

More information

à è ú ì à ú è á ú à à á ù ó ò é é à ì ó ò ì í ó á á ì í ì ì ì é à é ì í ù á ì ó í à ó é ì ì ì ì á í à ì ò á ò à è í ù à ì à ú í á é ó ù ì à è ì ì ó ì ú ì ì à á ì ì á í í ì à í ú è ì í é à ì ù è à è

More information

è ì è é è ò ì ù ù ó é ú ù è ó ì ù à è ùè á ù ù ò ó ò ù à é ù ò ì í à à à à ò à á è à è ù é é ì ú ì à à ì é ù é í ì ò

More information

9 + ( 9 + 1) 2 9 6 ( 9 + 1) 6 54 60 3240 + 1 + 1 = + 1270 + 1 = 271 2 6 2 6 12 6 + 1 = 271 ó ù ó ì á ó ò è ù à 365 1 499 4 29 940 ó á 29 43 81 ì è 2 3 5 2 18 20 3 5 7 3 20 22 4 4 6 4 19 21 5 5 7

More information

ó ú ú ì á ò à á ì ù í ü à ò á ò á à á

More information

ó ì ì ò = 4( +5 / 3 ) 3 12.478 = 2.32 23.2 (47) 1 365 4 1 4 1 19 365 1 365 4 = 29 499 4 235 940 V M = 1 3300 182 M M á

More information

ó ì ì ò = 4( +5 / 3 ) 3 12.478 = 2.32 23.2 (47) 1 365 4 1 4 1 19 365 1 365 4 = 29 499 4 235 940 V M = 1 3300 182 M M á

More information

ì ó è à ù í ú á é à à è á è é á ó é è ì è è è á è ò ù é é ò ú è è è é ù ù á í ù à í í í à ó í é ì é ù ó ì áá á è à á ó á ì à ì í ù úù á í à íí ì à ò è í ù ì ì ì ó á ì

More information

è ù

è ù è ù é à ò ò ì ù á ò ú ì ì á í é é ú í ì è ù í é í á á í è à í ò ì ì è à ù ì ì ì á ìì à é à á á à ú ó à ó è à à ì ò è è ì à è á ì ò ì ì ì ì ì á ó à ì à á à à ó á à ù ò á á á é ì à à à á

More information

è ù é à ò ò ì ù á ò ú ì ì á í é é ú í ì è ù í é í á á í è à í ò ì ì è à ù ì ì ì á ìì à é à á á à ú ó à ó è à à ì ò è è ì à è á ì ò ì ì ì ì ì á ó à ì à á à à ó á à ù ò á á á é ì à à à á

More information

á ì é ò í í í à ò è á è ú á ú á ú é é á ò ì ò ì ú ì ù á à ì ì ì ò í ì à ò á ù ì à á á é ò ó ì í á ù à è ú ì à ú ò ú ó ó é à ó ú ì ì ì à ì ì è í í ú è ú í é è ù

More information

3 5 5 3 1 9 1 0 1 0 1 0 1 0 1 2 1 2 1 2 2 π 202 2 3.14 100 2 628 a 12 15 x a 20 = 9 2 2 3 2 4 2 5 2 1 2 2 ìí ì í à á à á á à è é è ò è à ó ò ì ù à í

More information

校园之星

校园之星 y cu jin k rn ju zo ho shu m i lng b ng png bi s bo cn zho dn ji kn hu ch x r u q xn w i kn j ju xin xin bng nin dng l ng zo j l i so ch l jin xi su tu y j ng chn ru m zh sng shn O AB AB AB O B AB

More information

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70

More information

á á á ú é ó é é á í í á ú á é á á í í é

More information

ò ú ó ó ú ó ú ó ú ú ó G L E = G W à è í ü í ü ü á á á á á á á á

More information

í í à ù à à í è è ú ì á á í à ú á è á ú à é à ù ú ì ì ì ò í è ì ì í ì ì ì è ì ì à é ó ò ó ú é ì ù ì í ó è ì à è á à ì à à à í í é á à ù ì ò ì é ú í í à à à à

More information

ó ú à ù á í í ì ì ù á ù í í ò ó ú ù à ì ì è á í í ì è á ù è ì à ú ì ù ì í à ì ì ó ì ì è ì è á ó à ó ò é ú? à á á ú á í é ì é ì á à á ù á à ò á ò é ù? ì

More information

ò ó ì á è ó

ò ó ì á è ó ò ó ì á è ó à à è ì è á ó ì à ì à à à á ì ó à ì ì è ó à ú ì í í á ù ò ò í ì ó à ò ú ó ì à à à à à à í á ì ù ù è ù è ò è ù é à

More information

1989 67 1993 125 305 1989 251 1964 8 1990 231 1983 608 1987 207 1990 6 ú é ì à í à ó 1990 51 é í í ù è ì ò ú à ù ó ú è í à ì è è è í á ó ì á á ò ì á ò

More information

ì

ì ì ó à á à í é é è ú à ú ù è í ù è á ú é ù í é à ú á à í ó ò è ì ì é à à á ò à ú è ó á à í ù ú ì ì í ì á è ù ù ò ó á ì ì à è á á ì à ó è ì á ì ì à é ì ó é à ú í ì í á à á

More information

ò í ú ó ì à ò è 5500 500 2 5500 x 23 50 2 5 2 5 9 5 10 9 5 9 9 4 4 10 64 9 9 74 10 1 5 2 1 9 5 5 4 9 7 1 5 1 3 2 1 3 1 5 1 3 1 5 1 1 5 1 3 1 1 1 4 1 4 2 40 40 1

More information

ttian

ttian í á é ì ì ì ó á ú è ù ó è á á é ì ú á á ò á è è ó é è ì á à á

More information

è

è è à à à í á à à ì ú ú á ú ú ì ì í ù í à ú è ò ò ì ù ì à ì à í ì ì è è è é à ì é é á è í í à ì è ì ú í ù ì ò è à í ì à á è ì ó ú è é é ì é ì ì ì ú ó ì à ú á

More information

é ú í í à á í à ù à é ó à è á ù á à à ì á á à é í á ò è ì í ì ù à é ì ì à à è ù é à ù à é ú ì ú ù 1 1 3 4

More information

030 í á ì ú è ì à é ù ò í í ú ù ù á í í ì ù ó ù ì è à é é ú í ì ù ì è ò á à ì ì ì ì ì á ú ì é í í é ò í ì é è ú ú í é ú è à è è à è ó à ò ù à à ù ó ì ì ì à à ù à á ú á ì á ù ù è

More information

ú á à à á á è ù? ì í ì á ì ò é? é à ì? à ó é à ì à à ì é í ì è? à ì á ú ó á á ì ù ì è ù

More information

ò à í é ì è ì é á à è à è è ì á á à à à

More information

ú ì à ì ù ù é à à à í ú ì ì à í à é ì ó à è à ù ì é á ù ú ò ù ù ò

More information

校园之星

校园之星 DI QIU ZHI L min xin i y yun TAN XUN RENNAO DE MI MI DI QIU ZHI L t jun png TAN XUN RENNAO DE MI MI DI QIU ZHI L o su TAN XUN RENNAO DE MI MI DI QIU ZHI L bo x mio c b TAN XUN RENNAO DE MI MI DI QIU ZHI

More information

特大调查事故与处理实例(五)

特大调查事故与处理实例(五) ( ) ...1...5... 10 3.1... 12 8.30... 16... 19... 23 35KV... 26... 28... 31... 36... 39 10.1... 43... 48 7 17... 50... 65... 65... 67 7 17... 68 7 17... 82 I ... 84 ----... 88 4-20 11... 89... 90... 92

More information

专科疾病诊治(十八)

专科疾病诊治(十八) ...1...2...5...12...19...22...24...27...31...33...36...42...48...52...56...62...72 I ...87...91...94... 105... 108... 117... 125... 132... 134... 145... 160... 162... 166... 170... 176... 179... 182 II

More information

第 一 部 分 前 言 研 究 前 言 : 楊 逵 是 臺 灣 文 學 史 上 一 位 不 可 或 缺 的 重 要 作 家 他 的 文 學 作 品, 不 論 是 小 說 詩 歌 或 是 戲 劇 等, 都 有 著 相 當 的 社 會 影 響 力 為 深 入 瞭 解 這 位 文 學 巨 人 的 作 品,

第 一 部 分 前 言 研 究 前 言 : 楊 逵 是 臺 灣 文 學 史 上 一 位 不 可 或 缺 的 重 要 作 家 他 的 文 學 作 品, 不 論 是 小 說 詩 歌 或 是 戲 劇 等, 都 有 著 相 當 的 社 會 影 響 力 為 深 入 瞭 解 這 位 文 學 巨 人 的 作 品, 第 四 屆 全 國 高 中 台 灣 人 文 獎 語 文 組 佳 作 壓 不 扁 的 玫 瑰 楊 逵 的 小 說 研 究 私 立 曉 明 女 中 林 岡 儒 陳 璽 安 楊 筠 圃 指 導 老 師 : 施 淑 慧 第 一 部 分 前 言 研 究 前 言 : 楊 逵 是 臺 灣 文 學 史 上 一 位 不 可 或 缺 的 重 要 作 家 他 的 文 學 作 品, 不 論 是 小 說 詩 歌 或 是 戲

More information

è á à ì ì ì ò à ó ù ú à ò è ù è è ò í á è ù è à ù à è á ú á í à à à é à à à é à èi ú á à à ó á ì à à á è à à á ó à á ù à à á ì ó à í à é ò ú ì à ò ì à ù ì é à í í á á è ò á á á á

More information

ì à à ó é í í à ì í ó à í á ò ó ì í ì í í ù ó à í ì à ù à ú è à à à ú ó ò í ù è á á é è ò ì ì ì è é ù ì à ì á ù à á ò í à ì é á è á ì ò ó è ì ò ú ì ó é ú í ú è ù í í à ó ú ú

More information

é

é à á í ù é ù ó á è í ú ù è ì í á ì ú á é ó ú ò ì ò ì à ù à ì è ì ì à è ì ó è ú á è í ì é ì éá ì é ì ù è è í í ù á à à è è à ú á ó ú è í ú á ú è ì ù ú é ì é à ú ù ì ì ó í è ì ì

More information

勤 學 * 卓 越 * 快 樂 成 長 本 校 在 老 師 群 策 群 力 共 同 討 論 下, 型 塑 了 學 校 願 景 : 勤 學 卓 越 快 樂 成 長 ( 一 ) 勤 學 運 用 真 的 力 量 培 養 勤 學, 以 語 文 教 為 基 礎 紮 根 ( 二 ) 卓 越 利 用 美 的 感

勤 學 * 卓 越 * 快 樂 成 長 本 校 在 老 師 群 策 群 力 共 同 討 論 下, 型 塑 了 學 校 願 景 : 勤 學 卓 越 快 樂 成 長 ( 一 ) 勤 學 運 用 真 的 力 量 培 養 勤 學, 以 語 文 教 為 基 礎 紮 根 ( 二 ) 卓 越 利 用 美 的 感 桃 園 市 復 旦 國 民 小 學 104 學 年 度 學 校 課 程 計 畫 壹 依 據 貳 目 的 一 教 基 本 法 第 13 條, 國 民 教 法 第 4 條 二 教 部 92 公 佈 之 國 民 中 小 學 九 年 一 貫 課 程 綱 要 三 桃 園 市 政 府 推 動 國 民 中 小 學 九 年 一 貫 課 程 實 施 計 畫 四 桃 園 市 政 府 97.5.29 府 教 數 字 第

More information

ü Ä ä ä ï ï ü ä ä

ü Ä ä ä ï ï ü ä ä ü Ä ä ä ï ï ü ä ä ü ü ü ä 50000476_0047_2 2 3 316 ó é â á ó ü ü ü ü ü ü ü ü ü ü ü ü é é ô é ò è é ü ü ü ü ü

More information

板橋查某

板橋查某 ... 4... 4... 5... 7... 9... 13... 15... 18... 23... 25... 27... 30... 31... 37... 39... 41... 45... 49... 51... 53... 55... 57... 59... 61... 63... 65... 67... 69 2 ( )... 73... 77... 81... 83... 85...

More information

i n i ho n n n n n ng

i n i ho n n n n n ng A i i i i i i i i n i ho n n n n n ng o o o o o o o b B b b p b b b b b b b p b b b b b b i b i b b i b b i b i b i b bn bn bn bn bn bn bn b bn bn bn bn bn bn bng bng bng b pn bng bng bng pn bng bo bo

More information

Bài tập trắc nghiệm sóng cơ và sóng âm - Download.com.vn

Bài tập trắc nghiệm sóng cơ và sóng âm - Download.com.vn LÝ THUYẾT SÓNG CƠ VÀ SÓNG ÂM LỚP 1 Câu 1: 䁞 䁞 䁞 䁞 䁞 A. 䁞 䁞 ă 䁞 䁞 䁞 䁞 B. 䁞 C. 䁞䁞 ă 䁞 䁞 䁞 䁞 D. a ê 䁞 䁞 䁞 xa a 䁞䁞 䁞䁞 D Câu : T 䁞䁞 a m a A. Â ặ í ý ủa â 䁞 ặ í ý ầ ố ê B. a ặ í ý ủa â 䁞 ặ í ý ầ ố ă 䁞 䁞 â C.

More information

è à è è à à ó á ò ó ù ì à à ì ù à à è ù à ó á ù è à ò ì ò òú ù è à à ì ò ì ù í ù ì è í ú ò ì ù á ì è ì á à à ò ì ì ì ó é á é ú à ú ù ì à ó ì è á ì ù ì à à á í á á à ì è ì è á í á à à á è é ù í í è

More information

) () : 3 ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 4 ,,,,,,,,,,,,,,,,,,,,,,,,, 1963 6 ; 1963 4,,,,,,,,,,,,,,,,, 1996 4 7 :,,,,,, :,, :,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ;, ;, ;, ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

More information

7 67 68 1989 1 3 7 1938 1820 1822 1824 1828 9 1840 19 . 12 13 1917 11 1 30 1 2 1 30. 1 dié 2 6 1964 3 1 4 22 2 35 4 31 18 8 2 20 à 1989 16 1964 4 55 3 62 3 79 3 79 25 3 37 9

More information

1988 11 20 1 ( ) ( ) ( ) ( ) 2 ( ) (, ) 3 ( ) ( ) ( ) ( ) ò ò ó í è

More information