The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese This study demonstrates a practical method for extrac

Similar documents

གཞང འབ མ ན ཅ ཞ ག ཡ ན ནམ ད ན དང ས ཐ ག གཞང འབ མ ཞ ས པ ན གཞང ལམ མམ ཁ གསལ བ ར བཤད ན ར བ ལམ ལ ར འམ འབ མ པ ཆགས པར ག གཉ མ གཞང འབ མ བ ཡ ན གཡ ན ང ས ས ཡ ད པའ པར

གས ལ འད བས ར ར འཆང ཐ ང མ The Short Vajradhara Lineage Prayer


<4D F736F F D205F FB942A5CEA668B443C5E9BB73A740B5D8A4E5B8C9A552B1D0A7F75FA6BFB1A4ACFC2E646F63>

UDC The Policy Risk and Prevention in Chinese Securities Market

2015年4月11日雅思阅读预测机经(新东方版)


致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也

流年影片——时光台湾 踏向台湾的征程    向往着,向往着,如一匹马儿从缰绳间松脱,心中带着无限憧憬。    想象着,想象着,如一条鱼儿幻想着云上的模样,心中持着无限好奇。    我多曾梦想过这座好似远在天外的小岛,听着那小鲁姐姐的故事。总想去寻找我迷恋的莎莎仔仔。梦中,都有这座福尔摩莎的幻影。    这一次,我终于如愿踏上了去往台北的征程。向着海峡那岸前进,前进。 疯狂的海上之旅    随着宜蘭的海风在头顶拂过,我们乘着这艘环海的游艇,慢慢地驶出了港湾。    伴着马达的加速,碧波荡漾的海面开始变得波

Microsoft PowerPoint - STU_EC_Ch08.ppt

2/80 2

OpenVanilla.rtfd

2. 佔 中 對 香 港 帶 來 以 下 影 響 : 正 面 影 響 - 喚 起 市 民 對 人 權 及 ( 專 制 ) 管 治 的 關 注 和 討 論 o 香 港 市 民 總 不 能 一 味 認 命, 接 受 以 後 受 制 於 中 央, 沒 有 機 會 選 出 心 中 的 理 想 特 首 o 一

Microsoft Word - TIP006SCH Uni-edit Writing Tip - Presentperfecttenseandpasttenseinyourintroduction readytopublish

《中文信息学报》投稿模版

Construction of Chinese pediatric standard database A Dissertation Submitted for the Master s Degree Candidate:linan Adviser:Prof. Han Xinmin Nanjing

2015 Chinese FL Written examination


1. 請 先 檢 查 包 裝 內 容 物 AC750 多 模 式 無 線 分 享 器 安 裝 指 南 安 裝 指 南 CD 光 碟 BR-6208AC 電 源 供 應 器 網 路 線 2. 將 設 備 接 上 電 源, 即 可 使 用 智 慧 型 無 線 裝 置 進 行 設 定 A. 接 上 電 源

Chn 116 Neh.d.01.nis

Probase( 超 过 265 万 实 体 ), 百 度 知 心, 搜 狗 知 立 方 等 知 识 图 谱 只 提 供 英 汉 法 等 语 言 的 相 关 知 识 [3], 少 数 民 族 语 言 知 识 图 谱 的 构 建 才 刚 刚 起 步 例 如, 当 搜 索 ཏ ལའ བ མ ( 达 赖

You are invited to participate in the 2016 election for the University Staff Congress! The Congress consists of elected representatives from 106 distr

北塔佛学宝藏 沸汁蒸汽作腾涌由三字放诸光焰 ཕ གས བཅ ར འཕ ས པས ར ར གས མ བད ད ར ར བཅས ར མས ས ན ད ངས ནས 遍照十方金刚三所有甘露悉降临 ས ས ར ཡ ག གས མ ཐ མ པས བད ད ར ར ཞ ན

<4D F736F F D D312DC2B2B4C2AB47A16DC5AAAED1B0F3B5AAB0DDA144A7B5B867A16EB2A4B1B4A277A548AED1A4A4BEC7A5CDB0DDC344ACB0A8D2>

前 言 香 港 中 文 大 學 優 質 學 校 改 進 計 劃 ( 下 稱 計 劃 ) 團 隊 自 1998 年 起 積 極 於 本 地 推 動 理 論 及 實 踐 並 重 的 學 校 改 進 工 作, 並 逐 步 發 展 成 為 本 地 最 具 規 模 的 校 本 支 援 服 務 品 牌, 曾 支

( ) ( ) ( ) ( )

東莞工商總會劉百樂中學

Index of Zhengtong Daozang

¿ Ê£º˝

ENGG1410-F Tutorial 6

Barom Kagyu Ngondro Sadhana

大乘五蕴论

<4D F736F F D203037AB6EA578C657A467A661A4BDAFABB9B3B455AB61B379A7CEACE3A8732E646F63>

高職教師教學成敗歸因之研究

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

通識教育與我們的未來:萬能技術學院發展通識教育的現況與願景.PDF

1對外華語文詞彙教學的策略研究_第三次印).doc


汉语口语考试

Windows XP

Microsoft Word - 专论综述1.doc

A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

<4D F736F F D205F355FBDD7A16DA4E5A4DFC04AC073A16EA4A4AABAA175B74EB648A176BB50A175A4F1BFB3A176>


1505.indd

Microsoft Word - chnInfoPaper6

:

༅། །སུམ་ཅུ་པའི་སྙིང་པོ་ལེགས་བཤད་ལྗོན་པའི་དབང་པོ་བཞུགས་སོ།།

Abstract There arouses a fever pursuing the position of being a civil servant in China recently and the phenomenon of thousands of people running to a

32 戲劇學刊 A Study of Beijing Opera s Jing Actors and Their Vocal Accents in the Early Twentieth Century Using Two Operas, Muhuguan and Yuguoyuan, as Exa


南華大學數位論文

(Microsoft Word - \325\324\261\246\267\3222)


small fire indd

BC04 Module_antenna__ doc

Microsoft Word - Literature in a New Key 12→ docx

Microsoft Word doc

論法院作成出版品禁止發行之衡量標準

untitled

现代汉语语料库基本加工规格说明书


國 史 館 館 刊 第 23 期 Chiang Ching-kuo s Educational Innovation in Southern Jiangxi and Its Effects ( ) Abstract Wen-yuan Chu * Chiang Ching-kuo wa

Microsoft Word - CGJ6-1-05陳伯軒.doc

1.第二卷第二期p1

硕 士 学 位 论 文 论 文 题 目 : 北 岛 诗 歌 创 作 的 双 重 困 境 专 业 名 称 : 中 国 现 当 代 文 学 研 究 方 向 : 中 国 新 诗 研 究 论 文 作 者 : 奚 荣 荣 指 导 老 师 : 姜 玉 琴 2014 年 12 月

三維空間之機械手臂虛擬實境模擬


何繼文 232 詩代表因此分析黃詩的肌理特色也會從詩史的宏觀角度出發考察評價黃庭 堅對 詩法 演進所起的作用他主要從三方面探討黃庭堅詩的價值 一 薈萃宋詩 之長為宋詩之祖 二 以古人為師以質厚為本 三 運用 逆筆 本文即從 以上三方面展開討論闡述翁方綱評論黃庭堅詩的觀點剖析其背後的詩學理論依 據探討

2005硕士论文模版

<4D F736F F D20B6FECAAED2BBB6C8C4B8D4DE2E646F63>

4. 每 组 学 生 将 写 有 习 语 和 含 义 的 两 组 卡 片 分 别 洗 牌, 将 顺 序 打 乱, 然 后 将 两 组 卡 片 反 面 朝 上 置 于 课 桌 上 5. 学 生 依 次 从 两 组 卡 片 中 各 抽 取 一 张, 展 示 给 小 组 成 员, 并 大 声 朗 读 卡

Microsoft Word - D-2°w¶Ë¬ì¹ï¤U�Iµh®{¤âÀˬd¬yµ{_¬x°ö�×__P _.doc

高中英文科教師甄試心得

TWGHs S


University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

Abstract Since 1980 s, the Coca-Cola came into China and developed rapidly. From 1985 to now, the numbers of bottlers has increased from 3 to 23, and

LH_Series_Rev2014.pdf

Microsoft Word - 09王充人性論_確定版980317_.doc

English Language

20

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

H.-0<-., zr-kr$?-sj-+:a-;=-.-/a,,.$j-ar%-.0=- w/-(j<-p$?-0,,.j-3a%- [-8J?-:2R.-0-!J,,;R.-.%-3J.-0:A- KR$?-:)A$-0,,%-;A-,J$-0-:)A$-gJ/-.,, ]- 3J.-,J$-

目录 CONTENTS

2017 CCAFL Chinese in Context

<4D F736F F D20B5DAC8FDB7BDBE57C9CFD6A7B8B6D6AEB7A8C2C98696EE7DCCBDBEBF2E646F63>

摘 要 張 捷 明 是 台 灣 當 代 重 要 的 客 語 兒 童 文 學 作 家, 他 的 作 品 記 錄 著 客 家 人 的 思 想 文 化 與 觀 念, 也 曾 榮 獲 多 項 文 學 大 獎 的 肯 定, 對 台 灣 這 塊 土 地 上 的 客 家 人 有 著 深 厚 的 情 感 張 氏 於

Microsoft Word - 第四組心得.doc


南華大學數位論文

Microsoft Word - 05張政偉

Microsoft Word - xb 牛尚鹏.doc

\\Lhh\07-02\黑白\内页黑白1-16.p

Microsoft Word - 08_76-93_¦ó³B¬O¡§Âk¡¨®a¡H.doc

096STUT DOC

Microsoft Word doc

13 A DSS B DSS C DSS D DSS A. B. C. CPU D. 15 A B Cache C Cache D L0 L1 L2 Cache 16 SMP A B. C D 17 A B. C D A B - C - D

文言*白话*普通话*方言

Transcription:

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese Christopher Handy Michael Litchard handyca@mcmaster.ca http://handyc.sdf.org Inaugural NARNiHS Conference 23 July 2017

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese This study demonstrates a practical method for extracting recurrent strings from digitized texts in cases where grammar, vocabulary and other information about the texts are partly or entirely unknown.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese Our method involves building concordances of words and phrases from digitized input sets of texts, using a simple but effective patternrecognition algorithm. The algorithm can be generalized to work with information in any language, but we restrict this study to just three major languages of the Buddhist tradition: Sanskrit, classical Tibetan and classical Chinese.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese We utilize free text files available in online databases so that our examples can be verified easily. We also provide source code examples of our algorithm in C and Haskell, available on GitHub: https://github.com/handyc

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese Three languages of the Buddhist literary tradition Sanskrit, Tibetan and Chinese lack word boundary delimiters in their traditional manuscripts. A human being familiar with these languages can identify individual words in such manuscripts, but the texts have no spaces between words, such that we cannot locate words without prior knowledge of the language.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese As a result of this problem, digital concordances for Sanskrit, Tibetan and Chinese often require some amount of manual part-of-speech tagging before sending datasets to the computer.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese Our software runs through every possible string of n syllables in every text of a text corpus, where n is any number desired by the user. We refer to strings of connected syllables as n-grams, named by their specific n size as 1-gram, 2-gram, 3-gram, etc.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese The program counts each n-gram in a given text, and creates a concordance file for that text. These concordance files are then combined to form a concordance file for the entire corpus.

The Haks Language Modeling System: Examples from Buddhist Texts in Sanskrit, Tibetan and Chinese For example, searching on n =4 among a sample set of major Sanskrit Mahāyāna texts, we found the sequence bo-dhi-sa-ttva appearing frequently in many different texts. If this sequence appears more frequently in Mahāyāna texts than in mainstream texts, it could be used as an identifier for the Mahāyāna genre.

Sanskrit Mahāyāna and Mūlasarvāstivāda Vinaya frequent n-grams Mahāyāna 4-gram Mahāyāna 8-gram MSV 4-gram MSV 8-gram bodhisattva (3343) nuttarāyāṁsamyaksaṁbo (451) kathayati (1367) bhagavataārocaya (166) tathāgata (2096) ttarāyāṁsamyaksaṁbodhau (436) bhagavanā (550) vaśeṣāmāpattimāpa (166) kulaputra (1346) nuttarāṁsamyaksaṁbodhi (320) gavānāha (520) ghāvaśeṣāmāpattimā (166) śatasaha (1298) samyaksaṁbodhimabhisaṁ (303) sakathaya (499) gavataārocayanti (166) bodhisattvā (1289) ttarāṁsamyaksaṁbodhima (302) samayena (458) nakālenatenasama (164) samyaksaṁbo (901) rāṁsamyaksaṁbodhimabhi (297) kathayanti (405) kālenatenasamaye (164) bodhisattvo (874) thāgatorhansamyaksaṁbu (266) saṃlakṣaya (372) lenatenasamayena (163) athakhalu (860) kṣetraparamāṇurajaḥ (262) damavoca (372) vobhagavataāroca (159) lokadhātu (812) ddhakṣetraparamāṇura (260) lakṣayati (356) kṣavobhagavataāro (159) sahasrāṇi (746) traparamāṇurajaḥsa (259) bhagavatā (346) tatprakaraṇaṃbhikṣavo (153) mahāmate (740) buddhakṣetraparamāṇu (250) midamavo (332) tprakaraṇaṃbhikṣavobha (152) buddhakṣetra (647) gavantametadavoca (241) ghāvaśeṣā (311) raṇaṃbhikṣavobhagava (152) tasahasrā (637) bhagavantametadavo (236) gṛhapati (303) karaṇaṃbhikṣavobhaga (152) dhisattvasya (616) ṭīnayutaśatasaha (224) praticchannā (298) bhikṣavobhagavataā (152) tadavoca (610) koṭīnayutaśatasa (224) tisakatha (292) ṇaṃbhikṣavobhagavata (151) sarvasattva (599) paramāṇurajaḥsamā (205) tadabhava (288) gavantamidamavoca (150) sattvomahā (578) myaksaṁbodhimabhisaṁbu (205) rvavadyāva (280) ārocayantibhagavā (135) tathāgatā (571) ṭīniyutaśatasaha (196) saṃghāvaśe (278)* tenakālenatenasa (135)

Tibetan 'dul ba (=vinaya, monastic law ) texts from the Derge Kanjur (Buddhist canon) 'dul ba text 2-gram 4-gram kl00001e1.txt DGE_SLONG (2671) SO_SOR_THAR_PA'I (672) kl00001e2.txt PA_DANG (1827) BCOM_LDAN_'DAS_KYIS (578) kl0001e3inc.txt DGE_SLONG (2031) BCOM_LDAN_'DAS_KYIS (523) kl0001e4inc.txt PA_DANG (1713) BCOM_LDAN_'DAS_KYIS (407) kl00002e1.txt DGE_SLONG (346) TSE_DANG_LDAN_PA (101) kl00003e1.txt DGE_SLONG (2089) TSE_DANG_LDAN_PA (647) kl00003e2inc.txt DGE_SLONG (2636) TSE_DANG_LDAN_PA (749) kl00003e3.txt DGE_SLONG (2550) BCOM_LDAN_'DAS_KYIS (879) kl00003e4.txt PA_DANG (1679) BCOM_LDAN_'DAS_KYIS (591) kl00004e.txt DGE_SLONG (465) DGE_SLONG_MA_GANG (211)

Tibetan 'dul ba (=vinaya, monastic law ) texts from the Derge Kanjur (Buddhist canon) 'dul ba text 2-gram 4-gram KL00001001(eTB).txt དག ས ང (2622) ས ས ར ཐར པའ (667) KL00001002(eTB).txt པ དང (1796) བཅ མ ལ ན འདས ཀ ས (568) KL00001003(eTB).txt དག ས ང (1993) བཅ མ ལ ན འདས ཀ ས (515) KL00001004(eTB).txt པ དང (1686) བཅ མ ལ ན འདས ཀ ས (404) KL00002001(eTB).txt དག ས ང (342) ཚ དང ལ ན པ (100) KL00003001(eTB).txt དག ས ང (2042) ཚ དང ལ ན པ (622) KL00003002(eTB).txt དག ས ང (2595) ཚ དང ལ ན པ (733) KL00003003(eTB).txt དག ས ང (2500) བཅ མ ལ ན འདས ཀ ས (858) KL00003004(eTB).txt པ དང (1656) བཅ མ ལ ན འདས ཀ ས (581) KL00004(eTB).txt དག ས ང (457) དག ས ང མ གང (211)

Tibetan mdo mang (=sūtra) texts from the Derge Kanjur (Buddhist canon) mdo mang text 4-gram 8-gram kl00094e.txt BYANG_CHUB_SEMS_DPA' (111) BYANG_CHUB_SEMS_DPA'_MCHOG_TU_DGA' _BA'I (25) kl00095e.txt BYANG_CHUB_SEMS_DPA' (608) SLONG_DAG_DE_LTAR_BYANG_CHUB_SEMS _DPA' (36) kl00096e.txt BYANG_CHUB_SEMS_DPA' (55) BYANG_CHUB_SEMS_DPA'I_RAB_TU_'BYUNG _BA (25) kl00097e.txt BYANG_CHUB_SEMS_DPA' (63) PA_JI_LTAR_NA_BYANG_CHUB_SEMS_DPA' (30) kl00098e.txt BYANG_CHUB_SEMS_DPA' (29) BYANG_CHUB_SEMS_DPA'_SEMS_DPA'_CHE N_PO (11) kl00108e.txt BYANG_CHUB_SEMS_DPA' (187) BYANG_CHUB_SEMS_DPA'_SEMS_DPA'_CHE N_PO (88) kl00353.txt BYANG_CHUB_SEMS_DPA' (353) BYANG_CHUB_SEMS_DPA'_SEMS_DPA'_CHE N_PO (22) kl00357.txt BYANG_CHUB_SEMS_DPA' (27) BYANG_CHUB_SEMS_DPA'_SEMS_DPA'_CHE N_PO (8)

Tibetan mdo mang (=sūtra) texts from the Derge Kanjur (Buddhist canon) mdo mang text 4-gram 8-gram KL00094(eTB).txt བ ང ཆ བ ཏ ན (977)* བ ང ཆ བ ཏ ན ས མས བས ད ད བད (679)* KL00095(eTB).txt བ ང ཆ བ ས མས དཔའ (591) ས ང དག ད ལ ར བ ང ཆ བ ས མས དཔའ (36) KL00096(eTB).txt བ ང ཆ བ ས མས དཔའ (55) བ ང ཆ བ ས མས དཔའ རབ ཏ འབ ང བ (24) KL00097(eTB).txt བ ང ཆ བ ས མས དཔའ (60) པ ཇ ལ ར ན བ ང ཆ བ ས མས དཔའ (29) KL00098(eTB).txt བ ང ཆ བ ས མས དཔའ (29) བ ང ཆ བ ས མས དཔའ ས མས དཔའ ཆ ན པ (11) KL00108(eTB).txt བ ང ཆ བ ས མས དཔའ (108) བ ང ཆ བ ས མས དཔའ ས མས དཔའ ཆ ན པ (87) KL00353(eTB).txt བ ང ཆ བ ས མས དཔའ (232) བ ང ཆ བ ཏ ས མས བས ད པར ག ར ཏ (9)* KL00357(eTB).txt བ ང ཆ བ ས མས དཔའ (26) བ ང ཆ བ ས མས དཔའ ས མས དཔའ ཆ ན པ (8)

Chinese texts from the Taishō canon (Chinese Buddhist canon) Text 1-gram 2-gram 4-gram 8-gram T01 有 者 (21400) (21078) (20109) (16553) 比丘 世尊 沙門 (7863) (7848) (4876) (3014) 所以者何 沙門瞿曇 尊者阿難 爾時世尊 (879) (799) (557) (544) 如來無所著等正覺 聞佛所說歡喜奉行 我聞一時佛遊 誦我聞一時佛 (246) (242) (216) (199) T02 時 如 (21383) (18528) (16702) (16470) 比丘 世尊 爾時 (11395) (7862) (7260) (6083) 爾時世尊 所說歡喜 聞佛所說 佛所說歡 (2592) (1803) (1756) (1699) 衛國祇樹給孤獨園 舍衛國祇樹給孤獨 聞佛所說歡喜奉行 我聞一時佛住 (1505) (1505) (1380) (1275) T03 如 無 (16212) (15204) (14458) (14028) 爾時 一切 (5812) (5750) (4446) (3834) 藐三菩提 三藐三菩 阿耨多羅 耨多羅三 (1094) (1094) (1093) (1093) 阿耨多羅三藐三菩 耨多羅三藐三菩提 成阿耨多羅三藐三 多羅三藐三菩提心 (1092) (1092) (349) (241) T04 者 人 (16280) (11786) (11086) (10931) 比丘 故 世尊 爾時 (3117) (2268) (2248) (2141) 故說曰 爾時世尊 即說偈言 亦復 (1052) (520) (347) (300) 舍衛國祇樹給孤獨 衛國祇樹給孤獨園 在舍衛國祇樹給孤 佛在舍衛國祇樹給 (138) (137) (137) (134)

Chinese texts from the Taishō canon (Chinese Buddhist canon) Text 1-gram 2-gram 4-gram 8-gram T08 菩 無 (30632) (29114) (28812) (27650) 波羅 羅蜜 般若 (16532) (16492) (16387) (12207) 般若波羅 若波羅蜜 摩訶 薩摩訶薩 (11852) (11851) (6444) (6439) 阿耨多羅三藐三菩 耨多羅三藐三菩提 須菩提摩訶薩 阿耨多羅三耶三菩 (2176) (2170) (878) (878) T09 一 無 佛 法 (19709) (18855) (16633) (15684) 一切 眾生 如來 (14366) (9990) (8800) (4534) 一切眾生 摩訶 薩摩訶薩 令一切眾 (2769) (2089) (2088) (1187) 阿耨多羅三藐三菩 耨多羅三藐三菩提 子為摩訶薩 佛子為摩訶 (544) (544) (267) (267) T10 一 無 切 諸 (30535) (29172) (21625) (20996) 一切 眾生 (21590) (17716) (11979) (6543) 一切眾生 摩訶 薩摩訶薩 一切諸佛 (3496) (2369) (2368) (1211) 阿耨多羅三藐三菩 耨多羅三藐三菩提 謂生心我 薩生心我已得 (495) (495) (316) (316) T11 無 如 (25990) (21719) (21493) (19870) 一切 如來 (10722) (7850) (7281) (6397) 薩摩訶薩 摩訶 文殊師利 一切眾生 (2303) (2303) (1033) (802) 阿耨多羅三藐三菩 耨多羅三藐三菩提 舍利子摩訶薩 得阿耨多羅三藐三 (770) (770) (331) (154)

Chinese texts from the Taishō canon (Chinese Buddhist canon) Text 1-gram 2-gram 4-gram 8-gram T12 如 無 (31334) (28306) (27667) (27300) 如來 眾生 (10028) (9206) (7684) (7624) 摩訶 薩摩訶薩 亦復 一切眾生 (1900) (1896) (1640) (1385) 阿耨多羅三藐三菩 耨多羅三藐三菩提 得阿耨多羅三藐三 善男子摩訶薩 (1052) (1050) (369) (334) T13 無 如 (23427) (22261) (21834) (19803) 一切 眾生 (9957) (9957) (7919) (7743) 摩訶 薩摩訶薩 一切眾生 阿耨多羅 (1686) (1680) (1109) (905) 阿耨多羅三藐三菩 耨多羅三藐三菩提 多羅三藐三菩提心 發阿耨多羅三藐三 (898) (898) (263) (248) T14 無 佛 南 如 (58875) (44990) (37115) (19559) 南無 佛南 如來 (36603) (28455) (9873) (7861) 如來南無 王佛南無 佛南無無 南無 (4964) (2403) (2148) (1460) 阿耨多羅三藐三菩 耨多羅三藐三菩提 中華電子佛典協會 曰智慧為六何謂 (607) (607) (332) (242) T15 無 如 (21311) (21014) (19035) (15385) 一切 眾生 (7368) (5846) (4631) (3574) 文殊師利 可思議 摩訶 薩摩訶薩 (1282) (1125) (645) (644) 阿耨多羅三藐三菩 耨多羅三藐三菩提 童子摩訶薩復 子摩訶薩復有 (359) (359) (171) (171)

Chinese texts from the Taishō canon (Chinese Buddhist canon) Text 1-gram 2-gram 4-gram 8-gram T21 一 二 如 (15785) (15538) (11616) (11430) 二合 一切 (7689) (5164) (4365) (3513) 娑嚩二合 此陀羅尼 嚩二合引 電子佛典 (1151) (784) (767) (684) 中華電子佛典協會 項本資料庫可自由 電子佛典普及版完 電子佛典協會版權 (456) (228) (228) (228) T22 比 丘 (38638) (37624) (33402) (25496) 比丘 諸比 丘尼 (37618) (9580) (8891) (8760) 若比丘尼 六群比丘 白佛佛言 告諸比丘 (1663) (1570) (1517) (1456) 默然故事持 從今戒應說 今戒應說若 戒應說若比 (509) (482) (449) (442) T23 比 丘 (30543) (28299) (23647) (22827) 比丘 苾芻 丘尼 (22825) (8356) (6004) (4509) 種種因緣 僧伽婆尸 伽婆尸沙 白佛佛言 (1156) (1054) (1054) (1011) 應說若復苾芻 學處應說若復 處應說若復苾 制其學處應說 (409) (372) (368) (363) T24 者 有 (27289) (23089) (18720) (16271) 苾芻 比丘 世尊 (8486) (6489) (5131) (4908) 爾時世尊 白佛佛言 時諸苾芻 波逸底迦 (695) (611) (601) (551) 波逸底迦若復苾芻 苾芻以緣白佛佛言 者波逸底迦若復苾 逸底迦若復苾芻尼 (279) (206) (191) (182)