文档智能 : 数据集 模型和应用 崔磊, 徐毅恒, 吕腾超, 韦福如 微软亚洲研究院 {lecu, t-yihengxu, tengchaolv, 摘要 文档智能是指通过计算机进行自动阅读 理解以及分析商业文档的过程, 是自然语言处理和计算机视觉交叉领域的一

Size: px
Start display at page:

Download "文档智能 : 数据集 模型和应用 崔磊, 徐毅恒, 吕腾超, 韦福如 微软亚洲研究院 {lecu, t-yihengxu, tengchaolv, 摘要 文档智能是指通过计算机进行自动阅读 理解以及分析商业文档的过程, 是自然语言处理和计算机视觉交叉领域的一"

Transcription

1 文档智能 : 数据集 模型和应用 崔磊, 徐毅恒, 吕腾超, 韦福如 微软亚洲研究院 {lecu, t-yihengxu, tengchaolv, fuwei}@microsoft.com 摘要 文档智能是指通过计算机进行自动阅读 理解以及分析商业文档的过程, 是自然语言处理和计算机视觉交叉领域的一个重要研究方向 近年来, 深度学习技术的普及极大地推动了文档智能领域的发展, 以文档版面分析 文档信息抽取 文档视觉问答以及文档图像分类等为代表的文档智能任务都有显著的性能提升 本文对于早期基于启发式规则的文档分析技术 基于统计机器学习的算法 以及近年来基于深度学习和预训练的方法进行简要介绍, 并展望了文档智能技术的未来发展方向 关键词 : 文档智能 ; 文档版面分析 ; 文档信息抽取 ; 文档视觉问答 ; 文档图像分类 ; 深度学习 ; 多模态预训练 Document AI: Benchmarks, Models and Applications Lei CUI, Yiheng XU, Tengchao LV, Furu WEI Microsoft Research Asia {lecu, t-yihengxu, tengchaolv, fuwei}@microsoft.com Abstract 坄坯坣坵坭坥坮坴坁坉圬坯坲坄坯坣坵坭坥坮坴坉坮坴坥坬坬坩坧坥坮坣坥圬坩坳坡坲坥坬坡坴坩坶坥坬坹坮坥坷坲坥坳坥坡坲坣坨坴坯坰坩坣坴坨坡坴坲坥坦坥坲坳坴坯坴坨坥坴坥坣坨坮坩坱坵坥坳坴坯坡坵坴坯坭坡坴坩坣坡坬坬坹坲坥坡坤圬坵坮坤坥坲坳坴坡坮坤坡坮坤坡坮坡坬坹坺坥坢坵坳坩坮坥坳坳坤坯坣坵坭坥坮坴坳圮坉坴坩坳坡坮坩坭坰坯坲坴坡坮坴坲坥坳坥坡坲坣坨坤坩坲坥坣坴坩坯坮坦坯坲坴坨坥坩坮坴坥坲坤坩坳坣坩坰坬坩坮坡坲坹坯坦坮坡坴坵坲坡坬坬坡坮坧坵坡坧坥坰坲坯坣坥坳坳圭坩坮坧坡坮坤坣坯坭坰坵坴坥坲坶坩坳坩坯坮圮坉坮坲坥坣坥坮坴坹坥坡坲坳圬坴坨坥坰坯坰坵坬坡坲坩坴坹坯坦坤坥坥坰坬坥坡坲坮坩坮坧坴坥坣坨坮坯坬坯坧坹坨坡坳坧坲坥坡坴坬坹坡坤坶坡坮坣坥坤坴坨坥坤坥坶坥坬坯坰坭坥坮坴坯坦坄坯坣坵坭坥坮坴坁坉坴坡坳坫坳圬坳坵坣坨坡坳坤坯坣坵坭坥坮坴坬坡坹圭坯坵坴坡坮坡坬坹坳坩坳圬坤坯坣坵坭坥坮坴坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圬坤坯坣坵坭坥坮坴坶坩坳坵坡坬坱坵坥坳坴坩坯坮坡坮坳坷坥坲坩坮坧圬坡坮坤坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮坥坴坣圮坔坨坩坳坰坡坰坥坲坢坲坩坥圍坹坩坮坴坲坯坤坵坣坥坳坴坨坥坥坡坲坬坹圭坳坴坡坧坥坨坥坵坲坩坳坴坩坣坲坵坬坥圭坢坡坳坥坤坤坯坣坵坭坥坮坴坡坮坡坬坹坳坩坳圬坳坴坡坴坩坳坴坩坣坡坬坭坡坣坨坩坮坥坬坥坡坲坮坩坮坧坢坡坳坥坤坡坬坧坯坲坩坴坨坭坳圬坡坳坷坥坬坬坡坳坴坨坥坤坥坥坰坬坥坡坲坮坩坮坧坢坡坳坥坤坡坰坰坲坯坡坣坨坥坳坥坳坰坥坣坩坡坬坬坹坴坨坥坰坲坥圭坴坲坡坩坮坩坮坧坡坰坰坲坯坡坣坨坥坳圮坆坩坮坡坬坬坹圬坷坥坡坬坳坯坬坯坯坫坩坮坴坯坴坨坥坦坵坴坵坲坥坤坩坲坥坣坴坩坯坮坯坦坄坯坣坵坭坥坮坴坁坉圮 坋坥坹坷坯坲坤坳场坄坯坣坵坭坥坮坴坁坉圬坤坯坣坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳圬坤坯坣坵坭坥坮坴坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圬坤坯坣坵坭坥坮坴坶坩坳坵坡坬坱坵坥坳坴坩坯坮坡坮坳坷坥坲坩坮坧圬坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮圬坤坥坥坰坬坥坡坲坮坩坮坧圬坭坵坬坴坩坭坯坤坡坬坰坲坥圭坴坲坡坩坮坩坮坧 2021 中国大会根据 Creative Commons Attribution 4.0 International License 许可出版

2 1 文档智能 文档智能 ( 坄坯坣坵坭坥坮坴坁坉圬坯坲坄坯坣坵坭坥坮坴坉坮坴坥坬坬坩坧坥坮坣坥 ) 是近年来一项蓬勃发展的研究课题和实际的工业界需求, 主要是指对于网页 数字文档或扫描文档所包含的文本以及丰富的排版格式等信息, 通过人工智能技术进行理解 分类 提取以及信息归纳的过程 由于布局和格式的多样性 低质量的扫描文档图像以及模板结构的复杂性, 文档智能是一项非常具有挑战性的任务并获得相关领域的广泛关注 随着数字化进程的加快, 文档 图像等载体的结构化分析和内容提取成为关乎企业数字化转型成败的关键一环, 自动 精准 快速的信息处理对于生产力的提升至关重要 以商业文档为例, 不仅包含了公司内外部事务的处理细节和知识沉淀, 还有大量行业相关的实体和数字信息 人工提取这些信息既耗时费力且精度低, 而且可复用性也不高, 因此, 文档智能技术应运而生 文档智能技术深层次地结合了人工智能和人类智能, 在金融 医疗 保险 能源 物流等多个行业都有不同类型的应用 例如 : 在金融领域, 它可以实现财报分析和智能决策分析, 为企业战略的制定和投资决策提供科学 系统的数据支撑 ; 在医疗领域, 它可以实现病例的数字化, 提高诊断的精准度, 并通过分析医学文献和病例的关联性, 定位潜在的治疗方案 在财务领域, 它可以实现发票和采购单的自动化信息提取, 将大量无结构化文档进行自动结构化转换, 并支撑大量下游业务场景, 节省大量人工处理时间开销 在过去的圳地年中, 文档智能的发展大致经历了三个阶段, 从简单的规则启发式方法逐渐进化至神经网络的方法 圹地年代初期, 研究人员大多使用基于启发式规则的方法进行文档的理解与分析, 通过人工观察文档的布局信息, 总结归纳一些处理规则, 对固定布局信息的文档进行处理 然而, 传统基于规则的方法往往需要较大的人力成本, 而且这些人工总结的规则可扩展性不强, 因此研究人员开始采用基于统计学习的方法 圲地地地年以来, 随着机器学习技术的发展和进步, 基于大规模标注数据驱动的机器学习模型成为了文档智能的主流方法, 它通过人工设计的特征模板, 利用有监督学习的方式在标注数据中学习不同特征的权重, 以此来理解 分析文档的内容和布局 然而, 虽然传统的文档理解和分析技术基于人工定制的规则或少量标注数据进行学习, 这些方法虽然能够带来一定程度的性能提升, 但由于定制规则和可学习的样本数量不足, 其通用性往往不尽如人意, 而且针对不同类别文档的分析迁移成本较高, 这距离文档智能技术的实用化和产业化还有相当一段距离 近年来, 随着深度学习技术的发展, 以及大量无标注电子文档的积累, 文档分析与识别技术进入了一个全新的时代 图圱所表示的是在当前深度学习框架下文档智能技术的基本框架, 其中不同类型的文档通过内容提取工具 ( 坈坔坍坌圯坘坍坌抽取 坐坄坆解析器 光学字符识别坏坃坒等 ) 将文本内容 位置布局信息和视觉图像信息组织起来, 利用大规模预训练的深度神经网络进行分析, 最终完成各项下游应用任务, 包括文档版面分析 文档信息抽取 文档视觉问答以及文档图像分类等 深度学习技术的出现, 特别是以卷积神经网络 ( 坃坎坎 ) 图神经网络 ( 均坎坎 ) 以及坔坲坡坮坳坦坯坲坭坥坲架构在坖坡坳坷坡坮坩坥坴坡坬圮圬圲地圱圷圩为代表预训练技术的出现, 彻底改变了传统机器学习需要大量人工标注数据的前提, 更多地依赖大量无标注数据进行自监督学习, 进而通过坜预训练圭参数调优圢模式来解决文档智能相关的应用任务, 取得了显著性突破 尽管深度学习极大地提高了文档智能技术的准确性, 但是在实际应用中仍然有很多问题亟待解决 首先, 受限于当前大规模预训练模型输入长度的限制, 文档智能预训练模型通常需要将文档截断为几个部分分别输入模型进行处理, 这对于复杂长文档的多页跨页处理带来了极大的挑战 其次, 由于实际场景中的扫描文档图像质量参差不齐, 特别是人工标注的训练数据往往质量较高, 而业务场景的文档图像由于扫描设备的清晰度 纸张褶皱和摆放位置的随意性, 导致了性能不佳, 因而需要利用更多数据增强技术来帮助现有模型提升性能 此外, 当前文档智能各项任务通常是独立训练的, 不同任务之间的关联性还未被有效的利用, 例如文档信息抽取和文档视觉问答有某些共性的语义表示, 可以利用多任务学习框架更好的解决这类问题 最后, 基于预训练的文档智能模型在实际应用中也遇到了计算资源和训练样本不足的问题, 探索基于小模型的深度学习架构和模型压缩技术, 以及少样本学习 ( 坦坥坷圭坳坨坯坴坬坥坡坲坮坩坮坧 ) 和零样本学习 ( 坺坥坲坯圭坳坨坯坴坬坥坡坲坮坩坮坧 ) 技术也是当前重要的研究方向, 并具有很大的实用价值 接下来, 我们首先将介绍当前主流的文档智能模型框架 任务和数据集, 随后将分别重点介绍早期基于启发式规则的文档分析技术 基于传统统计机器学习的算法模型 以及近年来基于深度学习, 特别是基于多模态预训练技术的文档智能模型和算法, 最后我们将展望文档智能技术的未来发展方向

3 文档 预训练神经网络模型 应用 网页 PDF/WORD/PPT 扫描图像 HTML/ XML PDF 解析器 OCR 文本 / 布局 / 图像 文档布局分析文档信息抽取文档视觉问答文档图像分类 坆坩坧坵坲坥圱场基于深度学习的文档智能技术框架 2 主流文档智能技术模型框架 任务及数据集 圲圮圱 基于卷积神经网络架构的文档版面分析模型 近年来, 卷积神经网络在计算机视觉领域取得了巨大的成功, 特别是基于大规模标注数据集坉坭坡坧坥坎坥坴和坃坏坃坏的有监督预训练模型坒坥坳坎坥坴在坈坥坥坴坡坬圮圬圲地圱圵圩在图像分类 物体检测以及场景分割任务上都带来了极大的性能提升 具体来讲, 随着多阶段检测坆坡坳坴坥坲坒圭坃坎坎在坒坥坮坥坴坡坬圮圬圲地圱圶圩和坍坡坳坫坒圭坃坎坎在坈坥坥坴坡坬圮圬圲地圱圸圩等模型以及单阶段检测模型坓坓坄在坌坩坵坥坴坡坬圮圬圲地圱圶圩和坙坏坌坏在坒坥坤坭坯坮坡坮坤坆坡坲坨坡坤坩圬圲地圱圸圩的普及, 物体识别在计算机视觉中几乎成为了已解决问题 文档版面分析本质上可以看作一种文档图像的物体检测任务, 文档中的标题 段落 表格 插图等基本单元就是需要检测和识别的物体 在坙坡坮坧坥坴坡坬圮圬圲地圱圷坡圩将文档版面分析看作是一个像素级分割任务, 并尝试利用卷积神经网络进行像素分类取得很好的效果 在坓坣坨坲坥坩坢坥坲坥坴坡坬圮圬圲地圱圷圩首次利用坆坡坳坴坥坲坒圭坃坎坎模型应用于文档版面分析中的表格识别任务, 如图圲所示, 在坉坃坄坁坒圲地圱圳在均坿坯坢坥坬坥坴坡坬圮圬圲地圱圳圩表格识别数据集取得了坓坏坔坁的结果 然而, 文档版面分析虽然是一个经典的文档智能任务, 但是多年来一直受限于较小的数据集规模, 仅仅套用经典计算机视觉预训练模型依然是不够的 随着大规模弱监督文档版面分析数据集坐坵坢坌坡坹坎坥坴在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坢圩 坐坵坢坔坡坢坎坥坴在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坡圩 坔坡坢坬坥坂坡坮坫在坌坩坥坴坡坬圮圬圲地圲地坡圩以及坄坯坣坂坡坮坫在坌坩坥坴坡坬圮圬圲地圲地坢圩数据集的出现, 研究人员可以对不同的计算机视觉模型和算法进行更为深入的比较和分析, 进一步推动了文档版面分析技术的发展 坆坩坧坵坲坥圲场基于卷积神经网络坆坡坳坴坥坲坒圭坃坎坎的文档版面分析模型 圲圮圲 基于图神经网络架构的文档信息抽取模型 信息抽取是从非结构化文本中提取结构化信息的过程, 其作为一个经典和基础的自然语言

4 (a) (b) 坆坩坧坵坲坥圳场基于图神经网络架构的文档信息抽取模型 处理问题已经得到广泛研究 传统的信息抽取聚焦于从纯文本中提取实体与关系信息, 却较少有对视觉富文本的研究 视觉富文本数据是指语义结构不仅由本文内容决定, 也与排版 表格结构 字体等视觉元素有关的文本数据 视觉富文本数据在生活中随处可见, 例如收据 证件 保险单等 在坌坩坵坥坴坡坬圮圬圲地圱圹圩提出利用图卷积神经网络对视觉富文本数据进行建模, 如图圳所示 每张图片经过坏坃坒系统后会得到一组文本块, 每个文本块包含其在图片中的坐标信息与文本内容 这项工作将这一组文本块构成全连接有向图, 即每个文本块构成一个节点, 每个节点都与其他所有节点有连接 节点的初始特征由文本块的文本内容通过坂坩圭坌坓坔坍编码得到 边的初始特征为邻居文本块与当前文本块的相对坐标与长宽信息, 该特征使用当前文本块的高度进行归一化, 具有仿射不变性 与其他图卷积模型仅在节点上进行卷积不同, 这项工作更加关注在信息抽取中坜个体圭关系圭个体圢的三元信息更加重要, 所以在坜节点圭边圭节点圢的三元特征组上进行卷积 除此之外, 还引入了自注意力机制, 让网络在全连接有向图构成的所有有向三元组中挑选更加值得注意的信息, 并加权聚合特征 初始的节点特征与边特征经过多层卷积后得到节点与边的高层表征 这项工作在两份真实商业数据上测试了所提出方法的效果, 分别为增值税发票 ( 坖坁坔坉, 固定版式, 圳地地地张 ) 和国际采购收据 ( 坉坐坒, 非固定版式, 圱圵地地张 ) 使用了两个坂坡坳坥坬坩坮坥, 坂坡坳坥坬坩坮坥坉为对每个文本块的文本内容独立做坂坩坌坓坔坍圫坃坒坆解码, 坂坡坳坥坬坩坮坥坉坉为将所有文本块的文本内容进行坜从左到右 从上到下圢的顺序拼接后, 对拼接文本整体做坂坩坌坓坔坍圫坃坒坆解码 实验表明, 基于图卷积的模型在坂坡坳坬坩坮坥的基础上都有明显提升, 其中在仅依靠文本信息就可以抽取的字段 ( 如日期 ) 上与坂坡坳坥坬坩坮坥持平, 而在需要依靠视觉信息做判断的字段 ( 如价格 税额 ) 上有较大提升 此外, 实验显示, 视觉信息起主要作用, 增加了语义相近文本的区分度 文本信息也对视觉信息起到一定的辅助作用 自注意力机制在固定版式数据上基本没有帮助, 但是在非固定版式数据上有一定提升 圲圮圳 基于坔坲坡坮坳坦坯坲坭坥坲架构的通用文档理解预训练模型 很多情况下, 文档中文字的位置关系蕴含着丰富的语义信息 例如, 表单通常是以键值对 ( 坫坥坹圭坶坡坬坵坥坰坡坩坲 ) 的形式展示的 通常情况下, 键值对的排布通常是左右或者上下形式, 并且有特殊的类型关系 类似地, 在表格文档中, 表格中的文字通常是网格状排列, 并且表头一般出现在第一列或第一行 通过预训练, 这些与文本天然对齐的位置信息可以为下游的信息抽取任务提供更丰富的语义信息 对于富文本文档, 除了文字本身的位置关系之外, 文字格式所呈现的视觉信息同样可以帮助下游任务 对文本级 ( 坴坯坫坥坮圭坬坥坶坥坬 ) 任务来说, 文字大小, 是否倾斜, 是否加粗, 以及字体等富文本格式能够体现相应的语义 通常来说, 表单键值对的键位 ( 坫坥坹 ) 通常会以加粗的形式给出 对于一般文档来说, 文章的标题通常会放大加粗呈现, 特殊概念名词会以斜体呈现等 对文档级 ( 坤坯坣坵坭坥坮坴圭坬坥坶坥坬 ) 任务来说, 整体的文档图像能提供全局的结构信息 例如个人简历的整体文档结构与科学文献的文档结构是有明显的视觉差异的 这些模态对齐的富文本格式所展现的视觉特征可以通过视觉模型抽取, 结合到预训练阶段, 从而有效地帮助下游任务 为了利用上述信息, 我们提出了通用文档预训练模型坌坡坹坯坵坴坌坍在坘坵坥坴坡坬圮圬圲地圲地圩, 如图圴所示 在现有的预训练模型基础上添加圲圭坄坐坯坳坩坴坩坯坮坅坭坢坥坤坤坩坮坧和坉坭坡坧坥坅坭坢坥坤坤坩坮坧两种新的坅坭坢坥坤坤坩坮坧层, 这样一来可以有效地结合文档结构和视觉信息 具体来讲, 根据坏坃坒获得的文本坂坯坵坮坤坩坮坧坂坯坸, 我们能获取文本在文档中的具体位置 将对应坐标转化为虚拟坐

5 Downstream Tasks Image Embeddings LayoutLM Embeddings + [CLS] Date Routed: January 11, 1994 Contract No FC Layers Pre-trained LayoutLM Text Embeddings Position Embeddings (x0) Position Embeddings (y0) Position Embeddings (x1) Position Embeddings (y1) E ([CLS]) + E (0) + E (0) + E (maxw) + E (maxh) E (Date) E (Routed:) E (January) E (11,) E (1994) E (Contract) E (No.) E (4011) E (86) E (117) E (227) E (281) E (303) E (415) E (468) E (556) E (138) E (138) E (138) E (138) E (139) E (138) E (139) E (139) E (112) E (162) E (277) E (293) E (331) E (464) E (487) E (583) E (148) E (148) E (153) E (148) E (149) E (149) E (149) E (150) E (0000) + E (589) + E (139) + E (621) + E (150) Pre-built OCR/ PDF Parser ROI Faster R-CNN 坆坩坧坵坲坥圴场基于坔坲坡坮坳坦坯坲坭坥坲架构的通用文档理解预训练模型坌坡坹坯坵坴坌坍 标之后, 我们计算该坐标对应在坸 坹 坷 坨四个坅坭坢坥坤坤坩坮坧子层的表示, 最终的圲圭坄坐坯坳坩坴坩坯坮坅坭坢坥坤坤坩坮坧为四个子层的坅坭坢坥坤坤坩坮坧之和 在坉坭坡坧坥坅坭坢坥坤坤坩坮坧部分, 我们将每个文本相应的坂坯坵坮坤坩坮坧坂坯坸当作坆坡坳坴坥坲坒圭坃坎坎中的候选框 ( 坐坲坯坰坯坳坡坬 ), 从而提取对应的局部特征 特殊地, 由于坛坃坌坓坝符号用于表示整个输入文本的语义, 我们同样使用整张文档图像作为该位置的坉坭坡坧坥坅坭坢坥坤坤坩坮坧, 从而保持模态对齐 在预训练阶段, 我们针对坌坡坹坯坵坴坌坍的特点提出两个自监督预训练任务 : 圱圮坍坡坳坫坥坤坖坩坳坵坡坬圭坌坡坮坧坵坡坧坥坍坯坤坥坬 ( 坍坖坌坍, 遮罩式视觉语言模型 ): 大量实验已经证明坍坌坍能够在预训练阶段有效地进行自监督学习 我们在此基础上进行了修改 : 在遮盖 ( 坍坡坳坫 ) 当前词之后, 保留对应的圲圭坄坐坯坳坩坴坩坯坮坅坭坢坥坤坤坩坮坧暗示, 让模型预测对应的词 在这种方法下, 模型根据已有的上下文和对应的视觉暗示预测被遮罩的词, 从而让模型更好地学习文本位置和文本语义的模态对齐关系 圲圮坍坵坬坴坩圭坬坡坢坥坬坄坯坣坵坭坥坮坴坃坬坡坳坳坩圌坣坡坴坩坯坮在坍坄坃, 多标签文档分类圩 : 坍坌坍能够有效的表示词级别的信息, 但是对于文档级的表示, 我们需要文档级的预训练任务来引入更高层的语义信息 在预训练阶段我们使用的坉坉坔圭坃坄坉坐数据集为每个文档提供了多标签的文档类型标注, 我们引入坍坄坃多标签文档分类任务 该任务使得模型可以利用这些监督信号去聚合相应的文档类别, 并捕捉文档类型信息, 从而获得更有效的高层语义表示 实验结果表明, 我们在预训练中引入的结构和视觉信息, 能够有效地迁移到下游任务中 最终在多个下游任务中都取得了显著的准确率提升 与传统的基于卷积神经网络和图神经网络模型不同, 通用文档智能预训练模型的优势在于可以支持不同类型的下游应用 圲圮圴 文档智能主流任务和数据集 文档智能涉及了自动阅读 理解和分析文档的相关技术, 在实际场景的应用中主要包括四大类任务, 分别是 : 文档版面分析 : 是指对文档版面内的图像 文本 表格信息和位置关系所进行的自动分析 识别和理解的过程 文档信息抽取 : 是指从文档中大量非结构化内容抽取实体及其关系的技术, 与传统的纯文本信息抽取不同, 文档的构建使得文字由一维的顺序排列变为二维的空间排列, 因此文本信息 视觉信息和位置信息在文档信息抽取中都是极为重要的影响因素 文档视觉问答 : 是指给定文档图像数据, 利用坏坃坒技术或其他文字提取技术自动识别影像资料后, 通过判断所识别文字的内在逻辑, 回答关于图片的自然语言问题

6 任务 数据集 支持语言 论文圯链接 坉坃坄坁坒圲地圱圳 英文 在均坿坯坢坥坬坥坴坡坬圮圬圲地圱圳圩 坉坃坄坁坒圲地圱圹 英文 在均坡坯坥坴坡坬圮圬圲地圱圹圩 坉坃坄坁坒圲地圲圱 英文 在坙坥坰坥坳坥坴坡坬圮圬圲地圲圱圩 坕坎坌坖 英文 在坓坨坡坨坡坢坥坴坡坬圮圬圲地圱地圩 坍坡坲坭坯坴 中文圯英文 在坆坡坮坧坥坴坡坬圮圬圲地圱圲圩 坐坵坢坔坡坢坎坥坴 英文 在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坡圩 文档版面分析 坐坵坢坌坡坹坎坥坴 英文 在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坢圩 坔坡坢坬坥坂坡坮坫 英文 在坌坩坥坴坡坬圮圬圲地圲地坡圩 坄坯坣坂坡坮坫 英文 在坌坩坥坴坡坬圮圬圲地圲地坢圩 坔坎坃坒 英文 在坁坢坤坡坬坬坡坨坥坴坡坬圮圬圲地圲圱圩 坔坡坢坌坥坘 英文 在坄坥坳坡坩坥坴坡坬圮圬圲地圲圱圩 坉坉坉坔圭坁坒圭圱圳坋 英文 在坍坯坮坤坡坬坥坴坡坬圮圬圲地圲地圩 坒坥坡坤坩坮坧坂坡坮坫 英文 坆坕坎坓坄 英文 在均坵坩坬坬坡坵坭坥坊坡坵坭坥圬圲地圱圹圩 坓坒坏坉坅 英文 在坈坵坡坮坧坥坴坡坬圮圬圲地圱圹圩 坃坏坒坄 英文 在坐坡坲坫坥坴坡坬圮圬圲地圱圹圩 坅坁坔坅坎 中文 在均坵坯坥坴坡坬圮圬圲地圱圹圩 文档信息抽取 坅坐坈坏坉坅中文在块坡坮坧坥坴坡坬圮圬圲地圲圱圩坄坥坥坰坦坯坲坭英文在坓坴坲坡坹坡坮坤坓坶坥坴坬坩坣坨坮坡坹坡圬圲地圲地圩 坋坬坥坩坳坴坥坲 英文 在坓坴坡坮坩坳圠坬坡坷坥坫坥坴坡坬圮圬圲地圲圱圩 坘坆坕坎坄 中文圯日文圯西班牙文圯法文圯意大利文圯德文圯葡萄牙文 在坘坵坥坴坡坬圮圬圲地圲圱坢圩 坄坯坣坖坑坁 英文 在坍坡坴坨坥坷坥坴坡坬圮圬圲地圲圱坢圩 文档视觉问答 坉坮坦坯坧坲坡坰坨坩坣坳坖坑坁英文在坍坡坴坨坥坷坥坴坡坬圮圬圲地圲圱坡圩坖坩坳坵坡坬坍坒坃英文在坔坡坮坡坫坡坥坴坡坬圮圬圲地圲圱圩 保险文本视觉问答 中文 文档图像分类 坔坯坢坡坣坣坯圭圳圴圸圲英文在坋坵坭坡坲坥坴坡坬圮圬圲地圱圴圩坒坖坌圭坃坄坉坐英文在坈坡坲坬坥坹坥坴坡坬圮圬圲地圱圵圩 坔坡坢坬坥圱场文档智能领域主流任务 ( 文档版面分析 文档信息抽取 文档视觉问答 文档图像分类 ) 开源数据集 文档图像分类 : 是指针对文档图像进行分析识别从而归类的过程 对于这四种主要的文档智能任务, 学术界和工业界也开源了大量相关的基准数据集, 如表圱所示 这也极大地推动了相关领域的研究人员构建新的算法模型, 特别是当前基于深度神经网络的模型在这些任务上都有不俗的表现 接下来, 我们将分别详细介绍在过去不同时期的经典模型和算法, 包括基于启发式规则的文档分析技术 基于统计机器学习的文档分析技术和基于深度学习的通用文档智能模型, 为大家提供参考 3 基于启发式规则的文档分析技术 采用启发式规则的文档分析技术大致可分为自顶向下 自底向上和混合模式三种方式 自顶向下方式将文档图片作为整体逐步将其划分为不同区域 以递归方式进行切割, 直至区域分割至预定义的标准, 通常为块或列 自底向上以像素或组件为基本元素单位, 对基本元素进行分组 合并以形成更大的同质区域 自顶向下方式在特定格式下的文档中能够更快 更高效地分析文档 而自底向上虽需要耗费更多的计算时间, 但通用型更强, 可覆盖更多不同布局类型的文档 混合方式则将其两者相结合以尝试产生更好的效果 本节从自顶向下和自底向上两种角度出发, 介绍基于坐坲坯坪坥坣坴坩坯坮坐坲坯圌坬坥 坉坭坡坧坥坓坭坥坡坲圭坩坮坧 坃坯坮坮坥坣坴坥坤坃坯坭坰坯坮坥坮坴坳等方式的文档分析技术

7 圳圮圱 坐坲坯坪坥坣坴坩坯坮坐坲坯圌坬坥 坐坲坯坪坥坣坴坩坯坮坐坲坯圌坬坥作为一种自顶向下的分析方式被广泛应用于文档分析 在坎坡坧坹坡坮坤坓坥坴坨圬圱圹圸圴圩使用坐坲坯坪坥坣坴坩坯坮坐坲坯圌坬坥中的坘圭坙切割算法对文档进行切割, 这一方式适用于具有固定文本区域和行距的结构化文本, 但该方式对边界噪声敏感且无法在倾斜的文本上提供良好性能, 对文档质量要求较高 在坂坡坲圭坙坯坳坥坦坥坴坡坬圮圬圲地地圹圩使用自适应局部投影方式计算文档的倾斜度, 以尝试消除文本倾斜导致的性能下降, 实验证明模型在倾斜和弯曲文本上得到了较为准确的结果 此外还有很多坘圭坙切割算法的变体被提出以解决现存的缺陷, 在坏圧均坯坲坭坡坮圬圱圹圹圳圩将坘圭坙切割算法扩展至使用组件边界框的投影, 在坓坹坬坷坥坳坴坥坲坡坮坤坓坥坴坨圬圱圹圹圵圩使用了编辑成本评估指标以指导模型进行分割, 均在一定程度上提高了模型的性能 坐坲坯坪坥坣坴坩坯坮坐坲坯圌坬坥分析算法适用于结构化文本, 尤其是曼哈顿 ( 坍坡坮坨坡坴坴坥坮 ) 布局文档 在布局复杂 文本倾斜或包含边界噪声的文档上可能无法展现出良好的性能 圳圮圲 坉坭坡坧坥坓坭坥坡坲坩坮坧 坉坭坡坧坥坓坭坥坡坲坩坮坧分析法指从一个位置向四周渗透, 逐渐扩展至所有同质区域, 以此确定页面当中的一个区域 在块坯坮坧坥坴坡坬圮圬圱圹圸圲圩采用自顶向下策略, 使用游长平滑算法 ( 坒坵坮圭坬坥坮坧坴坨坓坭坯坯坴坨坩坮坧坁坬坧坯坲坩坴坨坭, 坒坌坓坁 ) 判断同质区域 将图像二值化后, 像素值地表示背景, 圱为前景, 当地周围的地数目小于指定阈值坃时, 该位置的地修改为圱, 游长平滑算法通过这一操作将距离相近的前景内容合并为整体 这种方式可以逐步将字符合并为单词, 单词合并为文本行, 继而将范围不断延伸至整个同质区域 在坆坩坳坨坥坲坥坴坡坬圮圬圱圹圹地圩在此基础上对其进行进一步改进, 增加了除噪 倾斜矫正等预处理, 此外游长平滑算法的阈值坃修改为依据动态算法进行调整, 进一步提升模型的适应能力 在坅坳坰坯坳坩坴坯坥坴坡坬圮圬圱圹圹地圩采用了类似的方法, 但操作对象由像素改为了字符框 在坓坨坩坡坮坤均坯坶坩坮坤坡坲坡坪坵圬圲地地圴圩则是对图片中的每一个位置像素进行扩展, 得到一个新的灰度图, 随后进行抽取, 在手写字体 文本倾斜等情况下仍能表现出良好的性能 圳圮圳 坃坯坮坮坥坣坴坥坤坃坯坭坰坯坮坥坮坴坳 坃坯坮坮坥坣坴坥坤坃坯坭坰坯坮坥坮坴坳分析法作为一种自底向上的技术, 推测最小粒度元素之间的关系, 用于寻找同质区域, 最终将区域分类为不同属性 在坆坩坳坨坥坲坥坴坡坬圮圬圱圹圹地圩采用坃坯坮坮坥坣坴坥坤坃坯坭坰坯坮坥坮坴坳技术, 找到每个组件的坋近邻 ( 坋坎坥坡坲坥坳坴坎坥坩坧坨坢坯坲坳, 坋坎坎 ) 组件, 通过互相之间的位置 角度等关系来推断当前区域属性 在坓坡坩坴坯坨坥坴坡坬圮圬圱圹圹圳圩判断并根据文档的倾角将文字合并成线, 继而将线合并为区域, 随后将其分类为不同的属性 在坋坩坳坥坥坴坡坬圮圬圱圹圹圸圩同样尝试解决文本的倾斜问题, 作者采用了近似面积坖坯坲坯坮坯坩图 ( 坁坰坰坲坯坸坩坭坡坴坥坤坁坲坥坡坖坯坲坯坮坯坩坄坩坡坧坲坡坭 ) 来获得区域的候选边界, 这一操作对于任意倾角的区域有效 但由于计算过程中需要估计字符间距和行内间距, 因此当文档中包含大字体及宽字间距等情况时, 模型并不能发挥出良好性能 此外在坂坵坫坨坡坲坩坥坴坡坬圮圬圲地圱地圩也尝试在使用坃坯坮坮坥坣坴坥坤坃坯坭坰坯坮坥坮坴坳的基础上使用坁坵坴坯坍坌坐以便寻找分类器最佳参数, 进一步提升性能 圳圮圴 其他方法 除上文所述外, 还有一些其他的启发式规则方法, 例如, 在坂坡坩坲坤坥坴坡坬圮圬圱圹圹地圩采用自顶向下的方式按空白将文档进行切割划分区域 在坘坩坡坯坡坮坤坙坡坮圬圲地地圳圩使用了坄坥坬坡坵坮坡坹坔坲坩坡坮坧坵坬坡坴坩坯坮算法进行文档分析, 在坂坵坫坨坡坲坩坥坴坡坬圮圬圲地地圹圩在此基础上将其应用于书写随意的手写文档 此外还有一些混合算法, 在坏坫坡坭坯坴坯坡坮坤坔坡坫坡坨坡坳坨坩圬圱圹圹圳圩通过分隔符和空白来切割块, 在每个块中进一步将内部组件合并为文本行 在坓坭坩坴坨圬圲地地圹圩将文档分析分成了两部分, 首先使用自底向上的方式来定位制表符, 借助于制表符推断列布局 随后在列布局上采用自顶向下方式来推断结构和文本顺序 4 基于统计机器学习的文档分析技术 传统的文档分析过程通常分为两阶段 : 圱圮将文档图片切割, 得到多个不同候选区域 圲圮对区域进行属性分类, 将其判别为文本 图像等规定类 基于机器学习的方案也通常从这两个角度入手, 部分工作尝试使用机器学习算法参与文档的切割, 其余则尝试在已生成的区域上构造特征使用机器学习算法对区域进行分类 此外由于统计机器学习技术带来的性能上的提升, 较多基于统计机器学习的方法在表格检测任务中被尝试使用, 因表格检测作为文档分析的一个重要

8 子任务, 本节也会对其进行一些介绍 因此与前文基于技术角度的阐述方式不同的是, 从下文开始将会从文档分析中的不同任务角度来对其发展情况做出介绍 圴圮圱 文档切割 在文档的切割过程中, 在坂坡坥坣坨坬坥坲坡坮坤坉坮坧坯坬坤圬圲地圱圱圩结合坸圭坹裁剪算法, 使用逻辑斯蒂回归对文档进行切割, 丢弃空白部分 在得到相应区域后, 实验比较了坋近邻 逻辑斯蒂回归 ( 坌坯坧坩坳坴坩坣坒坥坧坲坥坳坳坩坯坮, 坌坒 ) 和最大熵马尔可夫模型 ( 坍坡坸坩坭坵坭坅坮坴坲坯坰坹坍坡坲坫坯坶坍坯坤圭坥坬坳, 坍坅坍坍 ) 等算法作为分类器的性能优劣, 实验表明最大熵马尔可夫模型和逻辑斯蒂回归在属性分类任务上可以展现出较好的性能 在坅坳坰坯坳坩坴坯坥坴坡坬圮圬圲地地圸圩在文档分割过程中进一步加强机器学习算法在其中的参与程度 在自底向上的过程中, 从字母到单词到文本行逐渐合并的过程中使用了一种基于内核的算法在坄坩坥坴坴坥坲坩坣坨坥坴坡坬圮圬圱圹圹圷圩, 并将结果转换成坸坭坬结构存储 之后使用文档组织算法 ( 坄坯坣坵坭坥坮坴坏坲坧坡坮坩坺坡坴坩坯坮坃坯坭坰坯坳坥坲, 坄坏坃 ) 对文档进行分析 在块坵坥坴坡坬圮圬圲地地圸圩则致力于文字同时存在两种阅读顺序的问题, 此前的算法均假定文字只有一种书写方向, 但遇到诸如汉语或日语等可以水平或者垂直方向书写的文字时无法正常地工作 该算法将文档分割分为四个步骤用于判断并处理文本, 并使用了支持向量机以决定是否执行步骤 圴圮圲 区域分类 在区域属性分类问题上, 大量工作主要致力于尝试不同机器学习算法作为分类器输出结果 其中在块坥坩坥坴坡坬圮圬圲地圱圳圩实验比较了支持向量机 多层感知机 ( 坍坵坬坴坩圭坌坡坹坥坲坐坥坲坣坥坰圭坴坲坯坮, 坍坌坐 ) 和高斯混合模型 ( 均坡坵坳坳坩坡坮坍坩坸坴坵坲坥坍坯坤坥坬坳, 均坍坍 ) 几种机器学习算法作为分类器时的性能优劣, 实验结果表明支持向量机和多层感知机在区域属性上的分类性能明显优于高斯混合模型 在坂坵坫坨坡坲坩坥坴坡坬圮圬圲地圱圲圩手动构造了多个特征, 对区域抽取相应特征后使用坁坵坴坯坍坌坐算法进行分类, 在阿拉伯语数据集中得到了圹圵圥的分割准确率 在坂坡坥坣坨坬坥坲坡坮坤坉坮圭坧坯坬坤圬圲地圱圱圩在文档分割上做了进一步改进, 使用了金字塔形算法, 在中世纪手稿上进行了三个不同级别的分析, 最后使用动态多层感知机 ( 坄坹坮坡坭坩坣坍坵坬坴坩圭坌坡坹坥坲坐坥坲坣坥坰坴坲坯坮, 坄坍坌坐 ) 作为分类器 圴圮圳 表格检测 除上述方式之外, 基于统计机器学习技术在表格识别领域存在大量研究 在块坡坮坧坥坴坡坬圮圬圲地地地圻块坡坮坧坴坥坴坡坬圮圬圲地地圱圻块坡坮坧坥坴坡坬圮圬圲地地圲圩使用了二叉树对文档进行自上而下分析查找表格候选区, 继而根据区域特征确定最终表格区域 在坐坩坮坴坯坥坴坡坬圮圬圲地地圳圩则使用了条件随机场在坈坔坍坌页面中抽取表格区域, 并确定表格中的标题 子标题等内容 在坥坓坩坬坶坡圬圲地地圹圩使用隐马尔可夫 ( 坈坩坤坤坥坮坍坡坲坫坯坶坍坯坤坥坬坳, 坈坍坍坳 ) 抽取表格区域 在坃坨坥坮坡坮坤坌坯坰坲坥坳坴坩圬圲地圱圱圩在手写文档中检索表格区域, 并使用支持向量机识别其中的文字区域, 随后依据文本行确定表格所在位置 在坋坡坳坡坲坥坴坡坬圮圬圲地圱圳圩同样使用了支持向量机技术 首先识别图中水平和竖直的垂直线, 随后使用支持向量机对每条线的属性进行分类, 判断该线条是否属于表格 在坂坡坲坬坡坳坥坴坡坬圮圬圲地圱圴圩使用多层感知机对文档中的坣坯坮坮坥坣坴坥坤坣坯坭坰坯坮坥坮坴进行分类, 判断其是否为文本 在坂坡坮坳坡坬坥坴坡坬圮圬圲地圱圴圩使用坬坥坰坴坯坮坩坣坡库在坂坬坯坯坭坢坥坲坧圬圱圹圹圱圩对文档进行分割, 随后对每一个区域构造包含周围环境信息的特征 使用坆坩坸圭坰坯坩坮坴坭坯坤坥坬在坌坩坥坴坡坬圮圬圲地圱圳圩对每一个区域进行分类, 用以识别文档中的表格区域 它使得模型在分类过程中不再孤立地对其进行分类, 而是学习区域相互之间的关系 在坒坡坳坨坩坤坥坴坡坬圮圬圲地圱圷圩采用了与前一份工作相同的思路, 但将操作粒度缩小为单词级别, 对每一个词进行分类, 之后使用坁坵坴坯坍坌坐来判断该词是否属于表格 5 基于深度学习的文档智能技术 近年来, 深度学习方法已经成为许多机器学习问题的解决范式 在许多研究领域, 深度学习方法被证明是十分有效的 最近, 预训练模型的流行也进一步发掘了深度神经网络的性能 而文档智能领域的发展也体现出同样的趋势 在本节中我们将现存的模型分为针对特定任务的深度学习模型和支持多种下游任务的通用预训练模型两个章节进行介绍

9 圵圮圱 圵圮圱圮圱 针对特定任务的深度学习模型 文档版面分析 文档版面分析包含两个主要的子任务 : 文档视觉结构分析和文档语义结构分析在坂坩坮圭坭坡坫坨坡坳坨坥坮坡坮坤坍坡坨坭坯坵坤圬圲地圱圹圩 文档视觉分析的主要目的是检测文档结构并确定其同类区域的边界 而文档语义结构分析是需要为这些检测到的区域标记具体的文档类别, 如标题 段落 表格等 坐坵坢坌坡坹坎坥坴在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坢圩是一个大规模的文档版面分析数据集, 通过自动解析坐坵坢坍坥坤的坘坍坌文件构建了超过圳圶地圬地地地个文档图片 坄坯坣坂坡坮坫在坌坩坥坴坡坬圮圬圲地圲地坢圩通过坡坲坘坩坶网站的坐坄坆文件和坌坡坔坥坘文件的对应关系自动构建了一个可扩展的文档版面分析数据集, 同时支持对基于文本的方法和基于图像的方法进行评测 坉坉坉坔圭坁坒圭圱圳坋在坍坯坮坤坡坬坥坴坡坬圮圬圲地圲地圩提供了圱圳圬地地地的人工标注的文档图片用于版面分析 在章节圲圮圲中, 我们介绍了将较为经典的卷积神经网络应用在文档版面分析领域的工作在坈坥坥坴坡坬圮圬圲地圱圵圻坒坥坮坥坴坡坬圮圬圲地圱圶圻坈坥坥坴坡坬圮圬圲地圱圸圻坌坩坵坥坴坡坬圮圬圲地圱圶圻坒坥坤坭坯坮坡坮坤坆坡坲坨坡坤坩圬圲地圱圸圻坙坡坮坧坥坴坡坬圮圬圲地圱圷坡圻坓坣坨坲坥坩坢坥坲坥坴坡坬圮圬圲地圱圷圩, 但随着对文档版面分析的性能要求逐渐提高, 越来越多的科研工作针对文档这一领域对目标检测算法进行了针对性的改进 在坙坡坮坧坥坴坡坬圮圬圲地圱圷坢圩将文档语义结构分析任务视为一个逐像素的分类问题 他们提出了一个同时考虑视觉和文本信息的多模态神经网络 在坖坩坡坮坡坡坮坤坏坬坩坶坥坩坲坡圬圲地圱圷圩提出了一个用于移动和云服务的文档布局分析的轻量级模型 该模型使用图像的一维信息进行推理, 并与使用二维信息的模型进行比较, 在实验中取得了较高的准确性 在坃坨坥坮坥坴坡坬圮圬圲地圱圷圩介绍了一种基于卷积神经网络 ( 坃坎坎 ) 的手写历史文件图像的页面分割方法 在坏坬坩坶坥坩坲坡坥坴坡坬圮圬圲地圱圸圩提出了一个基于坃坎坎的多任务逐像素预测模型 在块坩坣坫坡坮坤坐坵坰坰坥圬圲地圱圸圩提出了一个用于历史文件分割的高性能全卷积神经网络 ( 坆坃坎 ) 在均坲坿坵坮坩坮坧坥坴坡坬圮圬圲地圱圹圩提出了一种针对历史文献的两阶段文本行检测方法 在坓坯坴坯坡坮坤坙坯坯圬圲地圱圹圩将上下文信息纳入坆坡坳坴坥坲坒圭坃坎坎模型 该模型利用文章元素内容的局部不变性质, 提高了区域检测性能 表格检测与表格结构识别在文档版面分析中, 表格理解是一项富有挑战性的任务 有别于标题 段落等文档元素, 表格的格式通常较为多变, 结构也较为复杂 因此, 有大量的相关工作围绕表格进行展开, 其中最为主要的两个子任务分别是表格检测和表格结构识别 ( 圱 ) 表格检测是指确定文档中的表格的边界 ( 圲 ) 表格结构识别是指将表格的语义结构, 包括行 列 单元格的信息按照预定义的格式抽取出来 近年来, 有许多针对表格理解这一任务提出的数据集 坍坡坲坭坯坴在坆坡坮坧坥坴坡坬圮圬圲地圱圲圩和坕坎坌坖在坓坨坡坨坡坢坥坴坡坬圮圬圲地圱地圩是较早的表格识别数据集 坉坃坄坁坒会议在表格检测与识别上举办的多次竞赛提供了优质的表格数据集在均坿坯坢坥坬坥坴坡坬圮圬圲地圱圳圻均坡坯坥坴坡坬圮圬圲地圱圹圩 但这些传统表格数据集通常较小, 难以发挥现代深度神经网络的优势, 因此研究工作坔坡坢坬坥坂坡坮坫在坌坩坥坴坡坬圮圬圲地圲地坡圩利用坌坡坔坥坸和坏圎坣坥块坯坲坤来自动构建了一个大规模的表格理解数据集 此后, 坐坵坢坔坡坢坎坥坴在坚坨坯坮坧坥坴坡坬圮圬圲地圱圹坡圩提出了一个大规模表格数据集并提供了表格结构及单元格内容辅助表格识别 坔坎坃坒在坁坢坤坡坬坬坡坨坥坴坡坬圮圬圲地圲圱圩在提供表格标注的同时提供了表格类别的标注 针对表格理解这一任务的特性, 许多目标检测的方法在表格理解领域都能取得较好的效果 坆坡坳坴坥坲坒圭坃坎坎在坒坥坮坥坴坡坬圮圬圲地圱圶圩在表格检测任务上直接应用就能达到非常好的性能 在此基础上, 在坓坩坤坤坩坱坵坩坥坴坡坬圮圬圲地圱圸圩通过将可变形卷积应用在坆坡坳坴坥坲坒圭坃坎坎上获得了更好的性能 坃坡坳坣坡坤坥坔坡坢坎坥坴在坐坲坡坳坡坤坥坴坡坬圮圬圲地圲地圩使用了坃坡坳坣坡坤坥坒圭坃坎坎在坃坡坩坡坮坤坖坡坳坣坯坮坣坥坬坯坳圬圲地圱圸圩模型同时完成表格检测和表格结构识别 坔坡坢坬坥坓坥坮坳坥在坄坯坮坧坥坴坡坬圮圬圲地圱圹圩通过增加单元格特征 添加采样算法来显著提高了表格检测能力 除了上述两个主要的子任务, 针对已解析后表格的理解也逐渐成为新的挑战 坔坁坐坁坓在坈坥坲坺坩坧坥坴坡坬圮圬圲地圲地圩是较早的将预训练技术引入到表格理解任务的模型 通过引入额外的位置编码层, 坔坁坐坁坓可以使坔坲坡坮坳坦坯坲坭坥坲在坖坡坳坷坡坮坩坥坴坡坬圮圬圲地圱圷圩编码器接受结构化的表格输入 经过在大量的表格数据上进行掩码式预训练后, 坔坁坐坁坓在多种下游语义分析任务中显著超过了传统方法 继坔坁坐坁坓后, 坔坕坔坁在块坡坮坧坥坴坡坬圮圬圲地圲地坡圩引入了二维坐标树来表示结构化表格的层级信息, 并针对这一结构提出了基于树结构的位置表示方式和注意力机制来显示建模层次化表格 结合不同层级的预训练任务, 坔坕坔坁在多个下游数据集上取得了进一步的性能提升

10 圵圮圱圮圲 文档信息抽取 文档信息抽取是指从大量非结构化富文本文档内容中抽取语义实体及其之间关系的技术 文档信息抽取任务对于文档类别的不同, 抽取的目标实体也不尽相同 坆坕坎坓坄在均坵坩坬圭坬坡坵坭坥坊坡坵坭坥圬圲地圱圹圩是一个文档理解数据集, 其包含圱圹圹张表单, 每张表单中包含表单实体的键值对 坃坏坒坄在坐坡坲坫坥坴坡坬圮圬圲地圱圹圩是一个票据理解数据集, 并包含圸个大类共圵圴小类种实体标签 坋坬坥坩坳坴坥坲在坓坴坡坮坩坳圠坬坡坷坥坫坥坴坡坬圮圬圲地圲圱圩是一个针对长文档实体抽取任务的文档理解数据集, 包含有协议和财务报表等长文本文档 坄坥坥坰坆坯坲坭在坓坴坲坡坹坡坮坤坓坶坥坴坬坩坣坨坮坡坹坡圬圲地圲地圩数据集是一个针对电视和有线电视政治广告披露表格的英文数据集 坅坁坔坅坎数据集是针对中文证件的信息抽取数据集, 在坙坵坥坴坡坬圮圬圲地圲圱圩在其圴地地张子集上进一步添加了文本框标注 坅坐坈坏坉坅在块坡坮坧坥坴坡坬圮圬圲地圲圱圩数据集是一个针对中文文档数据的信息抽取数据集 坘坆坕坎坄在坘坵坥坴坡坬圮圬圲地圲圱坢圩是随着坌坡坹坯坵坴坘坌坍模型提出了针对坆坕坎坓坄数据集的多语言扩展版本, 包含有除英文以外的七种主流语言的富文本文档 由于富文本文档的丰富视觉信息, 很多研究工作将文档信息抽取任务建模为了计算机视觉任务, 通过语义分割或文本框回归等任务进行信息抽取 考虑到文档信息抽取中文本信息同样具有重要作用, 通常的框架是将文档图片视为像素网格, 并在该特征图上添加文本特征来获得更好的特征表示 根据添加文本特征级别的不同, 这一方法的基本发展顺序呈现出了从字符级别到单词级别再到上下文级别的趋势 坃坨坡坲坧坲坩坤在坋坡坴坴坩坥坴坡坬圮圬圲地圱圸圩利用一个基于卷积的编码器圭解码器网络, 通过将字符进行坏坮坥坨坯坴编码来将文本信息融合到图像中 坖坩坳坵坡坬块坯坲坤均坲坩坤在坋坥坲坲坯坵坭坩坥坴坡坬圮圬圲地圲地圩实现了块坯坲坤坧坲坩坤在坋坡坴坴坩坥坴坡坬圮圬圲地圱圸圩, 通过将字符级文本信息换成单词级的坷坯坲坤圲坶坥坣特征, 并融合了一定的视觉信息, 提高了抽取任务的性能 坂坅坒坔坧坲坩坤在坄坥坮坫坡坮坤坒坥坩坳坳坷坩坧圬圲地圱圹圩通过使用坂坅坒坔获得了上下文文本表示, 进一步提升了性能 坖坩坂坅坒坔坧坲坩坤在坌坩坮坥坴坡坬圮圬圲地圲圱圩在坂坅坒坔坧坲坩坤的基础上将坂坅坒坔的文本特征较早地在卷积阶段与图像特征进行融合, 从而获得了较好的效果 由于富文本文档中的信息仍以文本作为主体, 很多研究工作将文档信息抽取任务作为特殊的自然语言理解任务 在坍坡坪坵坭坤坥坲坥坴坡坬圮圬圲地圲地圩通过根据抽取目标的类别来生成目标备选, 在表单任务上取得了较好的效果 坔坒坉坅在坚坨坡坮坧坥坴坡坬圮圬圲地圲地圩联合文本检测识别与信息抽取, 让两个阶段的任务互相促进从而获得更好的信息抽取效果 在块坡坮坧坥坴坡坬圮圬圲地圲地坢圩通过三种不同模态信息的融合来预测文本片段之间的关系, 实现了对表单的层次化抽取 非结构化的富文本文档由多个邻接的文本片段组成, 那么自然可以使用图网络对非结构化富文本文档进行表示 文档中的文本片段建模为图中的节点, 而文本片段之间的关系则可建模为边, 这样整个文档就可以被表示为一个图网络 在章节圲圮圲中, 我们介绍了图神经网络在富文本文档中进行信息抽取的代表性工作在坌坩坵坥坴坡坬圮圬圲地圱圹圩 在此基础上, 逐渐有更多的研究工作基于图神经网络展开 在坈坷坡坮坧坥坴坡坬圮圬圲地圲地圩将文档建模为了有向图, 通过依存分析的方法对文档进行信息抽取 在坒坩坢坡坥坴坡坬圮圬圲地圱圹圩使用基于图神经网络的模型来进行发票中表格的信息抽取 在块坥坩坥坴坡坬圮圬圲地圲地圩通过在预训练模型的输出表示上使用图卷积神经网络来建模文本布局, 提高了信息抽取的性能 在坃坨坥坮坧坥坴坡坬圮圬圲地圲地圩通过将文档表示为图结构并使用基于图的注意力机制, 结合坃坒坆在小样本学习上取得了较好的性能 坐坉坃坋在坙坵坥坴坡坬圮圬圲地圲圱圩模型通过引入一个可基于节点进行学习的图来表示文档, 在发票抽取任务中取得了较好的性能 圵圮圱圮圳 文档图像分类 文档图像分类是指对文档图像进行归类标记的任务 坒坖坌圭坃坄坉坐在坈坡坲坬坥坹坥坴坡坬圮圬圲地圱圵圩是该任务中的代表性数据集 该数据集包含圱圶个文档图像类别共圴地地圬地地地张灰度图片 由于文档图像分类仍然属于图像分类的范畴, 所以针对自然图片的分类算法同样能较好的解决文档图像分类的问题 在坁坦坺坡坬坥坴坡坬圮圬圲地圱圵圩介绍了一种基于深度卷积神经网络 ( 坃坎坎 ) 的文档图像分类方法用于文档图像分类 为了克服小数据集样本不足的问题, 他们使用了经过坉坭坡坧坥坮坥坴训练的坁坬坥坸坮坥坴网络作为初始化, 从而迁移到文档图像领域 在坁坦坺坡坬坥坴坡坬圮圬圲地圱圷圩尝试将均坯坯坧坌坥坎坥坴圬坖均均圬坒坥坳坎坥坴等在自然图片领域获得成功的模型通过迁移学习的方式在文档图片上进行训练 在坔坥坮坳坭坥坹坥坲坡坮坤坍坡坲坴坩坮坥坺圬圲地圱圷圩通过对模型参数和数据处理的调整, 使坃坎坎模型不借助从自然图片的迁移学习就能优于此前模型的性能 在坄坡坳坥坴坡坬圮圬圲地圱圸圩提出了一个基于不同区域分类的深度卷积神经网络框架用于文档图像分类 该方法通过对文档的不同区域分别进行分类, 最终融合多个不同区域的分类器在文档图像分类上获得了明显的性能提升 在坓坡坲坫坨坥坬坡坮坤坎坡坮坤坩圬圲地圱圹圩通过引入了金字塔形的多尺度结构来抽取不同层级的特征 在坄坡坵坰坨坩坮坥坥坥坴坡坬圮圬

11 (a) (b) 坆坩坧坵坲坥圵场文档视觉问答任务示例 圲地圱圹圩通过对文档图片进行字符识别 ( 坏坃坒 ) 获得文档的文本, 并对图像特征和文本特征进行组合, 进一步提升了分类性能 圵圮圱圮圴 文档视觉问答 文档视觉问答是一个针对文档图片的高层理解任务 具体来说, 给定一张文档图片和一个针对性的问题, 模型需要根据图片给出该问题的正确答案 具体的例子如图圵所示 针对文档的视觉问答工作最早出现在数据集坄坯坣坖坑坁在坍坡坴坨坥坷坥坴坡坬圮圬圲地圲圱坢圩中, 该数据集包含了超过圱圲地地地个文档和对应的圵地地地个问题 后来, 出现了针对文档中图表的视觉问答工作坉坮坦坯坧坲坡坰坨坩坣坖坑坁在坍坡坴坨坥坷坥坴坡坬圮圬圲地圲圱坡圩 针对坄坯坣坖坑坁数据集的答案较短, 文档主题较单一的缺陷, 有研究人员提出了坖坩坳坵坡坬坍坒坃在坔坡坮坡坫坡坥坴坡坬圮圬圲地圲圱圩数据集 不同于传统坖坑坁任务, 文档视觉问答中的文档文本对任务具有关键作用, 所以现存的代表性方法都将文档图片进行字符识别 ( 坏坃坒 ) 处理得到的文档文本作为重要的信息 在得到文档文本后, 针对不同数据的特点, 视觉问答任务被建模为不同的问题 对于坄坯坣坖坑坁数据来说, 绝大部分的问题答案都是作为文本片段存在于文档文本中的, 所以主流的方法都将其建模为了机器阅读理解问题 ( 坍坡坣坨坩坮坥坒坥坡坤坩坮坧坃坯坭坰坲坥坨坥坮坳坩坯坮 ) 通过为模型提供视觉特征和文档文本, 模型根据问题在给定的文档文本上进行文本片段的抽取来作为问题答案 而对于坖坩坳坵坡坬坍坒坃数据集, 问题的答案通常不蕴含在文档文本片段中, 需要给出较长的抽象回答 因此, 在这种情况下, 可行的方法是使用文本生成式的方法生成问题的答案 圵圮圲 支持多种下游任务的通用预训练模型 以上针对特定任务的深度学习方法针对某一项文档理解任务上能够取得较好的性能, 然而这些方法主要面临两个限制 : 在圱圩这些模型通常依赖于有限的标记数据, 而忽视了挖掘大量无标注数据中的知识 对于文档理解任务尤其是其中的信息抽取任务来说, 详细标注的数据是昂贵且消耗时间的 另一方面, 由于富文本文档在现实生活的大量使用, 存在着大量的未标注文档, 而这些大量的未标注数据可以使用自监督预训练加以利用 在圲 ) 富文本文档不仅有大量的文本信息, 同时也包含丰富的版面和视觉信息 已有的针对特定任务的模型由于数据量的限制, 通常只能通过预训练的坃坖模型或坎坌坐模型来获取对应模态的特征, 而且大部分工作只利用了单一模态的信息或者是两种特征的简单组合而不是深度交互 坔坲坡坮坳坦坯坲坭坥坲在坖坡坳坷坡坮坩坥坴坡坬圮圬圲地圱圷圩在迁移学习领域的成功证明了深度上下文化 ( 坃坯坮坴坥坸坴坵坡坬坩坺坮坧 ) 对于序列建模的重要性, 因此将文本和其他模态进行深度交互融合是一个较为明显的趋势 富文本文档主要包含三种模态信息 : 文本 布局以及视觉信息, 并且这三种模态在富文本文档中有天然的对齐特性 因此, 如何对文档进行建模并且通过训练达到跨模态对齐是一

12 个重要的问题 坌坡坹坯坵坴坌坍在坘坵坥坴坡坬圮圬圲地圲地圩以及后续提出的坌坡坹坯坵坴坌坍坶圲在坘坵坥坴坡坬圮圬圲地圲圱坡圩模型的提出正是针对这一方向进行的研究工作 在章节圲圮圳中, 我们详细介绍了坌坡坹坯坵坴坌坍这一通用文档理解预训练模型, 通过将文本和布局进行联合预训练, 坌坡坹坯坵坴坌坍在多种文档理解任务上取得了显著提升 在此基础上, 又有许多后续的研究工作对这一框架进行了针对性的改进 坌坡坹坯坵坴坌坍在预训练过程中没有引入文档视觉信息, 从而在坄坯坣坖坑坁这类需要较强视觉感知能力的任务上效果欠佳 针对这一问题, 坌坡坹坯坵坴坌坍坶圲在坘坵坥坴坡坬圮圬圲地圲圱坡圩通过将视觉特征信息融入到预训练过程中, 大大提高了模型的图像理解能力 具体来说, 在结构方面, 坌坡坹坯坵坴坌坍坶圲引入了空间感知自注意力机制在坳坰坡坴坩坡坬圭坡坷坡坲坥坳坥坬坦圭坡坴坴坥坮坴坩坯坮圩, 并将视觉特征作为输入序列的一部分 在预训练目标方面, 坌坡坹坯坵坴坌坍坶圲在掩码视觉语言模型 ( 坍坡坳坫坥坤坖坩坳坵坡坬圭坌坡坮坧坵坡坧坥坍坯坤坥坬 ) 之外又提出了文本坼图像对齐 ( 坔坥坸坴圭坉坭坡坧坥坁坬坩坧坮坭坥坮坴 ) 和文本坼图像匹配 ( 坔坥坸坴圭坉坭坡坧坥坍坡坴坣坨 ) 任务 通过在这两方面的改进, 模型对于视觉信息的感知能力大大提高, 并在包括坄坯坣坖坑坁在内的六种下游任务中获得了显著提升 坌坡坹坯坵坴坌坍模型虽然在英文数据上取得了成功, 但是对于非英语世界来说文档理解任务同样重要, 而坌坡坹坯坵坴坘坌坍在坘坵坥坴坡坬圮圬圲地圲圱坢圩的提出解决了这一问题 坌坡坹坯坵坴坘坌坍基于坌坡坹坯坵坴坌坍坶圲的模型结构, 通过使用圵圳种语言进行预训练, 扩展了坌坡坹坯坵坴坌坍的语言支持 与此同时, 相比于纯文本的跨语言模型, 坌坡坹坯坵坴坘坌坍在迁移能力上有明显的优势, 这证明了不仅多语言文本之间可以进行跨语言学习, 多语言富文本文档之间的还可以进行文档布局的迁移学习 坌坡坹坯坵坴坌坍提出之后, 许多研究工作针对这一框架进行了针对性的改进 坌坁坍坂坅坒坔在均坡坲圭坮坣坡坲坥坫坥坴坡坬圮圬圲地圲地圩通过使用坒坯坂坅坒坔坡作为预训练初始化获得了更好的性能 坂坒坏坓在坈坯坮坧坥坴坡坬圮圬圲地圲地圩在引入区域掩码训练的同时在编码器阶段加入了文本空间位置信息, 提高了模型对空间位置感知能力 在坌坩坥坴坡坬圮圬圲地圲圱坡圩通过文本块内共享相同的位置信息并在预训练阶段引入位置信息预测的方式, 也让模型具有一定的位置感知能力 坌坁坍坐坒坅坔在块坵坥坴坡坬圮圬圲地圲圱圩通过为模型提供更多的模态信息如字体字号 插图等, 对网页文档进行建模, 并结合多种层次化的预训练任务来增强模型对文本和图片的理解能力 坓坥坬坦坄坯坣在坌坩坥坴坡坬圮圬圲地圲圱坢圩通过在输入阶段使用文档实体目标作为输入, 结合模态适应的注意力机制, 提升了模型的模态交互能力 坄坯坣坆坯坲坭坥坲在坁坰坰坡坬坡坲坡坪坵坥坴坡坬圮圬圲地圲圱圩通过引入了更高清的图片输入以及图像重构的预训练任务, 更加充分地利用了图像信息, 从而提高了模型性能 除了语言理解之外, 很多模型着眼于扩展模型的语言生成能力 一个共同的特点是都是用了坅坮坣坯坤坥坲圭坄坥坣坯坤坥坲范式 坔坉坌坔在坐坯坷坡坬圭坳坫坩坥坴坡坬圮圬圲地圲圱圩通过将坌坡坹坯坵坴编码层引入坔圵模型并结合文档数据预训练, 使模型能够处理文档领域的生成任务 坌坡坹坯坵坴坔圵和坌坡坹坯坵坴坂坁坒坔在坔坡坮坡坫坡坥坴坡坬圮圬圲地圲圱圩在文档视觉问答任务微调阶段在坔圵和坂坁坒坔模型的基础上引入文本位置编码, 来帮助模型理解并生成问题答案 6 结语 信息处理是数字化转型的基础和前提, 如今对处理能力 处理速度和处理精度也都有着越来越高的要求 以商业领域为例, 电子商业文档就涵盖了采购单据 行业报告 商务邮件 销售合同 雇佣协议 商业发票 个人简历等大量繁杂的信息 机器人流程自动化 ( 坒坯坢坯坴坩坣坐坲坯坣坥坳坳坁坵坴坯坭坡坴坩坯坮, 坒坐坁 ) 行业正是在这一背景下应运而生, 利用人工智能技术帮助大量人工从繁杂的电子文档处理任务中解脱出来, 并通过一系列配套的自动化工具提升生产力, 坒坐坁的关键核心之一就是文档智能分析技术 在过去的圲地年间, 文档智能分析技术主要经历了三个阶段, 从最初的基于启发式规则, 过渡到基于统计机器学习, 到近来基于深度学习的方法, 极大地提升了分析性能和准确率 与此同时我们也观察到, 以坌坡坹坯坵坴坌坍为代表的大规模自监督通用文档智能预训练模型也越来越多地受到人们的关注和使用, 逐步成为构建更为复杂算法的基本单元, 后续研究工作也层出不穷, 促使文档智能领域加速发展 展望未来, 除了解决文档多页跨页 训练数据质量参差不齐 多任务关联性较弱以及少样本零样本学习等问题, 还应该特别关注文字检测识别坏坃坒技术与文档智能技术的结合, 因为文档智能下游任务的输入通常来自于自动文字检测和识别算法, 文字识别的准确性往往对于下游任务有很大的影响 此外, 如何将文档智能技术与现有人类知识以及人工处理文档的技巧相结合, 也是未来值得探索的一个研究课题

13 参考文献 坁坢坤坥坬坲坡坨坭坡坮坁坢坤坡坬坬坡坨圬坁坬坥坸坡坮坤坥坲坂坥坲坥坮坤坥坹坥坶圬坉坳坬坡坭坎坵坲坡坤坩坮圬坡坮坤坄坡坮坩坹坡坲坎坵坲坳坥坩坴坯坶圮 圲地圲圱圮 坔坮坣坲场 坔坡坢坬坥坮坥坴坤坥坴坥坣坴坩坯坮坡坮坤坣坬坡坳坳坩圌坣坡坴坩坯坮坤坡坴坡坳坥坴圮 arxiv preprint arxiv: 圮 坍坵坨坡坭坭坡坤坚坥坳坨坡坮坁坦坺坡坬圬坓坡坭坵坥坬坥坃坡坰坯坢坩坡坮坣坯圬坍坵坨坡坭坭坡坤坉坭坲坡坮坍坡坬坩坫圬坓坩坭坯坮坥坍坡坲坩坮坡坩圬坔坨坯坭坡坳坍坂坲坥坵坥坬圬坁坮坤坲坥坡坳坄坥坮坧坥坬圬坡坮坤坍坡坲坣坵坳坌坩坷坩坣坫坩圮圲地圱圵圮坄坥坥坰坤坯坣坣坬坡坳坳坩圌坥坲场坄坯坣坵坭坥坮坴坣坬坡坳坳坩圌坣坡坴坩坯坮坷坩坴坨坤坥坥坰坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫圮坉坮 th international conference on document analysis and recognition (ICDAR) 圬坰坡坧坥坳圱圱圱圱坻圱圱圱圵圮坉坅坅坅圮 坍坵坨坡坭坭坡坤坚坥坳坨坡坮坁坦坺坡坬圬坁坮坤坲坥坡坳坋坿坯坬坳坣坨圬坓坨坥坲坡坺坁坨坭坥坤圬坡坮坤坍坡坲坣坵坳坌坩坷坩坣坫坩圮圲地圱圷圮坃坵坴坴坩坮坧坴坨坥坥坲坲坯坲坢坹坨坡坬坦场坉坮坶坥坳坴坩坧坡坴坩坯坮坯坦坶坥坲坹坤坥坥坰坣坮坮坡坮坤坡坤坶坡坮坣坥坤坴坲坡坩坮坩坮坧坳坴坲坡坴坥坧坩坥坳坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮圮坉坮 th IAPR International Conference on Document Analysis and Recognition (ICDAR) 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圸圸圳坻圸圸圸圮坉坅坅坅圮 坓坲坩坫坡坲坁坰坰坡坬坡坲坡坪坵圬坂坨坡坶坡坮坊坡坳坡坮坩圬坂坨坡坲坧坡坶坡坕坲坡坬坡坋坯坴坡圬坙坵坳坨坥坮坧坘坩坥圬坡坮坤坒坍坡坮坭坡坴坨坡圮圲地圲圱圮坄坯坣圭坦坯坲坭坥坲场坅坮坤圭坴坯圭坥坮坤坴坲坡坮坳坦坯坲坭坥坲坦坯坲坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧圮 arxiv preprint arxiv: 圮 坍坩坣坨坥坡坬坂坡坥坣坨坬坥坲坡坮坤坒坯坬坦坉坮坧坯坬坤圮圲地圱圱圮坍坵坬坴坩坲坥坳坯坬坵坴坩坯坮坬坡坹坯坵坴坡坮坡坬坹坳坩坳坯坦坭坥坤坩坥坶坡坬坭坡坮坵坳坣坲坩坰坴坳坵坳坩坮坧坤坹坮坡坭坩坣坭坬坰圮坉坮 2011 International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圱圱圸圵坻圱圱圸圹圮坉坅坅坅圮 坈坥坮坲坹坓坂坡坩坲坤圬坓坵坳坡坮坅坊坯坮坥坳圬坡坮坤坓坴坥坶坥坮坊坆坯坲坴坵坮坥圮圱圹圹地圮坉坭坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坢坹坳坨坡坰坥圭坤坩坲坥坣坴坥坤坣坯坶坥坲坳圮坉坮 [1990] Proceedings. 10th International Conference on Pattern Recognition 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圸圲地坻圸圲圵圮坉坅坅坅圮 坁坮坵坫坲坩坴坩坂坡坮坳坡坬圬均坡坵坲坡坶坈坡坲坩坴圬坡坮坤坓坵坭坡坮坴坲坡坄坵坴坴坡坒坯坹圮圲地圱圴圮坔坡坢坬坥坥坸坴坲坡坣坴坩坯坮坦坲坯坭坤坯坣坵坭坥坮坴坩坭坡坧坥坳坵坳坩坮坧圌坸坥坤坰坯坩坮坴坭坯坤坥坬圮坉坮 Proceedings of the 2014 Indian Conference on Computer Vision Graphics and Image Processing 圬坰坡坧坥坳圱坻圸圮 坉坴坡坹坂坡坲圭坙坯坳坥坦圬坎坡坴坥坈坡坧坢坩圬坋坬坡坲坡坋坥坤坥坭圬坡坮坤坉坴坳坨坡坫坄坩坮坳坴坥坩坮圮圲地地圹圮坌坩坮坥坳坥坧坭坥坮坴坡坴坩坯坮坦坯坲坤坥坧坲坡坤坥坤坨坡坮坤坷坲坩坴坴坥坮坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坳圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圱圱圶圱坻圱圱圶圵圮坉坅坅坅圮 坐坨坩坬坩坰坰坩坮坥坂坡坲坬坡坳圬坓圓坥坢坡坳坴坩坥坮坁坤坡坭圬坃坬圓坥坭坥坮坴坃坨坡坴坥坬坡坩坮圬坡坮坤坔坨坩坥坲坲坹坐坡坱坵坥坴圮圲地圱圴圮坁坴坹坰坥坤坡坮坤坨坡坮坤圭坷坲坩坴坴坥坮坴坥坸坴坢坬坯坣坫坳坥坧坭坥坮坴坡坴坩坯坮坳坹坳坴坥坭坦坯坲坨坥坴坥坲坯坧坥坮坥坯坵坳坡坮坤坣坯坭坰坬坥坸坤坯坣坵坭坥坮坴坳圮坉坮 th IAPR International Workshop on Document Analysis Systems 圬坰坡坧坥坳圴圶坻圵地圮坉坅坅坅圮 均坡坬坡坬坍坂坩坮坭坡坫坨坡坳坨坥坮坡坮坤坓坡坢坲坩坁坍坡坨坭坯坵坤圮圲地圱圹圮坄坯坣坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳场坁坣坯坭坰坲坥坨坥坮坳坩坶坥坳坵坲坶坥坹圮 ACM Computing Surveys (CSUR) 圬圵圲在圶圩场圱坻圳圶圮 坄坡坮坓坂坬坯坯坭坢坥坲坧圮圱圹圹圱圮坍坵坬坴坩坲坥坳坯坬坵坴坩坯坮坭坯坲坰坨坯坬坯坧坩坣坡坬坡坰坰坲坯坡坣坨坴坯坤坯坣坵坭坥坮坴坩坭坡坧坥坡坮坡坬坹坳坩坳圮坉坮 Proc. of the international conference on document analysis and recognition, Saint-Malo, France 圮 坓坹坥坤坓坡坱坩坢坂坵坫坨坡坲坩圬坆坡坩坳坡坬坓坨坡坦坡坩坴圬坡坮坤坔坨坯坭坡坳坍坂坲坥坵坥坬圮圲地地圹圮坓坣坲坩坰坴圭坩坮坤坥坰坥坮坤坥坮坴坨坡坮坤坷坲坩坴坴坥坮坴坥坸坴坬坩坮坥坳坳坥坧坭坥坮坴坡坴坩坯坮坵坳坩坮坧坡坣坴坩坶坥坣坯坮坴坯坵坲坳圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圴圴圶坻圴圵地圮坉坅坅坅圮 坓坹坥坤坓坡坱坩坢坂坵坫坨坡坲坩圬坍坡坹坣坥坉坢坲坡坨坩坭坁坬坩坁坬坁坺坡坷坩圬坆坡坩坳坡坬坓坨坡坦坡坩坴圬坡坮坤坔坨坯坭坡坳坍坂坲坥坵坥坬圮圲地圱地圮坄坯坣坵坭坥坮坴坩坭坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坵坳坩坮坧坤坩坳坣坲坩坭坩坮坡坴坩坶坥坬坥坡坲坮坩坮坧坯坶坥坲坣坯坮坮坥坣坴坥坤坣坯坭坰坯坮坥坮坴坳圮坉坮 Proceedings of the 9th IAPR International Workshop on Document Analysis Systems 圬坰坡坧坥坳圱圸圳坻圱圹地圮 坓坹坥坤坓坡坱坩坢坂坵坫坨坡坲坩圬坔坨坯坭坡坳坍坂坲坥坵坥坬圬坁坢坥坤坥坬坫坡坤坩坲坁坳坩圬坡坮坤坊坩坨坡坤坅坬圭坓坡坮坡圮圲地圱圲圮坌坡坹坯坵坴坡坮坡坬坹坳坩坳坦坯坲坡坲坡坢坩坣坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坩坭坡坧坥坳坵坳坩坮坧坭坡坣坨坩坮坥坬坥坡坲坮坩坮坧圮坉坮 2012 International Conference on Frontiers in Handwriting Recognition 圬坰坡坧坥坳圶圳圹坻圶圴圴圮坉坅坅坅圮 坚坨坡坯坷坥坩坃坡坩坡坮坤坎坵坮坯坖坡坳坣坯坮坣坥坬坯坳圮圲地圱圸圮坃坡坳坣坡坤坥坲圭坣坮坮场坄坥坬坶坩坮坧坩坮坴坯坨坩坧坨坱坵坡坬坩坴坹坯坢坪坥坣坴坤坥坴坥坣坴坩坯坮圮坉坮 Proceedings of the IEEE conference on computer vision and pattern recognition 圬坰坡坧坥坳圶圱圵圴坻圶圱圶圲圮 坊坩坮坃坨坥坮坡坮坤坄坡坮坩坥坬坌坯坰坲坥坳坴坩圮圲地圱圱圮坔坡坢坬坥坤坥坴坥坣坴坩坯坮坩坮坮坯坩坳坹坯國圭坬坩坮坥坨坡坮坤坷坲坩坴坴坥坮坤坯坣坵坭坥坮坴坳圮坉坮 2011 International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圳圹圹坻圴地圳圮坉坅坅坅圮 坋坡坩坃坨坥坮圬坍坡坴坨坩坡坳坓坥坵坲坥坴圬坊坥坡坮坈坥坮坮坥坢坥坲坴圬坡坮坤坒坯坬坦坉坮坧坯坬坤圮圲地圱圷圮坃坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳坦坯坲坰坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坯坦坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坩坭坡坧坥坳圮坉坮 th IAPR International Conference on Document Analysis and Recognition (ICDAR) 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圹圶圵坻圹圷地圮坉坅坅坅圮

14 坍坥坮坧坬坩坃坨坥坮坧圬坍坩坮坧坨坵坩坑坩坵圬坘坩坮坧坓坨坩圬坊坵坮坈坵坡坮坧圬坡坮坤块坥坩坌坩坮圮圲地圲地圮坏坮坥圭坳坨坯坴坴坥坸坴圌坥坬坤坬坡坢坥坬坩坮坧坵坳坩坮坧坡坴坴坥坮坴坩坯坮坡坮坤坢坥坬坩坥坦坰坲坯坰坡坧坡坴坩坯坮坦坯坲坳坴坲坵坣坴坵坲坥坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圮坉坮 Proceedings of the 28th ACM International Conference on Multimedia 圬坰坡坧坥坳圳圴地坻圳圴圸圮 坁坲坩坮坤坡坭坄坡坳圬坓坡坩坫坡坴坒坯坹圬坕坪坪坷坡坬坂坨坡坴坴坡坣坨坡坲坹坡圬坡坮坤坓坷坡坰坡坮坋坐坡坲坵坩圮圲地圱圸圮坄坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌圭坣坡坴坩坯坮坷坩坴坨坩坮坴坲坡圭坤坯坭坡坩坮坴坲坡坮坳坦坥坲坬坥坡坲坮坩坮坧坡坮坤坳坴坡坣坫坥坤坧坥坮坥坲坡坬坩坺坡坴坩坯坮坯坦坤坥坥坰坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳圮坉坮 th International Conference on Pattern Recognition (ICPR) 圬坰坡坧坥坳圳圱圸地坻圳圱圸圵圮坉坅坅坅圮 坔坹坬坥坲坄坡坵坰坨坩坮坥坥圬坎坩坫坵坮坪坐坡坴坥坬圬坡坮坤坍坯坨坡坭坭坡坤坒坡坳坨坩坤坩圮圲地圱圹圮坍坯坤坵坬坡坲坭坵坬坴坩坭坯坤坡坬坡坲坣坨坩坴坥坣坴坵坲坥坦坯坲坤坯坣坵坭坥坮坴坣坬坡坳坳坩圌坣坡坴坩坯坮圮 arxiv preprint arxiv: 圮 坔坩坭坯坉坄坥坮坫坡坮坤坃坨坲坩坳坴坩坡坮坒坥坩坳坳坷坩坧圮圲地圱圹圮坂坥坲坴坧坲坩坤场坃坯坮坴坥坸坴坵坡坬坩坺坥坤坥坭坢坥坤坤坩坮坧坦坯坲圲坤坤坯坣坵坭坥坮坴坲坥坰坲坥坳坥坮坴坡坴坩坯坮坡坮坤坵坮坤坥坲坳坴坡坮坤坩坮坧圮 arxiv preprint arxiv: 圮 坈坡坲坳坨坄坥坳坡坩圬坐坲坡坴坩坫坋坡坹坡坬圬坡坮坤坍坡坹坡坮坫坓坩坮坧坨圮圲地圲圱圮坔坡坢坬坥坸场坁坢坥坮坣坨坭坡坲坫坤坡坴坡坳坥坴坦坯坲坳坴坲坵坣坴坵坲坥坡坮坤坣坯坮坴坥坮坴坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坲坯坭坳坣坩坥坮坴坩圌坣坴坡坢坬坥坳圮 坔坨坯坭坡坳均坄坩坥坴坴坥坲坩坣坨圬坒坩坣坨坡坲坤坈坌坡坴坨坲坯坰圬坡坮坤坔坯坭圓坡坳坌坯坺坡坮坯圭坐圓坥坲坥坺圮圱圹圹圷圮坓坯坬坶坩坮坧坴坨坥坭坵坬坴坩坰坬坥坩坮坳坴坡坮坣坥坰坲坯坢坬坥坭坷坩坴坨坡坸坩坳圭坰坡坲坡坬坬坥坬坲坥坣坴坡坮坧坬坥坳圮 Artificial intelligence 圬圸圹在圱圭圲圩场圳圱坻圷圱圮 坈坡坯坹坵坄坯坮坧圬坓坨坩坪坩坥坌坩坵圬坓坨坩坈坡坮圬坚坨坯坵坹坵坆坵圬坡坮坤坄坯坮坧坭坥坩坚坨坡坮坧圮圲地圱圹圮坔坡坢坬坥坳坥坮坳坥场坓坰坲坥坡坤坳坨坥坥坴坴坡坢坬坥坤坥坴坥坣坴坩坯坮坷坩坴坨坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳圮坉坮 Proceedings of the AAAI Conference on Artificial Intelligence 圬坶坯坬坵坭坥圳圳圬坰坡坧坥坳圶圹坻圷圶圮 坁坮坡坃坯坳坴坡坥坓坩坬坶坡圮圲地地圹圮坌坥坡坲坮坩坮坧坲坩坣坨坨坩坤坤坥坮坭坡坲坫坯坶坭坯坤坥坬坳坩坮坤坯坣坵坭坥坮坴坡坮坡坬坹坳坩坳场坔坡坢坬坥坬坯坣坡坴坩坯坮圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圸圴圳坻圸圴圷圮坉坅坅坅圮 坆坬坯坲坩坡坮坡坅坳坰坯坳坩坴坯圬坄坯坮坡坴坯坍坡坬坥坲坢坡圬均坩坯坶坡坮坮坩坓坥坭坥坲坡坲坯圬坅坮坲坩坣坯坁坮坮坥坳坥圬坡坮坤均坩坯坶坡坮坮坡坓坣坡坦坵坲坯圮圱圹圹地圮坁坮坥坸坰坥坲坩坭坥坮坴坡坬坰坡坧坥坬坡坹坯坵坴坲坥坣坯坧坮坩坴坩坯坮坳坹坳坴坥坭坦坯坲坯圎坣坥坤坯坣坵坭坥坮坴坡坵坴坯坭坡坴坩坣坣坬坡坳坳坩圌坣坡坴坩坯坮场坡坮坩坮圭坴坥坧坲坡坴坥坤坡坰坰坲坯坡坣坨坦坯坲坩坮坤坵坣坴坩坶坥坧坥坮坥坲坡坬坩坺坡坴坩坯坮圮坉坮 [1990] Proceedings. 10th International Conference on Pattern Recognition 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圵圵圷坻圵圶圲圮坉坅坅坅圮 坆坬坯坲坩坡坮坡坅坳坰坯坳坩坴坯圬坓坴坥坦坡坮坯坆坥坲坩坬坬坩圬坔坥坲坥坳坡坍坁坂坡坳坩坬坥圬坡坮坤坎坩坣坯坬坡坄坩坍坡坵坲坯圮圲地地圸圮坍坡坣坨坩坮坥坬坥坡坲坮坩坮坧坦坯坲坤坩坧坩坴坡坬坤坯坣坵坭坥坮坴坰坲坯坣坥坳坳坩坮坧场坆坲坯坭坬坡坹坯坵坴坡坮坡坬坹坳坩坳坴坯坭坥坴坡坤坡坴坡坥坸坴坲坡坣坴坩坯坮圮坉坮 Machine learning in document analysis and recognition 圬坰坡坧坥坳圱地圵坻圱圳圸圮坓坰坲坩坮坧坥坲圮 坊坩坮坧坆坡坮坧圬坘坩坮坔坡坯圬坚坨坩坔坡坮坧圬坒坵坩坨坥坮坧坑坩坵圬坡坮坤坙坩坮坧坌坩坵圮圲地圱圲圮坄坡坴坡坳坥坴圬坧坲坯坵坮坤圭坴坲坵坴坨坡坮坤坰坥坲坦坯坲坭坡坮坣坥坭坥坴坲坩坣坳坦坯坲坴坡坢坬坥坤坥坴坥坣坴坩坯坮坥坶坡坬坵坡坴坩坯坮圮坉坮 th IAPR International Workshop on Document Analysis Systems 圬坰坡坧坥坳圴圴圵坻圴圴圹圮坉坅坅坅圮 坊坡坭坥坳坌坆坩坳坨坥坲圬坓坴坵坡坲坴坃坈坩坮坤坳圬坡坮坤坄坯坮坡坬坤坐坄圧坁坭坡坴坯圮圱圹圹地圮坁坲坵坬坥圭坢坡坳坥坤坳坹坳坴坥坭坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮圮坉坮 [1990] Proceedings. 10th International Conference on Pattern Recognition 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圵圶圷坻圵圷圲圮坉坅坅坅圮 坌坩坡坮坧坣坡坩均坡坯圬坙坩坬坵坮坈坵坡坮坧圬坈坥坲坶圓坥坄圓坥坪坥坡坮圬坊坥坡坮圭坌坵坣坍坥坵坮坩坥坲圬坑坩坮坱坩坮坙坡坮圬坙坵坆坡坮坧圬坆坬坯坲坩坡坮坋坬坥坢坥坲圬坡坮坤坅坶坡坌坡坮坧圮圲地圱圹圮坉坣坤坡坲圲地圱圹坣坯坭坰坥坴坩坴坩坯坮坯坮坴坡坢坬坥坤坥坴坥坣坴坩坯坮坡坮坤坲坥坣坯坧坮坩坴坩坯坮在坣坴坤坡坲圩圮坉坮 2019 International Conference on Document Analysis and Recognition (ICDAR) 圬坰坡坧坥坳圱圵圱地坻圱圵圱圵圮 圠坌坵坫坡坳坺均坡坲坮坣坡坲坥坫圬坒坡坦坡圠坬坐坯坷坡坬坳坫坩圬坔坯坭坡坳坺坓坴坡坮坩坳圠坬坡坷坥坫圬坂坡坲坴坯坳坺坔坯坰坯坬坳坫坩圬坐坩坯坴坲坈坡坬坡坭坡圬坍坩坣坨坡圠坬坔坵坲坳坫坩圬坡坮坤坆坩坬坩坰均坲坡坬坩圓坮坳坫坩圮圲地圲地圮坌坡坭坢坥坲坴场坌坡坹坯坵坴圭坡坷坡坲坥在坬坡坮坧坵坡坧坥圩坭坯坤坥坬坩坮坧坦坯坲坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圮 arxiv preprint arxiv: 圮 坍坡坸坃圮均坿坯坢坥坬圬坔坡坭坩坲坈坡坳坳坡坮圬坅坲坭坥坬坩坮坤坡坏坲坯圬坡坮坤均圮坏坲坳坩圮圲地圱圳圮坉坣坤坡坲圲地圱圳坴坡坢坬坥坣坯坭坰坥坴坩坴坩坯坮圮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圱圴圴圹坻圱圴圵圳圮 坔坯坢坩坡坳均坲坿坵坮坩坮坧圬均坵坮坤坲坡坭坌坥坩坦坥坲坴圬坔坯坢坩坡坳坓坴坲坡坵圙圬坊坯坨坡坮坮坥坳坍坩坣坨坡坥坬圬坡坮坤坒坯坧坥坲坌坡坢坡坨坮圮圲地圱圹圮坁坴坷坯圭坳坴坡坧坥坭坥坴坨坯坤坦坯坲坴坥坸坴坬坩坮坥坤坥坴坥坣坴坩坯坮坩坮坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坳圮 International Journal on Document Analysis and Recognition (IJDAR) 圬圲圲在圳圩场圲圸圵坻圳地圲圮 坊坥坡坮圭坐坨坩坬坩坰坰坥坔坨坩坲坡坮均坵坩坬坬坡坵坭坥坊坡坵坭坥圬坈坡坺坩坭坋坥坭坡坬坅坫坥坮坥坬圮圲地圱圹圮坆坵坮坳坤场坁坤坡坴坡坳坥坴坦坯坲坦坯坲坭坵坮坤坥坲圭坳坴坡坮坤坩坮坧坩坮坮坯坩坳坹坳坣坡坮坮坥坤坤坯坣坵坭坥坮坴坳圮坉坮 Accepted to ICDAR-OST 圮 坈坥均坵坯圬坘坩坡坭坥坮坧坑坩坮圬坊坩坡坭坩坮坧坌坩坵圬坊坵坮坹坵坈坡坮圬坊坩坮坧坴坵坯坌坩坵圬坡坮坤坅坲坲坵坩坄坩坮坧圮圲地圱圹圮坅坡坴坥坮场坅坮坴坩坴坹圭坡坷坡坲坥坡坴坴坥坮坴坩坯坮坦坯坲坳坩坮坧坬坥坳坨坯坴坶坩坳坵坡坬坴坥坸坴坥坸坴坲坡坣坴坩坯坮圮

15 坁坤坡坭块坈坡坲坬坥坹圬坁坬坥坸坕坦坫坥坳圬坡坮坤坋坯坮坳坴坡坮坴坩坮坯坳均坄坥坲坰坡坮坩坳圮圲地圱圵圮坅坶坡坬坵坡坴坩坯坮坯坦坤坥坥坰坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坴坳坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮坡坮坤坲坥坴坲坩坥坶坡坬圮坉坮 International Conference on Document Analysis and Recognition (ICDAR) 圮 坋坡坩坭坩坮坧坈坥圬坘坩坡坮坧坹坵坚坨坡坮坧圬坓坨坡坯坱坩坮坧坒坥坮圬坡坮坤坊坩坡坮坓坵坮圮 圲地圱圵圮 坄坥坥坰坲坥坳坩坤坵坡坬坬坥坡坲坮坩坮坧坦坯坲坩坭坡坧坥 坲坥坣坯坧坮坩坴坩坯坮圮 坋坡坩坭坩坮坧坈坥圬均坥坯坲坧坩坡均坫坩坯坸坡坲坩圬坐坩坯坴坲坄坯坬坬圓坡坲圬坡坮坤坒坯坳坳均坩坲坳坨坩坣坫圮圲地圱圸圮坍坡坳坫坲圭坣坮坮圮 坊坯坮坡坴坨坡坮坈坥坲坺坩坧圬坐坡坷坥圠坬坋坲坺坹坳坺坴坯坦坎坯坷坡坫圬坔坨坯坭坡坳坍坿坵坬坬坥坲圬坆坲坡坮坣坥坳坣坯坐坩坣坣坩坮坮坯圬坡坮坤坊坵坬坩坡坮坍坡坲坴坩坮坅坩坳坥坮坳坣坨坬坯坳圮圲地圲地圮坔坡坰坡坳场块坥坡坫坬坹坳坵坰坥坲坶坩坳坥坤坴坡坢坬坥坰坡坲坳坩坮坧坶坩坡坰坲坥圭坴坲坡坩坮坩坮坧圮 arxiv preprint arxiv: 圮 坔坥坡坫坧坹坵坈坯坮坧圬坄坯坮坧坈坹坵坮坋坩坭圬坍坩坮坧坩坊坩圬块坯坮坳坥坯坫坈坷坡坮坧圬坄坡坥坨坹坵坮坎坡坭圬坡坮坤坓坵坮坧坲坡坥坐坡坲坫圮圲地圲地圮坂坲坯坳场坁坰坲坥圭坴坲坡坩坮坥坤坬坡坮坧坵坡坧坥坭坯坤坥坬坦坯坲坵坮坤坥坲坳坴坡坮坤坩坮坧坴坥坸坴坳坩坮坤坯坣坵坭坥坮坴圮 坚坨坥坮坧坈坵坡坮坧圬坋坡坩坃坨坥坮圬坊坩坡坮坨坵坡坈坥圬坘坩坡坮坧坂坡坩圬坄坩坭坯坳坴坨坥坮坩坳坋坡坲坡坴坺坡坳圬坓坨坩坪坩坡坮坌坵圬坡坮坤坃圮坖圮坊坡坷坡坨坡坲圮圲地圱圹圮坉坣坤坡坲圲地圱圹坣坯坭坰坥坴坩坴坩坯坮坯坮坳坣坡坮坮坥坤坲坥坣坥坩坰坴坯坣坲坡坮坤坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圮 2019 International Conference on Document Analysis and Recognition (ICDAR) 圬坓坥坰圮 块坯坮坳坥坯坫坈坷坡坮坧圬坊坩坮坹坥坯坮坧坙坩坭圬坓坥坵坮坧坨坹坵坮坐坡坲坫圬坓坯坨坥坥坙坡坮坧圬坡坮坤坍坩坮坪坯坯坮坓坥坯圮圲地圲地圮坓坰坡圭坴坩坡坬坤坥坰坥坮坤坥坮坣坹坰坡坲坳坩坮坧坦坯坲坳坥坭坩圭坳坴坲坵坣坴坵坲坥坤坤坯坣坵坭坥坮坴坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮圮 arxiv preprint arxiv: 圮 坔坨坯坴坲坥坩坮坧坡坭坋坡坳坡坲圬坐坨坩坬坩坰坰坩坮坥坂坡坲坬坡坳圬坓坥坢坡坳坴坩坥坮坁坤坡坭圬坃坬圓坥坭坥坮坴坃坨坡坴坥坬坡坩坮圬坡坮坤坔坨坩坥坲坲坹坐坡坱坵坥坴圮圲地圱圳圮坌坥坡坲坮坩坮坧坴坯坤坥坴坥坣坴坴坡坢坬坥坳坩坮坳坣坡坮坮坥坤坤坯坣坵坭坥坮坴坩坭坡坧坥坳坵坳坩坮坧坬坩坮坥坩坮坦坯坲坭坡坴坩坯坮圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圱圱圸圵坻圱圱圸圹圮坉坅坅坅圮 坁坮坯坯坰坒坋坡坴坴坩圬坃坨坲坩坳坴坩坡坮坒坥坩坳坳坷坩坧圬坃坯坲坤坵坬坡均坵坤坥坲圬坓坥坢坡坳坴坩坡坮坂坲坡坲坤坡圬坓坴坥國坥坮坂坩坣坫坥坬圬坊坯坨坡坮坮坥坳坈坿坯坨坮坥圬坡坮坤坊坥坡坮坂坡坰坴坩坳坴坥坆坡坤坤坯坵坬圮圲地圱圸圮坃坨坡坲坧坲坩坤场坔坯坷坡坲坤坳坵坮坤坥坲坳坴坡坮坤坩坮坧圲坄坤坯坣坵坭坥坮坴坳圮坉坮 Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing 圬坰坡坧坥坳圴圴圵圹坻圴圴圶圹圬坂坲坵坳坳坥坬坳圬坂坥坬坧坩坵坭圬坏坣坴坯坢坥坲圭坎坯坶坥坭坢坥坲圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坡坴坩坯坮坡坬坌坩坮坧坵坩坳坴坩坣坳圮 坍坯坨坡坭坥坤坋坥坲坲坯坵坭坩圬坏坴坨坭坡坮坥坓坡坹坥坭圬坡坮坤坁坹坭坥坮坓坨坡坢坯坵圮圲地圲地圮坖坩坳坵坡坬坷坯坲坤坧坲坩坤场坉坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣圭坴坩坯坮坦坲坯坭坳坣坡坮坮坥坤坤坯坣坵坭坥坮坴坳坵坳坩坮坧坡坭坵坬坴坩坭坯坤坡坬坡坰坰坲坯坡坣坨圮 arxiv preprint arxiv: 圮 坋坯坩坣坨坩坋坩坳坥圬坁坫坩坮坯坲坩坓坡坴坯圬坡坮坤坍坯坴坯坩坉坷坡坴坡圮圱圹圹圸圮坓坥坧坭坥坮坴坡坴坩坯坮坯坦坰坡坧坥坩坭坡坧坥坳坵坳坩坮坧坴坨坥坡坲坥坡坶坯坲坯坮坯坩坤坩坡坧坲坡坭圮 Computer Vision and Image Understanding 圬圷地在圳圩场圳圷地坻圳圸圲圮 坊圮坋坵坭坡坲圬坐坥坮坧坙坥圬坡坮坤坄圮坄坯坥坲坭坡坮坮圮圲地圱圴圮坓坴坲坵坣坴坵坲坡坬坳坩坭坩坬坡坲坩坴坹坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮坡坮坤坲坥坴坲坩坥坶坡坬圮 Pattern Recognit. Lett. 圬圴圳场圱圱圹坻圱圲圶圮 坑坵坡坮坮坡坮坌坩圬坊坩坮坧坤坯坮坧块坡坮坧圬坄坡坶坩坤块坩坰坦圬坡坮坤坚坨坵坯坷坥坮坔坵圮圲地圱圳圮坆坩坸坥坤圭坰坯坩坮坴坭坯坤坥坬坦坯坲坳坴坲坵坣坴坵坲坥坤坬坡坢坥坬坩坮坧圮坉坮 International conference on machine learning 圬坰坡坧坥坳圲圱圴坻圲圲圱圮坐坍坌坒圮 坍坩坮坧坨坡坯坌坩圬坌坥坩坃坵坩圬坓坨坡坯坨坡坮坈坵坡坮坧圬坆坵坲坵块坥坩圬坍坩坮坧坚坨坯坵圬坡坮坤坚坨坯坵坪坵坮坌坩圮圲地圲地坡圮坔坡坢坬坥坂坡坮坫场坔坡坢坬坥坢坥坮坣坨坭坡坲坫坦坯坲坩坭坡坧坥圭坢坡坳坥坤坴坡坢坬坥坤坥坴坥坣坴坩坯坮坡坮坤坲坥坣坯坧坮坩坴坩坯坮圮坉坮 Proceedings of the 12th Language Resources and Evaluation Conference 圬坰坡坧坥坳圱圹圱圸坻圱圹圲圵圬坍坡坲坳坥坩坬坬坥圬坆坲坡坮坣坥圬坍坡坹圮坅坵坲坯坰坥坡坮坌坡坮坧坵坡坧坥坒坥坳坯坵坲坣坥坳坁坳坳坯坣坩坡坴坩坯坮圮 坍坩坮坧坨坡坯坌坩圬坙坩坨坥坮坧坘坵圬坌坥坩坃坵坩圬坓坨坡坯坨坡坮坈坵坡坮坧圬坆坵坲坵块坥坩圬坚坨坯坵坪坵坮坌坩圬坡坮坤坍坩坮坧坚坨坯坵圮圲地圲地坢圮坄坯坣坂坡坮坫场坁坢坥坮坣坨坭坡坲坫坤坡坴坡坳坥坴坦坯坲坤坯坣坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳圮坉坮 Proceedings of the 28th International Conference on Computational Linguistics 圬坰坡坧坥坳圹圴圹坻圹圶地圬坂坡坲坣坥坬坯坮坡圬坓坰坡坩坮在坏坮坬坩坮坥圩圬坄坥坣坥坭坢坥坲圮坉坮坴坥坲坮坡坴坩坯坮坡坬坃坯坭坭坩坴坴坥坥坯坮坃坯坭坰坵坴坡坴坩坯坮坡坬坌坩坮坧坵坩坳坴坩坣坳圮 坃坨坥坮坬坩坡坮坧坌坩圬坂坩坮坂坩圬坍坩坮坧坙坡坮圬块坥坩块坡坮坧圬坓坯坮坧坦坡坮坧坈坵坡坮坧圬坆坥坩坈坵坡坮坧圬坡坮坤坌坵坯坓坩圮圲地圲圱坡圮坓坴坲坵坣圭坴坵坲坡坬坬坭场坓坴坲坵坣坴坵坲坡坬坰坲坥圭坴坲坡坩坮坩坮坧坦坯坲坦坯坲坭坵坮坤坥坲坳坴坡坮坤坩坮坧圮 arxiv preprint arxiv: 圮 坐坥坩坺坨坡坯坌坩圬坊坩坵坸坩坡坮坧均坵圬坊坡坳坯坮坋坵坥坮圬坖坬坡坤坉坍坯坲坡坲坩坵圬坈坡坮坤坯坮坧坚坨坡坯圬坒坡坪坩坶坊坡坩坮圬坖坡坲坵坮坍坡坮坪坵坮坡坴坨坡圬坡坮坤坈坯坮坧坦坵坌坩坵圮圲地圲圱坢圮坓坥坬坦坤坯坣场坓坥坬坦圭坳坵坰坥坲坶坩坳坥坤坤坯坣坵坭坥坮坴坲坥坰坲坥坳坥坮坴坡坴坩坯坮坬坥坡坲坮坩坮坧圮坉坮 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition 圬坰坡坧坥坳圵圶圵圲坻圵圶圶地圮 块坥坩坨坯坮坧坌坩坮圬坑坩坦坡坮坧均坡坯圬坌坥坩坓坵坮圬坚坨坵坯坹坡坯坚坨坯坮坧圬坋坡坩坈坵圬坑坩坮坒坥坮圬坡坮坤坑坩坡坮坧坈坵坯圮圲地圲圱圮坖坩坢坥坲坴圭坧坲坩坤场坁坪坯坩坮坴坬坹坴坲坡坩坮坥坤坭坵坬坴坩圭坭坯坤坡坬圲坤坤坯坣坵坭坥坮坴坲坥坰坲坥坳坥坮坴坡坴坩坯坮坦坯坲坫坥坹坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坲坯坭坤坯坣坵坭坥坮坴坳圮 arxiv preprint arxiv: 圮

16 块坥坩坌坩坵圬坄坲坡坧坯坭坩坲坁坮坧坵坥坬坯坶圬坄坵坭坩坴坲坵坅坲坨坡坮圬坃坨坲坩坳坴坩坡坮坓坺坥坧坥坤坹圬坓坣坯坴坴坒坥坥坤圬坃坨坥坮坧圭坙坡坮坧坆坵圬坡坮坤坁坬坥坸坡坮坤坥坲坃圮坂坥坲坧圮圲地圱圶圮坓坳坤场坓坩坮坧坬坥坳坨坯坴坭坵坬坴坩坢坯坸坤坥坴坥坣坴坯坲圮 Lecture Notes in Computer Science 圬坰坡坧坥圲圱坻圳圷圮 坘坩坡坯坪坩坮坧坌坩坵圬坆坥坩坹坵均坡坯圬坑坩坯坮坧坚坨坡坮坧圬坡坮坤坈坵坡坳坨坡坚坨坡坯圮圲地圱圹圮均坲坡坰坨坣坯坮坶坯坬坵坴坩坯坮坦坯坲坭坵坬坴坩坭坯坤坡坬坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坲坯坭坶坩坳坵坡坬坬坹坲坩坣坨坤坯坣坵坭坥坮坴坳圮坉坮 Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 2 (Industry Papers) 圬坰坡坧坥坳圳圲坻圳圹圬坍坩坮坮坥坡坰坯坬坩坳圬坍坩坮坮坥坳坯坴坡圬坊坵坮坥圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坡坴坩坯坮坡坬坌坩坮坧坵坩坳坴坩坣坳圮 坂坯坤坨坩坳坡坴坴坷坡坐坲坡坳坡坤坍坡坪坵坭坤坥坲圬坎坡坶坮坥坥坴坐坯坴坴坩圬坓坡坮坤坥坥坰坔坡坴坡圬坊坡坭坥坳坂坲坡坤坬坥坹块坥坮坤坴圬坑坩坚坨坡坯圬坡坮坤坍坡坲坣坎坡坪坯坲坫圮圲地圲地圮坒坥坰坲坥坳坥坮坴坡坴坩坯坮坬坥坡坲坮坩坮坧坦坯坲坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坲坯坭坦坯坲坭圭坬坩坫坥坤坯坣坵坭坥坮坴坳圮坉坮 proceedings of the 58th annual meeting of the Association for Computational Linguistics 圬坰坡坧坥坳圶圴圹圵坻圶圵地圴圮 坍坩坮坥坳坨坍坡坴坨坥坷圬坖坩坲坡坪坂坡坧坡坬圬坒坵坢園坥坮坐圓坥坲坥坺坔坩坴坯圬坄坩坭坯坳坴坨坥坮坩坳坋坡坲坡坴坺坡坳圬坅坲坮坥坳坴坖坡坬坶坥坮坹圬坡坮坤坃圮坖坊坡坷坡坨坡坲圮圲地圲圱坡圮坉坮坦坯坧坲坡坰坨坩坣坶坱坡圮 坍坩坮坥坳坨坍坡坴坨坥坷圬坄坩坭坯坳坴坨坥坮坩坳坋坡坲坡坴坺坡坳圬坡坮坤坃圮坖圮坊坡坷坡坨坡坲圮 圲地圲圱坢圮 坄坯坣坶坱坡场坁坤坡坴坡坳坥坴坦坯坲坶坱坡坯坮 坤坯坣坵坭坥坮坴坩坭坡坧坥坳圮 坁坪坯坹坍坯坮坤坡坬圬坐坥坴坥坲坌坩坰坰坳圬坡坮坤坃坖坊坡坷坡坨坡坲圮圲地圲地圮坉坩坩坴圭坡坲圭圱圳坫场坡坮坥坷坤坡坴坡坳坥坴坦坯坲坧坲坡坰坨坩坣坡坬坯坢坪坥坣坴坤坥坴坥坣坴坩坯坮坩坮坤坯坣坵坭坥坮坴坳圮坉坮 International Workshop on Document Analysis Systems 圬坰坡坧坥坳圲圱圶坻圲圳地圮坓坰坲坩坮坧坥坲圮 均坥坯坲坧坥坎坡坧坹坡坮坤坓坨坡坲坡坤坃坓坥坴坨圮圱圹圸圴圮坈坩坥坲坡坲坣坨坩坣坡坬坲坥坰坲坥坳坥坮坴坡坴坩坯坮坯坦坯坰坴坩坣坡坬坬坹坳坣坡坮坮坥坤坤坯坣坵坭坥坮坴坳圮 坌坡坷坲坥坮坣坥坏圧均坯坲坭坡坮圮圱圹圹圳圮坔坨坥坤坯坣坵坭坥坮坴坳坰坥坣坴坲坵坭坦坯坲坰坡坧坥坬坡坹坯坵坴坡坮坡坬坹坳坩坳圮 IEEE Transactions on pattern analysis and machine intelligence 圬圱圵在圱圱圩场圱圱圶圲坻圱圱圷圳圮 坍坡坳坡坹坵坫坩坏坫坡坭坯坴坯坡坮坤坍坡坫坯坴坯坔坡坫坡坨坡坳坨坩圮圱圹圹圳圮坁坨坹坢坲坩坤坰坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坭坥坴坨坯坤圮坉坮 Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR 93) 圬坰坡坧坥坳圷圴圳坻圷圴圶圮坉坅坅坅圮 坓坯圌坡坁坲坥坳坏坬坩坶坥坩坲坡圬坂坥坮坯坩坴坓坥坧坵坩坮圬坡坮坤坆坲坥坤坥坲坩坣坋坡坰坬坡坮圮圲地圱圸圮坤坨坳坥坧坭坥坮坴场坁坧坥坮坥坲坩坣坤坥坥坰圭坬坥坡坲坮坩坮坧坡坰坰坲坯坡坣坨坦坯坲坤坯坣坵坭坥坮坴坳坥坧坭坥坮坴坡坴坩坯坮圮坉坮 th International Conference on Frontiers in Handwriting Recognition (ICFHR) 圬坰坡坧坥坳圷坻圱圲圮坉坅坅坅圮 坓坥坵坮坧坨坹坵坮坐坡坲坫圬坓坥坵坮坧坓坨坩坮圬坂坡坤坯坌坥坥圬坊坵坮坹坥坯坰坌坥坥圬坊坡坥坨坥坵坮坧坓坵坲坨圬坍坩坮坪坯坯坮坓坥坯圬坡坮坤坈坷坡坬坳坵坫坌坥坥圮圲地圱圹圮坃坯坲坤场坁坣坯坮坳坯坬坩坤坡坴坥坤坲坥坣坥坩坰坴坤坡坴坡坳坥坴坦坯坲坰坯坳坴圭坯坣坲坰坡坲坳坩坮坧圮 坄坡坶坩坤坐坩坮坴坯圬坁坮坤坲坥坷坍坣坃坡坬坬坵坭圬坘坩坮坧块坥坩圬坡坮坤块坂坲坵坣坥坃坲坯坦坴圮圲地地圳圮坔坡坢坬坥坥坸坴坲坡坣坴坩坯坮坵坳坩坮坧坣坯坮坤坩坴坩坯坮坡坬坲坡坮坤坯坭圌坥坬坤坳圮坉坮 Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval 圬坰坡坧坥坳圲圳圵坻圲圴圲圮 坒坡坦坡圠坬坐坯坷坡坬坳坫坩圬圠坌坵坫坡坳坺坂坯坲坣坨坭坡坮坮圬坄坡坷坩坤坊坵坲坫坩坥坷坩坣坺圬坔坯坭坡坳坺坄坷坯坪坡坫圬坍坩坣坨坡圠坬坐坩坥坴坲坵坳坺坫坡圬坡坮坤均坡坢坲坩坥坬坡坐坡圠坬坫坡圮圲地圲圱圮均坯坩坮坧坦坵坬坬圭坴坩坬坴坢坯坯坧坩坥坯坮坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧坷坩坴坨坴坥坸坴圭坩坭坡坧坥圭坬坡坹坯坵坴坴坲坡坮坳坦坯坲坭坥坲圮 arxiv preprint arxiv: 圮 坄坥坶坡坳坨坩坳坨坐坲坡坳坡坤圬坁坹坡坮均坡坤坰坡坬圬坋坳坨坩坴坩坪坋坡坰坡坤坮坩圬坍坡坮坩坳坨坖坩坳坡坶坥圬坡坮坤坋坡坶坩坴坡坓坵坬坴坡坮坰坵坲坥圮圲地圲地圮坃坡坳圭坣坡坤坥坴坡坢坮坥坴场坁坮坡坰坰坲坯坡坣坨坦坯坲坥坮坤坴坯坥坮坤坴坡坢坬坥坤坥坴坥坣坴坩坯坮坡坮坤坳坴坲坵坣坴坵坲坥坲坥坣坯坧坮坩坴坩坯坮坦坲坯坭坩坭坡坧坥圭坢坡坳坥坤坤坯坣坵坭坥坮坴坳圮坉坮 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops 圬坰坡坧坥坳圵圷圲坻圵圷圳圮 坓坨坥坩坫坨坆坡坩坳坡坬坒坡坳坨坩坤圬坁坢坤坵坬坬坡坨坁坫坭坡坬圬坍坵坨坡坭坭坡坤坁坤坮坡坮圬坁坬坩坁坤坮坡坮坁坳坬坡坭圬坡坮坤坁坮坤坲坥坡坳坄坥坮坧坥坬圮圲地圱圷圮坔坡坢坬坥坲坥坣坯坧坮坩坴坩坯坮坩坮坨坥坴坥坲坯坧坥坮坥坯坵坳坤坯坣坵坭坥坮坴坳坵坳坩坮坧坭坡坣坨坩坮坥坬坥坡坲坮坩坮坧圮坉坮 th IAPR International conference on document analysis and recognition (ICDAR) 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圷圷圷坻圷圸圲圮坉坅坅坅圮 坊坯坳坥坰坨坒坥坤坭坯坮坡坮坤坁坬坩坆坡坲坨坡坤坩圮圲地圱圸圮坙坯坬坯坶圳场坁坮坩坮坣坲坥坭坥坮坴坡坬坩坭坰坲坯坶坥坭坥坮坴圮 arxiv 圮 坓坨坡坯坱坩坮坧坒坥坮圬坋坡坩坭坩坮坧坈坥圬坒坯坳坳均坩坲坳坨坩坣坫圬坡坮坤坊坩坡坮坓坵坮圮圲地圱圶圮坆坡坳坴坥坲坲圭坣坮坮场坴坯坷坡坲坤坳坲坥坡坬圭坴坩坭坥坯坢圭坪坥坣坴坤坥坴坥坣坴坩坯坮坷坩坴坨坲坥坧坩坯坮坰坲坯坰坯坳坡坬坮坥坴坷坯坲坫坳圮 IEEE transactions on pattern analysis and machine intelligence 圬圳圹在圶圩场圱圱圳圷坻圱圱圴圹圮 坐坡坵坒坩坢坡圬坁坮坪坡坮坄坵坴坴坡圬坌坵坴坺均坯坬坤坭坡坮坮圬坁坬坩坣坩坡坆坯坲坮圓坥坳圬坏坲坩坯坬坒坡坭坯坳圬坡坮坤坊坯坳坥坰坌坬坡坤圓坯坳圮圲地圱圹圮坔坡坢坬坥坤坥坴坥坣坴坩坯坮坩坮坩坮坶坯坩坣坥坤坯坣坵坭坥坮坴坳坢坹坧坲坡坰坨坮坥坵坲坡坬坮坥坴坷坯坲坫坳圮坉坮 2019 International Conference on Document Analysis and Recognition (ICDAR) 圬坰坡坧坥坳圱圲圲坻圱圲圷圮坉坅坅坅圮

17 坔坡坫坡坳坨坩坓坡坩坴坯坨圬坍坩坣坨坩坹坯坳坨坩坔坡坣坨坩坫坡坷坡圬坡坮坤坔坯坳坨坩坦坵坭坩坙坡坭坡坡坩圮圱圹圹圳圮坄坯坣坵坭坥坮坴坩坭坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坡坮坤坴坥坸坴坡坲坥坡坯坲坤坥坲坩坮坧圮坉坮 Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR 93) 圬坰坡坧坥坳圳圲圳坻圳圲圹圮坉坅坅坅圮 坒坩坴坥坳坨坓坡坲坫坨坥坬坡坮坤坁坲坮坡坢坎坡坮坤坩圮圲地圱圹圮坄坥坴坥坲坭坩坮坩坳坴坩坣坲坯坵坴坩坮坧坢坥坴坷坥坥坮坬坡坹坯坵坴坡坢坳坴坲坡坣坴坩坯坮坳坦坯坲坭坵坬坴坩圭坳坣坡坬坥坣坬坡坳坳坩圌坣坡坴坩坯坮坯坦坶坩坳坵坡坬坬坹坲坩坣坨坤坯坣坵坭坥坮坴坳圮坉坮 28th International Joint Conference on Artificial Intelligence (IJCAI), 2019 圮 坓坥坢坡坳坴坩坡坮坓坣坨坲坥坩坢坥坲圬坓坴坥坦坡坮坁坧坮坥圬坉坶坯块坯坬坦圬坁坮坤坲坥坡坳坄坥坮坧坥坬圬坡坮坤坓坨坥坲坡坺坁坨坭坥坤圮圲地圱圷圮坄坥坥坰坤坥坳坲坴场坄坥坥坰坬坥坡坲坮坩坮坧坦坯坲坤坥坴坥坣坴坩坯坮坡坮坤坳坴坲坵坣坴坵坲坥坲坥坣坯坧坮坩坴坩坯坮坯坦坴坡坢坬坥坳坩坮坤坯坣坵坭坥坮坴坩坭坡坧坥坳圮坉坮 th IAPR International Conference on Document Analysis and Recognition (ICDAR) 圬坶坯坬坵坭坥地圱圬坰坡坧坥坳圱圱圶圲坻圱圱圶圷圮 坁坳坩坦坓坨坡坨坡坢圬坆坡坩坳坡坬坓坨坡坦坡坩坴圬坔坨坯坭坡坳坋坩坥坮坩坮坧坥坲圬坡坮坤坁坮坤坲坥坡坳坄坥坮坧坥坬圮圲地圱地圮坁坮坯坰坥坮坡坰坰坲坯坡坣坨坴坯坷坡坲坤坳坴坨坥坢坥坮坣坨坭坡坲坫坩坮坧坯坦坴坡坢坬坥坳坴坲坵坣坴坵坲坥坲坥坣坯坧坮坩坴坩坯坮坳坹坳坴坥坭坳圮坉坮 Proceedings of the 9th IAPR International Workshop on Document Analysis Systems 圬坄坁坓圧圱地圬坰坡坧坥圱圱圳坻圱圲地圬坎坥坷坙坯坲坫圬坎坙圬坕坓坁圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坩坮坧坍坡坣坨坩坮坥坲坹圮 坚坨坩坸坩坮坓坨坩坡坮坤坖坥坮坵均坯坶坩坮坤坡坲坡坪坵圮圲地地圴圮坌坩坮坥坳坥坰坡坲坡坴坩坯坮坦坯坲坣坯坭坰坬坥坸坤坯坣坵坭坥坮坴坩坭坡坧坥坳坵坳坩坮坧坦坵坺坺坹坲坵坮坬坥坮坧坴坨圮坉坮 First International Workshop on Document Image Analysis for Libraries, Proceedings. 圬坰坡坧坥坳圳地圶坻圳圱圲圮坉坅坅坅圮 坓坨坯坡坩坢坁坨坭坥坤坓坩坤坤坩坱坵坩圬坍坵坨坡坭坭坡坤坉坭坲坡坮坍坡坬坩坫圬坓坴坥坦坡坮坁坧坮坥圬坁坮坤坲坥坡坳坄坥坮坧坥坬圬坡坮坤坓坨坥坲坡坺坁坨坭坥坤圮圲地圱圸圮坄坥坣坮坴场坄坥坥坰坤坥坦坯坲坭坡坢坬坥坣坮坮坦坯坲坴坡坢坬坥坤坥坴坥坣坴坩坯坮圮 IEEE Access 圬圶场圷圴圱圵圱坻圷圴圱圶圱圮 坒坡坹坭坯坮坤块坓坭坩坴坨圮圲地地圹圮坈坹坢坲坩坤坰坡坧坥坬坡坹坯坵坴坡坮坡坬坹坳坩坳坶坩坡坴坡坢圭坳坴坯坰坤坥坴坥坣坴坩坯坮圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圲圴圱坻圲圴圵圮坉坅坅坅圮 坃坡坲坬坯坳坓坯坴坯坡坮坤坓坨坩坮坪坡坥坙坯坯圮圲地圱圹圮坖坩坳坵坡坬坤坥坴坥坣坴坩坯坮坷坩坴坨坣坯坮坴坥坸坴坦坯坲坤坯坣坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳圮坉坮 Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) 圬坰坡坧坥坳圳圴圶圲坻圳圴圶圸圬坈坯坮坧坋坯坮坧圬坃坨坩坮坡圬坎坯坶坥坭坢坥坲圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坡坴坩坯坮坡坬坌坩坮坧坵坩坳坴坩坣坳圮 坔坯坭坡坳坺坓坴坡坮坩坳圠坬坡坷坥坫圬坆坩坬坩坰均坲坡坬坩圓坮坳坫坩圬坁坮坮坡块坲圓坯坢坬坥坷坳坫坡圬坄坡坷坩坤坌坩坰坩圓坮坳坫坩圬坁坧坮坩坥坳坺坫坡坋坡坬坩坳坫坡圬坐坡坵坬坩坮坡坒坯坳坡坬坳坫坡圬坂坡坲坴坯坳坺坔坯坰坯坬坳坫坩圬坡坮坤坐坲坺坥坭坹坳圠坬坡坷坂坩坥坣坥坫圮圲地圲圱圮坋坬坥坩坳坴坥坲场坋坥坹坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坤坡坴坡坳坥坴坳坩坮坶坯坬坶坩坮坧坬坯坮坧坤坯坣坵坭坥坮坴坳坷坩坴坨坣坯坭坰坬坥坸坬坡坹坯坵坴坳圮 坊坯坮坡坴坨坡坮坓坴坲坡坹坡坮坤坓坴坡坣坥坹坓坶坥坴坬坩坣坨坮坡坹坡圮圲地圲地圮坐坲坯坪坥坣坴坤坥坥坰坦坯坲坭场坅坸坴坲坡坣坴坩坮坦坯坲坭坡坴坩坯坮坦坲坯坭坤坯坣坵坭坥坮坴坳圮 坄坯坮坓坹坬坷坥坳坴坥坲坡坮坤坓坨坡坲坡坤坓坥坴坨圮圱圹圹圵圮坁坴坲坡坩坮坡坢坬坥圬坳坩坮坧坬坥圭坰坡坳坳坡坬坧坯坲坩坴坨坭坦坯坲坣坯坬坵坭坮坳坥坧坭坥坮坴坡坴坩坯坮圮坉坮 Proceedings of 3rd International Conference on Document Analysis and Recognition 圬坶坯坬坵坭坥圲圬坰坡坧坥坳圶圱圵坻圶圱圸圮坉坅坅坅圮 坒坹坯坴坡坔坡坮坡坫坡圬坋坹坯坳坵坫坥坎坩坳坨坩坤坡圬坡坮坤坓坥坮坙坯坳坨坩坤坡圮圲地圲圱圮坖坩坳坵坡坬坭坲坣场坍坡坣坨坩坮坥坲坥坡坤坩坮坧坣坯坭坰坲坥坨坥坮坳坩坯坮坯坮坤坯坣坵坭坥坮坴坩坭坡坧坥坳圮 arxiv preprint arxiv: 圮 坃坨坲坩坳坔坥坮坳坭坥坹坥坲坡坮坤坔坯坮坹坍坡坲坴坩坮坥坺圮圲地圱圷圮坁坮坡坬坹坳坩坳坯坦坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坣坬坡坳坳坩圌坣坡坴坩坯坮圮坉坮 th IAPR International Conference on Document Analysis and Recognition (ICDAR) 圬坶坯坬坵坭坥圱圬坰坡坧坥坳圳圸圸坻圳圹圳圮坉坅坅坅圮 坁坳坨坩坳坨坖坡坳坷坡坮坩圬坎坯坡坭坓坨坡坺坥坥坲圬坎坩坫坩坐坡坲坭坡坲圬坊坡坫坯坢坕坳坺坫坯坲坥坩坴圬坌坬坩坯坮坊坯坮坥坳圬坁坩坤坡坮坎均坯坭坥坺圬圠坌坵坫坡坳坺坋坡坩坳坥坲圬坡坮坤坉坬坬坩坡坐坯坬坯坳坵坫坨坩坮圮圲地圱圷圮坁坴坴坥坮坴坩坯坮坩坳坡坬坬坹坯坵坮坥坥坤圮坉坮 Advances in neural information processing systems 圬坰坡坧坥坳圵圹圹圸坻圶地地圸圮 坍坡坴坨坥坵坳坐坡坬坨坡坲坥坳坖坩坡坮坡坡坮坤坄圓坡坲坩坯坁坵坧坵坳坴坯坂坯坲坧坥坳坏坬坩坶坥坩坲坡圮圲地圱圷圮坆坡坳坴坣坮坮圭坢坡坳坥坤坤坯坣坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳圮 2017 IEEE International Conference on Computer Vision Workshops (ICCVW) 圬坰坡坧坥坳圱圱圷圳坻圱圱圸地圮 坙坡坬坩坮块坡坮坧圬坒坯坢坥坲坴坈坡坲坡坬坩坣坫圬坡坮坤坉坨坳坩坮坔坐坨坩坬坬坩坰坳圮圲地地地圮坉坭坰坲坯坶坥坭坥坮坴坯坦坺坯坮坥坣坯坮坴坥坮坴坣坬坡坳坳坩圌坣坡坴坩坯坮坢坹坵坳坩坮坧坢坡坣坫坧坲坯坵坮坤坡坮坡坬坹坳坩坳圮坉坮 Fourth IAPR International Workshop on Document Analysis Systems.(DAS2000) 圮坃坩坴坥坳坥坥坲圮 坙坡坬坩坮块坡坮坧圬坉坨坳坩坮坔坐坨坩坬坬坩坰坳圬坡坮坤坒坯坢坥坲坴坍坈坡坲坡坬坩坣坫圮圲地地圲圮坔坡坢坬坥坤坥坴坥坣坴坩坯坮坶坩坡坰坲坯坢坡坢坩坬坩坴坹坯坰坴坩坭坩坺坡坴坩坯坮圮坉坮 International Workshop on Document Analysis Systems 圬坰坡坧坥坳圲圷圲坻圲圸圲圮坓坰坲坩坮坧坥坲圮 坚坨坩坲坵坯块坡坮坧圬坈坡坯坹坵坄坯坮坧圬坒坡坮坊坩坡圬坊坩坡坌坩圬坚坨坩坹坩坆坵圬坓坨坩坈坡坮圬坡坮坤坄坯坮坧坭坥坩坚坨坡坮坧圮圲地圲地坡圮坓坴坲坵坣坴坵坲坥圭坡坷坡坲坥坰坲坥圭坴坲坡坩坮坩坮坧坦坯坲坴坡坢坬坥坵坮坤坥坲坳坴坡坮坤坩坮坧坷坩坴坨坴坲坥坥圭坢坡坳坥坤坴坲坡坮坳坦坯坲坭坥坲坳圮 arxiv preprint arxiv: 圮

18 坚坩坬坯坮坧块坡坮坧圬坍坩坮坧坪坩坥坚坨坡坮圬坘坵坥坢坯坌坩坵圬坡坮坤坄坩坮坧坌坩坡坮坧圮圲地圲地坢圮坄坯坣坳坴坲坵坣坴场坁坭坵坬坴坩坭坯坤坡坬坭坥坴坨坯坤坴坯坥坸坴坲坡坣坴坨坩坥坲坡坲坣坨坹坳坴坲坵坣坴坵坲坥坩坮坤坯坣坵坭坥坮坴坦坯坲坧坥坮坥坲坡坬坦坯坲坭坵坮坤坥坲坳坴坡坮坤坩坮坧圮 arxiv preprint arxiv: 圮 坊坩坡坰坥坮坧块坡坮坧圬坃坨坯坮坧坹坵坌坩坵圬坌坩坡坮坷坥坮坊坩坮圬均坵坯坺坨坩坔坡坮坧圬坊坩坡坸坩坮坚坨坡坮坧圬坓坨坵坡坩坴坡坯坚坨坡坮坧圬坑坩坡坮坹坩坮坧块坡坮坧圬坙坡坱坩坡坮坧块坵圬坡坮坤坍坩坮坧坸坩坡坮坧坃坡坩圮圲地圲圱圮坔坯坷坡坲坤坳坲坯坢坵坳坴坶坩坳坵坡坬坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坩坮坲坥坡坬坷坯坲坬坤场坎坥坷坤坡坴坡坳坥坴坡坮坤坮坯坶坥坬坳坯坬坵坴坩坯坮圮坉坮 Proceedings of the AAAI Conference on Artificial Intelligence 圬坶坯坬坵坭坥圳圵圬坰坡坧坥坳圲圷圳圸坻圲圷圴圵圮 坙坡坬坩坮块坡坮坧坴圬坉坨坳坩坮坔坐坨坩坬坬坩坰坳坴圬坡坮坤坒坯坢坥坲坴坈坡坲坡坬坩坣坫圮圲地地圱圮坁坵坴坯坭坡坴坩坣坴坡坢坬坥坧坲坯坵坮坤坴坲坵坴坨坧坥坮坥坲坡坴坩坯坮坡坮坤坡坢坡坣坫坧坲坯坵坮坤圭坡坮坡坬坹坳坩坳圭坢坡坳坥坤坴坡坢坬坥坳坴坲坵坣坴坵坲坥坥坸坴坲坡坣坴坩坯坮坭坥坴坨坯坤圮坉坮 Proceedings of Sixth International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圵圲圸坻圵圳圲圮坉坅坅坅圮 坈坡坯块坥坩圬坍坩坣坨坥坡坬坂坡坥坣坨坬坥坲圬坆坯坵坡坤坓坬坩坭坡坮坥圬坡坮坤坒坯坬坦坉坮坧坯坬坤圮圲地圱圳圮坅坶坡坬坵坡坴坩坯坮坯坦坳坶坭圬坭坬坰坡坮坤坧坭坭坣坬坡坳坳坩圌坥坲坳坦坯坲坬坡坹坯坵坴坡坮坡坬坹坳坩坳坯坦坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坳圮坉坮 th International Conference on Document Analysis and Recognition 圬坰坡坧坥坳圱圲圲地坻圱圲圲圴圮坉坅坅坅圮 坍坥坮坧坸坩块坥坩圬坙坩坦坡坮坈坥圬坡坮坤坑坩坯坮坧坚坨坡坮坧圮圲地圲地圮坒坯坢坵坳坴坬坡坹坯坵坴圭坡坷坡坲坥坩坥坦坯坲坶坩坳坵坡坬坬坹坲坩坣坨坤坯坣坵坭坥坮坴坳坷坩坴坨坰坲坥圭坴坲坡坩坮坥坤坬坡坮坧坵坡坧坥坭坯坤坥坬坳圮坉坮 Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval 圬坰坡坧坥坳圲圳圶圷坻圲圳圷圶圮 坃坨坲坩坳坴坯坰坨块坩坣坫坡坮坤坆坲坡坮坫坐坵坰坰坥圮圲地圱圸圮坆坵坬坬坹坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳坦坯坲坰坡坧坥坳坥坧坭坥坮坴坡坴坩坯坮坯坦坨坩坳坴坯坲坩坣坡坬坤坯坣坵坭坥坮坴坩坭坡坧坥坳圮坉坮 th IAPR International Workshop on Document Analysis Systems (DAS) 圬坰坡坧坥坳圲圸圷坻圲圹圲圮坉坅坅坅圮 坋坷坡坮坙圮块坯坮坧圬坒坩坣坨坡坲坤均圮坃坡坳坥坹圬坡坮坤坆坲坩坥坤坲坩坣坨坍圮块坡坨坬圮 圱圹圸圲圮 坄坯坣坵坭坥坮坴坡坮坡坬坹坳坩坳坳坹坳坴坥坭圮 IBM journal of research and development 圬圲圶在圶圩场圶圴圷坻圶圵圶圮 坃坨坵坮坧圭坃坨坩坨块坵圬坃坨坩坥坮圭坈坳坩坮坧坃坨坯坵圬坡坮坤坆坵坃坨坡坮坧圮圲地地圸圮坁坭坡坣坨坩坮坥圭坬坥坡坲坮坩坮坧坡坰坰坲坯坡坣坨坦坯坲坡坮坡坬坹坺坩坮坧坤坯坣坵坭坥坮坴坬坡坹坯坵坴坳坴坲坵坣坴坵坲坥坳坷坩坴坨坴坷坯坲坥坡坤坩坮坧坯坲坤坥坲坳圮 Pattern recognition 圬圴圱在圱地圩场圳圲地地坻圳圲圱圳圮 坔坥圭坌坩坮块坵圬坃坨坥坮坧坌坩圬坍坩坮坧坹坡坮坧坚坨坡坮坧圬坔坡坯坃坨坥坮圬坓坰坵坲坴坨坩坁坭坢坡坈坯坭坢坡坩坡坨圬坡坮坤坍坩坣坨坡坥坬坂坥坮坤坥坲坳坫坹圮圲地圲圱圮坌坡坭坰坲坥坴场坌坡坹坯坵坴圭坡坷坡坲坥坭坵坬坴坩坭坯坤坡坬坰坲坥坴坲坡坩坮坩坮坧坦坯坲坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧圮 arxiv preprint arxiv: 圮 坙坩坘坩坡坯坡坮坤坈坯坮坧坙坡坮圮圲地地圳圮坔坥坸坴坲坥坧坩坯坮坥坸坴坲坡坣坴坩坯坮坩坮坡坤坯坣坵坭坥坮坴坩坭坡坧坥坢坡坳坥坤坯坮坴坨坥坤坥坬坡坵坮坡坹坴坥坳坳坥坬坬坡坴坩坯坮圮 Pattern Recognition 圬圳圶在圳圩场圷圹圹坻圸地圹圮 坙坩坨坥坮坧坘坵圬坍坩坮坧坨坡坯坌坩圬坌坥坩坃坵坩圬坓坨坡坯坨坡坮坈坵坡坮坧圬坆坵坲坵块坥坩圬坡坮坤坍坩坮坧坚坨坯坵圮圲地圲地圮坌坡坹坯坵坴坌坍场坐坲坥圭坴坲坡坩坮坩坮坧坯坦坴坥坸坴坡坮坤坬坡坹坯坵坴坦坯坲坤坯坣坵坭坥坮坴坩坭坡坧坥坵坮坤坥坲坳坴坡坮坤坩坮坧圮坉坮 Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining 圬坋坄坄圧圲地圬坰坡坧坥圱圱圹圲坻圱圲地地圬坎坥坷坙坯坲坫圬坎坙圬坕坓坁圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坩坮坧坍坡坣坨坩坮坥坲坹圮 坙坡坮坧坘坵圬坙坩坨坥坮坧坘坵圬坔坥坮坧坣坨坡坯坌坶圬坌坥坩坃坵坩圬坆坵坲坵块坥坩圬均坵坯坸坩坮块坡坮坧圬坙坩坪坵坡坮坌坵圬坄坩坮坥坩坆坬坯坲坥坮坣坩坯圬坃坨坡坚坨坡坮坧圬块坡坮坸坩坡坮坧坃坨坥圬坍坩坮坚坨坡坮坧圬坡坮坤坌坩坤坯坮坧坚坨坯坵圮圲地圲圱坡圮坌坡坹坯坵坴坌坍坶圲场坍坵坬坴坩圭坭坯坤坡坬坰坲坥圭坴坲坡坩坮坩坮坧坦坯坲坶坩坳坵坡坬坬坹圭坲坩坣坨坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧圮坉坮 Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) 圬坰坡坧坥坳圲圵圷圹坻圲圵圹圱圬坏坮坬坩坮坥圬坁坵坧坵坳坴圮坁坳坳坯坣坩坡坴坩坯坮坦坯坲坃坯坭坰坵坴坡坴坩坯坮坡坬坌坩坮坧坵坩坳坴坩坣坳圮 坙坩坨坥坮坧坘坵圬坔坥坮坧坣坨坡坯坌坶圬坌坥坩坃坵坩圬均坵坯坸坩坮块坡坮坧圬坙坩坪坵坡坮坌坵圬坄坩坮坥坩坆坬坯坲坥坮坣坩坯圬坃坨坡坚坨坡坮坧圬坡坮坤坆坵坲坵块坥坩圮圲地圲圱坢圮坌坡坹坯坵坴坘坌坍场坍坵坬坴坩坭坯坤坡坬坰坲坥圭坴坲坡坩坮坩坮坧坦坯坲坭坵坬坴坩坬坩坮坧坵坡坬坶坩坳坵坡坬坬坹圭坲坩坣坨坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧圮 坘坩坡坯坙坡坮坧圬坅坲坳坩坮坙坵坭坥坲圬坐坡坵坬坁坳坥坮坴坥圬坍坩坫坥坋坲坡坬坥坹圬坄坡坮坩坥坬坋坩坦坥坲圬坡坮坤坃圮坌坥坥均坩坬坥坳圮圲地圱圷坡圮坌坥坡坲坮坩坮坧坴坯坥坸坴坲坡坣坴坳坥坭坡坮坴坩坣坳坴坲坵坣坴坵坲坥坦坲坯坭坤坯坣坵坭坥坮坴坳坵坳坩坮坧坭坵坬坴坩坭坯坤坡坬坦坵坬坬坹坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫圮 坘坩坡坯坷坥坩坙坡坮坧圬坅坲坳坩坮坙坵坭坥坲圬坐坡坵坬坁坳坥坮坴坥圬坍坩坫坥坋坲坡坬坥坹圬坄坡坮坩坥坬坋坩坦坥坲圬坡坮坤坃圮坌坥坥均坩坬坥坳圮圲地圱圷坢圮坌坥坡坲坮坩坮坧坴坯坥坸坴坲坡坣坴坳坥坭坡坮坴坩坣坳坴坲坵坣坴坵坲坥坦坲坯坭坤坯坣坵坭坥坮坴坳坵坳坩坮坧坭坵坬坴坩坭坯坤坡坬坦坵坬坬坹坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坵坲坡坬坮坥坴坷坯坲坫坳圮 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 圬坰坡坧坥坳圴圳圴圲坻圴圳圵圱圮 坁坮坴坯坮坩坯坊坩坭坥坮坯坙坥坰坥坳圬坘坵坚坨坯坮坧圬坡坮坤坄坯坵坧坬坡坳坂坵坲坤坩坣坫圮 圲地圲圱圮 坉坣坤坡坲圲地圲圱坣坯坭坰坥坴坩坴坩坯坮坯坮坳坣坩坥坮坴坩圌坣 坬坩坴坥坲坡坴坵坲坥坰坡坲坳坩坮坧圮 块坥坮坷坥坮坙坵圬坎坩坮坧坌坵圬坘坩坡坮坢坩坡坯坑坩圬坐坩坮坧均坯坮坧圬坡坮坤坒坯坮坧坘坩坡坯圮圲地圲圱圮坐坩坣坫场坐坲坯坣坥坳坳坩坮坧坫坥坹坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坲坯坭坤坯坣坵坭坥坮坴坳坵坳坩坮坧坩坭坰坲坯坶坥坤坧坲坡坰坨坬坥坡坲坮坩坮坧圭坣坯坮坶坯坬坵坴坩坯坮坡坬坮坥坴坷坯坲坫坳圮坉坮 th International Conference on Pattern Recognition (ICPR) 圬坰坡坧坥坳圴圳圶圳坻圴圳圷地圮坉坅坅坅圮

19 坐坥坮坧坚坨坡坮坧圬坙坵坮坬坵坘坵圬坚坨坡坮坺坨坡坮坃坨坥坮坧圬坓坨坩坬坩坡坮坧坐坵圬坊坩坮坧坌坵圬坌坩坡坮坧坑坩坡坯圬坙坩坎坩坵圬坡坮坤坆坥坩块坵圮圲地圲地圮坔坲坩坥场坅坮坤圭坴坯圭坥坮坤坴坥坸坴坲坥坡坤坩坮坧坡坮坤坩坮坦坯坲坭坡坴坩坯坮坥坸坴坲坡坣坴坩坯坮坦坯坲坤坯坣坵坭坥坮坴坵坮坤坥坲坳坴坡坮坤坩坮坧圮坉坮 Proceedings of the 28th ACM International Conference on Multimedia 圬坰坡坧坥坳圱圴圱圳坻圱圴圲圲圮 坘坵坚坨坯坮坧圬坅坬坡坨坥坨坓坨坡圌坥坩坂坡坶坡坮坩圬坡坮坤坁坮坴坯坮坩坯坊坩坭坥坮坯坙坥坰坥坳圮圲地圱圹坡圮坉坭坡坧坥圭坢坡坳坥坤坴坡坢坬坥坲坥坣坯坧坮坩坴坩坯坮场坤坡坴坡圬坭坯坤坥坬圬坡坮坤坥坶坡坬坵坡坴坩坯坮圮 arxiv preprint arxiv: 圮 坘坵坚坨坯坮坧圬坊坩坡坮坢坩坮坔坡坮坧圬坡坮坤坁坮坴坯坮坩坯坊坩坭坥坮坯坙坥坰坥坳圮圲地圱圹坢圮坐坵坢坬坡坹坮坥坴场坬坡坲坧坥坳坴坤坡坴坡坳坥坴坥坶坥坲坦坯坲坤坯坣圭坵坭坥坮坴坬坡坹坯坵坴坡坮坡坬坹坳坩坳圮坉坮 2019 International Conference on Document Analysis and Recognition (ICDAR) 圬坰坡坧坥坳圱地圱圵坻圱地圲圲圮坉坅坅坅圬坓坥坰圮

第四章 102 图 4唱16 基于图像渲染的理论基础 三张拍摄图像以及它们投影到球面上生成的球面图像 拼图的圆心是相同的 而拼图是由球面图像上的弧线图像组成的 因此我 们称之为同心球拼图 如图 4唱18 所示 这些拼图中半径最大的是圆 Ck 最小的是圆 C0 设圆 Ck 的半径为 r 虚拟相机水平视域为 θ 有 r R sin θ 2 4畅11 由此可见 构造同心球拼图的过程实际上就是对投影图像中的弧线图像

More information

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作 * 夏传玲 : 本文简要回顾了国内外定性研究在最近 多年的发展概况, 总结 了定性研究的六个发展趋势和分析策略上的三种流派 在上述两种背景下, 本文探讨了计算机辅助的定性分析给定性研究带来的机遇和挑战, 特别是它和手工操作对比时的优势和劣势, 以及应用这种定性分析技术所可能面临的困难 : 定性研究定性分析 文化差异,, (, ),,,, ( - ) ( - ) ( - ) ( - ) ( - ) (

More information

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位 自然科学版 文章编号 视网膜图像中视盘的快速自动定位方法 赵晓芳 林土胜 李碧 摘 要 基于眼底视网膜血管的分布结构及视盘本身的特点 提出一种快速自动定位视盘的方法 首先根据视网膜血管的网络分布结构大致定位视盘的垂直坐标 然后根据视盘 的亮度信息及视盘与血管的关系来定位视盘的水平坐标 最后把视盘限定在以粗定位的视盘为中心的一个小窗口内 用 变换精确定位视盘中心 该方法不需要事先分割视网膜血管 也不需要对算法进行训练

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

,,,,,,, ;,, ;, ;, (, / ),, ;,,.,,,,,,,,,,,,,,,,, ;,,,,,,, 1, :,,, ;,,,, (, ),,,,, 1,,, (,, )

,,,,,,, ;,, ;, ;, (, / ),, ;,,.,,,,,,,,,,,,,,,,, ;,,,,,,, 1, :,,, ;,,,, (, ),,,,, 1,,, (,, ) 刘世定 内容提要 : 本文在嵌入性视角的引导下, 进入关系合同理论领域 对关系合同的 分析, 以威廉姆森的合同治理结构理论作为基点 在分析了他的理论脉络和隐含假 设后, 本文提出了三个假定, 即约前关系导入 多元关系属性 对关系属性的有限控 制 在新的假设下, 首先讨论了合同治理结构和嵌入关系结构之间不同的对应关系, 并特别探讨了两者间的结构性摩擦 继而, 在关系合同的研究中引入了委托 - 代理关系,

More information

附3

附3 普 通 高 等 学 校 本 科 专 业 设 置 申 请 表 ( 备 案 专 业 适 用 ) 080910T 3-6 2 016 7 6 4884878 目 录 填 表 说 明 ⒈ ⒉ ⒊ ⒋ ⒌ 1. 普 通 高 等 学 校 增 设 本 科 专 业 基 本 情 况 表 080910T 3-6 1978 36 ( 1978) ( 2008) 2017 60 120 / S J ⒉ 学 校 基 本 情

More information

卷 首 语 首 新 春 致 辞 骏 马 奔 腾, 紫 冬 迎 春 值 此 新 春 佳 节 来 临 之 际, 我 们 党 政 领 导 班 子 全 体 成 员 向 研 究 所 全 体 职 工 研 究 生 离 退 休 同 志 和 支 持 自 动 化 所 改 革 创 新 发 展 的 各 界 同 仁 致 以 诚 挚 的 问 候 和 美 好 的 祝 愿! 一 年 来, 研 究 所 稳 步 推 进 一 三 五 规

More information

第一章

第一章 6.1 1. N-gram 2. 3. 4. 60 6.2 4.114.13 4.124.14 Rong Jin[7] TF*IDF - SARS SARS SARS SARS 61 62 [1] Michele Banko, Vibhu O. Mittal, and Michael J. Witbrock. 2000. Headline Generation Based on Statistical

More information

圲 坃坏坎坔坅坎坔坓 圲圮圴圮圱 坅坵坬坥坲方法圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴圱 圲圮圴圮圲 龙格坼库塔方法圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴圲 圲圮圴圮圳 两点边值问题圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴

圲 坃坏坎坔坅坎坔坓 圲圮圴圮圱 坅坵坬坥坲方法圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴圱 圲圮圴圮圲 龙格坼库塔方法圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴圲 圲圮圴圮圳 两点边值问题圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圴 Contents 0 绪论 7 1 计算机数和误差 11 圱圮圱 计算机数及其表示 圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圱圱 圱圮圲 舍入误差对计算的影响圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圱圲 圱圮圳 减法的计算 圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮 圱圳 2 物理学中的常用数值方法 15 圲圮圱 数值积分方法圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮圮

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

2013 年 7 月 总 第 235 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 节 令 是 一 种 命 令 毕 淑 敏 1 聚 焦 CASIA 自 动 化 所 召 开 庆 祝 建 党 92 周

2013 年 7 月 总 第 235 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 节 令 是 一 种 命 令 毕 淑 敏 1 聚 焦 CASIA 自 动 化 所 召 开 庆 祝 建 党 92 周 卷 首 语 首 节 令 是 一 种 命 令 文 / 毕 淑 敏 夏 初, 买 菜 老 人 对 我 说, 买 我 的 吧 看 他 的 菜 摊, 好 似 堆 积 着 银 粉 色 的 乒 乓 球 我 说, 这 么 小 啊, 还 青, 远 没 有 冬 天 时 我 吃 的 西 红 柿 好 老 人 不 悦 地 说, 冬 天 的 西 红 柿 算 什 么 西 红 柿! 吃 它 们 哪 里 是 吃 菜, 分 明 是

More information

MAXQ BA ( ) / 20

MAXQ BA ( ) / 20 MAXQ BA11011028 2016 6 7 () 2016 6 7 1 / 20 1 2 3 4 () 2016 6 7 2 / 20 RoboCup 2D 11 11 100ms/ 1: RoboCup 2D () 2016 6 7 3 / 20 2: () 2016 6 7 4 / 20 () 2016 6 7 5 / 20 Markov Decision Theory [Puterman,

More information

水晶分析师

水晶分析师 大数据时代的挑战 产品定位 体系架构 功能特点 大数据处理平台 行业大数据应用 IT 基础设施 数据源 Hadoop Yarn 终端 统一管理和监控中心(Deploy,Configure,monitor,Manage) Master Servers TRS CRYSTAL MPP Flat Files Applications&DBs ETL&DI Products 技术指标 1 TRS

More information

:, (.., ) ( ),,,,,,, (. ), ( ) (, ) ( ),, -,, (, ),,,,, ;,,, (, ),,,,,,,,, ( ),,,,,,,,, ;,,,,,,

:, (.., ) ( ),,,,,,, (. ), ( ) (, ) ( ),, -,, (, ),,,,, ;,,, (, ),,,,,,,,, ( ),,,,,,,,, ;,,,,,, * 郭于华 内容提要 : 从饮食这一看似平常却是最基本的生活空间入手, 观察与理解文化的 变迁是一个重要而深刻的视角 本文以对儿童食品与进食的调查分析, 探讨当前社 会代际之间文化传承的特点及变化 研究表明 :. 家庭中的三代人分别具有相对不同的关于食物的知识体系, 他们在选择食品和安排进食过程中所考虑的因素 依据的 标准和观念是不同的, 孩子比其父辈 祖辈带有更明显的现代消费主义特征 ;. 代际

More information

附件2

附件2 附 件 2 辽 宁 省 普 通 高 等 学 校 本 科 优 势 特 色 专 业 申 报 书 专 业 名 称 : 计 算 机 科 学 与 技 术 专 业 代 码 : 080901 推 荐 学 校 ( 公 章 ): 大 连 民 族 大 学 推 荐 学 校 代 码 : 12026 专 业 带 头 人 : 刘 勇 奎 联 系 电 话 ( 手 机 ): 15942808103 辽 宁 省 教 育 厅 制 2015

More information

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :, 3 1 Vol. 3. 1 2008 2 CAA I Transactions on Intelligent Systems Feb. 2008, (,210093) :.,; 3., 3. :; ; ; ; : TP391 :A :167324785 (2008) 0120001208 A system f or automatic generation of 3D building models

More information

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公 2013 年 度 上 海 高 校 市 级 精 品 课 程 申 报 表 ( 本 科 ) 学 校 名 称 东 华 大 学 课 程 名 称 计 算 机 系 统 与 网 络 技 术 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 所 属 二 级 学 科 名 称 课 程 负 责 人 申 报 日 期 工 科 计 算 机

More information

理 成 可 做 關 聯 分 析 的 格 式, 再 應 用 統 計 統 計 計 算 軟 體 R (R Core Team, 2013) 中 的 延 伸 套 件 arules (Hahsler, Gruen, and Hornik, 2005; Hahsler, Buchta, Gruen, and H

理 成 可 做 關 聯 分 析 的 格 式, 再 應 用 統 計 統 計 計 算 軟 體 R (R Core Team, 2013) 中 的 延 伸 套 件 arules (Hahsler, Gruen, and Hornik, 2005; Hahsler, Buchta, Gruen, and H 連 鎖 輕 食 店 之 產 品 關 聯 分 析 - 以 茗 人 為 例 Association Analysis of Deli Chain Example of MingZen 摘 要 所 謂 關 聯 分 析, 就 是 從 商 店 銷 售 交 易 資 料 庫 中, 找 出 項 目 之 間 的 關 聯 性, 並 探 勘 出 在 資 料 間 具 有 相 關 性 的 隱 藏 規 則 有 趣 的 是, 商

More information

第壹章

第壹章 資訊管理系 德州撲克之 智慧型喊注系統 指導教授 萬 絢 教授 組員名單 游子祥 蔡宗益 張宇祥 李姵嫺 978C019 978C043 978C089 978C101 中華民國101年5月 嶺 東 科 技 大 學 資 訊 管 理 系 德 州 撲 克 之 智 慧 型 喊 注 系 統 資訊管理系專題口試委員審定書 德州撲克之 智慧型喊注系統 指導教授 萬 絢 教授 組員名單 游子祥 978C019 蔡宗益

More information

2

2 自主设置目录外二级学科备案表 2012 11 6 中国地质大学 1 0 4 9 1 0 8 1 8 z 3 地学信息工程 Geosciences Information Engineering 0 8 1 8 地质资源与地质工程 学科概况简要描述 ( 主要包括学科内涵 研究内容 ) 1 2 该学科学术带头人和学术梯队简介 1945-10 19 11 15 8 1975-03 2002-06 7 7

More information

[1] [4] Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins)

[1] [4] Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins) 38 8 38th Annual Conference of CSQ & 8th NQMS MCP IE 120 1. [1] [4] 1 2 3 2. Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins)

More information

????????

???????? 深度学习 项目简介 葛丽丽 译 西蒙菲沙大学 教育学院 富有想像力的教育研究中心 电邮 ierg-ed@sfu.ca 网址: http://www.ierg.net 基本思想 开学的第一个星期 每个学生都会接到一个任意布置的主题 从此将围绕这个主题 进行深度学习 这些主题可能包括 鸟 苹果 马戏团 火车 和 太阳系 等内容 在接下来的小学 初中以及高中阶段 除了基本课程以外 学 生将继续深入地学习指定的题目

More information

标题

标题 第 19 卷 摇 第 4 期 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 模 式 识 别 与 人 工 智 能 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 Vol. 19 摇 No. 4 摇 006 年 8 月 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 PR & AI 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 Aug 摇 摇

More information

年第 期

年第 期 年第 期 论虚拟实践的哲学意蕴 孙伟平 信息技术 虚拟技术 实践 实践形态 虚拟实践 所谓虚拟实践 是指人们按照一定的目的 通过数字化中介系统在虚拟时空进行的 主体与虚拟客体双向对象化的感性活动 它是人们有目的 有意识进行的能动的探索和改造 虚拟客体 同时也提升和改造自身的客观活动 是人类在当代技术革命推动下兴起的一种新型的实践活动形态 具有与传统实践迥然不同的特征 虚拟实在性 即时交互性 自由开放性

More information

贾根良 马国旺 后凯恩斯经济学 多样性 共同基础 综合 后凯恩斯经济学是自 凯恩斯革命 以来 一直致力于完成 流产 的 凯恩斯革命 并以反新古典主流面目存在的一支异端经济学流派 它是对凯恩斯经济学范式的恢复和拓展 凯恩斯 卡莱茨基 斯拉法和老制度主义的思想构成了其理论渊源 该学术传统经历了三代的 传承演进 今天 后凯恩斯主义者在方法论 宏观经济学 微观定价理论和内部综合等方面已经 取得了重大进展 成为西方经济学中不可忽视的一个重要流派

More information

¹

¹ 复仇母题与中外叙事文学 杨经建 彭在钦 复仇是一种特殊的历史文化现象 也是以超常态的 极端性方式为特征的人类自然法则的体现 而在中外叙事文学中以 复仇 为取向的创作大致有三种母题形态 血亲复仇 痴心女子负心汉式复仇 第三类复仇 本文在对这三类复仇叙事模式进行艺术解析的前提下 发掘并阐释了蕴涵其中的不同民族的文化精神和价值指向 复仇母题 叙事文学 创作模式 文化蕴涵 ¹ º » ¼ ½ ¹

More information

<4D6963726F736F667420576F7264202D2041444C33A3BAD7D4C8BBD3EFD1D4B4A6C0EDD3EBBBFAC6F7D1A7CFB02076332030A3A8D3E0A3A92E646F63>

<4D6963726F736F667420576F7264202D2041444C33A3BAD7D4C8BBD3EFD1D4B4A6C0EDD3EBBBFAC6F7D1A7CFB02076332030A3A8D3E0A3A92E646F63> 中 国 计 算 机 学 会 学 科 前 沿 讲 习 班 The CCF Advanced Disciplines Lectures 第 31 期 主 题 自 然 语 言 处 理 与 机 器 学 习 理 论 方 法 与 应 用 2012 年 10 月 31 日 -11 月 2 日 北 京 随 着 计 算 机 网 络 和 移 动 通 讯 技 术 的 快 速 发 展 和 普 及, 面 向 网 络 文 本

More information

ChinaBI企业会员服务- BI企业

ChinaBI企业会员服务- BI企业 商业智能 (BI) 开源工具 Pentaho BisDemo 介绍及操作说明 联系人 : 杜号权苏州百咨信息技术有限公司电话 : 0512-62861389 手机 :18616571230 QQ:37971343 E-mail:du.haoquan@bizintelsolutions.com 权限控制管理 : 权限控制管理包括 : 浏览权限和数据权限 ( 权限部分两个角色 :ceo,usa; 两个用户

More information

JAIST Reposi Title WWW における関連リンク集の自動生成 Author(s) 田村, 雅樹 Citation Issue Date Type Thesis or Dissertation Text version author U

JAIST Reposi   Title WWW における関連リンク集の自動生成 Author(s) 田村, 雅樹 Citation Issue Date Type Thesis or Dissertation Text version author U JAIST Reposi https://dspace.j Title WWW における関連リンク集の自動生成 Author(s) 田村, 雅樹 Citation Issue Date 2006-03 Type Thesis or Dissertation Text version author URL http://hdl.handle.net/10119/1979 Rights Description

More information

中科院期刊分区数据 - 社会科学 版 序号期刊全称 ISSN 1 EXERCISE AND SPORT SCIENCES REVIEWS 2 ECONOMETRICA NETWORKS & SPATIAL ECONOMICS JOURNAL OF SPORTS

中科院期刊分区数据 - 社会科学 版 序号期刊全称 ISSN 1 EXERCISE AND SPORT SCIENCES REVIEWS 2 ECONOMETRICA NETWORKS & SPATIAL ECONOMICS JOURNAL OF SPORTS 中科院期刊分数据 - -2016 版 1 EXERCISE AND REVIEWS 2 ECONOMETRICA 3 4 5 6 7 8 9 NETWORKS & SPATIAL ECONOMICS S Studies in Science Education SOCIAL SCIENCE COMPUTER REVIEW SCIENCE AND ENGINEERING ETHICS STRENGTH

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 The BitCoin Scripting Language 交易实例 交易结构 "result": { "txid": "921a dd24", "hash": "921a dd24", "version": 1, "size": 226, "locktime": 0, "vin": [ ], "vout": [ ], "blockhash": "0000000000000000002c510d

More information

<4D6963726F736F667420576F7264202D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

<4D6963726F736F667420576F7264202D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378> 批 准 立 项 年 份 2007 通 过 验 收 年 份 2013 教 育 部 重 点 实 验 室 年 度 报 告 ( 2015 年 1 月 2015 年 12 月 ) 实 验 室 名 称 : 机 器 智 能 与 先 进 计 算 教 育 部 重 点 实 验 室 实 验 室 主 任 : 张 军 实 验 室 联 系 人 / 联 系 电 电 : 詹 志 辉 /13826089486 E-mail 地 址

More information

张成思 本文运用向量系统下的协整分析方法 针对 年不同生产和消 费阶段的上中下游价格的动态传导特征以及货币因素对不同价格的驱动机制进行分析 研究结果表明 我国上中下游价格存在长期均衡关系 并且上中游价格对下游价格具有显 著动态传递效应 而下游价格对中游价格以及中游价格对上游价格分别存在反向传导的 倒逼机制 另外 货币因素对上游价格的动态驱动效果最为显著 但并没有直接作用于下 游价格 因此 虽然货币政策的现时变化可能在一段时间内不会直接反映在下游居民消费价格的变化上

More information

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 第 1 页共 32 页 crm Mobile V1.0 for IOS 用户手册 一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 二 crm Mobile 界面介绍 : 第 3 页共 32 页 三 新建 (New) 功能使用说明 1 选择产品 第 4 页共 32 页 2 填写问题的简要描述和详细描述 第 5 页共

More information

FPGAs in Next Generation Wireless Networks WPChinese

FPGAs in Next Generation Wireless Networks WPChinese FPGA 2010 3 Lattice Semiconductor 5555 Northeast Moore Ct. Hillsboro, Oregon 97124 USA Telephone: (503) 268-8000 www.latticesemi.com 1 FPGAs in Next Generation Wireless Networks GSM GSM-EDGE 384kbps CDMA2000

More information

untitled

untitled 1. 95 年 度 2 老 2 老 8 10 11 理 4 2007.3.12 2. 更 Cisco 2960 switch 路 更 路 更 路 更 更 NIS 狀 料 兩 數 Visual Studio Standard.net 2005 老 2007.4.19 Panel talk 行 95 年 度 良 老 葉 羅 老 45 參 行 領 力 立 C 行 力 行 路 力 95 年 度 路 97 年

More information

2014年西南大学暑期培训班招生通知

2014年西南大学暑期培训班招生通知 第 四 届 全 国 脑 影 像 暑 期 工 作 坊 脑 科 学 与 类 脑 研 究 : 神 经 影 像 数 据 分 析 与 应 用 (2016 第 二 轮 通 知 ) 主 办 单 位 : 西 南 大 学 心 理 学 部 西 南 大 学 研 究 生 院 一 会 议 简 介 脑 科 学 与 类 脑 智 能 已 成 为 世 界 各 国 科 技 角 逐 的 热 点 我 国 即 将 启 动 的 脑 计 划 包

More information

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID 58 2016. 14 * LireSolr LireSolr CEDD Ajax CSpace LireSolr CEDD Abstract In order to offer better image support services it is necessary to extend the image retrieval function of our institutional repository.

More information

Microsoft Word - Preface_1_14.doc

Microsoft Word - Preface_1_14.doc 中 文 混 淆 字 集 應 用 於 別 字 偵 錯 模 板 自 動 產 生 Chinese Confusion Word Set for Automatic Generation of Spelling Error Detecting Template 陳 勇 志 Yong-Zhi Chen, 吳 世 弘 Shih-Hung Wu 朝 陽 科 技 大 學 資 訊 工 程 系 Department of

More information

! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $ %% " $ "--/

!  #   $ %   # #  $  #  #!  $ ! # # # #! &$! ( % !!! )$ %  (!!!! *$ ( %  (!!!! +$ %  #! $!, $ $ $ $ $ $ $, $ $ --. %/ % $ %%  $ --/ "##$ "% "##& " "##( )$ "##%! ) "##$ * "##( "##$ "##(!!!!!!!!! ! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $

More information

!!

!! 徐二明 陈 茵 以企业资源基础理论为基础 从企业吸收能力这一概念入手 剖析企业吸收能力与企业竞争优势的关系 研究组织管理机制对企业吸收能力构建和发展的影响 依据吸收能力经典文献对吸收能力的前因进行重新梳理和归类 对现有文献中各种思路有一定的整理和明示作用 通过研究两种吸收能力的 类影响因素 辨识出中国企业在吸收能力培养和发展方面的优势和弱势 通过实证方法全面衡量和验证潜在吸收能力与实际吸收能力两者之间以及两能力与企业竞争优势的关系

More information

Microsoft Word - 31空中大學校稿檔.doc

Microsoft Word - 31空中大學校稿檔.doc 高 雄 市 立 空 中 大 學 103 年 度 施 政 績 效 成 果 報 告 重 要 施 政 項 目 執 行 成 果 與 效 益 壹 教 學 研 究 及 訓 輔 一 推 動 教 務 行 政 ( 一 ) 積 極 招 生 拓 展 生 源, 持 續 推 動 終 身 學 習 與 繼 續 教 育 理 念, 致 力 成 為 實 用 取 向 的 幸 福 大 學 1. 訂 定 招 生 人 數 量 化 目 標, 定

More information

北 京 大 学

北 京 大 学 北 京 大 学 硕 士 研 究 生 培 养 方 案 ( 信 息 工 程 学 院 报 表 修 订 版 本 ) 一 级 学 科 名 称 专 业 名 称 计 算 机 科 学 与 技 术 计 算 机 应 用 技 术 专 业 代 码 081203 北 京 大 学 研 究 生 院 制 表 填 表 日 期 :2012 年 06 月 16 日 一 学 科 ( 专 业 ) 主 要 研 究 方 向 序 研 究 方 向

More information

东南大学硕士学位论文 LCD 显示中灰度控制机理的研究及电路实现姓名 : 曹志香申请学位级别 : 硕士专业 : 微电子学与固体电子学指导教师 : 孙大有 20040327 LCD 显示中灰度控制机理的研究及电路实现 作者 : 曹志香 学位授予单位 : 东南大学 相似文献 (1 条 ) 1.

More information

片 要求小王等同学对这些文物用两种不同的标准进行分类 说出分类标准和结果 其所考查的目标实则是呼应了一般学习能力中的 整理信息 的要求 即从图片材料 中提取历史信息 对所获材料进行归类 开卷的第三题以 古代少数民族问题 为材料主题 体现交往与融合在文明发展 历程中的地位与作用 以探究性学习为主线 集中考查学生在开展探究性活动中对文 献 实物 口传等不同种类史料 材料 的运用水平 包括对有关史实的再现

More information

山东省招生委员会

山东省招生委员会 附 件 2: 2012 年 度 山 东 大 学 精 品 课 程 申 报 表 课 程 名 称 课 程 负 责 人 所 属 院 系 网 站 建 设 与 设 计 连 莉 副 教 授 计 算 机 学 院 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 践 ( 验 ) 课 所 属 专 业 大 类 所 属 专 业 类 理 工 电 子 信 息 科 学 类 联 系 电 话 13256167020

More information

[1] Liu Hongwei,2013, Study on Comprehensive Evaluation of Iron and Steel Enterprises Production System s Basic Capacities, International Asia Confere

[1] Liu Hongwei,2013, Study on Comprehensive Evaluation of Iron and Steel Enterprises Production System s Basic Capacities, International Asia Confere 刘 洪 伟 工 业 工 程 系 副 教 授 CV 下 载 办 公 电 话 : 电 子 邮 箱 :hw_liu999@tju.edu.cn 研 究 方 向 : 精 益 生 产 与 精 益 管 理 理 论 及 应 用 ; 工 业 工 程 与 信 息 技 术 集 成 管 理 ; 系 统 可 靠 性 理 论 与 方 法 ; 医 院 管 理 理 论 及 应 用 教 育 与 工 作 经 历 时 间 单 位 专

More information

JOURNAL OF DISTANCE EDUCATION International View [1] ( ) ; (NITRD) (Basic R&D) (Cross-cutting R&D Foundations) ( ) ( 1) (1) ;(2) ;(3) ;(4) ;(5)

JOURNAL OF DISTANCE EDUCATION International View [1] ( ) ; (NITRD) (Basic R&D) (Cross-cutting R&D Foundations) ( ) ( 1) (1) ;(2) ;(3) ;(4) ;(5) 荨荨 ( 264000) [ ] (AI) 2016 10 (Educational Artificial Intelligence) [ ] ; ;EAI; ; ; ; ; [ ] G40-057 [ ] A [ ] 1672 0008(2017)01 0026 10 DOI10.15881/j.cnki.cn33-1304/g4.2017.01.003 (AI) (Subcommittee on

More information

欧洲研究 年第 期

欧洲研究 年第 期 论中欧伙伴关系中的不对称性与对称性 周 弘 在自然界和人类社会中都充满了不对称性和对称性的复杂关系 其中潜藏着挑战 也蕴涵着动力和机遇 这种现象同样存在于中欧关系之中 中欧关系中的不对称性表现在经济社会 政治制度和历史文化等三个主要方面 在这些不对称性中同时又包含着对称性 并孕育着发展中欧伙伴关系的机遇 中欧双方需要相互理解对方的 方式 寻求对称性与互补性 创造共赢局面 推动合作伙伴关系的继续发展

More information

胡 鑫 陈兴蜀 王海舟 刘 磊 利用基于协议分析和逆向工程的主动测量方法对 点播系统进行了研究 通过对 点播协议进行分析 获悉该协议的通信格式和语义信息 总结出了 点播系统的工作原理 在此基础上设计并实现了基于分布式网络爬虫的 点播系统主动测量平台 并对该平台获取的用户数据进行统计分析 获得了 点播系统部分用户行为特征 研究结果对 点播系统的监控及优化提供了研究方法 点播 协议分析 爬虫 主动测量

More information

,,, ( ) ( ), %, %,,,,,,,,,,,,,,,,,,, %,,,,,,,, :,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,, :., ( ),,,,,, :,, ( ),,

,,, ( ) ( ), %, %,,,,,,,,,,,,,,,,,,, %,,,,,,,, :,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,, :., ( ),,,,,, :,, ( ),, * ( ) 葛延风 内容提要 : 中国养老保障制度改革的方向是基金预筹积累的个人帐户制度 在向新制度的转轨过程中, 核心的问题是解决老职工的养老金来源 年以来的改 革没有解决这一问题, 以致于陷入困境 作者认为改革的思路是用国有资产存量偿 还对老职工的养老金负债, 在此基础上建立完全的个人帐户制度 医疗和失业保障 改革也应转换思路 医疗保障制度改革应打破城乡分割问题, 建立城乡一体化的保障体系 失业保障不能通过失业保险解决,

More information

Office Office Office Microsoft Word Office Office Azure Office One Drive 2 app 3 : [5] 3, :, [6]; [5], ; [8], [1], ICTCLAS(Institute of Computing Tech

Office Office Office Microsoft Word Office Office Azure Office One Drive 2 app 3 : [5] 3, :, [6]; [5], ; [8], [1], ICTCLAS(Institute of Computing Tech - OfficeCoder 1 2 3 4 1,2,3,4 xingjiarong@mail.sdu.edu.cn 1 xuchongyang@mail.sdu.edu.cn 2 sun.mc@outlook.com 3 luoyuanhang@mail.sdu.edu.cn 4 Abstract. Microsoft Word 2013 Word 2013 Office Keywords:,, HTML5,

More information

任春平 邹志利 在坡度为 的平面斜坡上进行了单向不规则波的沿岸流不稳定运动实验 观测到了沿 岸流的周期性波动 波动周期约为 利用最大熵方法和三角函数回归法求得这种波动的主 频率以及幅值 分析了波动幅值在垂直岸线方向的变化 结果表明该变化与沿岸流变化类似 即在 沿岸流最大值附近这种波动强度最大 为了分析波动的机理 利用线性沿岸流不稳定模型对模型实验结果进行了分析 求得了不稳定运动增长模式和波动周期 并与对应实测结果进行了比较

More information

不对称相互依存与合作型施压 # # ( # ( %

不对称相互依存与合作型施压 # # ( # ( % 世界政治 年第 期 不对称相互依存与 合作型施压 美国对华战略的策略调整 王 帆! 尽管中美两国间的相互依存度在加深 但保持不对称的相互依存 关系仍是美国对华政策的重点 在不对称相互依存的前提下 美国对中国开始实施了 一种新的合作型施压策略 该策略成为美国对华战略的手段之一 作者分析了在相互 依存条件下美国对华实施合作型施压政策的背景 目的 相关议题和实施手段 并以谷歌事件 哥本哈根气候谈判以及人民币汇率问题这三个案例

More information

本文通过对世界体育运动发展的历史与现实的研究 提出了体能文 化的概念 论述了体能文化的国际化和民族性及其对人类社会政治 经济 文化和社 会生活多方面的影响 文章指出 国际竞技体育运动是 世纪以来人类社会生活全 球化的先导 是当代世界各民族 各国家和平共处 平等参与 公平竞争机制实现程度最高的国际事务 是人类社会国际化进程中民族文化多样性实现整合的范例 是展望 新世纪人类社会文明范式的着眼点 同时提示了进行体育人类学研究的必要性和重

More information

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1 C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 月 3 日 1 1 INPUTOUTPUT 1 InputOutput 题目描述 用 cin 输入你的姓名 ( 没有空格 ) 和年龄 ( 整数 ), 并用 cout 输出 输入输出符合以下范例 输入 master 999 输出 I am master, 999 years old. 注意 "," 后面有一个空格,"." 结束,

More information

然 而 打 开 目 前 市 场 上 流 行 的 任 意 一 款 智 能 输 入 法, 上 面 提 到 的 词 都 会 被 轻 轻 松 松 的 输 出 来 ; 不 仅 如 此, 所 有 的 智 能 输 入 法 都 支 持 用 户 短 句 级 别 以 及 句 子 级 别 的 输 入 方 法, 并 且 能

然 而 打 开 目 前 市 场 上 流 行 的 任 意 一 款 智 能 输 入 法, 上 面 提 到 的 词 都 会 被 轻 轻 松 松 的 输 出 来 ; 不 仅 如 此, 所 有 的 智 能 输 入 法 都 支 持 用 户 短 句 级 别 以 及 句 子 级 别 的 输 入 方 法, 并 且 能 自 然 语 言 处 理 让 输 入 法 变 得 更 聪 明 王 砚 峰 贾 剑 峰 张 扬 1. 引 言 随 着 电 脑 的 普 及 和 互 联 网 的 发 展, 输 入 法 已 经 成 为 了 人 们 生 活 和 工 作 中 最 不 可 或 缺 的 工 具 软 件, 人 们 在 网 上 聊 天 中 的 对 话 交 流, 以 及 工 作 中 的 电 子 邮 件 和 文 档 报 告, 都 是 通 过

More information

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析 电子科学技术电子科学技术第 02 卷第 03 期 Electronic 2015 年 Science 5 月 & Technology Electronic Science & Technology Vol.02 No.03 May.2015 年 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 刘高军, 李丹, 程利伟, 钱程, 段然 ( 北方工业大学计算机学院, 北京,100144)

More information

! # %&! ##! # %

! # %&! ##! # % 综 述 本文研究了在卤化银光敏层的基础上构建多层 盘的原理 研制了将影像中的银转化为产生荧光产物的方法 从而在应用荧光读取信息时可极大地提高其信噪比 研究后作者得出结论 传统的卤化银照相术能在制造多层光盘 中得到应用 多层光盘 荧光读取! # %!!&!(&! #! # % ! # %&! ##! # % ! # % ! #! # %!!! # %&! # %! # % &! ( )

More information

中文模板

中文模板 软 件 学 报 doi: 10.13328/j.cnki.jos.004932 中 文 公 众 事 件 信 息 熵 计 算 方 法 靳 锐 +, 张 宏 莉, 张 玥, 王 星 ( 哈 尔 滨 工 业 大 学 计 算 机 科 学 与 技 术 学 院, 哈 尔 滨 150001) Calculation Method of Chinese Public Event Information Entropy

More information

交流活动

交流活动 信 息 科 学 技 术 学 院 简 报 School of Electronics Engineering and Computer Science 二 零 一 六 年 第 二 期 ( 总 第 102 期 ) 北 京 大 学 信 息 科 学 技 术 学 院 二 零 一 六 年 三 月 三 十 一 日 党 政 : 3 月 7 日, 北 京 大 学 校 长 助 理 教 育 基 金 会 秘 书 长 邓 娅

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

社会科学版 李雁南 从明治末期到大正年代 随着大日本帝国的建立 日本文学中形成了 东方主义 视角 拥有了一套用来表述其他亚洲国家的霸权话语体系 中国由于悠远的历史 广袤的国土 适度的距离成为大正年代日本作家普遍关注的 东方异国 的主体 他们用经典文本中的幻象取代中国的实体 在中国寻找神秘浪漫的异国情调 同时 中国作为日本的 东方 使日本作家自身的殖民者身份得以确认 中国因此成为日本帝国文化的有效参照系

More information

untitled

untitled 100084 E-mail: ahz@mail.tsinghua.edu.cn (Look Up Table, LUT) Adaboost 300 Adaboost TP391 Real Time Facial Expression Classification WANG Yubo, AI Haizhou, WU Bo, HUANG Chang Computer Science and Technology

More information

Cyberspace, D-world, E-learning: 1 Giving Libraries and Schools the Cu t t i n g 2 Ed g e L i b r a ry Association of the Republic of China Taiwan New

Cyberspace, D-world, E-learning: 1 Giving Libraries and Schools the Cu t t i n g 2 Ed g e L i b r a ry Association of the Republic of China Taiwan New 1 1 0 16 4 5 96 96 96 96 1 2 1 5 50 1 96 50 96 1 2 3 1 1,905 504 49 95 1 96 1 2 10 33 50 11 50 22 9 6 1 3 1 5 96 3 2 49 6 229 Cyberspace, D-world, E-learning: 1 Giving Libraries and Schools the Cu t t

More information

Natural Neural Networks

Natural Neural Networks 深度学习讨论班 黄雷 2016-11-29 内容大纲 1. 深度学习介绍 神经网络的历史 深度学习的应用 2. 多层感知机 (multi-layer perceptron machine) 前向神经网络 (feedforward neural network) 3. 卷积神经网络 (Convolution neural networks) 4. 递归神经网络 (Recursive neural networks)

More information

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子 北 京 服 装 学 院 精 品 课 程 建 设 立 项 申 报 表 课 程 名 称 管 理 信 息 系 统 所 属 部 门 商 学 院 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 所 属 二 级 学 科 名 称 课 程 负 责 人 管 理 科 学 与 工 程 管 理 信 息 系 统 蒋 效 宇 申 报 日

More information

<4D6963726F736F667420576F7264202D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA32303136C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D30343036C8B7B6A8B8E5>

<4D6963726F736F667420576F7264202D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA32303136C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D30343036C8B7B6A8B8E5> 上 海 科 技 大 学 信 息 科 学 与 技 术 学 院 年 度 博 士 资 格 考 试 实 施 细 则 一 总 则 本 细 则 由 上 海 科 技 大 学 信 息 科 学 与 技 术 学 院 ( 以 下 简 称 信 息 学 院 ) 教 学 指 导 委 员 会 讨 论 制 定, 适 用 于 信 息 学 院 2014 级 硕 士 研 究 生 的 年 度 博 士 资 格 考 试 信 息 学 院 2014

More information

¹ º» ¼ ¹ º» ¼

¹ º» ¼ ¹ º» ¼ 重构后冷战时期的跨大西洋关系 理想与现实 赵怀普 冷战时期以北约为支柱的大西洋联盟构成了美欧关系的基础 但由于双方权力的不对称 美欧联盟关系带有从属性质 冷战结束和欧盟崛起对传统的美欧关系格局带来了强烈冲击 重构后冷战时期的跨大西洋关系成为美欧双方的共同议程 美欧在跨大西洋关系重构问题上的互动和博弈表明 由于双方之间存在着利益和目标上的深刻分歧 短期内并不具备形成一种新的全面和机制化的大西洋伙伴关系的现实基础

More information

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 1948.08.28 1. 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 13808485157 研 究 方 向 数 据 处 理 近 三 年 来

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 1948.08.28 1. 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 13808485157 研 究 方 向 数 据 处 理 近 三 年 来 湖 南 省 普 通 高 等 学 校 省 级 精 品 课 程 复 核 申 报 表 学 校 名 称 : 课 程 名 称 : 课 程 负 责 人 : 立 项 时 间 : 国 防 科 技 大 学 概 率 论 与 数 理 统 计 吴 翊 2009 年 课 程 网 站 地 址 :jpkc2009.nudt.edu.cn/gllysltj jpkc.nudt.edu.cn/gltj 湖 南 省 教 育 厅 制 二

More information

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用 第 卷 第 期 年 月 交通运输工程学报 曹 源 唐 涛 徐田华 穆建成 为了确保列车运行控制系统设计和开发的正确性 比较了仿真 测试和形式化 种能够验证 系统设计正确性的方式 根据列车运行控制系统对安全的苛求性 提出了 个与系统安全相关的重要特性 即实时性 混成性 分布 并发 性 反应性 并分析了与这些特性相关的具体形式化方法 通 过对每种形式化方法的数学基础和应用范围的分析和归类 给出了各种方法的优势和不足

More information

附件1:

附件1: 信息工程学院电气信息技术实验教学中心 2015 北京市级实验教学示范中心申请书 - 附表 负责人 : 联系电话 : 电子邮箱 : 戴波 010-81292145 daibo@bipt.edu.cn 2015 年 12 月 25 日 1... 1 2...10 3...15 4...24 5...24 6...27 7...28 8...28 9...30 10...31 11...31 12 URT...33

More information

油 吶 喊, 還 常 常 得 趕 場 為 少 年 的 班 級 加 油 打 氣 沒 多 久, 我 就 觀 察 到 少 年 在 班 上 總 是 形 單 影 隻, 好 像 沒 什 麼 可 以 開 懷 對 談 的 同 學 這 時 的 孩 子, 正 值 十 七 歲 荷 爾 蒙 旺 盛 分 泌 的 年 紀, 凡

油 吶 喊, 還 常 常 得 趕 場 為 少 年 的 班 級 加 油 打 氣 沒 多 久, 我 就 觀 察 到 少 年 在 班 上 總 是 形 單 影 隻, 好 像 沒 什 麼 可 以 開 懷 對 談 的 同 學 這 時 的 孩 子, 正 值 十 七 歲 荷 爾 蒙 旺 盛 分 泌 的 年 紀, 凡 一 個 跳 級 資 優 生 的 眼 淚 跳 級 的 資 優 生, 總 是 頂 著 聰 明 的 光 環, 但 在 那 光 環 之 下, 孩 子 得 承 受 多 少 超 齡 的 心 理 壓 力, 面 對 多 少 想 像 不 到 的 難 堪 處 境 呢? 老 師, 我 想 留 級! 少 年 放 下 攪 動 咖 啡 的 小 湯 匙, 突 然 抬 起 頭 來 對 我 說 留 級? 為 什 麼? 要 留 到 哪

More information

附件1:

附件1: 增 列 硕 士 专 业 学 位 授 权 点 申 请 表 硕 士 专 业 学 位 类 别 ( 工 程 领 域 ): 工 程 硕 士 ( 计 算 机 技 术 ) 申 报 单 位 名 称 : 上 海 电 力 学 院 国 务 院 学 位 委 员 会 办 公 室 制 表 2016 年 6 月 26 日 填 目 录 一 申 请 增 列 硕 士 专 业 学 位 授 权 点 论 证 报 告... 1 1. 人 才

More information

第 期 房建成等 动态定位的强跟踪卡尔曼滤波研究

第 期 房建成等 动态定位的强跟踪卡尔曼滤波研究 第 卷第 期 年 月 东南大学学报 房建成万德钧吴秋平 东南大学仪器科学与工程系 南京 提出一种改进的强跟踪卡尔曼滤波算法 应用于 动态定位滤波中获得明显效果 首先采用描述机动载体运动的 当前 统计模型 建立了一种新的 动态定位扩展卡尔曼滤波模型及其自适应算法 然后 为了进一步提高滤波器的动态性能 改进了周东华等提出的强跟踪滤波器 大大提高了 动态定位扩展卡尔曼滤波器的跟踪能力 动态定位 卡尔曼滤波

More information

,,,,,,,,,, (,, - ), ( ),,, :, (, ),,,,, ; (, ),,,,,,, (, ), (, ) (, )?,,,, (,, ),,,,,, (, ;, ),,, ;,,,, ;, ;, 1,,,,, 2,,,,, :,,, ;,,,,, 1 2 : :, :, (

,,,,,,,,,, (,, - ), ( ),,, :, (, ),,,,, ; (, ),,,,,,, (, ), (, ) (, )?,,,, (,, ),,,,,, (, ;, ),,, ;,,,, ;, ;, 1,,,,, 2,,,,, :,,, ;,,,,, 1 2 : :, :, ( 对深圳原致丽玩具厂百余封书信的分析 谭 深 内容提要 : 本文归纳了打工妹们书信中的五个主要话题, 并通过这些话题分析了工厂打工妹的交往圈子的活动和功能, 她们工作流动的原因和策略, 她们与出生家庭 的关系, 她们的感情和婚姻, 她们对打工生活的评价 分析特别注重了性别的角度, 指出了打工妹们的处境 经历和态度形成中的性别原因,,,,, ( ), ( ) 1,,,,,,,,,,,,, :,, / ;,,

More information

石油与天然气地质 杨少春 信荃麟 断块油藏测井解释模型的建立 资料的处理及储层评价应始终考虑地质因素的影响 不同类型储层 不同沉积相带以及不同开发时期的测井响应 岩性 物性 韵律性 电性及含水率等均不相同 根据这些差异和特点 分别建立了孔隙度 渗透率和含油饱和度等参数的解释模型和计算模型 提高了解释精度 勘探和开发阶段测井资料的处理除应考虑岩性 沉积相带 注水后储层结构变化外 还应考虑断块的复杂性及断块之间的联系

More information

CH01.indd

CH01.indd 3D ios Android Windows 10 App Apple icloud Google Wi-Fi 4G 1 ( 3D ) 2 3 4 5 CPU / / 2 6 App UNIX OS X Windows Linux (ios Android Windows 8/8.1/10 BlackBerry OS) 7 ( ZigBee UWB) (IEEE 802.11/a/b/g/n/ad/ac

More information

Microsoft Word - 103-4 記錄附件

Microsoft Word - 103-4 記錄附件 國 立 虎 尾 技 大 103 年 度 第 4 次 教 務 會 議 記 錄 附 件 中 華 民 國 104 年 6 月 16 日 受 文 者 : 國 立 虎 尾 技 大 發 文 日 期 : 中 華 民 國 104 年 5 月 28 日 發 文 字 號 : 臺 教 技 ( 二 ) 字 第 1040058590 號 速 別 : 最 速 件 密 等 及 解 密 條 件 或 保 密 期 限 : 附 件 :

More information

(Pattern Recognition) 1 1. CCD

(Pattern Recognition) 1 1. CCD ********************************* ********************************* (Pattern Recognition) 1 1. CCD 2. 3. 4. 1 ABSTRACT KeywordsMachine Vision, Real Time Inspection, Image Processing The purpose of this

More information

44(1) (1) (4) (4) 63-88TSSCI Liu, W. Y., & Teele S. (2009). A study on the intelligence profile

44(1) (1) (4) (4) 63-88TSSCI Liu, W. Y., & Teele S. (2009). A study on the intelligence profile 03-8632639 E-mail weiyu@mail.ndhu.edu.tw //1997/8~2000/7 / 2008 8 () 1992 8 1. 2. 3. 4. Wei-Yu Liu 2001.8~2008.7 * SCI EI SSCI A&HCI A 2016 11(1) 1-11 Liu, W. Y. (2015). The Study of Writing Reflective

More information

: ( -. [ ~ ] ) [, ],,,, [ ] [ ] [ ],,, :,, [,, ], ;, ;,,,, ~ %,,. [ ],,( ) ; ( ),..

: ( -. [ ~ ] ) [, ],,,, [ ] [ ] [ ],,, :,, [,, ], ;, ;,,,, ~ %,,. [ ],,( ) ; ( ),.. .. * 面向虚拟视点图像绘制的深度图编码算法 1 朱波, 蒋刚毅 **, 张云,, 郁梅 (., ;., ) :,,,, ;,, ;,,,.,,, ~ % : ; ; :. : : - ( ) - -, - **,,, (.,,, ;..,,, ) :, -., -., -,.., -.,..,,, % %. : - ; ;, [, ], (, ), [, ] [, ],, [ ],,,, [ ]

More information

2014 年 11 月 总 第 251 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 赠 人 一 片 云 1 科 研 动 态 与 学 术 交 流 自 动 化 所 人 脸 识 别 技 术 在 首 届

2014 年 11 月 总 第 251 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 赠 人 一 片 云 1 科 研 动 态 与 学 术 交 流 自 动 化 所 人 脸 识 别 技 术 在 首 届 卷 首 语 首 赠 人 一 片 云 世 间 人 情 多 讲 究 赠 人 以 物, 而 物 尽 必 然 情 非 我 赠 人 以 云, 君 行 千 里, 抬 头 便 见 白 云, 还 怕 断 了 友 情 不 成? 人 间 冷 暖 是 人 最 在 乎 的, 人 与 人 的 交 往 也 往 往 就 在 这 冷 暖 二 字 上 你 赠 物 于 他 并 不 能 心 暖, 而 赠 他 一 份 真 情 可 能 就

More information

IT 36% Computer Science Teachers Association, CSTA K K-12 CSTA K-12 K-12 K-6 K6-9 K STEM STEM STEM

IT 36% Computer Science Teachers Association, CSTA K K-12 CSTA K-12 K-12 K-6 K6-9 K STEM STEM STEM 2017 4 357 GLOBAL EDUCATION Vol. 46 No4, 2017 K-12 2016 K-12 K-12 / 200062 / 200062 2015 8 2015 STEM STEM 1 Computer Science Association for Computing Machinery ACM Code Computer Science Teachers Association

More information

专 技 能 1. 精 通 Matlab/Simulink 平 台 下 的 海 洋 运 载 器 运 动 控 制 系 统 与 仿 真 建 模 设 计 ; 2. 精 通 51 单 片 机 AVR 单 片 机 Arduino 开 源 板 的 开 发 和 设 计 ; 3. 精 通 基 于 Arduino 板

专 技 能 1. 精 通 Matlab/Simulink 平 台 下 的 海 洋 运 载 器 运 动 控 制 系 统 与 仿 真 建 模 设 计 ; 2. 精 通 51 单 片 机 AVR 单 片 机 Arduino 开 源 板 的 开 发 和 设 计 ; 3. 精 通 基 于 Arduino 板 姓 名 董 早 鹏 性 别 男 出 生 年 月 1988 年 8 月 籍 贯 江 西 鹰 潭 基 本 情 况 政 治 面 貌 中 共 党 员 婚 姻 状 况 未 婚 最 高 学 历 工 学 博 士 外 语 水 平 英 语 六 级 联 系 方 式 电 话 :18945069498 E-mail:dongzaopeng@hrbeu.edu.cn 地 址 : 哈 尔 滨 市 南 岗 区 哈 尔 滨 工 程

More information

巨变 村落的终结 & ( ( ) (( & & + # ) # # # # + # #

巨变 村落的终结 & ( ( ) (( & & + # ) # # # # + # # 巨变 村落的终结 都市里的村庄研究 李培林 本文是中国发达地区村落终结过程的记录和分析 作者通过对广州市 城中村的调查发现 村落终结的艰难 并不仅仅在于生活的改善 也不仅仅是非农化和工业化的问题 甚至也不单纯是变更城乡分割的户籍制度问题 而在于它最终要伴随产权的重新界定和社会关系网络的重组 作者试图通过建立具有普遍解释力的村落终结类型 建构村落城市化整个链条的最后一环 以便能够在理论上复制中国改革开放以后村落非农化

More information

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3) 03-863-3531 E-mail jmwu@mail.ndhu.edu.tw /(1990/06-1994/06) (1988/06-1990/06) (1984/09-1988/06) / (1997/8-) (1996/08-1997/07) () 1996 8 Wu, Jiann-Ming ( SCI EI SSCI TSSCI EconLit A&HCI ) 1. Pei-Hsun Hsu

More information

flare

flare flare 解题报告 福州一中 卓亮 April 30, 2012 Contents 1 题意简述 3 2 命题思路 3 3 考查点 5 4 问题分析 6 5 数据生成方法 12 6 选手得分统计 12 7 后记 12 Appendices 16 A flare 完整题面 16 B Glossary of graph theory 17 C Usage of the program 17 圱 List

More information

Microsoft Word - 互联网物联网探索-讲习班.doc

Microsoft Word - 互联网物联网探索-讲习班.doc 中 国 计 算 机 学 会 学 科 前 沿 讲 习 班 The CCF Advanced Disciplines Lectures 第 51 期 互 联 网 与 物 联 网 的 新 探 索 2014 年 9 月 19-21 日 上 海 本 期 CCF 学 科 前 沿 讲 习 班 互 联 网 与 物 联 网 的 新 探 索 邀 请 到 了 互 联 网 和 物 联 网 领 域 重 量 级 的 专 家 学

More information

ognitiongedr) CDC JHU ACE2005 CDC ACE2005 IBM CDC ACE2005 CDC 1 ACE [35-8] CDC CDC [ ] NIST ACE2008 GEDR CDC 1 1 CDC John Smiths [

ognitiongedr) CDC JHU ACE2005 CDC ACE2005 IBM CDC ACE2005 CDC 1 ACE [35-8] CDC CDC [ ] NIST ACE2008 GEDR CDC 1 1 CDC John Smiths [ 29 1 2015 1 JOURNAL OFCHINESEINFORMATION PROCESSING Vol.29No.1 Jan.2015 1003-0077(2015)01-0057-10 (1. 215006) (2. 215006) (CrossDocumentCoreferenceCDC) CDC ACE2005 ACE CDC TP391 A ConstructionofInformationExtraction-orientatedChinese

More information

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前 东 北 大 学 中 荷 生 物 医 学 与 信 息 工 程 学 院 2016 年 度 生 物 医 学 与 信 息 工 程 论 坛 会 议 时 间 2016 年 6 月 8 日, 星 期 三,9:30 至 16:00 会 议 地 址 会 议 网 址 主 办 单 位 东 北 大 学 浑 南 校 区 沈 阳 市 浑 南 区 创 新 路 195 号 生 命 科 学 大 楼 B 座 619 报 告 厅 http://www.bmie.neu.edu.cn

More information

李鹏飞 从小说对社会风俗 时代环境 自然风物 服饰器物等社会生活内容的不同描写方式及其效果出发, 可以将中国 古代小说分成具体型 抽象型与半具体半抽象型三大类这一分类方法不再以小说的情节 人物 主题等基本要素作为 分类标准, 从而为考察古代小说的艺术特色与作家的思维特点提供了一个新的视角 中国古代小说 ; 具体型小说 ; 抽象型小说 ; 半具体半抽象型小说 李鹏飞, 北京大学中文系副教授, 文学博士,

More information

关于2007年硕士研究生培养方案修订几点要求的说明

关于2007年硕士研究生培养方案修订几点要求的说明 学 科 门 类 : 管 理 学 一 级 学 科 : 管 理 科 学 与 工 程 管 理 信 息 系 统 学 科 培 养 方 案 ( 二 级 学 科 代 码 :1201Z1) 一 学 科 概 况 管 理 信 息 系 统 是 一 个 集 管 理 科 学 信 息 技 术 和 行 为 科 学 等 多 学 科 交 叉 的 综 合 性 学 科 本 学 科 主 要 研 究 如 何 利 用 信 息 技 术 提 高

More information

財團法人張思恒文教基金會

財團法人張思恒文教基金會 資 訊 社 會 研 究 (12) 頁 213-240,2007 年 1 月 台 灣 數 位 內 容 產 業 專 業 人 才 培 訓 問 題 探 討 : 以 遊 戲 動 畫 產 業 為 例 洪 雅 玲 輔 仁 大 學 影 像 傳 播 學 系 jazzyl@ms32.hinet.net 摘 要 本 研 究 想 以 一 個 專 業 技 術 培 育 者 的 角 色, 從 學 界 的 培 訓 與 產 界 的

More information

春 雷 新 雨 看 潮 生 2015 年 计 算 机 系 大 众 创 业 万 众 创 新 校 友 论 坛 创 业 新 锐 奖 颁 奖 孙 茂 松 为 罗 建 北 老 师 颁 发 创 业 伯 乐 奖 杨 士 强 为 本 科 生 超 新 星 工 作 室 颁 发 未 来 创 新 之 星 奖 杨 士 强 为

春 雷 新 雨 看 潮 生 2015 年 计 算 机 系 大 众 创 业 万 众 创 新 校 友 论 坛 创 业 新 锐 奖 颁 奖 孙 茂 松 为 罗 建 北 老 师 颁 发 创 业 伯 乐 奖 杨 士 强 为 本 科 生 超 新 星 工 作 室 颁 发 未 来 创 新 之 星 奖 杨 士 强 为 清 华 大 学 计 算 机 科 学 与 技 术 系 Department of Computer Science and Technology,Tsinghua University 系 友 通 讯 ALUMNI EXPRESS 系 讯 简 报 春 雷 新 雨 看 潮 生 2015 年 计 算 机 系 大 众 创 业 万 众 创 新 校 友 论 坛 举 行 我 系 为 80 岁 老 教 师 举 行

More information

P(x,y) P(x-1,y) P(x,y-1) P(x,y+1) P(x+1,y) 1 3.2 Sobel LaplacePrewittRoberts Sobel [2] Sobel 3.3 2 [6] 0 1 1: P(x,y) t (4-connectivity) 2: P(x,y) t 3:

P(x,y) P(x-1,y) P(x,y-1) P(x,y+1) P(x+1,y) 1 3.2 Sobel LaplacePrewittRoberts Sobel [2] Sobel 3.3 2 [6] 0 1 1: P(x,y) t (4-connectivity) 2: P(x,y) t 3: chdong@npic.edu.tw rola@mail.stu.edu.tw (ITS) (LPR) ITS 2. [1][8] [3][9][12] [9] frequency table Sobel [3][12] RGB HSB color model [11] Hough transformation Sobel [4] [10] 1. Intelligent Transportation

More information

电 信 领 域 排 名 前 20 名 占 15 席 1 IEEE Communications Surveys And Tutorials 874 6.311 3 IEEE Communications Magazine 6016 3.785 4 IEEE Journal On Selected A

电 信 领 域 排 名 前 20 名 占 15 席 1 IEEE Communications Surveys And Tutorials 874 6.311 3 IEEE Communications Magazine 6016 3.785 4 IEEE Journal On Selected A IEL Newsletter 2012 年 12 月 特 刊 : IEEE 期 刊 的 影 响 因 子 在 各 学 科 领 域 的 排 名 情 况 欢 迎 体 验 全 新 的 IEEE Xplore 数 字 图 书 馆 www.ieee.org/ieeexplore IEEE 成 立 于 1884 年, 是 全 球 最 大 的 技 术 行 业 协 会, 凭 借 其 多 样 化 的 出 版 物 会 议

More information