Personal Branding Roadmap Template

Similar documents
L L

"!""#!"#$!"""!""$ %&# #$(!""%!""& ) *+#,$ -.# % /&01!""(!" " &#(& ) 203,+," #$4,$ #5, %&# #$(!""%!""( #$!""# $ $!"#

安徽电子工程学校

目 录 专 稿 季 烨 文 革 之 初 北 京 师 大 二 附 中 的 红 色 暴 力 姜 培 良 之 死 与 仇 恨 教 育 评 论 唐 燕 关 于 北 京 女 十 中 教 师 孙 迪 之 死 给 王 友 琴 纠 错 校 史 王 逸 伦 编 辑 合 肥 市 第 六 中 学 校 史 关 于 文 革

腰部酸痛保健法

$$% % $ (%) % %$ $ ( *+,)(-)-./0-1//0- %) %) % - $%2)33%0 $ % ((3./. 3/3 )3 / % (()33(1 % (()3(/ %89856%:;< % (()3 0()0 3 (. <<=330(<</ 3 3. ()

1.加入党组织主要经过哪些程序?

!"# $%& %!"# $%& %!"#$%& %! ( )***%% ) $)! +**+),,* -)+.* )( ) +, +*.*)+..**! )$,*)+$))$!"!#

大侠素材铺

材 料 目 录 1. 党 员 发 展 及 转 正 流 程 图 2. 申 请 入 党 人 员 基 本 信 息 及 培 养 记 录 表 3. 思 想 汇 报 传 阅 及 意 见 反 馈 表 4. 入 党 积 极 分 子 培 养 考 察 表 5. 政 治 审 查 函 调 信 模 板 6. 政 治 审 查

土 木 与 交 通 学 院 发 展 学 生 党 员 的 选 拨 条 件 与 推 荐 细 则 为 进 一 步 规 范 我 院 学 生 党 建 工 作, 加 强 和 完 善 我 院 对 学 生 党 员 各 个 阶 段 人 员 的 选 拔 和 培 养 工 作, 提 高 我 院 发 展 学 生 党 员 质

重 庆 市 万 州 区 人 民 政 府 公 报 卷 首 语 开 启 加 快 建 设 重 庆 第 二 大 城 市 新 征 程 1 万 州 区 委 区 政 府 文 件 传 达 政 令 宣 传 政 策 指 导 工 作 服 务 全 区 中 共 重 庆 市 万 州 区 委 重 庆 市 万 州 区 人 民 政

编译原理与技术

《米开朗琪罗传》


2


《杜甫集》

山东建筑大学学分制管理规定(试行)


2013年度西藏自治区教育厅

實用文格式大全.doc

个 小 小 的 乡 下 人 木 匠 的 儿 子, 竟 然 有 这 么 大 的 力 量 其 实 就 是 这 点, 祂 活 出 来 的 那 种 爱, 是 世 界 上 没 有 的 祂 活 出 来 的 爱 是 世 界 上 的 人 都 需 要 的, 但 却 是 人 人 在 这 个 世 界 上 都 得 不 到

薛 秦 高 继 宁 宋 明 锁 文 洪 梁 瑞 敏 贾 跃 进 内 蒙 古 自 治 区 (3 人 ) 琪 格 其 图 米 子 良 赵 震 生 辽 宁 省 (8 人 ) 田 素 琴 白 凤 鸣 肖 瑞 崇 黄 恩 申 白 长 川 杨 世 勇 李 敬 林 王 秀 云 吉 林 省 (5 人 ) 赵 继 福

電機工程系認可證照清單 /7/1

来 正 式 组 织 关 系 转 出 后 未 收 到 组 织 关 系 介 绍 信 回 执 的 党 员 排 查 的 主 要 任 务 是, 核 查 党 员 身 份 信 息, 摸 清 流 动 党 员 底 数, 理 顺 党 员 组 织 关 系, 健 全 完 善 党 员 档 案, 对 与 党 组 织 失 去 联

设 备 的 依 赖 程 度 低 的 产 业 劳 动 密 集 型 产 业 主 要 指 农 业 林 业 及 纺 织 服 装 玩 具 皮 革 家 具 等 制 造 业,B 项 说 法 错 误 ; C. 技 术 密 集 型 产 业 微 电 子 工 业 现 代 制 药 业,C 项 说 法 正 确 ; D. 资

生命科学学院 学年度学风建设实施方案

PowerPoint 演示文稿


避孕篇


cumcm0110.PDF

第二章

邻居啊 第二天 对门却悄无声息了 莫非昨夜的吵闹 仅是个幻觉 夜幕拉下时 寒风又吱溜溜地叫个不停 老婆 睡下后 我这只夜猫子 继续兴致勃勃地跟着福尔 摩斯去探案 白天的喧嚣退去了 周围格外安静 正 是读书的好时候 突然 响起了钟摆声 哒 哒 哒 节奏匀称 不疾不徐 声响却愈来愈大 格外突兀 了 原来

<4D F736F F D BAC520CAD7B6BCCAA6B7B6B4F3D1A C4EAD7A8D2B5BCBCCAF5D6B0CEF1C6C0C6B8B9A4D7F7D2E2BCFB2E646F63>

其 他 方 面 也 可 以 采 用 同 样 的 方 式, 这 样 又 可 以 锻 炼 除 语 文 方 面 的 其 他 能 力 了 而 英 语 方 面, 我 认 为 配 合 英 语 专 业 举 办 英 语 演 讲 比 赛 就 很 不 错 这 样 开 展 一 系 列 的 创 新 活 动, 锻 炼 多 方

第 六 条 办 法 第 五 条 ( 三 ) 协 会 考 评, 考 评 指 考 核 评 价 第 七 条 办 法 第 六 条 职 业 操 守 包 括 的 内 容 : 个 人 诚 信 不 做 假 账 不 偷 漏 税 不 贪 污 盗 窃 等 第 八 条 企 业 财 务 管 理 人 才 评 价 实 行 五 星

<4D F736F F D A67EABD7A4BAB3A1B1B1A8EEA8EEABD7A6DBA6E6B5FBA6F4AD70B5652E646F63>

统计工作情况汇报

他 随 身 带 有 二 三 十 张 古 方, 白 天 卖 药, 夜 晚 将 药 材 精 细 研 末, 按 方 配 制 对 于 病 人 服 药 后 反 应, 特 别 留 心 发 现 问 题, 就 近 向 老 医 生 老 药 贩 虚 心 求 教, 千 方 百 提 高 药 效 同 时 对 于 春 夏 秋

目 录 第 一 章 地 方 陪 同 导 游 人 员 服 务 程 序...1 第 一 节 地 方 陪 同 导 游 人 员 的 概 念 与 职 责...1 第 二 节 服 务 准 备...2 一 熟 悉 接 待 计 划...2 二 落 实 接 待 事 宜...5 三 物 质 和 知 识 的 准 备...

走 吧, 到 三 峡 去 : 那 里 是 我 们 先 人 用 生 命 之 血 打 造 的 家 园 走 吧, 到 三 峡 去 : 那 里 的 浪 涛 承 载 过 千 百 万 只 我 们 先 人 驶 向 今 天 的 航 船 走 吧, 到 三 峡 去 : 那 里 的 每 一 座 青 山 都 刻 满 了 我

6寸PDF生成工具

Microsoft Word - 送報伕2.doc

Microsoft Word - N011 斷翅天使

中 国 科 学 院 国 家 科 学 图 书 馆

申论写作套路万能模板

申 请 律 师 执 业 许 可 初 审 服 务 指 南 目 录 一 办 理 要 素 ( 一 ) 事 项 名 称 和 编 码 4 ( 二 ) 实 施 机 构 4 ( 三 ) 申 请 主 体 4 ( 四 ) 受 理 地 点 4 ( 五 ) 办 理 依 据 4 ( 六 ) 办 理 条 件 5 ( 七 )

( 地 ( ) 组 织 机 构 代 码 企 业 详 细 名 称 哈 密 地 伊 吾 新 疆 广 汇 新 能 源 有 限 公 司 玛 纳 斯 玛 纳 斯 祥 云 化 纤 有 限 公 司 玛 纳 斯 玛 纳 斯 澳 洋 科 技 有 限 责

申請機構基本資料

申請機構基本資料

环 境, 我 在 巩 固 在 校 期 间 所 学 习 的 理 论 知 识 的 同 时, 不 断 的 充 实 己, 利 用 业 余 时 间 主 动 学 习 专 业 知 识, 技 能, 把 理 论 联 系 到 工 作 实 践 中 作 为 一 名 工 作 生 活 中 的 党 员, 我 始 终 注 意 与

~2~

,,

untitled

图 文 聚 焦 国 培 计 划 (2013) 甘 肃 省 农 村 小 学 音 乐 骨 干 教 师 短 期 集 中 培 训 9 月 4 日 开 班 了, 学 员 老 师 们 从 甘 肃 省 各 个 县 市 州 汇 聚 湖 南 一 师, 开 始 了 为 期 14 天 的 培 训 学 习 : 鲜 明 的

Microsoft Word - 三方协议书与接收函的相关说明学生版.doc

附件1

要 及 时 为 入 党 积 极 分 子 确 定 两 名 培 养 联 系 人, 进 行 联 络 帮 助 要 定 期 ( 每 季 度 至 少 一 次 ) 听 取 培 养 联 系 人 的 思 想 和 工 作 情 况 汇 报, 及 时 完 成 入 党 积 极 分 子 登 记 表 ( 见 附 件 2) 的 填

宜 蘭 縣 104 學 年 度 復 興 國 中 校 本 資 優 教 育 方 案 -1 一 資 優 類 別 一 般 智 能 ( 國 小 ) 數 理 類 學 術 性 向 ( 國 中 ) 二 教 學 對 象 國 小 三 年 級 生, 四 年 級 生, 五 年 級 生, 六 年 級 生, 總 計 生 國 中

团 学 要 闻 我 校 召 开 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 3 月 17 日, 我 校 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 在 行 政 办 公 楼 五 楼 会 议 室 举 行, 校 团 委 委 员 各 院 ( 系 ) 团 委 书 记 校 学 生

欢迎辞

金 陵 饭 店 中 兴 华 已 报 备 按 照 国 资 委 要 求 定 期 轮 换 天 衡 已 报 备 按 照 国 资 委 要 求 定 期 轮 换 *ST 中 富 中 喜 已 报 备 业 务 约 定 书 到 期 普

辉 丰 股 份 重 大 事 项, 特 停 南 方 轴 承 临 时 停 牌 德 力 股 份 临 时 停 牌 瑞 丰 光 电 临 时 停 牌 联 建 光 电 临 时 停 牌 卡 奴 迪 路 临 时 停 牌

日 涨 幅 偏 离 值 达 到 7% 的 前 五 只 证 券 : 温 氏 股 份 ( 代 码 ) 涨 幅 偏 离 值 :11.68% 成 交 量 :1752 万 股 成 交 金 额 : 万 元 机 构 专 用 机 构 专 用

上市公司股东大会投票信息公告( )

股票代码: 股票简称:*ST新梅 编号:临

东 华 能 源 江 苏 苏 亚 金 诚 已 报 备 因 地 域 及 审 计 时 间 安 排 等 原 因 中 兴 华 已 报 备 客 户 重 新 选 聘 会 计 师 事 务 所 亿 帆 鑫 富 立 信 已 报 备 客

昆 明 机 床 瑞 华 已 报 备 前 任 服 务 年 限 较 长 毕 马 威 华 振 已 报 备 未 与 客 户 未 就 2015 年 审 计 收 费 达 成 一 致 意 见 中 国 核 电 天 健 已 报 备 定

金 利 科 技 临 时 停 牌 凤 凰 光 学 重 要 事 项 未 公 告, 连 续 停 牌 安 源 煤 业 重 要 事 项 未 公 告, 连 续 停 牌 万 泽 股 份 临 时 停 牌 爱 康 科 技 重 大 事 项, 特 停

光 一 科 技 重 大 事 项, 特 停 茂 业 商 业 重 要 事 项 未 公 告, 连 续 停 牌 浙 富 控 股 重 大 事 项, 特 停 键 桥 通 讯 重 大 事 项, 特 停 黑 牛 食 品 重 大 事 项, 特 停

郑 州 煤 电 重 要 事 项 未 公 告, 连 续 停 牌 金 圆 股 份 重 大 事 项, 特 停 永 鼎 股 份 重 要 事 项 未 公 告, 连 续 停 牌 长 城 影 视 临 时 停 牌 天 兴 仪 表 临 时 停 牌

卧 龙 地 产 重 要 事 项 未 公 告, 连 续 停 牌 春 兴 精 工 临 时 停 牌 *ST 沧 大 重 要 事 项 未 公 告, 连 续 停 牌 天 地 源 重 要 事 项 未 公 告, 连 续 停 牌 汇 冠 股 份

金 圆 股 份 重 大 事 项, 特 停 长 城 影 视 临 时 停 牌 天 兴 仪 表 临 时 停 牌 商 赢 环 球 重 要 事 项 未 公 告, 连 续 停 牌 荣 安 地 产 临 时 停 牌 中 南 文 化

Untitled Document

商 业 城 大 华 标 准 70 万 70 万 驰 宏 锌 锗 瑞 华 标 准 140 万 150 万 亚 星 锚 链 江 苏 公 证 天 业 标 准 80 万 80

untitled

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A83033A3A9D0CECABDD3EFD1D4D3EBD7D4B6AFBBFA2E707074>

<4D F736F F D A67EAF64BEC7BCFABEC7AAF7C2B2B3B95FA5FEB3A1AAA95F2D31312E31362E646F63>

得 依 法 召 集 股 東 臨 時 會 第 十 一 條 : 股 東 常 會 之 召 集 應 於 開 會 三 十 日 前, 股 東 臨 時 會 之 召 集 應 於 開 會 十 五 日 前, 將 開 會 日 期 地 點 及 召 集 事 由 通 知 各 股 東 並 公 告 之 第 十 二 條 : 本 公

同 時, 那 些 百 萬 富 翁 們 正 乘 坐 着 私 家 噴 射 機 駛 往 歐 洲, 甘 願 花 大 把 的 鈔 票 接 受 替 代 療 法 並 且 重 獲 了 健 康 替 代 療 法 總 是 很 靈 嗎? 不, 當 然 不 是 在 這 世 界 上 没 有 盡 善 盡 美 的 事 物 但 是

高校发展动态

杭师大党字〔2011〕15号中共杭州师范大学委员会关于进一步加强和改进发展党员工作的意见

<4D F736F F D B2C431A6B8A4A4A4DFA8C6B0C8B77CC4B3ACF6BFFD E646F63>

untitled

) & ( +,! (# ) +. + / & 6!!!.! (!,! (! & 7 6!. 8 / ! (! & 0 6! (9 & 2 7 6!! 3 : ; 5 7 6! ) % (. ()

市 立 永 平 高 中 無 填 報 無 填 報 (02) 市 立 樹 林 高 中 已 填 報 已 填 報 (02) 市 立 明 德 高 中 已 填 報 (02) 市 立 秀 峰 高 中 已 填 報

2. 禁 止 母 乳 代 用 品 之 促 銷 活 動, 以 及 不 得 以 贊 助 試 用 或 免 費 等 方 式, 取 得 奶 瓶 及 安 撫 奶 嘴 認 證 說 明 以 贊 助 試 用 或 免 費 等 方 式, 取 得 奶 瓶 及 安 撫 奶 嘴, 並 在 婦 產 科 門 診 兒 科 門 診 產

淡江大學種子課輔社台南服務隊

元 [ 所 ] IA27 ( D ) 下 列 何 項 情 況, 其 夫 妻 所 得 可 免 合 併 申 報? (A) 當 年 度 結 婚 (B) 當 年 度 離 婚 (C) 妻 58 歲, 夫 62 歲 無 所 得 受 其 子 扶 養 (D) 以 上 皆 是 [ 所 ]

<4D F736F F D20B1D0A87CB3A1C5E9A87CB870B8C9A755B1C0B0CABEC7AED5C5E9A87CB942B0CAB56FAE69B867B64FADECAB682E646F6378>

菩提道次第廣論

路 上 沒 說 話, 車 子 被 爸 離 去 後 開 走 了, 沒 什 麼 變, 除 了 一 股 淡 淡 的 香 味, 我 不 太 習 慣, 像 空 氣 中 的 粉 塵, 左 飄 右 飄, 光 中 飛 舞 我 沒 提, 看 車 窗 外, 外 面 不 太 有 趣, 我 只 是 沒 事 幹, 我 們 本

繁 華 國 小 101 學 年 母 親 節 感 恩 惜 福 - 跳 蚤 市 場 暨 科 學 闖 關 遊 戲 親 子 活 動 實 施 計 畫 一 依 據 : 本 校 101 學 年 度 校 務 計 畫 及 行 事 曆 二 目 的 : 1. 培 養 學 生 感 恩 惜 物 知 福 惜 福 的 節 儉 觀

台 中 市 北 屯 區 東 山 里 橫 坑 9 林 志 明 巷 89-5 菜 豆 菜 大 漿 果 菜 豆 菜 大 漿 果 小 漿 果 核 果 柑 桔 無 陳 錦 生 新 竹 市 香 山 區


育儿小故事(四)

2016 年 地 质 工 程 系 教 学 工 作 安 排 2016 学 年 我 系 将 在 总 结 过 去 工 作 的 基 础 上, 结 合 今 年 学 院 以 抓 质 量 强 内 涵 促 改 革 调 结 构 建 品 牌 细 管 理 重 过 程 为 宗 旨, 以 规 范 管 理 深 化 内 涵 为

<4D F736F F D203136BCADBBD8D2E4D3EBD1D0BEBF2E646F63>

Transcription:

文本数据管理与分析 正则表达式 -- 语言的形式化描述 邱锡鹏 复旦大学 http://nlp.fudan.edu.cn/xpqiu

需求 文本处理中的常见需求 匹配 * 天气 * 抽取 我要买明天从北京到上海的机票 数据验证 Email 的合法性 密码 替换 替换所有数字 如何描述规则! 2

语言 语言是在一个特定的字符集上, 通过一定的组合规则产生的字符序列的集合 有限字母表 ( 词表 ) 英文 英文字母 中文 汉字 不是任何字符串都符合语言规则 让一只猴子在打字机上随机地按键, 当按键时间达到无穷时, 几乎必然能够打出任何给定的文字, 比如莎士比亚的全套著作 -- 无限猴子定理 3

形式语言 文法分成四种类型 无限制文法 上下文相关文法 上下文无关文法 正规文法 Avram Noam Chomsky 1928 年 12 月 7 日 - 4

字符串的属性 字符串 (String) 是零个或多个字符组成的有限序列 E.g. tech 是长度为 4 的字符串 属性 长度 空字符串 ϵ 前缀 后缀 子串 子序列 5

字符串操作 - 拼接 如果 x 和 y 是字符串, 那么 x 和 y 的拼接 ( concatenation)xy 是将 y 附加在 x 的后面 x 为 ba,y 为 na, 则 xy 为 bana,xyy 为 banana 对于一个字符串和它自身的连接, 我们可以用指数运算来表示 x 2 = xx, x 3 = xxx, etc. x 0 = ε. xy 2 = banana. 6

字符串集合操作 字符串集合 ( 语言 ) 操作 并 拼接 闭包 (Closure) 7

字符串集合操作 并 L U M { s s is in L or in M} 拼接 LM {st s is in L and t is in M} Kleen 闭包 L * = {Є} U L U LL U LLL U LLLL U. 正则闭包 L + = L U LL U LLL U LLLL U. 8

例子 L = {A,B,.,Z,a,b,,z} D = {0,1,2,.,9} L D LD L4 = LLLL L * L(L D)* D 9

正则表达式 (Regular Expression) 正则表达式由字母表和算子组成, 可以表示字符串的集合和在这些集合上的运算 字母表 {0,1} ASCII 英文字母 汉字 运算 并 连接 闭包 https://zh.wikipedia.org/wiki/ 正则表达式 10

正则表达式的递归定义 ε 是正则表达式 代表 {ε} 如果 a 字母表 Σ 中的符号, 则 a 是正则表达式 代表 {a} 如果 r 和 s 是正则表达式, 则 r s 是正则表达式, 代表 L(r) U L(s) rs 是正则表达式, 代表 L(r)L(s) r* 是正则表达式, 代表 (L(r))* 11

优先级 * > 拼接 > 所有操作是左结合的 例子 a(b c)*d e 12

简写 如果 r 是正则表达式, 则 r+ 表示 r r* r? 表示 r Є. 表示 any chars a-z 表示 a 到 z 中的所有字母 13

例子 : 电话号码 (+86)-21-65642222 d=0-9 nation= +d 2 area = d 2 phone = d 8 phone_number = '(' nation')-' area'-' phone 14

例子 :Email anyone@fudan.edu anyone@fudan.edu.cn l=a-z a-z str = l + address = str '@' str '. str ('.' str)? 15

例子 : 无符号数 d=0-9 digits = d + opt_frac = '.' digits Є opt_exp (E('+' '-' Є) digits) Є num digits opt_frac opt_exp 16

题目 构造四个正则表达式用于验证 密码字符串, 依次满足如下要求 : 1. 只能由大小写字母 数字和横线 (-) 组成 ; 2. 满足条件 1, 并且开头和结尾不允许是横线 ; 3. 满足条件 2, 并且不允许有连续 ( 超过一个 ) 的横线 4. 满足条件 3, 并且不允许全部是数字 ; 17

如何实现? 有限状态自动机 Finite Automata {Q,, δ, q 0, F} Q 状态集合 输入符号集合 f 状态转移函数 Q x Q q 0, δ, 起始状态和终止状态 18

有限状态自动机 19

例子 20

例子 21

相互转换 正则表达式到自动机 自动机到正则表达式 22

正则表达式到自动机 For ε, For a, x ε y x a y 23

正则表达式到自动机 For s t, x ε ε N(s) N(t) ε ε y 24

正则表达式到自动机 For st, x N(s ) N(t) y 25

正则表达式到自动机 For s*, ε x ε N(s) ε y ε 26

例子 (a b)*abb 27

正则表达式引擎 正则表达式引擎分为两类 NFA ( Nondeterministic Finite Automata, 非确定型有穷状态自动机 ) DFA ( Deterministic Finite Automaton, 确定型有穷状态自动机 ) 在 Java 中, 使用 NFA 和 DFA 结合方法 28

正则表达式的特点 灵活性 逻辑性和功能性非常强 ; 可以迅速地用极简单的方式达到字符串的复杂控制 29

正则表达式的不足 可读性不高 当描述一个复杂的语言集合时, 正则表达式的可读性就变得很差 描述能力有限 比如对与语言集合 anban (n 为变量 ) 正则表达式并不能描述这个集合 正则表达式只适合匹配文本字面, 不适合匹配文本意义 ) 30

正则表达式的不足 容易引起性能问题 像.* 这种贪婪匹配符号很容易造成大量的回溯, 性能有时候会有上百万倍的下降, 编写好的正则表达式要对正则引擎执行方式有很清楚的理解才可以 正则的替换功能较差 31

自然语言的文法 32

程序语言的文法 33

上下文无关文法 上下文无关文法 终止符 terminals T 非终止符 non-terminals N 开始符号 S ( 非终止符 ) 产生式 productions r X N X ε, or X Y1 Y2... Yn where Yi N T 34

如何生成语言? 替换规则 X Y1... Yn 表示 X 可以被 Y1... Yn 替换 X ε 表示 X 可以被删除 生成语言 1. 由开始符号 S 开始 2. 替换其中的非终止符 X 3. 重复 (2), 直到字符串中全部为终止符 35

文法 G 对应的语言 文法 G 的语言为 : { a 1 a n S => a 1 a n } 其中,a i 为终止符 36

例子 : 算术表达式 E E E E + E ( E) id 37

例子 : 匹配的括号 { (i )i i 0} 文法 S (S) S ε 38

总结 正则表达式是文本处理中很重要的技术 几乎用在所有的文本处理系统 不足 需要一定的专家知识, 维护成本很高 不能处理自然语言的歧义现象 只能描述部分语言现象, 只能在单一 封闭的任务中使用 对于更难的任务, 需要使用更加复杂的方法 上下文无关文法 机器学习 ( 正则表达式也可以作为一种特征使用 ) 39

谢谢 40