第 3 章 数 据 在 计 算 机 中 的 表 示 43 在 进 位 计 数 制 中 有 数 码 数 位 ( 位 置 ) 基 数 和 位 权 等 用 语 数 码 是 在 一 个 计 数 制 中 用 来 表 示 数 值 的 符 号 ; 数 位 是 指 数 码 在 一 个 数 中 所 处 的 位 置 ;

Similar documents
目 录 1 正 文 乊 前 目 癿 本 文 内 容 声 明 字 符 编 码 相 兰 癿 背 景 知 识 拉 丁 字 母 什 么 是 字 符 编 码 字 符 编 码 标 准... 8

Microsoft Word - 最新正文.doc

第4章 信源及压缩编码

《计算机应用基础》学习材料(讲义)

Microsoft Word - fm.doc

03 最 新 計 算 機 概 論 3-1 文 字 表 示 法 (multimedia) (text) (image) (audio) (video) (text) (bit pattern) ASCII (American Standard Code for In

PT-18R PT-18R () PT-18R (CCC)

SuperMap 系列产品介绍

認 識 聲 音 的 原 理 人 們 靠 耳 朵 聽 到 外 在 聲 音 Jingo C. Liao 廖 正 宏 P 3 認 識 聲 音 的 原 理 聲 音 是 如 何 產 生 的? 聲 音 的 產 生 起 因 於 物 體 振 動 鼓 聲 由 鼓 面 振

LQ-2090CII/LQ-2090CIIN

LF 打印并走一行

Microsoft Word - ZPLII中文编程说明.doc

使用 Scene7 Media Portal

使用 Scene7 Media Portal

声 明 本 公 司 及 全 体 董 事 监 事 高 级 管 理 人 员 承 诺 不 存 在 虚 假 记 载 误 导 性 陈 述 或 重 大 遗 漏, 并 对 其 真 实 性 准 确 性 完 整 性 承 担 个 别 和 连 带 的 法 律 责 任 本 公 司 负 责 人 和 主 管 会 计 工 作 的

54 15 ipod/iphone/mp3/psp/pda

USSD DTMF 14,400 bits/s group3 class 1&2 GPRS for 900/1800/1900 AT 44pin - - 3V SIM SIM RS-232 : - AT (GSM and 07.05) ,20

1. ( B ) IT (A) (B) (C) (D) 2. ( A ) (A) (B) (C) (D) 3. ( B ) (A) GPS (B) GIS (C) ETC (D) CAI 4. ( D ) (A) (B) (C) (D) 5. ( B ) (Stored Program) (A) H

一、在PowerPoint中实现对象翻转

Nero 手册 <应用程序>

Users Manual NX-750

(Microsoft Word - \304\263\265{+\245\330\246\270.doc)

上海市教育考试院关于印发新修订的

<4D F736F F D20B1B1BEA9B1A9B7E7BFC6BCBCB9C9B7DDD3D0CFDEB9ABCBBECAD7B4CEB9ABBFAAB7A2D0D0B2A2D4DAB4B4D2B5B0E5C9CFCAD0D5D0B9C9CBB5C3F7CAE9A3A8C9EAB1A8B8E C4EA3132D4C23233C8D5B1A8CBCDA3A92E646F63>

<4D F736F F D20D5D0B9C9CBB5C3F7CAE95FB4FDCCE6BBBBB7E2C3E6BACDC7A9D7D6D2B35F636C65616E>

信息科技学业考试考纲.doc

第十一章 資料備份及復原(Backup and Restore)

untitled

前 言 版 权 2014 Vivitek Corporation. 是 Vivitek Corporation 的 商 标 其 他 商 标 是 其 各 自 所 有 者 的 资 产 值 重 量 和 尺 寸 等 均 为 近 似 值 规 格 如 有 变 更, 恕 不 另 行 通 知 免 责 声 明 本 文

T6000_end

Users Manual NX-500

untitled

卷首语

untitled

論故宮書畫的典藏、維護與數位化

2011/9/26 大 陸 港 澳 地 區 線 上 申 請 平 台 現 況 報 告 3 大 陸 港 澳 地 區 線 上 申 請 平 台 現 況 報 告 六 月 七 月 八 月 第 一 類 觀 光 1706 人 人 人 郵 輪 人 0 自 由 行 297

Microsoft Word doc

NC MCP MPG

SA054 Chinese user manual

SA29 Simplified Chinese user manual

WORD2000应用技巧大全(看完之后,保准你成为WORD高手) WORD2000应用技巧大全1

CH01.indd

四川省普通高等学校

百色人才网事业单位百色市中级人民法院2013年招聘人员工作公告招聘

title_PoD

ÿþ

Wireless Plus.book

“2010年全国职业院校技能大赛”高职组

SA1MXX Chinese user manual

PowerShot A640/A630

Microsoft Word - IP1說明書0811.doc

<img>

前 言 版 权 2012 Vivitek Corporation. 是 Vivitek Corporation 的 商 标 其 他 商 标 是 其 各 自 所 有 者 的 资 产 值 重 量 和 尺 寸 等 均 为 近 似 值 规 格 如 有 变 更, 恕 不 另 行 通 知 免 责 声 明 本 文

Ps22Pdf

untitled

版 本 :2014 年 3 月 DLP, DLP 标 志,DLP Link 和 Brilliant Color 为 Texas Instrument( 德 州 仪 器 公 司 ) 的 商 标 或 注 册 的 商 标 IBM 为 国 际 商 用 机 器 公 司 的 商 标 或 注 册 商 标 Appl

2007

主 題 四 : 都 卜 勒 效 應 一 都 卜 勒 效 應 1. 現 象 : 當 波 源 與 觀 察 者 連 線 間 有 相 對 運 動 時, 聽 者 所 接 收 到 的 頻 率 ( 視 頻 ) 將 與 波 源 之 原 頻 率 不 同, 此 現 象 稱 為 都 卜 勒 效 應 例 如 站 於 路 旁

MoStash_User_Guide_TW

C75CT09Y1

SCTWhiteBoard V1

r_09hr_practical_guide_kor.pdf

台南市立崇明國民中學九十五學年度第一學期第一次模擬考國文科試卷

设 计 竞 赛 内 容 和 评 分 标 准, 旨 在 引 导 职 业 学 校 电 子 商 务 计 算 机 市 场 营 销 等 相 关 专 业 的 教 学 改 革, 展 示 职 业 院 校 电 子 商 务 相 关 专 业 的 建 设 成 果, 推 动 电 子 商 务 职 业 教 育 的 发 展 和 创

untitled

OK dvp5990k_93_cs.indd :41:08

Program Guide(中文).PDF

OK dvp3266k_93_cs.indd :43:44

<4D F736F F D20C6F3D2B5CDF8D5BECFB5CDB3BCBCCAF5B9E6B7B6CAE9A3A8C6C0B9C0D3C3A3A92E646F63>

dvp3258_93_cs.indd :35:27

Microsoft Word 題目卷+解答+解析.doc

DSC-WX1

【早盘!在线聊天室免费 策略】时间窗口大限将至 惊天变盘或将开启

<4D F736F F D20A5C1B6A1B3E0C2A7B2DFAB55A4B6B2D02E646F63>

A.68 B.70 C.80 D.100 答 案 A 解 析 丁 产 品 的 可 变 现 净 值 =110-2=108( 万 元 ), 成 本 =100+40=140( 万 元 ), 可 变 现 净 值 低 于 成 本, 产 品 发 生 的 减 值, 所 以 丙 材 料 的 可 变 现 净 值 =1

<4D F736F F D B77CC4B3ACF6BFFD2DB0D3B77EC2B2B3F8C2BEBAD82E646F63>

钢铁金相图谱

Ch

DSC-T900

城关教区第一届powerpoint技能培训

关于要求审批《衢州市道路交通组织管理规划( )》的请示

<4D F736F F D20CDA8D3C3B9E6B7B6BABAD7D6B1ED5FB0B4B1E0C2EBC5C5C1D05F2E646F63>

untitled

CA-C750К

untitled

untitled

部 门 项 目 国 家 级 市 级 众 创 空 间 奖 励 政 策 支 持 类 大 渡 口 区 创 新 创 业 扶 持 办 法 ( 试 行 ) ( 大 渡 口 府 办 发 ) 第 三 条 众 创 空 间 项 目 培 育 奖 励 政 策 支 持 类 大 渡 口

72-P5986K-980B1

ebook37-4

<443A5C B75705CC4DAC8DD5CD2BBA1A2C6C0B9C0CEC4BCFE5C312EA1B6BDCCD3FDB2BFB0ECB9ABCCFCB9D8D3DAC8ABC3E6BFAAD5B9B8DFD6B0B8DFD7A8D4BAD0A3C8CBB2C5C5E0D1F8B9A4D7F7CBAEC6BDC6C0B9C0B5C4CDA8D6AAA1B7A3A8BDCCB8DFCCFC5B D3136BAC5A3A92E646F6

Microsoft Word - 新正文.doc

Windows Acrobat 4.0 Acrobat Acrobat 3.x Acrobat Reader 3.x - 75 MB Acrobat Acrobat 4.0 Acrobat Reader 4.0 Acrobat 4.0 Acrobat 3.x Acrobat

Microsoft Word - 04.doc

目 录 1. 硬 件 安 装 步 骤 云 端 加 密 键 盘 云 端 键 盘 加 密 串 接 器 软 件 安 装 步 骤 软 件 基 本 功 能 软 件 进 阶 使 用 说 明 选 单 说 明...

사용 설명서

2 A

(Microsoft Word - 5\276\302\270g\260\252\256v .doc)

Microsoft Word - ML1.doc

title_PoD

幻灯片 1

Transcription:

第 3 章 数 据 在 计 算 机 中 的 表 示 3.1 数 据 与 数 制 计 算 机 中 使 用 的 数 据 一 般 可 以 分 为 两 大 类 : 数 值 数 据 和 字 符 数 据 数 值 数 据 常 用 于 表 示 数 的 大 小 与 正 负 ; 字 符 数 据 则 用 于 表 示 非 数 值 的 信 息, 例 如 : 英 文 汉 字 图 形 和 语 音 等 数 据 数 据 在 计 算 机 中 是 以 电 子 器 件 的 物 理 状 态 ( 如 : 开 关 状 态 ) 来 表 示 的, 因 此, 各 种 数 据 在 计 算 机 中 都 是 用 二 进 制 编 码 的 形 式 来 表 示 3.1.1 数 据 及 其 分 类 1. 数 据 在 计 算 机 系 统 中, 各 种 字 母 数 字 符 号 的 组 合 语 音 图 形 图 像 等 统 称 为 数 据, 数 据 经 过 加 工 后 就 成 为 信 息 在 计 算 机 科 学 中, 数 据 是 指 所 有 能 输 入 到 计 算 机 并 被 计 算 机 程 序 处 理 的 符 号 的 总 称, 是 用 于 输 入 电 子 计 算 机 进 行 处 理, 具 有 一 定 意 义 的 数 字 字 母 符 号 和 模 拟 量 等 的 通 称 数 据 种 类 很 多 2. 数 据 分 类 (1) 按 性 质 分 数 据 按 性 质 可 分 为 :1 定 位 的, 如 各 种 坐 标 数 据 ;2 定 性 的, 如 表 示 事 物 属 性 的 数 据 ( 居 民 地 河 流 道 路 等 );3 定 量 的, 反 映 事 物 数 量 特 征 的 数 据, 如 长 度 面 积 体 积 等 几 何 量 或 重 量 速 度 等 物 理 量 ;4 定 时 的, 反 映 事 物 时 间 特 性 的 数 据, 如 年 月 日 时 分 秒 等 (2) 按 表 现 形 式 分 数 据 按 表 现 形 式 可 分 为 :1 数 字 数 据, 如 各 种 统 计 或 量 测 数 据 ;2 模 拟 数 据, 由 连 续 函 数 组 成, 是 指 在 某 个 区 间 连 续 变 化 的 物 理 量, 又 可 以 分 为 图 形 数 据 ( 如 点 线 面 ) 符 号 数 据 文 字 数 据 和 图 像 数 据 等, 如 声 音 的 大 小 和 温 度 的 变 化 等 (3) 按 记 录 方 式 分 数 据 按 记 录 方 式 可 分 为 : 地 图 表 格 影 像 磁 带 纸 带 按 数 字 化 方 式 分 为 矢 量 数 据 格 网 数 据 等 3.1.2 数 制 数 制 是 学 习 数 据 在 计 算 机 中 表 示 的 基 础, 不 掌 握 数 制 的 运 算 很 难 理 解 各 种 数 据 在 计 算 机 中 的 表 示 数 制 也 称 计 数 制, 是 指 用 一 组 固 定 的 符 号 和 统 一 的 规 则 来 表 示 数 值 的 方 法 按 进 位 的 方 法 进 行 计 数, 称 为 进 位 计 数 制 在 日 常 生 活 和 计 算 机 中 采 用 的 是 进 位 计 数 制 在 日 常 生 活 中, 人 们 最 常 用 的 是 十 进 位 计 数 制, 即 按 照 逢 十 进 一 的 原 则 进 行 计 数 的

第 3 章 数 据 在 计 算 机 中 的 表 示 43 在 进 位 计 数 制 中 有 数 码 数 位 ( 位 置 ) 基 数 和 位 权 等 用 语 数 码 是 在 一 个 计 数 制 中 用 来 表 示 数 值 的 符 号 ; 数 位 是 指 数 码 在 一 个 数 中 所 处 的 位 置 ; 基 数 是 指 在 某 种 进 位 计 数 制 中, 每 个 数 位 上 的 数 码 所 代 表 数 值 大 小 的 基 准 数 ; 位 权 是 基 数 位 置 的 幂 次, 表 示 数 码 在 不 同 位 置 上 所 代 表 的 数 值 例 如, 一 个 十 进 制 数 中 每 个 数 位 上 可 以 使 用 的 数 码 为 0 1 2 3 4 5 6 7 8 9 十 个 数 码, 基 数 为 十 基 数 为 十 的 进 位 计 数 制 按 逢 十 进 一 的 原 则 进 行 计 数 数 码 所 处 的 位 置 不 同, 代 表 数 值 的 大 小 也 不 一 样 例 如, 在 十 进 位 计 数 制 中, 小 数 点 左 边 第 一 位 为 个 位 数, 其 位 权 为 10 0, 第 二 位 为 十 位 数, 其 位 权 为 10 1, 第 三 位 是 百 位 数, 其 位 权 为 10 2, ; 小 数 点 右 边 第 一 位 是 十 分 位 数, 其 位 权 为 10 1, 第 二 位 是 百 分 位 数, 其 位 权 为 10 2, 第 三 位 是 千 分 位 数, 其 位 权 为 10 3, 十 进 数 的 7675 从 右 面 起 的 第 一 位 5 是 个 位, 第 二 位 7 是 十 位, 第 三 位 6 是 百 位, 第 四 位 是 7 千 位, 个 十 百 千 在 数 学 上 叫 做 位 权 或 权 每 一 位 上 的 数 码 与 该 位 位 权 的 乘 积 表 示 了 该 位 数 值 的 大 小 基 数 位 权 和 进 位 原 则 是 进 位 计 数 制 中 的 三 个 要 素 在 微 机 中, 常 用 的 是 十 进 制 二 进 制 八 进 制 和 十 六 进 制, 它 们 对 应 的 关 系 如 表 3 1 所 示 1. 十 进 制 数 表 3 1 十 进 制 二 进 制 八 进 制 十 六 进 制 的 对 应 关 系 十 进 制 二 进 制 八 进 制 十 六 进 制 0 0 0 0 1 1 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 A 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110 16 E 15 1111 17 F 十 进 位 计 数 制 简 称 十 进 制 十 进 制 数 具 有 下 列 特 点 : (1) 基 数 :10 (2) 数 码 :0 1 2 3 4 5 6 7 8 9 (3) 每 一 个 数 码 根 据 它 在 这 个 数 中 所 处 的 位 置 ( 数 位 ), 按 逢 十 进 一 来 决 定 其 实 际 数 值, 即 各 数 位 的 位 权 是 以 10 为 底 的 幂 次

44 大 学 计 算 机 基 础 面 向 计 算 思 维 例 如 (356.456) 10, 以 小 数 点 为 界, 从 小 数 点 往 左 依 次 为 个 位 十 位 百 位, 从 小 数 点 往 右 依 次 为 十 分 位 百 分 位 千 分 位 因 此, 小 数 点 左 边 第 一 位 6 代 表 数 值 6, 即 6 10 0, 第 二 位 5 代 表 数 值 50, 即 5 10 1 ; 第 三 位 3 代 表 数 值 300, 即 3 10 2 ; 小 数 点 右 边 第 一 位 4 代 表 数 值 0.4, 即 4 10 1 ; 第 二 位 5 代 表 数 值 0.05, 即 5 10 2 ; 第 三 位 6 代 表 数 值 0.006, 即 6 10 3 因 而 该 数 可 表 示 为 如 下 形 式 : (356.456) 10 =3 10 2 +5 10 1 +6 l0 0 +4 10 1 +5 10 2 +6 10 3 由 上 述 分 析 可 归 纳 出, 任 意 一 个 十 进 制 数 D, 可 表 示 成 如 下 形 式 : (D) 10 =D n 1 10 n 1 +D n 2 10 n 2 + +D 1 10 1 +D 0 10 0 +D 1 10 1 +D 2 10 2 + +D m 10 m 式 中 D i(i:n 1,n 2,,m 1) 为 数 位 上 的 数 码, 其 取 值 范 围 为 0~9;n 为 整 数 位 个 数, m 为 小 数 位 个 数,10 为 基 数,10 n 1,10 n 2,,10 1,10 0,10 1, l0 m 是 十 进 制 数 的 位 权 因 为 人 们 习 惯 使 用 十 进 制 数, 所 以 在 计 算 机 中, 一 般 用 十 进 制 数 作 为 数 据 的 输 入 和 输 出 2. 二 进 制 数 二 进 位 计 数 制 简 称 二 进 制 二 进 制 数 具 有 下 列 特 点 : (1) 基 数 :2 (2) 数 码 :0 1 (3) 每 个 数 码 根 据 它 在 这 个 数 中 的 数 位, 按 逢 二 进 一 来 决 定 其 实 际 数 值 例 如 :(11011.01) 2 =1 2 4 +1 2 3 +0 2 2 +1 2 1 +1 2 0 +1 2 1 +0 2 2 +1 2 3 =(27.625) 10 任 意 一 个 二 进 制 数 B, 可 以 表 示 成 如 下 形 式 : (B) 2 =B n 1 2 n 1 +B n 2 2 n 2 + +B 1 2 1 +B 0 2 0 +B 1 2 1 + +B m 2 m 式 中 B i 为 数 位 上 的 数 码, 其 取 值 范 围 为 0~1;n 为 整 数 位 个 数,m 为 小 数 位 个 数 2 为 基 数 2 n 1,2 n 2,,2 1,2 0,2 1,,2 m 是 二 进 制 数 的 位 权 计 算 机 中 数 的 存 储 和 运 算 都 使 用 二 进 制 数 3. 八 进 制 数 八 进 位 计 数 制 简 称 八 进 制 八 进 制 数 具 有 下 列 特 点 : (1) 基 数 :8 (2) 数 码 :0 1 2 3 4 5 6 7 (3) 每 个 数 码 根 据 它 在 这 个 数 中 的 数 位, 按 逢 八 进 一 来 决 定 其 实 际 的 数 值 例 如 :(432.24) 8 =4 8 2 +3 8 1 +2 8 0 +2 8 1 +4 8 2 =(282.3125) 10 任 意 一 个 八 进 制 数 Q, 可 以 表 示 成 如 下 形 式 : (Q) 8 =Q n 1 8 n 1 +Q n 2 8 n 2 + +Q 1 8 1 +Q 0 8 0 +Q 1 8 1 + +Q m+1 8 m+1 +Q m 8 m 式 中 Q i 为 数 位 上 的 数 码, 其 取 值 范 围 为 0~7;n 为 整 数 位 个 数,m 为 小 数 位 个 数 8 为 基 数,8 n 1,8 n 2,,8 1,8 0,8 1,,8 m 是 八 进 制 数 的 位 权 八 进 制 数 是 计 算 机 中 常 用 的 一 种 计 数 方 法, 它 可 以 弥 补 二 进 制 数 书 写 位 数 过 长 的 不 足 4. 十 六 进 制 数 十 六 进 位 计 数 制 简 称 为 十 六 进 制 十 六 进 制 数 具 有 下 列 特 点 : (1) 基 数 :16 (2) 数 码 :0 1 2 3 4 5 6 7 8 9 A B C D E F 由 于 数 字 只 有 0~9 十 个, 而 十 六 进 制 要 使 用 十 六 个 数 字, 而 每 位 上 只 能 有 一 个 数 码, 所 以 用 A~F 六 个 英 文 字 母 分 别 表 示 数 字 10~15

第 3 章 数 据 在 计 算 机 中 的 表 示 45 (3) 每 个 数 码 根 据 它 在 这 个 数 中 的 数 位, 按 逢 十 六 进 一 来 决 定 其 实 际 的 数 值 例 如 :(A3B.48) 16 =A 16 2 +3 16 1 +B 16 0 +4 16 1 +8 16 2 =(2619.28125) 10 任 意 一 个 十 六 进 制 数 H, 可 表 示 成 如 下 形 式 : (H) 16 =H n 1 16 n 1 +H n 2 16 n 2 + +H 1 16 1 +H 0 16 0 +H 1 16 1 + +H m 16 m 其 中 H i 为 数 位 上 的 数 码, 其 取 值 范 围 为 0~F;n 为 整 数 位 个 数,m 为 小 数 位 个 数 16 为 基 数,16 n 1,16 n 2,,16 1,16 0,16 1,,16 m 为 十 六 进 制 数 的 位 权 十 六 进 制 数 是 计 算 机 中 常 用 的 一 种 计 数 方 法, 它 可 以 弥 补 二 进 制 数 书 写 位 数 过 长 的 不 足 总 结 以 上 四 种 计 数 制, 可 将 它 们 的 特 点 概 括 为 : (1) 每 一 种 计 数 制 都 有 一 个 固 定 的 基 数 R(R 为 大 于 1 的 整 数 ), 它 的 每 一 数 位 可 取 R 个 不 同 的 数 码, 分 别 为 0~R 1; (2) 每 一 种 计 数 制 都 有 自 己 的 位 权, 并 且 遵 循 逢 R 进 一 的 原 则 对 于 任 一 个 R 进 位 计 数 制 数 S, 可 表 示 为 : (S) R = ± (S n 1 R n 1 +S n 2 R n 2 + +S 1 R 1 +S 0 R 0 +S 1 R 1 + +S m R m ) m = ± Si R i= n 1 i 式 中 S i 表 示 各 数 位 上 的 数 码, 其 取 值 范 围 为 0~R 1,R 为 计 数 制 的 基 数,i 为 数 位 的 编 号 ( 整 数 位 取 n 1~0, 小 数 位 取 1~ m) 另 外, 在 表 示 十 六 进 制 数 时, 在 数 码 后 加 H, 如 (A3B.48) 16, 可 写 成 A3B.48H 3.1.3 不 同 进 制 数 之 间 的 转 换 不 同 进 位 计 数 制 之 间 的 转 换, 实 质 是 基 数 间 的 转 换 一 般 转 换 的 原 则 是 : 如 果 两 个 有 理 数 相 等, 则 两 数 的 整 数 部 分 和 小 数 部 分 一 定 分 别 相 等 因 此, 各 数 制 之 间 进 行 转 换 时, 通 常 对 整 数 部 分 和 小 数 部 分 分 别 进 行 转 换 1. 非 十 进 制 数 转 换 成 十 进 制 数 非 十 进 制 数 转 换 成 十 进 制 数 的 方 法 是, 把 各 个 非 十 进 制 数 按 位 权 展 开 求 和 即 可 即 把 二 进 制 数 ( 或 八 进 制 数, 或 十 六 进 制 数 ) 写 成 2( 或 8 或 16) 的 各 次 幂 之 和 的 形 式, 然 后 计 算 其 结 果 例 3 1 把 下 列 二 进 制 数 转 换 成 十 进 制 数 (1110101) 2 =1 2 6 +1 2 5 +l 2 4 +0 2 3 +1 2 2 +0 2 1 +1 2 0 =64+32+16+0+4+0+1=(117) 10 (10101.101) 2 =1 2 4 +0 2 3 +1 2 2 +0 2 1 +1 2 0 +1 2 1 +0 2 2 +1 2 3 =16+0+4+0+1+0.5+0+0.125=(21.625) 10 例 3 2 把 下 列 八 进 制 数 转 换 成 十 进 制 数 (305) 8 =3 8 2 +0 8 1 +5 8 0 =192+5=(197) 10 (456.124) 8 =4 8 2 +5 8 1 +6 8 0 +1 8 1 +2 8 2 +4 8 3 =256+40+6+0.125+0.03125+0.0078125 =(302.1640625) 10 例 3 3 把 下 列 十 六 进 制 数 转 换 成 十 进 制 数 (2A4F) 16 =2 16 3 +A 16 2 +4 16 1 +F 16 0 =8192+2560+64+15=(10831) 10

46 大 学 计 算 机 基 础 面 向 计 算 思 维 (3B2F.A8) 16 =3 16 3 +B 16 2 +2 16 1 +F 16 0 +A 16 1 +8 16 2 =12288+2816+32+15+0.625+0.03125=(15151.65625) 10 2. 十 进 制 数 转 换 成 非 十 进 制 数 (1) 十 进 制 数 转 换 成 二 进 制 数 把 十 进 制 数 转 换 为 二 进 制 数 的 方 法 是 : 整 数 转 换 用 除 2 取 余 法 ; 小 数 转 换 用 乘 2 取 整 法 所 谓 除 2 取 余 法, 就 是 将 已 知 十 进 制 数 反 复 除 以 2, 若 每 次 相 除 之 后 余 数 为 1, 则 对 应 于 二 进 制 数 的 相 应 位 为 1; 余 数 为 0, 则 相 应 位 为 0 第 一 次 除 法 得 到 的 余 数 是 二 进 制 数 的 低 位, 最 后 一 次 余 数 是 二 进 制 数 的 高 位 从 低 位 到 高 位 逐 次 进 行, 直 到 商 为 0 最 后 一 次 除 法 所 得 的 余 数 为 K n 1, 则 K n 1 K n 2 K 1 K 0 即 为 所 求 的 二 进 制 数 例 如 : 将 (100) 10 转 换 成 二 进 制 整 数, 其 全 过 程 可 表 示 如 下 : 余 数 2 100 0 2 50 0 2 25 1 逆 2 12 0 排 2 6 0 列 2 3 1 2 1 1 0 (100) 10 =(K 6 K 5 K 4 K 3 K 2 K 1 K 0 ) 2 =(1100100) 2 十 进 制 纯 小 数 转 换 成 二 进 制 纯 小 数, 采 用 乘 2 取 整 法, 就 是 将 已 知 十 进 制 纯 小 数 反 复 乘 以 2, 每 次 乘 2 之 后, 所 得 新 的 整 数 部 分 为 1, 相 应 位 为 1, 如 果 整 数 部 分 为 0, 则 相 应 位 为 0 从 高 位 向 低 位 逐 次 进 行, 直 到 乘 2 取 整 后 的 小 数 部 分 为 0 或 满 足 精 度 要 求, 若 保 留 m 位 小 数, 对 m+1 位 小 数 进 行 0 舍 1 入 最 后 一 次 乘 2 所 得 的 整 数 部 分 为 K m 转 换 后, 所 得 的 纯 二 进 制 小 数 为 K 1 K 2 K m 例 如 : 将 (0.625) 10 转 换 成 纯 二 进 制 小 数, 转 换 过 程 如 下 : 0.625 整 数 2 正 1 1.250 整 数 部 分 =1,K 1 排 2 列 0 0.500 整 数 部 分 =0,K 2 2 1 1.000 整 数 部 分 =1,K 3 (0.625) 10 =(0.K 1 K 2 K 3 ) 2= (0.101) 2 再 如 : 将 (0.6531) 10 转 换 成 纯 二 进 制 小 数, 转 换 过 程 如 下 :

第 3 章 数 据 在 计 算 机 中 的 表 示 47 0.6531 整 数 2 1 1.3062 整 数 部 分 =1, K 1 2 0 0.6124 整 数 部 分 =0, K 2 2 正 1 1.2248 整 数 部 分 =1, K 3 排 2 列 0 0.4496 整 数 部 分 =0, K 4 2 0 0.8992 整 数 部 分 =0, K 5 2 1 1.7984 整 数 部 分 =1, K 6 2 1 1.5968 整 数 部 分 =1, K 7 2 1 1.1936 整 数 部 分 =1, K 8 2 0 0.3872 整 数 部 分 =0, K 9 如 只 取 八 位 小 数 能 满 足 精 度 要 求, 则 得 (0.6531) 10 =(0.K 1 K 2 K m ) 2 (0.K 1 K 2 K 3 K 4 K 5 K 6 K 7 K 8 ) =(0.10100111) 2 可 见, 十 进 制 纯 小 数 不 一 定 能 转 换 成 完 全 等 值 的 二 进 制 纯 小 数 遇 到 这 种 情 况 时, 根 据 精 度 要 求, 取 近 似 值 则 (100.6531) 10 (1100100.10100111) 2 (2) 十 进 制 数 转 换 成 八 进 制 数 十 进 制 数 转 换 成 八 进 制 数 的 方 法 是 : 整 数 部 分 转 换 采 用 除 8 取 余 法 ; 小 数 部 分 转 换 采 用 乘 8 取 整 法 (3) 十 进 制 数 转 换 成 十 六 进 制 数 将 十 进 制 数 转 换 成 十 六 进 制 数 的 方 法 是 : 整 数 部 分 转 换 采 用 除 16 取 余 法 ; 小 数 部 分 转 换 采 用 乘 16 取 整 法 3. 二 进 制 数 与 十 六 进 制 数 之 间 的 转 换 (1) 二 进 制 数 转 换 成 十 六 进 制 数 对 于 二 进 制 整 数, 只 要 自 右 到 左 将 每 四 位 二 进 制 数 分 为 一 组, 不 足 四 位 时, 在 左 面 添 0, 补 足 四 位 ; 对 于 二 进 制 小 数, 只 要 自 左 到 右 将 每 四 位 二 进 制 数 分 为 一 组, 不 足 四 位 时, 在 右 面 添 0, 补 足 四 位, 然 后 将 每 组 用 相 应 的 十 六 进 制 数 代 替, 即 可 完 成 转 换

48 大 学 计 算 机 基 础 面 向 计 算 思 维 例 如 : 把 (1011000001101.0100101) 2 转 换 成 十 六 进 制 数 (0001 0110 0000 1101. 0100 1010) 2 (1 6 0 D. 4 A) 16 则 (1011000001101.0100101) 2 =(160D.4A) 16 (2) 十 六 进 制 数 转 换 成 二 进 制 数 将 十 六 进 制 数 转 换 成 二 进 制 数, 只 要 将 每 一 位 十 六 进 制 数 用 四 位 相 应 的 二 进 制 数 表 示 即 可 完 成 转 换 例 如 : 将 (18A3.5E) 16 转 换 成 二 进 制 数 (1 8 A 3. 5 E) 16 (0001 1000 1010 0011. 0101 1110) 2 则 (18A3.5E) 16 =(1100010100011.0101111) 2 4. 二 进 制 数 与 八 进 制 数 之 间 的 转 换 (1) 二 进 制 数 转 换 成 八 进 制 数 对 于 二 进 制 整 数, 只 要 自 右 到 左 将 每 三 位 二 进 制 数 分 为 一 组, 不 足 三 位 时, 在 左 面 添 0, 补 足 三 位 ; 对 于 二 进 制 小 数, 只 要 自 左 到 右 将 每 三 位 二 进 制 数 分 为 一 组, 不 足 三 位 时, 在 右 面 添 0, 补 足 三 位, 然 后 将 每 组 用 相 应 的 八 进 制 数 代 替, 即 可 完 成 转 换 例 如 : 把 (101110111.0100101) 2 转 换 成 八 进 制 数 (101 110 111. 010 010 100) 2 (5 6 7. 2 2 4 ) 8 则 (101110111.0100101) 2 =(567.224) 8 (2) 八 进 制 数 转 换 成 二 进 制 数 将 八 进 制 数 转 换 成 二 进 制 数, 只 要 将 每 一 位 八 进 制 数 用 三 位 相 应 的 二 进 制 数 表 示 即 可 完 成 转 换 例 如 : 将 (1703.53) 8 转 换 成 二 进 制 数 (1 7 0 3. 5 3) 8 ( 001 111 000 011. 101 011) 2 则 (1703.53) 8 =(1111000011.101011) 2 3.2 数 值 在 计 算 机 中 的 表 示 3.2.1 数 值 编 码 1. 机 器 数 在 日 常 生 活 中 我 们 用 到 的 数 有 正 有 负, 在 计 算 机 中, 使 用 的 是 二 进 制 数, 只 有 0 和 1 两

第 3 章 数 据 在 计 算 机 中 的 表 示 49 种 值 那 么 在 计 算 机 中 如 何 表 示 正 负 数 呢? 把 + 号 也 用 0 和 1 表 示 (0 表 示 正 号,1 表 示 负 号 ) 放 在 存 储 器 的 最 高 位, 数 值 的 绝 对 值 放 在 除 符 号 位 以 外 的 部 分, 这 种 数 值 在 计 算 机 中 的 二 进 制 表 示 形 式, 称 为 机 器 数, 如 图 3 1 所 示 1 0 0 1 1 1 0 0 符 号 位 数 值 位 图 3 1 在 计 算 机 中 用 一 个 字 节 表 示 一 个 数 示 意 图 机 器 数 也 有 不 同 的 表 示 法, 常 用 的 有 3 种 : 原 码 补 码 和 反 码 2. 真 值 机 器 数 所 对 应 的 原 来 的 数 值 称 为 该 机 器 数 的 真 值 如 机 器 数 10011100 的 真 值 为 28 ( 0011100) 在 数 的 表 示 中, 机 器 数 与 真 值 的 区 别 是 : 真 值 带 符 号 如 0011100( 28), 真 值 在 机 器 中 的 表 示 形 式 为 机 器 数 10011100 例 如 : 真 值 数 为 +0111001(+57), 其 对 应 的 机 器 数 为 00111001, 其 中 最 高 位 为 0, 表 示 该 数 为 正 数 3. 原 码 反 码 和 补 码 机 器 数 中, 数 值 和 符 号 全 部 数 字 化 计 算 机 在 进 行 数 值 运 算 时, 采 用 把 各 种 符 号 位 和 数 值 位 一 起 编 码 的 方 法 常 见 的 有 原 码 补 码 和 反 码 表 示 法 (1) 原 码 原 码 表 示 法 是 机 器 数 的 一 种 简 单 的 表 示 法 其 符 号 位 用 0 表 示 正 号, 用 l 表 示 负 号, 数 值 一 般 用 二 进 制 形 式 表 示 设 有 一 数 为 X, 则 原 码 表 示 可 记 作 [x] 原 例 如,X 1 =+0001010 X 2 = 0001010 其 原 码 记 作 : [X 1 ] 原 =[+0001010] 原 =00001010 [X 2 ] 原 =[ 1001010] 原 =10001010 原 码 表 示 数 值 的 范 围 与 二 进 制 位 数 有 关 当 用 8 位 二 进 制 原 码 来 表 示 整 数 时, 其 表 示 范 围 : 最 大 值 为 01111111, 其 真 值 为 (127) 10 或 为 (+1111111) 2; 最 小 值 为 11111111, 其 真 值 为 ( 127) 10 或 为 ( 1111111) 2 在 原 码 表 示 法 中, 对 0 有 两 种 表 示 形 式 : [+0] 原 =00000000 [ 0] 原 =10000000 (2) 反 码 机 器 数 的 反 码 可 由 原 码 得 到 如 果 机 器 数 是 正 数, 则 该 机 器 数 的 反 码 与 原 码 一 样 ; 如 果 机 器 数 是 负 数, 则 该 机 器 数 的 反 码 是 对 它 的 原 码 ( 符 号 位 除 外 ) 各 位 取 反 而 得 到 的 设 有 一 数 X, 则 X 的 反 码 表 示 记 作 [X] 反

50 大 学 计 算 机 基 础 面 向 计 算 思 维 例 如 :X 1 =+0000110(+6) X 2 = 1000110( 6) 那 么 [X 1 ] 原 =00000110 [X 1 ] 反 =[X 1 ] 原 =00000110 [X 2 ] 原 =10000110 [X 2 ] 反 =111111001 当 用 8 位 二 进 制 反 码 来 表 示 整 数 时, 其 表 示 范 围 为 : 127~+127 在 反 码 表 示 法 中, 对 0 有 两 种 表 示 形 式 : (3) 补 码 [+0] 原 =00000000 [ 0] 反 =11111111 机 器 数 的 补 码 可 由 反 码 得 到 如 果 机 器 数 是 正 数, 则 该 机 器 数 的 补 码 与 反 码 相 同, 当 然 也 与 原 码 一 样 ; 如 果 机 器 数 是 负 数, 则 该 机 器 数 的 补 码 是 在 其 反 的 末 位 上 加 1 设 有 一 数 X, 则 X 的 码 表 示 记 作 [X] 补 例 如 : [+6] 补 =[+6] 反 =[+6] 原 =00000110 [ 6] 原 =10000110 [ 6] 反 =11111001 [ 6] 补 =11111010 11111001 + 1 11111010 在 补 码 表 示 法 中, 对 0 的 表 示 只 有 一 种, 即 : [+0] 补 =00000000 [ 0] 补 =00000000 当 用 8 位 二 进 制 补 码 来 表 示 整 数 时, 其 表 示 范 围 为 : 最 大 为 01111111, 其 真 值 为 (127) 10 或 为 (+1111111) 2; 最 小 为 10000000, 其 真 值 为 ( 128) 10 或 为 ( 10000000) 2 补 码 在 微 型 机 中 是 一 种 重 要 的 编 码 形 式, 请 注 意 : 1) 采 用 补 码 后, 可 以 方 便 地 将 减 法 运 算 转 化 成 加 法 运 算, 运 算 过 程 得 到 简 化 正 数 的 补 码 即 是 它 所 表 示 的 数 值 的 真 值, 而 负 数 的 补 码 的 数 值 部 份 却 不 是 它 所 表 示 的 数 的 真 值 采 用 补 码 进 行 运 算, 所 得 结 果 仍 为 补 码 2) 与 原 码 反 码 不 同, 数 值 0 的 补 码 只 有 一 个, 即 [0] 补 =00000000 [+0] 原 =00000000 [ 0] 反 =11111111 11111111 + 1 1 00000000 [ 0] 补 =00000000

第 3 章 数 据 在 计 算 机 中 的 表 示 51 3) 若 字 长 为 8 位, 则 补 码 所 表 示 的 范 围 为 128~+127; 进 行 补 码 运 算 时, 应 注 意 所 得 结 果 不 应 超 过 补 码 所 能 表 示 数 的 范 围 设 有 一 数 X, 则 X 的 补 码 表 示 记 作 [X] 补 例 如, X 1 =+1110110 X 2 = 1101010 那 么, [X 1 ] 原 =01110110 [X 1 ] 补 =01110110 即 [X 1 ] 原 =[X 1 ] 补 =01110110 [X 2 ] 原 =11101010 [X 2 ] 反 =10010101 [X 2 ] 补 =10010101+1=10010110 例 3 4 已 知 [X] 原 =101110l0, 求 [X] 补 分 析 如 下 : 由 [X] 原 求 [X] 补 的 原 则 是 : 若 机 器 数 为 正 数, 则 [X] 原 =[X] 补 ; 若 机 器 数 为 负 数, 则 该 机 器 数 的 补 码 可 对 它 的 原 码 ( 符 号 位 除 外 ) 所 有 位 求 反, 再 在 末 位 加 l 而 得 到 现 给 定 的 机 器 数 为 负 数, 故 有 [X] 补 =[X] 反 +1, 即 [X] 原 =10111010 [X] 反 =11000101 11000101 + 1 11000110 [X] 补 =11000110 例 3 5 已 知 [X] 补 =11110110, 求 [X] 原 分 析 如 下 : 对 于 机 器 数 为 正 数, 则 [X] 原 =[X] 补 ; 对 于 机 器 数 为 负 数, 则 有 [X] 原 =[[X] 补 ] 补 ; 现 给 定 的 为 负 数, 故 有 : [X] 补 =11110110 [[X] 补 ] 反 =10001001 10001001 + 1 10001010 [[X] 补 ] 补 =10001010=[X] 原 用 补 码 表 示 法 可 以 使 减 法 运 算 成 为 加 法 运 算 例 如 4 9 的 运 算 如 下 : 4 的 补 码 形 式 为 : 00000100 9 的 补 码 形 式 为 : + 11110111 11111011

52 大 学 计 算 机 基 础 面 向 计 算 思 维 结 果 为 11111011, 是 5 的 补 码 形 式 又 如 :( 9)+( 4) 的 运 算 如 下 : 9 的 补 码 形 式 为 : 11110111 4 的 补 码 形 式 为 : + 11111100 111110011 最 高 位 的 1 自 动 丢 失, 运 算 结 果 为 11110011, 是 13 的 补 码 形 式 由 上 可 见, 利 用 补 码 可 以 方 便 地 进 行 运 算, 在 数 的 有 效 范 围 内, 符 号 位 如 同 数 值 一 样 参 加 运 算, 也 允 许 产 生 最 高 位 的 进 位 ( 补 自 动 丢 失 ), 所 以 使 用 较 广 泛 3.2.2 数 值 在 计 算 机 中 的 表 示 在 计 算 机 中, 一 般 用 若 干 个 二 进 制 位 表 示 一 个 数 或 一 条 指 令, 把 它 们 作 为 一 个 整 体 来 处 理 存 储 和 传 送 这 种 作 为 一 个 整 体 来 处 理 的 二 进 制 位 串, 称 为 计 算 机 字 表 示 数 据 的 字 称 为 数 据 字, 表 示 指 令 的 字 称 为 指 令 字 计 算 机 是 以 字 为 单 位 进 行 处 理 存 储 和 传 送 的, 所 以 运 算 器 中 的 加 法 器 累 加 器 以 及 其 他 一 些 寄 存 器, 都 选 择 与 字 长 相 同 位 数 字 长 一 定, 则 计 算 机 数 据 字 所 能 表 示 的 数 的 范 围 也 就 确 定 了 例 如, 使 用 16 位 字 长 的 计 算 机, 它 可 以 表 示 无 符 号 整 数 的 最 大 值 是 (65535) 10 = (1111111111111111) 2 运 算 时, 若 数 值 超 出 机 器 数 所 能 表 示 的 范 围, 就 会 停 止 运 算 和 处 理, 这 种 现 象 称 为 溢 出 1. 定 点 数 计 算 机 中 运 算 的 数, 有 整 数, 也 有 小 数, 如 何 表 示 整 数 和 小 数 呢? 那 就 是 规 定 小 数 点 的 位 置 固 定 不 变, 这 时 的 机 器 数 称 为 定 点 数 (1) 定 点 整 数 定 点 整 数 就 是 将 小 数 点 的 位 置 固 定 在 存 储 器 的 末 端, 这 时 机 器 数 所 表 示 的 数 就 是 纯 整 数 假 设 机 器 字 长 为 16 位, 符 号 位 占 1 位, 数 值 部 分 占 15 位, 于 是 机 器 数 :0111111111111111 所 表 示 的 整 数 为 十 进 制 的 +32767, 如 图 3 2 所 示 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 符 号 位 数 据 位 图 3 2 定 点 整 数 在 计 算 机 中 的 表 示 示 意 图 固 定 小 数 点 位 16 位 定 点 整 数 补 码 表 示 数 的 范 围 : 最 大 为 0111111111111111, 其 真 值 为 (215) 10 =(32767) 10; 最 小 为 1000000000000000, 其 真 值 为 ( 32768) 10 (2) 定 点 小 数 定 点 小 数 就 是 将 小 数 点 的 位 置 固 定 在 符 号 位 的 右 端, 数 值 部 分 的 左 端, 这 时 机 器 数 所 表

第 3 章 数 据 在 计 算 机 中 的 表 示 53 示 的 数 就 是 纯 小 数 假 设 机 器 字 长 为 16 位, 符 号 位 占 1 位, 数 值 部 分 占 15 位, 于 是 机 器 数 0111111111111111 ( 即 0.111111111111111) 所 表 示 的 纯 小 数 为 十 进 制 的 +(1 2 15 ), 如 图 3 3 所 示 16 位 定 点 小 数 补 码 表 示 数 的 范 围 : 最 大 为 0.111111111111111, 其 真 值 为 (1 2 15 ) 10; 最 小 为 1.000000000000000, 其 真 值 为 ( 1) 10 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 符 号 位 固 定 小 数 点 位 数 据 位 图 3 3 定 点 小 数 在 计 算 机 中 的 表 示 示 意 图 定 点 表 示 法 所 能 表 示 的 数 值 范 围 很 有 限, 为 了 扩 大 定 点 数 的 表 示 范 围, 可 以 通 过 编 程 技 术, 采 用 多 个 字 节 来 表 示 一 个 定 点 数, 例 如, 采 用 4 个 字 节 或 8 个 字 节 等 2. 浮 点 数 在 计 算 机 中 处 理 的 数, 除 整 数 处, 大 多 处 理 的 是 实 数, 即 既 带 整 数 又 带 小 数 的 数 在 计 算 机 中, 为 了 能 表 示 实 数, 采 用 浮 点 表 示 法 在 同 样 字 长 的 情 况 下, 浮 点 表 示 法 能 表 示 的 数 的 范 围 扩 大 了, 浮 点 表 示 法 就 是 小 数 点 在 数 中 的 位 置 是 浮 动 的, 浮 点 表 示 法 由 两 部 分 组 成, 即 尾 数 和 阶 码 例 如,0.3125 10 3, 则 0.3125 为 尾 数,3 是 阶 码 在 浮 点 表 示 法 中, 小 数 点 的 位 置 是 浮 动 的, 阶 码 可 以 取 不 同 的 数 值 例 如, 十 进 制 数 3125.8125 可 表 示 为 : 3.1258125 10 +3 3125.8125 10 0 3125812.5 10 3 等 多 种 形 式 为 了 便 于 计 算 机 中 小 数 点 的 表 示, 规 定 将 浮 点 数 写 成 规 格 化 的 形 式, 即 尾 数 的 绝 对 值 大 于 等 于 0.1 并 且 小 于 1, 从 而 唯 一 地 规 定 了 小 数 点 的 位 置 十 进 制 数 3125.8125 以 规 格 化 形 式 表 示 为 : 0.31258125 10 4 对 于 任 意 二 进 制 数 在 计 算 机 中 的 浮 点 表 示 法 包 括 两 个 部 分 : 一 部 分 是 阶 码 ( 表 示 指 数, 记 作 E) ; 另 一 部 分 是 尾 数 ( 表 示 有 效 数 字, 记 作 M) 设 任 意 一 数 N 可 以 表 示 为 : N=M2 E 其 中 2 为 基 数,E 为 阶 码,M 为 尾 数 假 设 机 器 字 长 为 16 位, 阶 码 部 分 用 一 个 字 节 表 示, 尾 数 部 分 用 一 个 字 节 表 示, 则 机 器 数 0000011001000001 所 表 示 的 数 为 十 进 制 的 +(2 1 +2 7 )2 6, 即 +32.5, 如 图 3 4 所 示 其 中 : 阶 码 E=(00000110) 2 =(6) 10 尾 数 M=(0.1000001) 2 =(0.5078125) 10 数 值 N=M2 E =0.5078125 2 6 =(32.5) 10

54 大 学 计 算 机 基 础 面 向 计 算 思 维 阶 码 部 分 尾 数 部 分 0 0 0 0 0 1 1 0 0 1 0 01 0 0 0 1 阶 码 符 号 位 阶 码 数 据 位 图 3 4 尾 数 符 号 阶 位 尾 码 数 固 固 定 定 小 小 数 数 点 点 位 位 尾 数 数 据 位 浮 点 数 在 计 算 机 中 的 表 示 示 意 图 由 尾 数 部 分 隐 含 的 小 数 点 位 置 可 知, 尾 数 总 是 1 的 数 字, 它 给 出 该 浮 点 数 的 有 效 数 字 尾 数 部 分 的 符 号 位 确 定 该 浮 点 数 的 正 负 阶 码 给 出 的 总 是 整 数, 它 确 定 小 数 点 浮 动 的 位 数, 若 阶 符 为 正, 则 相 当 于 小 数 点 向 右 移 动 ; 若 阶 符 为 负, 则 相 当 于 小 数 点 向 左 移 动 浮 点 数 表 示 法 对 尾 数 有 如 下 规 定 : 1/2 M<1 即 要 求 尾 数 中 第 1 位 数 不 为 零, 这 样 的 浮 点 数 称 为 规 格 化 的 数 当 浮 点 数 的 尾 数 为 零 或 者 阶 码 为 最 小 值 时, 机 器 通 常 规 定, 把 该 数 看 作 零, 称 为 机 器 零 浮 点 数 表 示 和 运 算 中, 当 一 个 数 的 阶 码 大 于 机 器 所 能 表 示 的 最 大 阶 码 时, 产 生 上 溢 上 溢 时 机 器 一 般 不 再 继 续 运 算 而 转 入 溢 出 处 理 当 一 个 数 的 阶 码 小 于 机 器 所 能 表 示 的 最 小 阶 码 最 小 尾 数 或 绝 对 值 最 小 尾 数 时, 下 溢 时 一 般 当 作 机 器 零 来 处 理 若 机 器 字 长 为 32 位, 阶 码 部 分 用 一 个 字 节 表 示, 尾 数 部 分 用 三 个 字 节 表 示, 则 机 器 能 表 示 的 数 的 范 围 为 1.7 10 38 ~+1.7 10 38 3.BCD 码 在 计 算 机 中, 一 般 用 户 和 计 算 机 之 间 的 输 入 和 输 出 数 都 是 十 进 制, 由 于 计 算 机 内 用 的 都 是 二 进 制 数, 这 就 需 要 进 行 十 进 制 和 二 进 制 之 间 的 相 互 转 换, 这 项 工 作 由 计 算 机 本 身 自 动 完 成 在 计 算 机 中 采 用 了 输 入 / 输 出 转 换 的 二 至 十 进 制 编 码, 即 BCD 码 在 二 至 十 进 制 的 转 换 中, 用 4 位 二 进 制 数 表 示 1 位 十 进 制 数 的 编 码 方 法 最 常 用 的 是 8421BCD 码 8421 的 含 义 是 指 4 位 二 进 制 数 从 左 到 右 每 位 对 应 的 权 是 8 4 2 1 BCD 码 和 十 进 制 之 间 的 对 应 关 系 如 表 3 2 所 示 表 3 2 BCD 码 和 十 进 制 数 对 照 表 十 进 制 数 0 1 2 3 4 5 6 7 8 9 BCD 码 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 例 如 : 十 进 制 数 785.5 用 BCD 码 表 示 的 二 进 制 数 为 :(0111 1000 0101.0101)BCD 3.3 字 符 在 计 算 机 中 的 表 示 计 算 机 中 使 用 的 数 据 有 数 值 型 数 据 和 非 数 值 型 数 据 两 大 类 数 值 数 据 用 于 表 示 数 量 意 义 ;

第 3 章 数 据 在 计 算 机 中 的 表 示 55 非 数 值 数 据 又 称 为 符 号 数 据, 包 括 字 母 和 符 号 等 非 数 值 数 据 用 于 记 录 事 物 信 息 计 算 机 除 处 理 数 值 信 息 外, 大 量 处 理 的 是 字 符 信 息 例 如, 将 用 高 级 语 言 编 写 的 程 序 输 入 到 计 算 机 时, 人 与 计 算 机 通 信 时 所 用 的 语 言 就 不 再 是 一 种 纯 数 字 语 言 而 是 字 符 语 言 由 于 计 算 机 中 只 能 存 储 二 进 制 数, 这 就 需 要 对 字 符 进 行 编 码, 建 立 字 符 数 据 与 二 进 制 串 之 间 的 对 应 关 系, 以 便 于 计 算 机 识 别 存 储 和 处 理 3.3.1 英 文 字 符 在 计 算 机 中 的 表 示 1.ASCII 字 符 计 算 机 中 用 得 最 多 的 符 号 数 据 是 字 符, 它 是 用 户 和 计 算 机 之 间 的 桥 梁 用 户 使 用 计 算 机 的 输 入 设 备, 按 下 键 盘 上 的 字 符 键 向 计 算 机 内 输 入 命 令 和 数 据, 计 算 机 把 处 理 后 的 结 果 也 以 字 符 的 形 式 输 出 到 屏 幕 或 打 印 机 等 输 出 设 备 上 对 于 字 符 的 编 码 方 案 有 很 多 种, 但 使 用 最 广 泛 的 是 ASCII 码 (American Standard Code for Information Interchange,ASCII) ASCII 码 是 美 国 国 家 信 息 交 换 标 准 字 符 码, 后 来 被 采 纳 为 一 种 国 际 通 用 的 信 息 交 换 标 准 代 码 ASCII 码 就 是 用 7 位 二 进 制 编 码 表 示 一 个 英 文 字 符, 从 0000000 到 1111111 共 有 128 种 编 码, 可 用 来 表 示 128 个 不 同 的 字 符 ASCII 码 由 0~9 这 10 个 数 字 符 号,52 个 大 小 写 英 文 字 母,32 个 符 号 及 34 个 计 算 机 通 用 控 制 符 组 成, 共 有 128 个 元 素, 如 表 3 3 所 示 ASCII 码 表 的 查 表 方 式 是 : 先 查 列 ( 高 三 位 即 下 表 的 d6d5d4), 后 查 行 ( 低 四 位 d3d2d1d0), 然 后 按 从 左 到 右 的 书 写 顺 序 完 成, 如 B 的 ASCII 码 为 1000010 在 ASCII 码 进 行 存 放 时, 由 于 它 的 编 码 是 7 位, 因 1 个 字 节 (8 位 ) 是 计 算 机 中 常 用 单 位, 故 仍 以 1 字 节 来 存 放 1 个 ASCII 字 符, 每 个 字 节 中 多 余 的 最 高 位 取 0 表 3 3 ASCII 字 符 编 码 表 d3d2d1d0 d6d5d4 000 001 010 011 100 101 110 111 0000 NUL DEL SP 0 @ P P 0001 SOH DC1! 1 A Q a q 0010 STX DC2 2 B R b r 0011 EXT DC3 # 3 C S c s 0100 EOT DC4 $ 4 D T d t 0101 ENQ NAK % 5 E U e u 0110 ACK SYN & 6 F V f v 0111 BEL ETB, 7 G W g w 1000 BS CAN ( 8 H X h x 1001 HT EM ) 9 I Y i y 1010 LF SUB * : J Z j z 1011 VT ESC + ; K [ k { 1100 FF FS, < L \ l 1101 CR GS = M ] m } 1110 SO RS. > N ^ n ~ 1111 SI US /? O _ o DEL

56 大 学 计 算 机 基 础 面 向 计 算 思 维 由 表 3 4 可 知,ASCII 码 字 符 可 分 为 两 大 类 : (1) 打 印 字 符 : 即 从 键 盘 输 入 并 显 示 的 95 个 字 符, 如 大 小 写 英 文 字 母 各 26 个 ( 小 写 字 母 的 ASCII 值 比 大 写 字 母 的 ASCII 值 大 32), 数 字 0~9 这 10 个 数 字 字 符 的 高 3 位 编 码 (d6d5d4) 为 011, 低 4 位 为 0000~1001 当 去 掉 高 3 位 时, 低 4 位 正 好 是 二 进 制 形 式 的 0~9 (2) 不 可 打 印 字 符 : 共 33 个, 其 编 码 值 为 0~31(0000000~0011111) 2 和 (1111111) 2, 不 对 应 任 何 可 印 刷 字 符 不 可 打 印 字 符 通 常 为 控 制 符, 用 于 计 算 机 通 信 中 的 通 信 控 制 或 对 设 备 的 功 能 控 制 如 编 码 值 为 127(1111111), 是 删 除 控 制 DEL 码, 它 用 于 删 除 光 标 之 后 的 字 符 ASCII 码 字 符 的 码 值 可 用 7 位 二 进 制 代 码 或 2 位 十 六 进 制 来 表 示 例 如 字 母 D 的 ASCII 码 值 为 (1000100) 2 或 84H, 数 字 4 的 码 值 为 (0110100) 2 或 34H 等 计 算 机 内 部 存 储 与 操 作 常 以 字 节 为 单 位, 即 8 个 二 进 制 位 为 单 位 因 此 一 个 英 文 字 符 在 计 算 机 内 实 际 是 用 8 位 表 示 在 正 常 情 况 下, 最 高 位 d7 为 0 在 需 要 奇 偶 校 验 时, 这 一 位 可 用 于 存 放 奇 偶 校 验 的 值, 此 时 称 为 校 验 位 2. 扩 展 ASCII 码 字 符 计 算 机 内 部 存 储 与 操 作 常 以 字 节 为 单 位, 而 ASCII 码 字 符 是 用 7 位 二 进 制 数 表 示 一 个 字 符, 在 一 个 字 节 中, 高 位 全 为 0, 这 就 造 成 一 个 二 进 制 位 的 浪 费 因 此 有 的 单 位 或 部 门 就 对 ASCII 码 字 符 进 行 了 扩 展, 用 8 位 二 进 制 数 表 示 一 个 英 文 字 符, 这 就 是 扩 展 ASCII 码 字 符 EBCDIC 就 是 典 型 的 扩 展 ASCII 码 字 符 EBCDIC(Extended Binary Coded Decimal Interchange Code) 为 国 际 商 用 机 器 公 司 (IBM) 于 1963~1964 年 间 推 出 的 字 符 编 码 表, 根 据 早 期 打 孔 机 式 的 二 进 化 十 进 数 (BCD,Binary Coded Decimal) 排 列 而 成 在 了 解 了 数 值 与 英 文 字 符 在 计 算 机 内 的 表 示 后, 读 者 可 能 会 产 生 一 个 问 题 : 二 者 在 计 算 机 内 都 是 二 进 制 数, 如 何 区 分 数 值 和 英 文 字 符 呢? 例 如, 内 存 中 存 放 一 个 二 进 制 数 :01000010, 它 究 竟 表 示 数 值 66, 还 是 表 示 字 母 B? 而 对 一 个 孤 立 的 字 节, 确 实 无 法 区 分, 但 存 放 和 使 用 这 个 数 据 的 软 件, 会 以 其 他 方 式 保 存 有 关 的 类 型 信 息, 指 明 这 个 信 息 是 何 种 类 型 以 下 汉 字 信 息 也 是 如 此 3.3.2 汉 字 字 符 在 计 算 机 中 的 表 示 汉 字 是 汉 语 书 写 的 最 基 本 单 元, 其 使 用 最 晚 始 于 商 代, 历 经 甲 骨 文 大 篆 小 篆 隶 书 楷 书 ( 草 书 行 书 ) 诸 般 书 体 变 化 秦 始 皇 统 一 中 国, 李 斯 整 理 小 篆, 书 同 文 的 历 史 从 此 开 始 尽 管 汉 语 方 言 发 音 差 异 很 大, 但 是 书 写 系 统 的 统 一 减 少 了 方 言 差 异 造 成 的 交 流 障 碍 三 千 余 年 来, 汉 字 的 书 写 方 式 变 化 不 大, 使 得 后 人 得 以 阅 读 古 文 而 不 生 窒 碍 但 近 代 西 方 文 明 进 入 东 亚 之 后, 整 个 汉 字 文 化 圈 的 各 个 国 家 纷 纷 掀 起 了 学 习 西 方 的 思 潮, 其 中, 放 弃 使 用 汉 字 是 这 场 运 动 的 一 个 重 要 方 面 这 些 运 动 的 立 论 以 为 : 跟 西 方 拼 音 文 字 相 比, 汉 字 是 繁 琐 笨 拙 的 许 多 使 用 汉 字 的 国 家 即 进 行 了 不 同 程 度 的 汉 字 简 化, 甚 至 还 有 完 全 拼 音 化 的 尝 试 日 文 假 名 的 拉 丁 转 写 方 案 以 及 汉 语 多 种 拼 音 方 案 的 出 现 都 是 基 于 这 种 思 想 中 国 大 陆 将 汉 字 笔 划 参 考 行 书 草 书 加 以 省 简, 于 1956 年 1 月 28 日 审 订 通 过 简 化 字 总 表, 在 中 国 及 新 加 坡 使 用 至 今 中 国 香 港 台 湾 地 区 则 一 直 使 用 繁 体 中 文 目 前 在 使 用 汉 语 的 地 区, 大 都 使 用 两 种 规 范 汉 字, 分 别 是 繁 体 中 文 ( 繁 体 字 ) 和 简 体 中 文 ( 简 体 字 ) 英 文 文 字 是 拼 音 文 字, 所 有 文 字 均 由 26 个 字 母 拼 组 而 成, 所 以 使 用 一 个 字 节 表 示 一 个 字

第 3 章 数 据 在 计 算 机 中 的 表 示 57 符 足 够 了 但 汉 字 是 象 形 文 字, 汉 字 的 计 算 机 处 理 技 术 比 英 文 字 符 复 杂 得 多, 一 般 用 两 个 字 节 表 示 一 个 汉 字 1. 汉 字 输 入 码 汉 字 输 入 码 也 叫 外 码, 是 为 了 通 过 键 盘 字 符 把 汉 字 输 入 到 计 算 机 中 而 设 计 的 一 种 编 码 英 文 输 入 时, 想 输 入 什 么 字 符 便 按 什 么 键, 输 入 码 和 内 码 是 一 致 的 而 汉 字 输 入 则 不 同, 可 能 要 按 几 个 键 才 能 输 入 一 个 汉 字 汉 字 和 键 盘 字 符 组 合 的 对 应 方 式 称 为 汉 字 输 入 编 码 方 案 外 码 是 针 对 不 同 汉 字 输 入 法 而 言 的, 通 过 键 盘 按 某 种 输 入 法 进 行 汉 字 输 入 时, 人 与 计 算 机 进 行 信 息 交 换 所 用 的 编 码 称 为 汉 字 外 码 对 于 同 一 汉 字 而 言, 输 入 法 不 同, 其 外 码 也 是 不 同 的 例 如, 对 于 汉 字 啊, 在 区 位 码 输 入 法 中 的 外 码 是 1601, 在 拼 音 输 入 中 的 外 码 是 a, 而 在 五 笔 字 型 输 入 法 中 的 外 码 是 kbsk 汉 字 的 输 入 码 一 般 采 用 英 文 小 写 字 母 编 码, 所 以 输 入 汉 字 时, 键 盘 应 处 在 小 写 状 态 汉 字 的 输 入 码 种 类 繁 多, 可 分 以 下 4 种 类 型, 音 码 形 码 音 形 码 形 音 码 衡 量 一 个 输 入 码 的 优 劣 标 准 如 下 : 编 码 短, 可 以 减 少 击 键 次 数 ; 重 码 少, 可 以 实 现 盲 打 ; 好 学 好 记, 便 于 学 习 和 掌 握 但 到 目 前 为 止, 还 没 有 一 种 全 部 符 合 上 述 要 求 的 汉 字 输 入 方 法 (1) 音 码 音 码 输 入 码 主 要 是 以 汉 语 拼 音 为 基 础 进 行 拼 音 输 入 的 编 码 方 案, 如 全 拼 简 拼 智 能 ABC 搜 狗 输 入 法 等 优 点 是 简 单 易 学, 甚 至 不 需 要 再 学 习, 与 人 们 习 惯 一 致 缺 点 是 汉 字 同 音 多, 即 重 码 字 多, 输 入 汉 字 时 要 选 字, 则 输 入 速 度 慢 搜 狗 输 入 法 可 以 以 词 组 为 单 位, 很 好 地 弥 补 了 重 码 字 多 输 入 速 度 慢 的 不 足 (2) 形 码 形 码 输 入 码 主 要 是 根 据 汉 语 的 特 点, 按 汉 字 固 有 的 形 状, 把 汉 字 先 拆 分 成 部 首, 然 后 组 合 进 行 拼 形 输 入 的 编 码 方 案, 如 首 尾 码 输 入 法 五 笔 字 型 输 入 法 郑 码 输 入 法 等 优 点 是 不 考 虑 字 的 读 音, 见 字 识 码, 重 码 字 少, 输 入 速 度 快, 强 化 训 练 后 可 以 实 现 盲 打 缺 点 是 拆 字 法 没 有 统 一 的 国 家 标 准, 拆 字 难, 编 码 规 则 繁, 记 忆 量 大, 需 要 学 习 和 记 忆 五 笔 字 型 输 入 法 使 用 广 泛, 适 合 专 业 录 入 人 员, 可 实 现 盲 打, 但 必 须 记 住 字 根 掌 握 汉 字 的 间 架 结 构 和 书 写 顺 序, 学 会 拆 字 和 形 成 编 码 (3) 音 形 码 音 形 码 输 入 码 集 拼 音 与 拼 形 于 一 体, 以 拼 音 为 主, 兼 顾 拼 形 的 编 码 方 案, 如 音 形 码 自 然 码 钱 码 等 优 点 是 它 兼 容 了 拼 音 拼 形 输 入 的 优 点, 大 大 减 少 了 重 码 汉 字, 提 高 了 输 入 速 度 缺 点 是 既 要 考 虑 字 音, 又 要 考 虑 字 形, 编 码 比 较 麻 烦 (4) 形 音 码 形 音 码 输 入 码 集 拼 形 与 拼 音 于 一 体, 以 拼 形 为 主, 兼 顾 拼 音 形 的 编 码 方 案, 它 兼 容 了 拼 形 拼 音 输 入 的 优 点, 几 乎 没 有 重 码 汉 字 典 型 代 表 是 形 音 码 输 入 法, 兼 容 了 五 笔 字 输 入 法 和 拼 音 输 入 法, 并 且 对 两 种 输 入 法 进 行 适 当 调 整 的 一 种 编 码 (5) 数 字 码 数 字 码 也 称 流 水 码, 它 是 用 0~9 十 个 数 字 字 符 进 行 编 码 的 编 码 方 案, 如 电 报 码 区 位 码

58 大 学 计 算 机 基 础 面 向 计 算 思 维 等 优 点 是 无 重 码, 不 仅 能 对 汉 字 编 码, 还 能 对 各 种 字 母 数 字 符 号 进 行 编 码 缺 点 是 人 为 规 定 的 编 码, 属 于 无 理 码, 只 能 作 为 专 业 人 员 使 用 (6) 基 于 模 式 识 别 的 智 能 化 输 入 法 模 式 识 别 与 智 能 系 统 是 在 信 号 处 理 人 工 智 能 控 制 论 计 算 机 技 术 等 学 科 基 础 上 发 展 起 来 的 新 型 学 科 该 学 科 以 各 种 传 感 器 为 信 息 源, 以 信 息 处 理 与 模 式 识 别 的 理 论 技 术 为 核 心, 以 数 学 方 法 与 计 算 机 为 主 要 工 具, 探 索 对 各 种 媒 体 信 息 进 行 处 理 分 类 理 解, 并 在 此 基 础 上 构 造 具 有 某 些 智 能 特 性 的 系 统 或 装 置 的 方 法 途 径 与 实 现, 以 提 高 系 统 性 能 基 于 模 式 识 别 的 智 能 化 汉 字 输 入 法 就 是 在 此 基 础 上 产 生 的, 如 语 音 识 别 输 入 手 写 输 入 法 扫 描 输 入 法 等 现 在 汉 字 输 入 法 还 在 进 一 步 研 究 中, 将 来 有 一 天, 汉 字 输 入 不 再 是 人 们 使 用 计 算 机 的 瓶 颈, 人 们 坐 在 电 脑 前, 畅 游 在 计 算 机 世 界 里, 尽 情 享 受 着 计 算 机 世 界 带 给 我 们 的 快 乐 与 便 利 不 管 哪 种 汉 字 输 入 法, 都 是 操 作 者 向 计 算 机 输 入 汉 字 的 手 段, 而 在 计 算 机 内 部 都 是 以 汉 字 机 内 码 表 示 和 存 储 的 2. 汉 字 国 标 码 汉 字 国 标 码 也 叫 汉 字 交 换 码, 主 要 是 用 作 汉 字 信 息 交 换 的 1980 年, 为 了 使 每 个 汉 字 有 一 个 全 国 统 一 的 代 码, 我 国 颁 布 了 汉 字 编 码 的 国 家 标 准 :GB2312-80 信 息 交 换 用 汉 字 编 码 字 符 集 ( 基 本 集 ), 这 就 是 国 标 码, 简 称 GB 码 这 个 字 符 集 是 我 国 中 文 信 息 处 理 技 术 的 发 展 基 础, 也 是 目 前 国 内 所 有 汉 字 系 统 的 统 一 标 准 国 标 码 是 一 个 四 位 十 六 进 制 数, 区 位 码 是 一 个 四 位 的 十 进 制 数, 每 个 国 标 码 或 区 位 码 都 对 应 着 一 个 唯 一 的 汉 字 或 符 号, 但 因 为 十 六 进 制 数 我 们 很 少 用 到, 所 以 大 家 常 用 的 是 区 位 码, 它 的 前 两 位 叫 做 区 码, 后 两 位 叫 做 位 码 在 国 标 GB2312-80 中 有 6763 个 常 用 汉 字 国 标 GB2312 规 定, 所 有 的 国 标 汉 字 与 符 号 组 成 一 个 94 94 的 矩 阵 在 此 方 阵 中, 每 一 行 称 为 一 个 区, 每 一 列 称 为 一 个 位, 因 此, 这 个 方 阵 实 际 上 组 成 了 一 个 有 94 个 区 ( 区 号 分 别 为 01~94) 每 个 区 内 有 94 个 位 ( 位 号 分 别 为 01~94) 的 汉 字 字 符 集 一 个 汉 字 所 在 的 区 号 和 位 号 简 单 地 组 合 在 一 起 就 构 成 了 该 汉 字 的 区 位 码 在 汉 字 的 区 位 码 中, 高 两 位 为 区 号, 低 两 位 为 位 号 由 此 可 见, 区 位 码 与 汉 字 或 符 号 之 间 是 一 一 对 应 的 区 号 对 应 第 一 字 节, 位 号 对 应 第 二 字 节 01~09 区 为 符 号 数 字 区, 16~87 区 为 汉 字 区,10~15 区 88~94 区 是 有 待 进 一 步 标 准 化 的 空 白 区 GB2312 将 收 录 的 汉 字 分 成 两 级 : 第 一 级 是 常 用 汉 字 计 3755 个, 置 于 16~55 区, 按 汉 语 拼 音 字 母 / 笔 形 顺 序 排 列 ; 第 二 级 汉 字 是 次 常 用 汉 字 计 3008 个, 置 于 56~87 区, 按 部 首 / 笔 画 顺 序 排 列 汉 字 区 位 码 并 不 等 于 国 标 码, 国 标 码 是 由 区 位 码 稍 作 转 换 得 到 的, 其 转 换 方 法 为 : 将 十 进 制 区 码 和 位 码 各 加 32( 或 将 十 进 制 区 码 和 位 码 转 换 为 十 六 进 制 的 区 码 和 位 码, 再 将 区 码 和 位 码 各 加 十 六 进 制 的 20H) 就 构 成 了 国 标 码 如 啊 字 的 区 位 码 为 1601, 则 啊 字 的 国 标 码 为 4833(3021H), 它 是 经 过 下 面 的 转 换 得 到 的 :16+32=48,01+32=33( 或 (16) 10 =(10H) 16, (01) 10 =(01H) 16,10H+20H=30H,01H+20H=21H) 3. 汉 字 机 内 码 汉 字 机 内 码, 简 称 内 码, 指 计 算 机 内 部 存 储, 处 理 加 工 和 传 输 汉 字 时 所 用 的 二 进 制 编 码 输 入 码 被 接 受 后 就 由 汉 字 操 作 系 统 的 输 入 码 转 换 模 块 转 换 为 机 内 码, 与 所 采 用 的 键 盘 输 入 法 无 关 机 内 码 是 汉 字 最 基 本 的 编 码, 不 管 是 什 么 汉 字 系 统 和 汉 字 输 入 方 法, 输 入 的 汉 字 外 码 到 机 器 内 部 都 要 转 换 成 机 内 码, 才 能 被 存 储 和 进 行 各 种 处 理 国 标 码 是 汉 字 信 息 交 换 的 标 准 编 码, 但 因 其 前 后 字 节 的 最 高 位 为 0, 与 ASCII 码 发 生 冲 突,

第 3 章 数 据 在 计 算 机 中 的 表 示 59 如 啊 字, 国 标 码 为 30H 和 21H, 而 英 文 字 符 0 和! 的 ASCII 码 也 为 30H 和 21H, 现 假 如 内 存 中 有 两 个 字 节 为 30H 和 21H, 这 到 底 是 一 个 汉 字, 还 是 两 个 英 文 字 符 0 和! 呢? 于 是 就 出 现 了 二 义 性, 显 然, 国 标 码 是 不 可 能 在 计 算 机 内 部 直 接 采 用 的, 于 是, 汉 字 的 机 内 码 采 用 变 形 国 标 码, 其 变 换 方 法 为 : 将 国 标 码 的 每 个 字 节 都 加 上 十 进 制 128 ( 十 六 进 制 80H), 即 将 两 个 字 节 的 最 高 位 由 0 改 1, 其 余 7 位 不 变, 如 : 由 上 面 我 们 知 道, 啊 字 的 国 标 码 为 3021H, 前 字 节 为 (00110000) 2, 后 字 节 为 (00100001) 2, 高 位 改 1 为 (10110000) 2, 后 字 节 为 (10100001) 2, 即 为 (1011000010100001) 2, 即 为 B0A1H 因 此, 汉 字 啊 的 机 内 码 就 是 B0A1H 请 大 家 自 己 计 算 一 下 中 字 的 机 内 码 显 然, 汉 字 机 内 码 的 每 个 字 节 都 大 于 128, 这 就 解 决 了 与 西 文 字 符 的 ASCII 码 冲 突 的 问 题 如 上 所 述, 汉 字 输 入 码 区 位 码 国 标 码 与 机 内 码 都 是 汉 字 的 编 码 形 式, 它 们 之 间 有 着 千 丝 万 缕 的 联 系, 但 其 间 的 区 别 也 是 不 容 忽 视 的 4. 汉 字 字 型 码 汉 字 字 型 码 又 称 汉 字 字 模, 用 于 汉 字 在 显 示 屏 或 打 印 机 输 出 汉 字 字 型 码 通 常 有 两 种 表 示 方 式 : 点 阵 和 矢 量 表 示 方 法 用 点 阵 表 示 字 型 时, 汉 字 字 型 码 指 的 是 这 个 汉 字 字 型 点 阵 的 代 码 根 据 输 出 汉 字 的 要 求 不 同, 点 阵 的 多 少 也 不 同 简 易 型 汉 字 为 16 16 点 阵, 提 高 型 汉 字 为 24 24 点 阵 32 32 点 阵 48 48 点 阵 等, 如 图 3 5 所 示 图 3 5 16 16 点 阵 汉 字 字 形 码 示 意 图 汉 字 字 形 点 阵 规 模 愈 大, 字 型 愈 清 晰 美 观, 所 占 存 储 空 间 也 愈 大 以 16 16 点 阵 为 例, 存 储 一 个 汉 字 要 占 16 16/8=32 个 字 节 把 所 有 汉 字 字 形 所 构 成 的 集 合 叫 汉 字 库, 汉 字 库 分 为 点 阵 字 库 和 矢 量 字 库 点 阵 字 模 占 的 存 储 空 间 较 大, 而 且 不 同 的 点 阵 字 模 要 有 不 同 的 汉 字 字 库, 所 以 汉 字 字 库 一 般 在 外 存 存 放, 当 显 示 输 出 汉 字 时 才 检 索 字 库, 输 出 相 应 的 字 模 得 到 相 应 的 字 形

60 大 学 计 算 机 基 础 面 向 计 算 思 维 矢 量 表 示 方 式 存 储 的 是 描 述 汉 字 字 型 的 轮 廓 特 征, 当 要 输 出 汉 字 时, 通 过 计 算 机 的 计 算, 由 汉 字 字 型 描 述 生 成 所 需 大 小 和 形 状 的 汉 字 点 阵 矢 量 化 字 型 描 述 与 最 终 文 字 显 示 的 大 小 分 辨 率 无 关, 因 此 可 以 产 生 高 质 量 的 汉 字 输 出 Windows 中 使 用 的 TrueType 技 术 就 是 汉 字 的 矢 量 表 示 方 式 True Type ( 简 称 TT) 是 由 美 国 Apple 公 司 和 Microsoft 公 司 联 合 提 出 的 一 种 新 型 数 字 化 字 形 描 述 技 术 TT 是 一 种 彩 色 数 字 函 数 描 述 字 体 轮 廓 外 形 的 一 套 内 容 丰 富 的 指 令 集 合, 这 些 指 令 中 包 括 字 型 构 造 颜 色 填 充 数 字 描 述 函 数 流 程 条 件 控 制 栅 格 处 理 器 (TT 处 理 器 ) 控 制 附 加 提 示 信 息 控 制 等 指 令 TT 采 用 几 何 学 中 的 二 次 B 样 条 曲 线 及 直 线 来 描 述 字 体 的 外 形 轮 廓, 二 次 B 样 条 曲 线 具 有 一 阶 连 续 性 和 正 切 连 续 性 抛 物 线 可 由 二 次 B 样 条 曲 线 来 精 确 表 示, 更 为 复 杂 的 字 体 外 形 可 用 B 样 长 曲 线 的 数 学 特 性 以 数 条 相 接 的 二 次 B 样 条 曲 线 及 直 线 来 表 示 描 述 TT 字 体 的 文 件 ( 内 含 TT 字 体 描 述 信 息 指 令 集 各 种 标 记 表 格 等 ) 可 能 通 用 于 Mac 和 PC 平 台 在 Mac 平 台 上, 它 以 Sfnt 资 源 的 形 式 存 放, 在 Windows 平 台 上 以 TTF 文 件 出 现 为 保 证 TT 的 跨 平 台 兼 容 性, 字 体 文 件 的 数 据 格 式 采 用 Motorola 式 数 据 结 构 ( 高 位 在 前, 低 位 在 后 ) 存 放 所 有 Intel 平 台 的 TT 解 释 器 在 执 行 之 前, 只 要 进 行 适 当 的 预 处 理 即 可 Windows 的 TT 解 释 器 已 包 含 在 其 GDI( 图 形 设 备 接 口 ) 中, 所 以 任 何 Windows 支 持 的 输 出 设 备, 都 能 用 TT 字 体 输 出 TT 技 术 具 有 以 下 优 势 : (1) 真 正 的 所 见 即 所 得 效 果 由 于 TT 支 持 几 乎 所 有 的 输 出 设 备, 因 而 对 于 目 标 输 出 设 备 而 言, 无 论 系 统 的 屏 幕 激 光 打 印 机 或 激 光 照 排 机, 所 有 在 操 作 系 统 中 安 装 了 TT 字 体 均 能 在 输 出 设 备 上 以 指 定 的 分 辨 率 输 出, 所 以 多 数 排 版 类 应 用 程 序 可 以 根 据 当 前 目 标 输 出 设 备 的 分 辨 率 等 参 数, 来 对 页 面 进 行 精 确 的 布 局 (2) 支 持 字 体 嵌 入 技 术, 保 证 文 件 的 跨 系 统 传 递 性 TT 嵌 入 技 术 解 决 了 跨 系 统 间 的 文 件 和 字 体 的 一 致 性 问 题 在 应 用 程 序 中, 存 盘 的 文 件 可 将 文 件 中 使 用 的 所 有 TT 字 体 采 用 嵌 入 方 式 一 并 存 入 文 件 使 整 个 文 件 及 其 所 使 用 的 字 体 可 方 便 地 传 递 到 其 他 计 算 机 的 同 一 系 统 中 使 用 字 体 嵌 入 技 术 保 证 了 接 收 该 文 件 的 计 算 机 即 使 未 安 装 所 传 送 文 件 使 用 的 字 体, 也 可 通 过 装 载 随 文 件 一 同 嵌 入 的 TT 字 体 来 对 文 件 进 行 保 持 原 格 式, 使 用 原 字 体 进 行 打 印 和 修 改 (3) 操 作 系 统 平 台 的 兼 容 性 Mac 和 Windows 平 台 均 提 供 系 统 级 的 TT 支 持 所 以 在 不 同 操 作 系 统 平 台 间 的 同 名 应 用 程 序 文 件 有 跨 平 台 兼 容 性 如 Mac 机 上 的 PageMaker 可 以 使 用 在 如 果 已 安 装 了 文 件 中 所 用 的 所 有 TT 字 体, 则 该 文 件 在 Mac 上 产 生 的 最 终 输 出 效 果 将 与 在 Windows 下 的 输 出 保 持 高 度 一 致 (4)ABC 字 宽 值 在 TT 字 体 中 的 每 个 字 符 都 有 其 各 自 的 字 宽 值,TT 所 用 的 字 宽 描 述 方 法 比 传 统 的 PS 的 Type 1 更 为 完 善 和 科 学 它 采 用 ABC 字 宽 表, 即 将 传 统 上 的 一 个 字 符 的 字 宽 值 划 分 为 三 部 分 : A 宽 度 为 在 放 置 字 符 轮 廓 前 的 空 白 间 距, B 宽 度 为 字 符 轮 廓 本 身 的 间 距, C 为 字 符 轮 廓 右 方 的 空 白 间 距 A+B+C 即 相 当 于 传 统 的 字 宽 值, 同 时 A 或 C 间 距 可 以 分 别 为 负 值, 以 产 生 特 殊 的 排 字 效 果 采 用 ABC 字 宽 值 可 避 免 传 统 上 使 用 整 字 字 宽 值 而 引 起 的 累 积 舍 入 误 差 同 时 可 以 避 免 由 此 产 生 的 行 尾 的 最 后 一 个 字 符 移 至 下 一 行, 或 行 左 首 字 符 无 法 对 齐 等 输 出 时 不 可 预 料 的 后 果 排 版 应 用 程 序 在 计 算 一 行 的 累 积 字 宽 时 所 产 生 的 舍 入 误 差, 可 以 分 散 到 整 行 中 每 一 字 符 的 A 和 C 间 距 中, 保 证 了 断 行 的 高 度 准 确 性 和 用 户 定 义 的 左 右 边 界 尺 寸

第 3 章 数 据 在 计 算 机 中 的 表 示 61 的 精 确 性 在 Windows 98 以 上 系 统 中, 系 统 使 用 得 最 多 的 就 是 *.TTF(True Type) 轮 廓 字 库 文 件, 它 既 能 显 示 也 能 打 印, 并 且 支 持 无 极 变 倍, 在 任 何 情 况 下 都 不 会 出 现 锯 齿 问 题 而 *.FOT 则 是 与 *.TTF 文 件 对 应 的 字 体 资 源 文 件, 它 是 TTF 字 体 文 件 的 资 源 指 针, 指 明 了 系 统 所 使 用 的 TTF 文 件 的 具 体 位 置, 而 不 用 必 须 指 定 到 FONTS 文 件 夹 中 *.FNT( 矢 量 字 库 ) 和 *.FON( 显 示 字 库 ) 的 应 用 范 围 都 比 较 广 泛 另 外, 那 些 使 用 过 老 版 本 的 WPS 的 用 户 可 能 对 *.PS 文 件 还 有 一 定 的 印 象,*.PS 实 际 上 是 DOS 下 轮 廓 字 库 的 一 种 形 式, 其 性 能 与 *.TTF 基 本 类 似, 采 用 某 些 特 殊 方 法 之 后, 我 们 甚 至 还 可 以 实 现 在 Windows 中 直 接 使 用 这 些 *.PS 字 库 (*.PS1 *.PS2 都 是 PS 字 库 ) 点 阵 字 形 与 矢 量 字 形 的 区 别 是 : 点 阵 字 形 编 码 存 储 方 式 简 单, 显 示 和 打 印 汉 字 时 不 需 要 转 换, 直 接 在 字 库 中 取 字 形 输 出 即 可, 但 字 形 放 大 后 产 生 的 效 果 差, 而 且 同 一 种 字 体 不 同 的 点 阵 需 要 不 同 的 汉 字 库 矢 量 字 形 正 好 与 前 者 相 反 5. 汉 字 地 址 码 每 个 汉 字 字 形 码 在 汉 字 字 库 中 的 相 对 位 移 地 址 称 为 汉 字 地 址 码 需 要 向 输 出 设 备 输 出 汉 字 时, 必 须 通 过 地 址 码, 才 能 在 汉 字 字 库 中 找 到 所 需 要 的 汉 字 字 形 码 位 置, 取 出 所 需 要 的 字 形, 最 终 在 输 出 设 备 上 形 成 可 见 的 汉 字 字 形 为 了 能 快 速 地 找 到 所 需 要 的 汉 字 字 形 码, 地 址 码 和 机 内 码 要 有 简 明 的 对 应 转 换 关 系 综 上 所 述, 在 一 个 汉 字 处 理 系 统 中, 输 入 内 部 处 理 和 输 出 汉 字, 对 汉 字 的 编 码 要 求 也 不 一 样, 因 此 要 进 行 一 系 列 的 汉 字 编 码 及 转 换 汉 字 信 息 处 理 中 各 编 码 及 流 程 如 图 3 6 所 示 汉 字 输 入 输 入 码 国 际 码 机 内 码 地 址 码 字 形 码 汉 字 输 出 图 3 6 汉 字 信 息 处 理 系 统 模 型 6. 其 他 汉 字 编 码 除 GB 码 外, 目 前 常 用 的 还 有 :UCS 码 Unicode 码 GBK Big 5 码 等 (1)UCS 码 为 了 统 一 表 示 世 界 各 国 各 地 区 的 文 字, 便 于 全 球 范 围 的 信 息 交 流,1993 年, 国 际 标 准 化 组 织 公 布 了 名 为 通 用 多 八 位 编 码 字 集 的 国 际 标 准 ISO/IEC 10646 (Universal Multiple Octet Coded Character Set,UCS) UCS 为 世 界 上 正 在 使 用 的 各 种 文 字, 规 定 了 统 一 的 编 码 方 案, 为 多 文 种 的 信 息 交 换 和 信 息 处 理 创 造 了 基 本 条 件 UCS 是 所 有 其 他 字 符 集 标 准 的 一 个 超 集 它 保 证 与 其 他 字 符 集 是 双 向 兼 容 的, 也 就 是 说, 如 果 将 任 何 文 本 字 符 串 翻 译 到 UCS 格 式, 然 后 再 翻 译 回 原 编 码, 不 会 丢 失 任 何 信 息 UCS 整 个 字 符 集 可 以 容 纳 128 组, 每 组 有 256 个 平 面, 每 个 平 面 有 256 行, 每 行 有 256 个 字 位, 这 样 大 的 空 间 完 全 包 容 世 界 上 的 所 有 文 字 全 世 界 的 字 符 在 UCS 中 用 4 个 字 节 ( 组 号 平 面 号 行 号 和 字 位 号 ) 唯 一 地 表 示 第 一 个 平 面 (00 组 中 的 00 平 面 ) 称 为 基 本 多 文 种 平 面 (BMP) 它 包 含 字 母 文 字 音 节 文 字 和 表 意 文 字 等 它 分 为 四 个 区 :A I O R

62 大 学 计 算 机 基 础 面 向 计 算 思 维 A 区 :19903 个 字 位, 用 于 字 母 文 字 音 节 文 字 和 各 种 符 号 ; I 区 : 20992 个 字 位, 用 于 中 日 韩 (CJK) 统 一 的 表 意 文 字 ; O 区 :16384 个 字 位, 留 于 未 来 标 准 化 用 R 区 :8190 个 字 位, 作 为 基 本 多 文 种 平 面 的 限 制 使 用 区, 它 包 括 专 用 字 符 兼 容 字 符 等 例 如,ASCII 码 字 符 A, 它 的 ASCII 码 为 41H, 它 在 UCS 中 的 编 码 为 00000041H 汉 字 大, 它 在 GB2312 中 编 码 为 3473H, 它 在 UCS 中 的 编 码 为 00005927H UCS 的 实 际 表 现 形 式 为 UTF 8/UTF 16/UFT 32 编 码 (2)Unicode 码 Unicode 是 另 一 个 国 际 编 码 标 准, 采 用 双 字 节 表 示 世 界 上 的 主 要 文 字, 其 字 符 集 与 UCS 的 BMP 相 同 内 容 包 含 符 号 6811 个 汉 字 20902 个 ( 其 中 : 大 陆 提 出 的 汉 字 17124 个, 台 湾 提 出 的 汉 字 17258 个, 并 集 后 共 提 出 的 汉 字 为 20158 个, 未 提 出 字 符 共 744 个 ) 韩 文 拼 音 11172 个, 造 字 区 6400 个, 保 留 20249 个, 共 计 65534 个 由 于 UCS 中 每 个 字 符 需 要 用 4 个 字 节 表 示, 消 耗 的 存 储 空 间 也 就 多 事 实 上 全 世 界 正 在 使 用 的 各 种 文 字, 经 常 使 用 的 只 是 其 中 的 一 部 分, 其 数 量 不 足 65536(2 16 ), 因 此,UCS 字 符 集 中 最 前 面 一 部 分, 即 0 组 的 0 号 平 面 被 规 定 为 基 本 多 文 种 平 面 (BMP), 用 于 放 置 全 世 界 的 主 要 文 字 音 节 文 字 和 包 括 控 制 符 在 内 的 各 种 符 号 基 本 多 文 种 平 面 的 字 符, 其 4 字 节 代 码 的 前 2 字 节 都 是 0, 在 绝 大 多 数 应 用 场 合, 可 以 用 后 2 个 字 节 作 为 其 代 码 这 就 构 成 了 Unicode 代 码, 以 2 字 节 统 一 表 示 世 界 上 的 主 要 文 字, 得 到 越 来 越 广 泛 的 应 用 支 持 Unicode 编 码 的 相 关 电 脑 系 统 软 件, 如 UNIX Windows 已 有 推 出, 但 是 由 于 Unicode 的 ASCII 码 是 用 双 字 节 编 码 ( 即 一 般 电 脑 系 统 中 的 单 字 节 ASCII 码 前 加 0x00), 同 时 其 汉 字 编 码 与 各 国 的 现 有 编 码 也 不 兼 容, 造 成 现 有 的 软 件 和 数 据 不 能 直 接 使 用, 所 以 目 前 完 全 使 用 Unicode 软 件 系 统 的 用 户 并 不 多, 大 多 数 只 将 它 作 为 一 个 国 际 语 言 编 码 标 准 来 使 用 (3)GBK 码 GBK 全 称 汉 字 内 码 扩 展 规 范 (GBK 即 国 标 扩 展 汉 语 拼 音 的 第 一 个 字 母, 英 文 名 称 :Chinese Internal Code Specification), 中 华 人 民 共 和 国 全 国 信 息 技 术 标 准 化 技 术 委 员 会 于 1995 年 12 月 1 日 制 订, 国 家 技 术 监 督 局 标 准 化 司 电 子 工 业 部 科 技 与 质 量 监 督 司 于 1995 年 12 月 15 日 联 合 以 技 监 标 函 1995 229 号 文 件 的 形 式, 将 它 确 定 为 技 术 规 范 指 导 性 文 件 这 一 版 的 GBK 规 范 为 1.0 版 GBK 向 下 与 GB 2312 编 码 兼 容, 向 上 支 持 ISO 10646.1 国 际 标 准, 是 前 者 向 后 者 过 渡 过 程 中 的 一 个 承 上 启 下 的 产 物 我 国 1993 年 发 布 的 GB 13000.1 国 家 标 准 等 同 于 UCS GBK 编 码 是 在 GB2312-80 标 准 基 础 上 的 内 码 扩 展 规 范, 使 用 了 双 字 节 编 码 方 案, 其 编 码 范 围 从 8140 至 FEFE( 剔 除 xx7f), 共 23940 个 码 位, 收 录 了 21003 个 汉 字,882 个 符 号, 共 计 21885 个 字 符 完 全 兼 容 GB2312-80 标 准, 支 持 国 际 标 准 ISO/IEC10646-1 和 国 家 标 准 GB13000-1 中 的 全 部 中 日 韩 汉 字, 并 包 含 了 Big 5 编 码 中 的 所 有 汉 字 目 前 中 文 版 的 Windows 等 都 支 持 GBK 编 码 方 案 全 拼 紫 光 拼 音 等 输 入 法, 能 够 录 入 如 镕 镕 炁 夬 喆 嚞 姤 赟 龑 昳 堃 慜 靕 臹 等 GBK 简 繁 体 汉 字 (4)Big 5 码 Big 是 在 1984 年 由 中 国 台 湾 地 区 13 家 厂 商 与 台 湾 地 区 财 团 法 人 信 息 工 业 策 进 会 为 五 大 中

第 3 章 数 据 在 计 算 机 中 的 表 示 63 文 套 装 软 件 ( 宏 碁 神 通 佳 佳 零 壹 大 众 ) 所 设 计 的 中 文 内 码, 所 以 就 称 为 Big 5 中 文 内 码, 虽 然 五 大 套 装 软 件 并 没 有 成 功, 但 Big 5 码 却 深 远 地 影 响 了 中 文 电 脑 内 码, 直 至 今 日 五 大 码 的 英 文 名 称 Big 5 后 来 被 人 按 英 文 字 序 译 回 中 文, 以 致 现 在 有 五 大 码 和 大 五 码 两 个 中 文 名 称 Big 5 码, 是 通 行 于 中 国 台 湾 香 港 地 区 的 一 个 繁 体 字 编 码 方 案 大 五 码 是 使 用 繁 体 中 文 社 群 中 最 常 用 的 电 脑 汉 字 字 符 集 标 准, 共 收 录 13060 个 中 文 字 Big 5 虽 普 及 于 中 国 的 台 湾 香 港 与 澳 门 等 繁 体 中 文 通 行 区, 但 长 期 以 来 并 非 当 地 的 国 家 标 准, 而 只 是 业 界 标 准 倚 天 中 文 系 统 Windows 等 主 要 系 统 的 字 符 集 都 是 以 Big 5 为 基 准, 但 厂 商 又 各 自 增 删, 衍 生 出 多 种 不 同 版 本 2003 年,Big 5 被 收 录 到 台 湾 官 方 标 准 的 附 录 当 中, 取 得 了 较 正 式 的 地 位 这 个 最 新 版 本 被 称 为 Big 5-2003 (5) 关 于 汉 字 编 码 为 进 行 信 息 交 换, 各 汉 字 使 用 地 区 都 制 订 了 一 系 列 汉 字 字 符 集 标 准 1)GB2312-80 字 符 集, 收 入 6763 个 汉 字,682 个 符 号, 共 计 7445 个 字 符 这 个 字 符 集 是 我 国 中 文 信 息 处 理 技 术 的 发 展 基 础, 也 是 目 前 国 内 所 有 汉 字 系 统 的 统 一 基 础 标 准 2)GB2313 字 符 集, 收 入 汉 字 6763 个, 符 号 715 个, 总 计 7478 个 字 符, 这 是 大 陆 普 遍 使 用 的 简 体 字 符 集 楷 体 GB2313 仿 宋 GB2313 华 文 行 楷 等 市 面 上 绝 大 多 数 字 体 支 持 显 示 这 个 字 符 集, 亦 是 大 多 数 输 入 法 所 采 用 的 字 符 集 市 面 上 绝 大 多 数 所 谓 的 繁 体 字 体, 其 实 采 用 的 是 GB 2313 字 符 集 简 体 字 的 编 码, 用 字 体 显 示 为 繁 体 字, 而 不 是 直 接 用 GBK 字 符 集 中 繁 体 字 的 编 码, 错 误 百 出 3)BIG 5 字 符 集, 收 入 13060 个 繁 体 汉 字,808 个 符 号, 总 计 13868 个 字 符, 目 前 普 遍 使 用 于 中 国 的 台 湾 香 港 等 地 区 台 湾 教 育 部 标 准 宋 体 楷 体 等 港 台 大 多 数 字 体 支 持 这 个 字 符 集 的 显 示 4)GBK 字 符 集, 又 称 大 字 符 集 (GB=GuóBiāo 国 标,K= 扩 展 ), 包 含 以 上 两 种 字 符 集 汉 字, 收 入 21003 个 汉 字, 882 个 符 号, 共 计 21885 个 字 符, 包 括 了 中 日 韩 (CJK) 统 一 汉 字 20902 个 扩 展 A 集 (CJK Ext A) 中 的 汉 字 52 个 Windows 95\98 简 体 中 文 版 就 带 有 这 个 GBK.txt 文 件 宋 体 隶 书 黑 体 幼 圆 华 文 中 宋 华 文 细 黑 华 文 楷 体 标 楷 体 (DFKai SB) Arial Unicode MS MingLiU PMingLiU 等 字 体 支 持 显 示 这 个 字 符 集 Big 5( 繁 体 中 文 ) 与 GB2313( 简 体 中 文 ) 编 码 不 相 兼 容, 字 符 在 不 同 的 操 作 系 统 中 会 产 生 乱 码 文 本 文 字 的 简 体 与 繁 体 ( 文 字 及 编 码 ) 之 间 的 转 换, 可 用 BabelPad TextPro 或 Convertz 之 类 的 转 码 软 件 来 解 决 若 是 程 序, 如 Windows XP 操 作 系 统, 可 用 Microsoft AppLocale Utility 1.0 解 决 ;Windows 2000 的 操 作 系 统, 可 用 : 中 文 之 星 四 通 利 方 南 极 星 金 山 快 译 之 类 的 转 码 软 件 解 决 5)GB18030 字 符 集, 是 我 国 继 GB2312-1980 和 GB13000.1-1993 之 后 最 重 要 的 汉 字 编 码 标 准, 是 我 国 计 算 机 系 统 必 须 遵 循 的 基 础 性 标 准 之 一 GB18030 有 两 个 版 本 :GB18030-2000 和 GB18030-2005 GB18030-2000 是 GBK 的 取 代 版 本, 它 的 主 要 特 点 是 在 GBK 基 础 上 增 加 了 CJK 统 一 汉 字 扩 充 A 的 汉 字 GB18030-2005 的 主 要 特 点 是 在 GB18030-2000 基 础 上 增 加 了 CJK 统 一 汉 字 扩 充 B 的 汉 字 它 还 去 掉 了 单 字 节 编 码 的 欧 元 符 号 80H GB18030 有 1611668 个 码 位, 在 GB18030-2005 中 定 义 了 76556 个 字 符 随 着 我 国 汉 字

64 大 学 计 算 机 基 础 面 向 计 算 思 维 整 理 和 编 码 研 究 工 作 的 不 断 深 入, 以 及 国 际 标 准 ISO/IEC 10646 的 不 断 发 展,GB18030 所 收 录 的 字 符 将 在 新 版 本 中 增 加 6) 方 正 超 大 字 符 集, 包 含 GB18030 字 符 集 CJK Ext B 中 的 36862 个 汉 字, 共 计 64395 个 汉 字 宋 体 方 正 超 大 字 符 集 支 持 这 个 字 符 集 的 显 示 Microsoft Office XP 或 2003 简 体 中 文 版 就 自 带 这 个 字 体 Windows 2000 的 操 作 系 统 需 安 装 超 大 字 符 集 支 持 包 Surrogate 更 新 7)ISO/IEC 10646 / Unicode 字 符 集, 这 是 全 球 可 以 共 享 的 编 码 字 符 集, 两 者 相 互 兼 融, 涵 盖 了 世 界 上 主 要 语 文 的 字 符, 其 中 包 括 简 繁 体 汉 字, 计 有 : CJK 统 一 汉 字 20902 个, CJK Ext A 6582 个,Ext B 42711 个, 共 计 70195 个 汉 字 SimSun ExtB( 宋 体 ) MingLiU ExtB( 细 明 体 ) 能 显 示 全 部 Ext B 汉 字 至 今 尚 无 单 独 一 款 字 体 能 够 显 示 全 部 70195 个 汉 字, 但 可 用 海 峰 五 笔 新 概 念 五 笔 仓 颉 输 入 法 世 纪 版 新 版 的 微 软 新 注 音 仓 颉 输 入 法 6.0 版 ( 单 码 功 能 ) 等 输 入 法 录 入 Ext C 还 有 2 万 多 个 汉 字 详 情 请 参 阅 香 港 中 文 大 学 网 站 马 来 西 亚 仓 颉 之 友 网 站 福 建 陈 清 钰 个 人 网 站 8) 汉 字 构 形 数 据 库 2.3 版, 内 含 楷 书 字 形 60082 个 小 篆 11100 个 楚 系 简 帛 文 字 2627 个 金 文 3459 个 甲 骨 文 177 个 异 体 字 12768 组 可 以 安 装 该 程 序, 亦 可 以 解 压 后 使 用 其 中 的 字 体 文 件, 对 于 整 理 某 些 古 代 文 献 十 分 有 用 如 果 超 出 了 输 入 法 所 支 持 的 字 符 集, 就 不 能 录 入 计 算 机 如 果 没 有 相 应 字 体 的 支 持, 则 显 示 为 黑 框 方 框 或 空 白 如 果 操 作 系 统 或 应 用 软 件 不 支 持 该 字 符 集, 则 显 示 为 问 号 ( 一 个 或 两 个 ) 在 网 页 上 亦 存 在 同 样 的 情 况 3.4 图 形 和 图 像 在 计 算 机 中 的 表 示 3.4.1 图 形 在 计 算 机 中 的 表 示 1. 图 形 在 计 算 机 中 图 形 和 图 像 是 两 个 不 同 的 概 念 图 形 一 般 是 指 通 过 绘 图 软 件 绘 制 的 由 直 线 圆 圆 弧 矩 形 任 意 曲 线 等 几 何 图 形 组 成 的 画 面 2. 图 形 在 计 算 机 中 的 表 示 图 形 是 一 种 矢 量 图 矢 量 图 是 用 数 学 的 方 式 来 描 述 一 幅 图 形 矢 量 图 形 的 描 述 包 括 形 状 色 彩 位 置 等 矢 量 图 形 本 身 就 用 数 字 化 形 式 来 表 述 图 形 的 最 大 优 点 在 于 可 以 分 别 控 制 处 理 图 中 的 各 个 部 分, 如 在 屏 幕 上 移 动 旋 转 放 大 缩 小 而 不 失 真, 不 同 的 物 体 还 可 以 在 屏 幕 上 重 叠 并 保 持 各 自 的 特 性, 必 要 时 仍 可 分 开 但 对 于 一 幅 复 杂 的 彩 色 照 片, 很 难 用 数 学 来 描 述, 因 此 也 难 以 用 矢 量 图 来 表 示 3.4.2 图 像 在 计 算 机 中 的 表 示 1. 图 像 图 像 是 由 扫 描 仪 照 像 机 摄 像 机 等 输 入 的 画 面 形 一 般 是 指 通 过 绘 图 软 件 绘 制 的 由 直 线 圆 圆 弧 矩 形 任 意 曲 线 等 几 何 图 形 组 成 的 画 面 2. 静 态 图 像 在 计 算 机 中 的 表 示 自 然 景 物 成 像 后 可 以 复 制 成 照 片 录 像 带 进 行 保 存, 这 样 的 图 像 称 为 模 拟 图 像 它 们 是

第 3 章 数 据 在 计 算 机 中 的 表 示 65 连 续 的, 不 能 直 接 用 计 算 机 进 行 处 理, 还 需 要 进 一 步 转 化 处 理 静 态 图 像 在 计 算 机 中 是 用 位 图 来 表 示 的, 位 图 也 叫 点 阵 图 像, 是 由 若 干 个 排 列 成 行 列 的 点 构 成, 这 些 点 称 为 像 素 (Pixels), 用 以 描 述 图 像 中 各 点 的 明 暗 强 度 与 颜 色 每 个 像 素 点 的 亮 度 和 颜 色 信 息 用 若 干 数 据 位 来 表 示, 这 些 数 据 位 的 个 数 称 为 图 像 的 颜 色 深 度 或 灰 度 级 图 像 的 数 字 化 就 是 将 模 拟 图 像 转 化 成 位 图 的 过 程, 通 常 包 括 采 样 和 量 化 采 样 就 是 将 连 续 的 模 拟 图 像 变 换 成 离 散 点 的 操 作 过 程 在 这 个 过 程 中, 采 样 间 隔 是 个 重 要 参 数, 它 决 定 了 在 一 定 的 面 积 内 取 多 少 个 像 素 点 在 同 等 面 积 内, 像 素 点 数 越 多, 分 辨 率 就 越 高, 图 像 质 量 越 好 采 样 后, 图 像 成 为 离 散 的 像 素 点, 但 其 灰 度 仍 是 连 续 的 还 需 要 将 像 素 的 灰 度 转 换 成 离 散 的 整 数 值, 即 量 化 若 一 幅 数 字 图 像 的 量 化 灰 度 级 为 8 bit, 就 可 以 有 2 8 =256 个 灰 度 级 差 颜 色 深 度 与 显 示 的 颜 色 数 目 之 间 的 关 系 如 表 3 4 所 示 表 3 4 颜 色 深 度 与 显 示 的 颜 色 数 目 之 间 的 关 系 颜 色 深 度 (bit) 颜 色 总 数 图 像 名 称 1 2(2 1 ) 单 色 图 像 ( 黑 白 二 色 ) 4 16(2 4 ) 索 引 16 色 图 像 8 256(2 8 ) 索 引 256 色 图 像 16 65536(2 16 ) HI Color 图 像 ( 实 际 只 显 示 32768 种 颜 色 ) 24 16777216(2 24 ) True Color 图 像 ( 真 彩 色 ) 图 像 的 分 辨 率 越 高 颜 色 深 度 越 深, 则 数 字 化 后 的 图 像 效 果 越 逼 真, 图 像 数 据 量 也 越 大 但 是, 经 采 样 量 化 形 成 的 图 像 丢 掉 了 部 分 数 据, 与 模 拟 图 像 必 然 有 一 定 的 差 距 但 这 个 差 距 通 常 控 制 得 相 当 小, 以 至 人 的 肉 眼 难 以 分 辨, 人 们 可 以 将 数 字 化 图 像 等 同 于 模 拟 图 像 3. 动 画 和 视 频 动 画 和 视 频 是 图 形 和 图 像 的 动 态 形 式 动 态 图 像 是 由 一 系 列 的 静 态 画 面 按 一 定 的 顺 序 排 列 组 成, 并 配 以 同 步 的 声 音 每 一 个 静 态 画 面 称 为 一 帧, 当 每 秒 以 24 帧 的 速 度 播 放 时, 由 于 视 觉 的 暂 留 现 象 产 生 动 态 效 果 动 态 的 图 像 有 动 画 和 视 频 两 种 方 式 动 画 的 每 一 幅 画 面 是 通 过 工 具 软 件 ( 如 Flash 等 ) 对 图 像 素 材 进 行 编 辑 制 作 而 成 ; 而 视 频 影 像 是 对 信 号 源 ( 如 电 视 机 摄 像 机 等 ) 进 行 采 样 和 量 化 后 制 作 而 成 动 画 是 用 人 工 合 成 的 方 法 对 真 实 世 界 的 一 种 模 拟, 而 视 频 影 像 则 是 对 真 实 世 界 的 记 录 4. 图 像 压 缩 技 术 随 着 数 字 化 时 代 的 发 展, 需 要 存 储 传 输 和 处 理 的 信 息 的 数 量 成 指 数 级 地 增 加 图 像 作 为 数 字 信 息 的 重 要 组 成 部 分, 是 信 息 交 流 的 重 要 载 体, 也 是 蕴 含 信 息 量 最 大 的 媒 体 因 此 图 像 压 缩 作 为 图 像 处 理 的 一 个 重 要 组 成 部 分, 一 直 是 人 们 研 究 的 一 个 热 点 (1) 图 像 压 缩 的 基 本 原 理 图 像 数 据 之 所 以 能 被 压 缩, 就 是 因 为 数 据 中 存 在 着 冗 余 图 像 数 据 的 冗 余 主 要 表 现 为 : 图 像 中 相 邻 像 素 间 的 相 关 性 引 起 的 空 间 冗 余 ; 图 像 序 列 中 不 同 帧 之 间 存 在 相 关 性 引 起 的 时 间 冗 余 ; 不 同 彩 色 平 面 或 频 谱 带 的 相 关 性 引 起 的 频 谱 冗 余 数 据 压 缩 的 目 的 就 是 通 过 去 除 这 些 数 据 冗 余 来 减 少 表 示 数 据 所 需 的 比 特 数 由 于 图 像 数 据 量 的 庞 大, 在 存 储 传 输 处 理 时 非 常 困 难,

66 大 学 计 算 机 基 础 面 向 计 算 思 维 因 此 图 像 数 据 的 压 缩 就 显 得 非 常 重 要 信 息 时 代 带 来 了 信 息 爆 炸, 使 数 据 量 大 增, 因 此, 无 论 传 输 或 存 储 都 需 要 对 数 据 进 行 有 效 的 压 缩 在 遥 感 技 术 中, 各 种 航 天 探 测 器 采 用 压 缩 编 码 技 术, 将 获 取 的 巨 大 信 息 送 回 地 面 图 像 压 缩 是 数 据 压 缩 技 术 在 数 字 图 像 上 的 应 用, 它 的 目 的 是 减 少 图 像 数 据 中 的 冗 余 信 息 从 而 用 更 加 高 效 的 格 式 存 储 和 传 输 数 据 (2) 图 像 压 缩 基 本 方 法 图 像 压 缩 可 以 是 有 损 数 据 压 缩 也 可 以 是 无 损 数 据 压 缩 对 于 如 绘 制 的 技 术 图 图 表 或 者 漫 画 优 先 使 用 无 损 压 缩, 这 是 因 为 有 损 压 缩 方 法, 尤 其 是 在 低 的 位 速 条 件 下 将 会 带 来 压 缩 失 真 如 医 疗 图 像 或 者 用 于 存 档 的 扫 描 图 像 等 这 些 有 价 值 的 内 容 的 压 缩 也 尽 量 选 择 无 损 压 缩 方 法 有 损 方 法 非 常 适 合 于 自 然 的 图 像, 例 如 一 些 应 用 中 图 像 的 微 小 损 失 是 可 以 接 受 的 ( 有 时 是 无 法 感 知 的 ), 这 样 就 可 以 大 幅 度 地 减 小 位 速 (3) 图 像 压 缩 的 标 准 经 典 的 视 频 压 缩 算 法 已 渐 形 成 一 系 列 的 国 际 标 准 体 系, 如 H.26x 系 列 建 议 H.320 系 列 建 议 JPEG 以 及 MPEG 系 列 等 标 准 格 式 (4) 衡 量 数 据 压 缩 技 术 的 重 要 指 标 压 缩 比, 即 压 缩 前 后 所 需 的 信 息 存 储 之 比 要 大 恢 复 效 果, 即 要 尽 可 能 恢 复 到 原 始 数 据 压 缩 解 压 速 度, 尤 其 解 压 速 度 更 为 重 要, 因 为 解 压 是 实 时 的 实 现 压 缩 的 软 硬 件 开 销 要 小 3.4.3 常 用 的 图 像 文 件 格 式 在 图 形 图 像 数 据 处 理 中, 可 用 于 图 形 图 像 文 件 存 储 的 格 式 很 多, 现 分 类 列 出 常 用 的 文 件 1. 静 态 图 像 格 式 (1)JPEG 格 式 JPEG 是 由 联 合 照 片 专 家 组 (Joint Photographic Experts Group) 开 发 的 它 既 是 一 种 文 件 格 式, 又 是 一 种 压 缩 技 术 JPEG 作 为 一 种 很 灵 活 的 格 式, 具 有 调 节 图 像 质 量 的 功 能, 允 许 用 不 同 的 压 缩 比 例 对 这 种 文 件 压 缩 作 为 先 进 的 压 缩 技 术, 它 用 有 损 压 缩 方 式 去 除 冗 余 的 图 像 和 彩 色 数 据, 在 获 取 极 高 的 压 缩 率 的 同 时 能 展 现 十 分 丰 富 生 动 的 图 像 JPEG 格 式 是 现 在 使 用 最 为 广 泛 的 格 式 之 一, 也 是 目 前 最 优 秀 的 数 字 化 摄 影 图 像 的 存 储 方 式,JPEG 还 是 万 维 网 中 图 像 处 理 时 使 用 的 主 要 文 件 格 式 之 一 (2)PSD 格 式 这 种 图 像 文 件 格 式 是 Photoshop 7.0 默 认 的 格 式 其 文 件 格 式 后 缀 为 PSD 和 PDD 它 是 由 Adobe 公 司 专 门 开 发 的 适 用 于 Photoshop ImageReady 的 图 像 格 式 它 支 持 从 BMP 到 CMYK 的 所 有 色 彩 模 型 类 型, 是 最 能 体 现 Photoshop 7.0 功 能 与 特 征 的 优 化 格 式 这 种 格 式 已 经 得 到 了 广 泛 的 应 用 它 支 持 Photoshop 7.0 特 有 的 一 些 图 像 信 息, 包 括 能 够 存 储 图 层 蒙 板 通 道 和 其 他 的 图 像 信 息, 而 且 这 种 格 式 的 文 件 是 进 行 了 压 缩 的, 其 压 缩 比 例 和 JPEG 差 不 多, 并 且 压 缩 后 不 失 真, 不 会 影 响 到 图 像 的 质 量

第 3 章 数 据 在 计 算 机 中 的 表 示 67 (3)BMP 格 式 BMP(Bitmap) 是 Windows 操 作 系 统 中 的 标 准 图 像 文 件 格 式 这 种 格 式 的 特 点 是 包 含 的 图 像 信 息 较 丰 富, 几 乎 不 进 行 压 缩, 但 文 件 占 用 了 较 大 的 存 储 空 间 BMP 格 式 支 持 RGB 索 引 颜 色 灰 度 和 位 图 颜 色 模 式 A 基 本 上 绝 大 多 数 图 像 处 理 软 件 都 支 持 此 格 式 在 Windows 系 统 中 系 统 所 用 的 大 部 分 图 像 都 是 以 该 格 式 保 存 的, 如 墙 纸 图 像 屏 幕 保 护 图 像 等 BMP 格 式 图 像 的 文 件 可 以 使 用 RLE(Run Length Encoding, 运 行 长 度 编 码 ) 的 无 损 压 缩 方 案 进 行 压 缩 (4)GIF 格 式 GIF(Graphics Interchange Format) 是 CompuServe 公 司 开 发 的 图 像 文 件 格 式, 采 用 了 压 缩 存 储 技 术 GIF 格 式 同 时 支 持 线 图 灰 度 和 索 引 图 像, 但 最 多 支 持 256 种 色 彩 的 图 像 GIF 格 式 的 特 点 是 压 缩 比 高, 磁 盘 空 间 占 用 较 少 下 载 速 度 快 GIF 文 件 内 部 分 成 许 多 存 储 块, 用 来 存 储 多 幅 图 像 或 者 是 决 定 图 像 表 现 行 为 的 控 制 块, 用 以 实 现 动 画 和 交 互 式 应 用 2. 动 态 图 像 格 式 数 字 化 视 频 的 数 据 量 巨 大, 通 常 采 用 特 定 的 压 缩 算 法 对 数 据 进 行 压 缩, 根 据 压 缩 算 法 的 不 同, 保 存 数 字 化 视 频 的 常 用 格 式 如 下 : (1)MPEG/MPG MPEG(Moving Picture Experts Group) 是 1988 年 成 立 的 一 个 专 家 组 1991 年 制 定 了 一 个 MPEG 1 国 际 标 准, 采 用 的 算 法 简 称 为 MPEG 算 法, 是 目 前 最 常 见 的 视 频 压 缩 方 式, 可 对 包 括 声 音 在 内 的 运 动 图 像 进 行 压 缩 最 大 压 缩 可 达 约 1:200, 用 该 算 法 压 缩 的 数 据 称 为 MPEG 数 据, 由 该 数 据 产 生 的 文 件 称 MPEG 文 件, 常 以 MPG 为 后 缀, 部 分 采 用 MPEG 格 式 压 缩 的 视 频 文 件 也 以 DAT 为 扩 展 名 (2)AVI AVI (Audio Video Interleaved) 是 一 种 音 频 视 像 交 叉 记 录 的 数 字 视 频 文 件 格 式 1992 年 初, Microsoft 公 司 推 出 了 AVI 技 术, 是 对 视 频 文 件 采 用 的 一 种 有 损 压 缩 方 式 在 AVI 文 件 中, 运 动 图 像 和 伴 音 数 据 是 以 交 替 的 方 式 进 行 存 储 的 这 种 组 织 数 据 的 方 式 使 得 读 取 视 频 数 据 流 时 能 更 有 效 地 从 存 储 媒 介 得 到 连 续 的 信 息 (3)MOV MOV 是 Apple( 苹 果 ) 公 司 创 立 的 一 种 视 频 格 式, 它 是 图 像 及 视 频 处 理 软 件 QuickTime 所 支 持 的 格 式, 在 很 长 的 一 段 时 间 里, 它 都 只 是 在 苹 果 公 司 的 Mac 机 上 存 在, 随 着 个 人 多 媒 体 电 脑 近 几 年 的 飞 速 普 及,Apple 公 司 不 失 时 机 地 推 出 了 QuickTime 的 Windows 版 本 QuickTime 能 够 通 过 Internet 提 供 实 时 的 数 字 化 信 息 流 工 作 流 与 文 件 回 放 功 能 (4)ASF ASF (Advanced Streaming Format) 是 微 软 公 司 推 出 的 高 级 流 媒 体 格 式, 也 是 一 个 在 Internet 上 实 时 传 播 多 媒 体 的 技 术 标 准 由 于 它 使 用 了 MPEG 4 的 压 缩 算 法, 所 以 压 缩 率 和 图 像 的 质 量 都 很 不 错 它 应 用 的 主 要 部 件 是 NetShow 服 务 器 和 NetShow 播 放 器 将 媒 体 信 息 编 译 成 ASF 流 后, 发 送 到 NetShow 服 务 器, 再 由 NetShow 服 务 器 发 送 给 网 络 上 的 所 有 NetShow 播 放 器, 从 而 实 现 单 路 广 播 或 多 路 广 播 (5)RM RM 格 式 是 Real Networks 公 司 开 发 的 一 种 新 型 流 式 视 频 文 件 格 式, 又 称 Real Media, 是

68 大 学 计 算 机 基 础 面 向 计 算 思 维 目 前 Internet 上 最 流 行 的 跨 平 台 的 客 户 / 服 务 器 结 构 多 媒 体 应 用 标 准, 它 采 用 音 频 / 视 频 流 和 同 步 回 放 技 术, 实 现 了 网 上 全 带 宽 的 多 媒 体 回 放 RealPlayer 就 是 在 网 上 收 听 收 看 这 些 实 时 音 频 视 频 和 动 画 的 最 佳 工 具 只 要 用 户 的 线 路 允 许, 使 用 RealPlayer 可 以 不 必 下 载 完 音 频 / 视 频 内 容 就 能 实 现 网 络 在 线 播 放, 更 容 易 上 网 查 找 和 收 听 收 看 各 种 广 播 电 视 3.5 声 音 在 计 算 机 中 的 表 示 3.5.1 声 音 在 计 算 机 中 的 表 示 声 音 是 通 过 空 气 的 震 动 发 出, 通 常 用 模 拟 波 的 方 式 表 示 它 振 幅 反 映 声 音 的 音 量, 频 率 反 映 了 音 调 音 频 是 连 续 变 化 的 模 拟 信 号, 而 计 算 机 只 能 处 理 数 字 信 号, 要 使 计 算 机 能 处 理 音 频 信 号, 必 须 把 模 拟 音 频 信 号 转 换 成 用 0 1 表 示 的 数 字 信 号, 这 就 是 音 频 的 数 字 化, 将 模 拟 信 号 数 字 化, 会 涉 及 到 采 样 量 化 及 编 码 等 多 种 技 术 音 频 信 号 的 数 字 化 过 程 如 图 3 7 所 示 (a) 话 筒 录 音 (b) 音 频 信 号 采 样 (c) 采 样 信 号 量 化 (d) 音 频 文 件 图 3 7 音 频 信 号 的 数 字 化 过 程 每 隔 一 个 时 间 间 隔 在 模 拟 声 音 波 形 上 取 一 个 幅 度 值, 称 为 采 样, 采 样 频 率 是 指 一 秒 钟 内 采 样 的 次 数 采 样 频 率 越 高, 声 音 的 保 真 度 越 好 根 据 采 样 定 理, 采 样 频 率 应 不 低 于 声 音 信 号 最 高 频 率 的 两 倍 人 耳 能 听 到 声 音 的 频 率 范 围 大 约 为 20Hz~20 khz, 所 以 要 得 到 高 保 真 效 果, 采 样 频 率 应 大 于 40 khz 量 化 是 用 数 字 化 的 方 法 反 映 采 样 后 的 声 波 信 号 幅 度 值 的 大 小 量 化 时 采 用 的 二 进 制 数 的 位 数 称 为 量 化 位 数, 也 叫 采 样 精 度 或 采 样 位 数 它 决 定 了 模 拟 信 号 数 字 化 以 后 声 音 的 动 态 范 围 量 化 位 数 越 多, 音 效 也 就 越 好 采 样 时 的 量 化 是 通 过 声 卡 中 A/D 模 数 转 换 器 来 实 现 的 量 化 位 数 有 一 般 有 8 位 16 位 等 表 3 5 是 常 见 声 音 信 号 的 采 样 频 率 和 量 化 精 度 表 3 5 常 见 声 音 信 号 的 采 样 频 率 和 量 化 精 度 信 号 类 型 采 样 频 率 /khz 量 化 精 度 / 位 电 话 8 8 调 幅 广 播 11.025 8 调 频 广 播 22.05 16 数 字 激 光 唱 盘 44.1 16

第 3 章 数 据 在 计 算 机 中 的 表 示 69 经 过 量 化 后 得 到 的 数 字 信 息, 还 必 须 按 一 定 格 式 转 换 成 计 算 机 可 以 识 别 的 二 进 制 形 式, 才 能 在 计 算 机 中 保 存 用 二 进 制 形 式 表 示 量 化 值 的 过 程 称 为 编 码 3.5.2 声 音 文 件 格 式 数 字 音 频 信 息 在 计 算 机 中 是 以 文 件 的 形 式 保 存, 存 储 声 音 信 息 的 文 件 可 以 有 多 种 格 式, 如 WAV MIDI MP3 WMA 等 1.WAV 格 式 WAV 格 式 的 文 件 又 称 波 形 文 件, 是 用 不 同 的 采 样 率 对 声 音 的 模 拟 波 形 进 行 采 样 得 到 的 一 系 列 离 散 的 采 样 点, 以 不 同 的 量 化 位 数 (16 位 32 位 或 64 位 ) 把 这 些 采 样 点 的 值 转 换 成 二 进 制 数 得 到 的 WAV 是 数 字 音 频 技 术 中 最 常 用 的 格 式, 它 还 原 的 音 质 较 好, 被 称 为 无 损 的 音 乐, 但 所 需 存 储 空 间 较 大, 是 目 前 PC 机 上 广 为 流 行 的 声 音 文 件 格 式, 几 乎 所 有 的 音 频 编 辑 软 件 都 能 够 读 取 WAV 格 式 2.MIDI 格 式 MIDI 是 Musical Instrument Digital Interface( 乐 器 数 字 接 口 ) 的 缩 写 它 是 由 世 界 上 主 要 电 子 乐 器 制 造 厂 商 建 立 起 来 的 一 个 通 信 标 准, 并 于 1988 年 正 式 提 交 给 MIDI 制 造 商 协 会, 成 为 数 字 音 乐 的 一 个 国 际 标 准 MIDI 标 准 使 不 同 厂 家 生 产 的 电 子 合 成 乐 器 可 以 互 相 发 送 和 接 收 音 乐 数 据 MIDI 文 件 记 录 的 是 一 系 列 指 令 而 不 是 数 字 化 后 的 波 形 数 据, 所 以 它 占 用 存 储 空 间 比 Wav 文 件 要 小 很 多 一 个 MIDI 文 件 每 存 1 分 钟 的 音 乐 只 用 大 约 5~10KB 3.MPEG 格 式 MPEG 标 准 主 要 有 以 下 五 个,MPEG 1 MPEG 2 MPEG 4 MPEG 7 及 MPEG 21 等 该 专 家 组 建 于 1988 年, 专 门 负 责 为 CD 建 立 视 频 和 音 频 标 准, 而 成 员 都 是 视 频 音 频 及 系 统 领 域 的 技 术 专 家 及 后, 他 们 成 功 将 声 音 和 影 像 的 记 录 脱 离 了 传 统 的 模 拟 方 式, 建 立 了 ISO/IEC 1172 压 缩 编 码 标 准, 并 制 定 出 MPEG 格 式, 令 视 听 传 播 方 面 进 入 了 数 码 化 时 代 因 此, 大 家 现 时 泛 指 的 MPEG X 版 本, 就 是 由 ISO(International Organization for Standardization) 所 制 定 而 发 布 的 视 频 音 频 数 据 的 压 缩 标 准 MPEG 标 准 的 视 频 压 缩 编 码 技 术 主 要 利 用 了 具 有 运 动 补 偿 的 帧 间 压 缩 编 码 技 术 以 减 小 时 间 冗 余 度, 利 用 DCT 技 术 以 减 小 图 像 的 空 间 冗 余 度, 利 用 熵 编 码 则 在 信 息 表 示 方 面 减 小 了 统 计 冗 余 度 这 几 种 技 术 的 综 合 运 用, 大 大 增 强 了 压 缩 性 能 MPEG 3 是 对 MPEG Layer 3 的 简 称, 是 当 前 使 用 最 广 泛 的 数 字 化 声 音 格 式 其 技 术 采 用 MPEG Layer 3 标 准 对 WAVE 音 频 文 件 进 行 压 缩 而 成, 特 点 是 能 以 较 小 的 比 特 率 较 大 的 压 缩 率 达 到 近 乎 CD 音 质 MPEG 音 频 文 件 的 压 缩 是 一 种 有 损 压 缩, 其 压 缩 率 可 达 10:1~12:1, 由 于 其 文 件 尺 寸 小 音 质 好, 所 以 网 上 音 乐 大 量 使 用 MP3 格 式 4.WMA 格 式 WMA(Windows Media Audio) 是 微 软 自 己 开 发 的 Windows Media Audio 技 术 它 支 持 流 式 播 放 WMA 格 式 的 可 保 护 性 极 强, 甚 至 可 以 限 定 播 放 机 器 播 放 时 间 及 播 放 次 数, 具 有 相 当 的 版 权 保 护 能 力, 它 比 起 MP3 压 缩 技 术,WMA 无 论 从 技 术 性 能 ( 支 持 音 频 流 ) 还 是 压 缩 率 ( 比 MP3 高 一 倍 ) 都 超 过 了 MP3 格 式 用 它 来 制 作 接 近 CD 品 质 的 音 频 文 件, 其 体 积 仅 相 当 于 MP3 的 1/3