目录 第十二章 * 密度算符与熵 2 12.1 密度算符与量子力学原理.................... 3 12.1.1 期望值以及算符迹.................... 3 12.1.2 从量子纠缠态到混态................... 5 12.1.3 Bloch 球.......................... 10 12.1.4 哥本哈根诠释和多世界诠释............... 12 12.2 再谈密度算符与系综....................... 14 12.3 量子熵............................... 16 12.3.1 冯诺伊曼熵........................ 16 12.3.2 相对熵........................... 19 12.4 开放系统以及热力学第二定律.................. 22 12.4.1 开放系统的时间演化................... 22 12.4.2 热力学第二定律...................... 25 1
第十二章 * 密度算符与熵 陈童 本章讲述密度算符的概念和其含义 本章也将从一个更高的角度重新审视量子力学的基本原理, 并介绍量子力学的多世界诠释 本章随之系统讲述了冯诺伊曼熵和量子相对熵, 以及它们的各种性质 本章还会推导开放系统随着时间的演化方程, 并证明热力学第二定律 2
第十二章 * 密度算符与熵 3 12.1 密度算符与量子力学原理 前面章节研究的量子力学系统都是所谓的封闭完整系统, 也就是说, 我们忽略了系统与外界的相互作用, 并且我们研究的是整个系统而不是其中的一部分 但是, 现实中的系统总是从属于一个更大的系统, 是更大系统的一部分, 而不是全部 现实中的系统也总是会与外界环境甚至包括我们的仪器相互作用 如何描述这样的现实系统就是本节要解决的核心问题 通过对这一问题的讨论, 我们也得以从一个更高的视角来重新审视量子力学的基本原理 12.1.1 期望值以及算符迹 下面我们先作一些准备 测量与期望值在第二章关于量子力学基本原理的讨论中, 我们得出过一个重要公式 : 对某个物理量 A 多次重复实验测得的平均值 A 等于算符 A 在态上的期望值, 即 A = ψ A ψ, (12.1) ψ 为系统所处的量子态 我们也说过, 物理量 A 的测量值是相应算符 A 的本征值, 在单次实验中, 我们测得哪个值是随机的, 测得本征值 λ i 的概率为 p i = i ψ 2, 式中 i 为与本征值 λ i 相应的本征态 这样算出来的概率 p i 当然也可以通过重复多次实验来检验, 因此其计算公式应该也能写成期望值的形式, 的确, 假如定义投影算符 P i = i i, 则人们很容易验证 p i = ψ i i ψ = ψ P i ψ. (12.2) 因此, 不仅仅物理量的平均值, 而且物理量值的概率分布, 都可以表达成厄密算符期望值的形式 以上讨论告诉我们, 在量子力学中一切可以通过重复实验来进行检验的量都可以由一个适当厄密算符的期望值来计算, 假设这个厄密算符是 O, 习惯上, 人们常将这个期望值简记为 O, O = ψ O ψ. (12.3) 各种厄密算符的期望值就是我们能够从一个量子态中提取的所有信息
第十二章 * 密度算符与熵 4 算符求迹一个矩阵所有对角元的和称为矩阵的迹, 在幺正变换下矩阵的迹保持不变, 这使得我们可以将迹的概念推广到线性算符 对于一个线性算符 O, 我们记其迹为 Tr(O), 定义为 Tr(O) = i i O i, (12.4) 式中 { i } 为希尔伯特空间的一组正交归一矢量基 虽然为了计算算符的迹我们需要选取一个特定的表象, 但由于不同的表象之间只相差一个幺正变换, 所以算符的迹实际上并不依赖于表象 由此可以知道, 一个算符的迹就是它在任何一个表象中表示矩阵的迹, 特别的, 对于厄密算符, 我们可以将这个表象选为它的本征表象, 这时候算符的迹其实就是所有本征值的和 假设有两个算符 A 和 B, 读者容易证明算符迹满足如下等式 Tr(AB) = Tr(BA). (12.5) 不过, 值得说明的是, 对于无穷维希尔伯特空间, 并非所有算符的迹都是定义良好的, 因此在无穷维希尔伯特空间上应用 (12.5) 式时得特别小心, 有时候它并不成立 比方说, 对于坐标算符和动量算符的对易子来说, 如果简单地应用这个公式将会得出 Tr([X, P ]) = 0, 但实际上 Tr([X, P ]) = i Tr(1) 0 在这个例子中,(12.5) 式之所以不成立, 正是因为式中各算符的迹都不是良好定义的 利用算符的迹, 我们可以把算符的期望值公式重写成 ψ O ψ = Tr ( ψ ψ O ) = Tr ( ρ ψ O ). (12.6) 式中投影算符 ρ ψ = ψ ψ 要证明这个式子, 我们只需注意到 Tr ( ψ ψ O ) = i i ψ ψ O i = i ψ O i i ψ = ψ O ψ. 可见, 为了计算算符的期望值, 我们并不需要知道量子态 ψ, 而是只需要知道厄密算符 ρ ψ ψ 和 ρ ψ 的一个重要区别是, ψ 可以相差一个非物理的整体相位因子, 变成 e iθ ψ, 而 ρ ψ 在这种相位变换下不变, 也即是说, 它自动剔除了这一非物理的整体相位信息
第十二章 * 密度算符与熵 5 以上讨论告诉我们, 从一个量子系统中能够提取出来的所有物理信息都包含在 ρ ψ = ψ ψ 这一特殊厄密算符中 注意到 x ρ ψ x = x ψ 2 正好是概率密度 即是说,ρ ψ 在坐标表象中的对角元对应概率密度, 所以人们常常称 ρ ψ 为纯态密度算符, 它和狄拉克符号 ψ 表示的量子态是对应的, 这样的态也称为纯态 下面我们就是要将密度算符这一概念推广到更为一般的情形 12.1.2 从量子纠缠态到混态 密度算符的一般概念和这样的问题密切相关, 即对于一个由两部分组成的系统, 假设我们仅仅关心其中的一部分, 该如何描述我们所关心的对象? 这一小节我们就是要解决这个问题 一个例子不妨先看一个例子 假设我们有两个量子比特, 分别称作量子比特 A 和量子比特 B, 它们的希尔伯特分别为 H A 和 H B 假设 A, B 两者共同处在 ψ 态, ψ = c 0 00 + c 1 11. (12.7) 则我们很容易写出与这个态相应的纯态密度算符 ρ ψ = c 0 2 00 00 + c 1 2 11 11 + c 0 c 1 00 11 + c 1 c 0 11 00. (12.8) 我们称这个密度算符前面的两项为对角项, 后面的两项为非对角项 非对角项相应于通常所说的干涉项, 它描写了相互叠加的两个态之间的干涉 假设我们忽略 B 而仅仅只关心 A, 对 A 进行各种测量 比方说我们测量 A 的某个物理量 O A, 因此我们就要计算如下期望值, ( ) ψ O A ψ = Tr AB ρψ O A. (12.9) 式中 Tr AB 表示在整个系统的张量积希尔伯特空间 H A H B 上求迹 注意到 H A H B 的基矢量 ij AB = i A j B, i, j = 0, 1, 所以 Tr AB = Tr A Tr B, 式中 Tr A 和 Tr B 分别表示在 H A 和 H B 上求迹 由于 O A 只作用在 H A 上, 与 B 量子比特无关, 所以 Tr B 就直接作用在 ρ ψ 上, 得到 ρ A = Tr B (ρ ψ ) = c 0 2 0 0 + c 1 2 1 1. (12.10)
第十二章 * 密度算符与熵 6 这是一个只作用在 H A 上的厄密算符 而期望值公式 (12.9) 就变成 ( ) ψ O A ψ = Tr A ρa O A. (12.11) 以上讨论告诉我们, 如果仅仅只关心 A 量子比特, 那就无需知道 ψ, 只需知道 ρ A, 忽略 B 以后所有能从 A 量子比特提取出来的信息都包含在厄密算符 ρ A 中 我们称 ρ A 为 A 量子比特的密度算符, 当然它不是前面引入的纯态密度算符, 因为现在这个密度算符不能写成 ϕ A ϕ A 这样的形式, 我们称这种密度算符为混态密度算符, 简称混态 很明显,ρ A 满足 ( ) Tr A ρa = c0 2 + c 1 2 = 1. (12.12) 在这个例子中, 系统所处的 ψ = c 0 00 + c 1 11 态显然是一个纠缠态, 上面的推导过程告诉我们, 如果忽略 B 量子比特 ( 数学上就是将 ρ ψ 对 B 求迹, 称作 trace 掉 B), 我们将得到一个 A 的混态密度算符 ρ A, 称作 ρ ψ 在 A 上的约化密度算符 从 (12.10) 式可以看得很清楚, 在密度算符 ρ A 中, 量子比特 0 态与 1 态间的干涉项消失了, 这就叫做退相干 在这个例子中,A 的 0 态与 1 态退相干的原因有两个 : 首先,A 和 B 发生了量子纠缠, 其次, 我们忽略了 B 从 (12.10) 式还可以看到, 退相干的 A 量子比特对于忽略了 B 的我们来说, 完全可以看作是以 c 0 2 的概率处于 0 态, 以 c 1 2 的概率处于 1 态, 这分别对应 (12.10) 式中的 c 0 2 0 0 和 c 1 2 1 1 量子擦除 我们知道, 一个量子比特如果处在 + = ( 0 + 1 ) / 2 态, 那它 的 0 态和 1 态之间将会有干涉, 两者的相对位相可以观测, 通过对相 对位相的观测我们可以把 + 态和 = ( 0 1 ) / 2 态 100% 地区分开来 但是, 从前面的讨论中我们也知道, 如果将这个量子比特作为 A 与另一个 量子比特 B 纠缠起来, 使得 AB 整体处于 ϕ + = ( 00 + 11 ) / 2 = ( ++ + ) / 2 态, 那么当我们忽略 B 的时候,A 的 0 态和 1 态之间将会退相 ( ) ( ) 1 干, 这时候 A 将由混态密度算符 2 0 0 + 1 1 = 1 2 + + + 描述, 0, 1 之间的相对位相将会变得不可观测 这种不可观测是因为这时 候 A 量子比特取值是 0 还是 1 的信息通过与 B 的纠缠泄露出去了 但是, 假如我们不是完全忽略 B 的信息, 那就有一种方法可以恢 复 A 量子比特 0 态和 1 态之间的相干叠加性 这方法就是, 假设我们不
第十二章 * 密度算符与熵 7 是在 { 0, 1 } 基, 而是在 { +, } 基中观测 B 量子比特, 并根据观测结果 将所有的 A 量子比特分成 +, 两类 + 类 A 量子比特相应于对 B 的观测结果 是 +, 类 A 量子比特则相应于对 B 的观测结果是 那么这时候 + 类 A 量 子比特的 0, 1 态之间将是相干叠加的, 类也是如此 这是因为,AB 整 体的量子态是 ϕ + = ( + + + ) / 2, 因此当 B 的观测结果是 + 时, 对相应 A 量子比特的描述将不是混态密度算符 1 2( 0 0 + 1 1 ), 而是纯态 +, 同样, 当 B 的观测结果是 时, 对相应 A 量子比特的描述也是纯 态 当我们根据对 B 的观测结果将这两类 A 量子比特分开时, 它们各自 当然都是相干的 上面描述的这种恢复 A 量子比特相干性的方法就叫做量子擦除, 因 为无论对 B 的测量结果是 + 还是, 我们都得不到任何取值是 0 还是 1 的 信息 因此这种测量就从 B 量子比特中擦除了通过纠缠泄露出去的 A 取值 是 0 还是 1 的信息 两体纠缠的刻画 - 施密特分解 前面两量子比特的例子所揭示的量子纠缠态与子系统混态之间的联系 是一般性的, 为了看清楚这一点, 让我们更仔细地考察一下两体量子纠 缠 对于一个由 A B 两部分组成的系统, 假设这两部分的希尔伯特空间分 别为 H A 和 H B, 则任意量子态 ψ 必定可以写成 ψ = i A,i B ψ ia i B i A i B, (12.13) 式中 { i A } 和 { i B } 分别为 H A 和 H B 的正交归一矢量基 式中的叠加系数 ψ ia i B 有两个指标, 因此可以看成是一个矩阵, 根据矩阵的奇异值分解定理 1, ψ ia i B 必定可以分解成如下形式 ψ ia i B = a λ a u (a) i A v (a) i B, (12.14) 式中 u (a) i A 和 v (a) i B 分别满足正交归一条件 i A (u (a) i A ) u (b) i A = δ ab 和 i B (v (a) i B ) v (b) i B = δ ab, 并且我们总可以通过调节 u (a) i A 和 v (a) i B 之间的相对相位使得 λ a 0, 因此我们可以令 λ a = p a, p a 0 现在记 a A = i A u (a) i A i A, a B = 1 如果将这个矩阵看成是某个算符的表示矩阵, 那矩阵的奇异值分解定理其实就来源于 算符的奇异值分解定理
第十二章 * 密度算符与熵 8 i B v (a) i B i B, 则由 u (a) i A 和 v (a) i B 的正交归一性可以证明, a A 和 a B 分别正交归一, 即 A a b A = B a b B = δ ab 将 (12.14) 式代入 (12.13) 就可以得到 ψ = a pa a A a B. (12.15) 进一步利用 ψ 态的归一化条件, 容易得到 p a = 1. (12.16) a (12.15) 式就叫做两体系统量子态的施密特分解, 其中非零的 p a 数目就称作量子态的施密特数 显然, 斯密特数最小等于 1, 最大等于 H A 和 H B 维数中较小的那个 如果施密特数等于 1, 则由 (12.15) 式很容易看出, 这时候量子态 ψ 必定分解成 A, B 量子态乘积的形式, 反过来, 如果施密特数大于 1, 那就必定没有这样简单的分解, 从而 ψ 态就必定为一个纠缠态 即是说, ψ 不是纠缠态的充要条件是施密特数等于 1, 因此施密特数多少反映了两体纠缠的状况, 施密特数越大说明 A, B 纠缠得越厉害 密度算符与系综一个量子系统通常总是处于某个环境之中, 假设我们把系统看作 A, 把环境看作 B, 那么整个世界就可以看成是一个由 A, B 两部分组成的封闭完整系统, 其 A, B 两部分通常会纠缠起来 下面我们对整个世界的量子态应用施密特分解公式 (12.15), 我们记整个世界的密度算符为 ρ ψ = ψ ψ, 假设我们忽略 B 部分, 那就会得到 A 的约化密度算符 ρ A = Tr B (ρ ψ ), 我们从 A 中能够提取出来的所有信息都包含在 ρ A 中, 并可以通过计算算符期望 ( ) 值 Tr A ρa O A 来得到, 因此我们也称 ρ A 描写了子系统 A 的一个量子态, 只不过这个量子态不一定是纯态, 而可以是混态 由 (12.15) 式容易有 ρ A = a p a a A a. (12.17) 显然,ρ A 满足 Tr A ( ρa ) = a p a = 1 由于我们没有对 A 和 B 进行任何限制, 所以可以想见,(12.17) 应该能代表 A 的一个任意量子态 从 (12.17) 可以看 出, 施密特分解的 p a 刚好是密度算符 ρ A 的本征值, 施密特分解的 a A 则是
第十二章 * 密度算符与熵 9 相应的本征态 同样的, 我们也可以忽略 A 部分, 进而得到 B 部分的约化密 度算符 ρ B = Tr A (ρ ψ ), 为 ρ B = a p a a B a. (12.18) 如果原来 AB 整体的量子态 ψ 不是一个纠缠态, 也就是说施密特 数等于 1, 假设非零的 p a 为 a = 1 的 p 1, 则由于 a p a = 1, 必有 p 1 = 1, 由 (12.17) 和 (12.18) 的表达式可见, 这时候必有 ρ A = 1 A 1, ρ B = 1 B 1. (12.19) 显然这是两个纯态密度算符 反过来, 如果原来的 ψ 是一个纠缠态, 施密特数大于 1, 那 ρ A, ρ B 就是混态密度算符 所以整个完整系统 AB 的纠缠态和子系统 A 或者 B 的混态是相对应的 当然, 我们可以完全不提 B 部分, 直接定义一个系统的密度算符, 而不管它是否源于系统与环境的纠缠 一个系统的密度算符 ρ 包含了所有我们能从对这个系统的观测中提取出来的信息, 根据上面的讨论可以知道, 密度算符 ρ 应该满足如下性质 :1. 它是一个厄密算符 2. 它的本征值都大于等于 0, 为正定算符 3. Tr(ρ) = 1 有了密度算符以后, 对任何物理可观测量 O 期望值的计算就可以表达为 O = Tr(ρO). (12.20) 如果一个密度算符能够写成 ρ = ψ ψ 的形式, 就称为纯态密度算符, 它描述的系统状态就是纯态, 否则就是混态密度算符, 描述的状态就是混态 很显然, 纯态密度算符额外满足 ρ 2 = ρ. (12.21) 反过来, 如果一个密度算符额外满足上式, 则它的本征值必为 0 或 1, 由于密度算符所有本征值的和要等于 1, 因此它就必定能写成 ρ = ψ ψ 的形式 ( ψ 为 ρ 的本征态 ), 从而必为纯态密度算符 对于纯态密度算符, 我们必定有 Tr(ρ 2 ) = Tr(ρ) = 1. (12.22) 对于一个任意的密度算符 ρ, 我们必可以通过求解它的本征方程将它对角化成如下形式 ρ = a p a a a. (12.23)
第十二章 * 密度算符与熵 10 密度算符的正定性告诉我们 p a 0, Tr(ρ) = 1 的条件则告诉我们 a p a = 1, 所以 p a 1, 等号仅当 ρ 为纯态密度算符时才成立 因此, 对于混态密度算 符, 我们必有 Tr(ρ 2 ) = a p2 a < a p a = 1, 即对于混态密度算符, 必有 Tr(ρ 2 ) < 1. (12.24) 所有系统都可以看作某个更大的 AB 系统的 A 部分, 并且 (12.23) 的形式 以及前面关于施密特分解的知识进一步告诉我们, 所有的密度算符都可以 看成由这个更大系统的某个具有施密特分解 (12.15) 形式的纯态 ψ 通过忽 略 B 部分来得到,(12.15) 就称作密度算符 (12.23) 的纯化 然而, 密度算符的概念其实并不需要通过它的纯化来理解 密度算符 的 (12.23) 形式启发我们可以从系综的角度解释密度算符 也即是说, 我们 可以认为密度算符描述的是大量系统的集合, 其中每一个系统以概率 p a 处 于 a 态 这是因为, 这一系综中任何物理量 O 的期望值同样由下式给出 O = a p a a O a = Tr(ρO). (12.25) 密度算符的系综解释和纯化解释是有所不同的, 纯化解释可以用于单个系统, 而系综解释只适用于大量系统的系综 但是, 由于对任何物理量期望值的测量都需要多次重复实验, 这相当于引入了大量系统, 因此在实验上我们实际上无法区分密度算符的纯化解释和系综解释 不过, 根据系综解释, 我们可以将密度算符中出现的概率 p a 看成是源于我们对系统信息的缺失, 它造成了我们对系统的某种无知 在纯化解释中, 系统作为 A 部分与辅助的 B 纠缠成了一个整体, 在这个整体中 A 和 B 的 个性 都已经失去, 而 p a 所反映的信息缺失就源于我们对 B 部分的忽略 总之, 密度算符描述中包含了对系统的某种无知, 这种无知来源于对系统的信息缺失, 而系综诠释的好处是, 它允许这种信息缺失和纠缠无关, 任何信息缺失都可以对应于一个系综, 从而给出一个密度算符 然而, 如何量化密度算符中包含的无知呢? 这个问题我们后面再来讨论 12.1.3 Bloch 球 下面我们详细地讨论一下单个量子比特的密度算符 ρ 这时候希尔伯特空间是 2 维的, 为了具体起见我们可以将基矢量 { 0, 1 } 表示成 ( ) ( ) 1 0 0 = 1 =. (12.26) 0 1
第十二章 * 密度算符与熵 11 如此一来, 密度算符 ρ 就应该表示成一个 2 2 的厄密矩阵, 称为密度矩阵 但是, 任何 2 2 的厄密矩阵都可以用 {1, σ x, σ y, σ z } 这四个厄密矩阵展开为 ρ = 1(w 2 0 1 + w σ), 式中 {w 0, w} 均为实数 注意到泡利矩阵的迹为零, 则由 Tr(ρ) = 1 可知,w 0 = 1, 从而单个量子比特的密度矩阵 ρ 必定可以表示成如下形式 ρ(w) = 2( 1 ) 1 + w σ. (12.27) w 称为量子比特的极化矢量, 所以单量子比特的密度矩阵完全由其极化矢量刻画 另外, 容易算出 Tr(ρ 2 ) = 1(1 + 2 w2 ), 由 Tr(ρ 2 ) 1 可知 w 2 1, (12.28) 等号当且仅当 ρ(w) 为一个纯态密度矩阵时才成立 由上面的讨论可知, 单个量子比特的所有可能密度矩阵一一对应于 3 维极化矢量空间中的一个单位球体 w 2 1, 称为 Bloch 球, 这个球体的表面对应于单量子比特的可能纯态, 球内部分描写的当然就是混态 特别的, 在 Bloch 球体中心,w = 0 处的那个混态, 就是通常所谓的最大混态, 很显然, 它是 ρ(0) = 1 2 1 = 1 ) 0 0 + 1 1. (12.29) 2( 之所以说 ρ(w) 表达式中的 w 是极化矢量, 是因为, 假设将单量子比特看成电子自旋, 0 态看成自旋向上态, 1 态看成自旋向下态, 则我们可以计算 n 方向泡利算符 (n σ) 的期望值, 易得 (n σ) w = Tr((n σ)ρ(w)) = n w. (12.30) 这告诉我们,n 方向自旋期望值是矢量 w 在 n 方向上的投影, 可见 w 正好代表自旋极化 假设在单位球面上取一个单位矢量 n = (sin θ cos ϕ, sin θ sin ϕ, cos θ), ) n 2 = 1, 则纯态密度矩阵就是 ρ(n) = 2( 1 1 + n σ 假设记相应的纯态为 ψ(n), 即 ρ(n) = ψ(n) ψ(n), 则由于 (n σ)ρ(n) = ρ(n)(n σ) = ρ(n), 容易看出, ψ(n) 必为 (n σ) 的本征值为 1 的本征态 利用 3 个泡利矩阵的表达式, 并将单位矢量 n 的分量形式代入 ρ(n), 容易得到 ( ) cos 2 (θ/2) cos(θ/2) sin(θ/2)e iϕ ρ(n) =. (12.31) cos(θ/2) sin(θ/2)e iϕ sin 2 (θ/2)
第十二章 * 密度算符与熵 12 由此可以得到 ( ) cos(θ/2)e iϕ/2 ψ(n) =. (12.32) sin(θ/2)e iϕ/2 假设有两个密度矩阵 ρ(w 1 ) 和 ρ(w 2 ), 则对于任意 0 t 1 均有 tρ(w 1 ) + (1 t)ρ(w 2 ) = ρ(tw 1 + (1 t)w 2 ), (12.33) 也即是说, 两个密度矩阵按照 tρ(w 1 ) + (1 t)ρ(w 2 ) 的形式组合以后结果依然是一个密度矩阵, 而且这个密度矩阵的极化矢量刚好是 tw 1 + (1 t)w 2 实际上, 假设将 0 t 1 看成可变参数, 那方程 tw 1 + (1 t)w 2 描写的就是 w 1 与 w 2 的连线线段, 这条线段当然依然在 3 维空间的单位球体之内, 因此连线上的每一点当然都对应一个密度矩阵 12.1.4 哥本哈根诠释和多世界诠释 在第二章的 量子比特与薛定谔猫 一节中, 我们谈到测量会导致态的坍缩, 这种说法其实只是对量子力学的一种诠释, 而对于量子测量过程发生了什么, 其实有多种诠释 现在, 让我们更细致地考察一下量子测量过程, 并介绍两种不同的主要诠释, 哥本哈根诠释和多世界诠释 大致来说, 目前对量子测量过程的认识是下面这样的 : 简言之, 测量过程就是一个被测对象和观察者 ( 包括仪器 ) 以及环境发生纠缠的过程 以测量一个电子的自旋 z 分量为例, 这时候我们可以把一个任意的电子自旋态 ψ 分解成自旋向上态 和自旋向下态 的叠加, 即 ψ = c + c 假设测量之前电子处在 ψ, 观察者 ( 包括仪器 ) 处在 m 0 态, 环境处在 e 0 态 那么测量之前整个世界的量子态 W 0 就是 W 0 = ψ m 0 e 0 = c m 0 e 0 + c m 0 e 0 现在对电子的自旋 z 分量进行测量, 当测到电子自旋向上时, 我们记观察者处于 m 态, 记这时候环境的状态为 e, 而当测到电子自旋向下时, 记观察者处于 m 态, 记这时候环境的状态为 e 而电子 观察者 环境这三者的整体也是一个量子系统, 因此在测量过程中这个整体的量子态必然是保持线性叠加并幺正演化的, 因此测量以后, 世界的量子态将由测量前的 W 0 幺正演化到 W, 由于要保持量子态的线性叠加, W 必定可以写成 W = c m e + c m e 很显然, 与测量前的 W 0 态不同, 在 W 态中, 电子 观察者 以及环境这三者纠缠成了一个整体
第十二章 * 密度算符与熵 13 请注意, W 态依然是一个确定的量子态, 因此这时候依然是不谈概率的 但是, 简化一点来说, 在测量时我们关心的当然只是作为观测对象的电子, 以及仪器上的读数和观察者看到某个读数时的心情, 我们会完全忽视环境, 实际上我们也根本无法收集到环境的信息 而由于电子 观察者 以及环境纠缠成了一个整体, 因此当我们忽视环境的信息时, 电子和观察者的量子力学描述就不再是一个纯态了, 而是混态 c 2, m, m + c 2, m, m 也就是说, 原来的相干叠加消失了, 概率出现了 观察者有 c 2 的概率处在 m 态并发现电子自旋向上, 有 c 2 的概率处在 m 态并发现电子自旋向下 这个过程就是我们前面说过的退相干 很显然, 退相干是因为量子信息泄露到了环境中去而产生的 到此为止都还没有涉及到量子态的坍缩, 量子力学的不同诠释对上面的内容基本上还是有共识的 麻烦就出在, 一旦我们在某次测量中观察到电子自旋向上, 在我们看来整个世界就应该处在 W = m e 态, 相反, 如果在某次测量中我们观察到电子自旋向下, 那在我们看来, 这时候整个世界就应该处在 W = m e 态 这时候就有不同的观点了, 哥本哈根诠释的观点是, 一次测量只发生了一个可能的结果, 因此量子态坍缩了, 当我们观察到电子自旋向上时, 世界的量子态就从 W 坍缩到了 W, 而当我们观察到电子自旋向下时, 世界的量子态就从 W 坍缩到了 W 至于坍缩过程是如何进行的, 目前物理学家们依然在研究之中 这种诠释的问题在于, 我们可以设想有一个外在于整个世界的 朋友, 他根本不关心我们的电子自旋是向上还是向下, 他根本就没有进行观测, 因此对于他来说, 世界的量子态应该依然是 W, 根本就没有什么量子态的坍缩 另一种不同的诠释通常人们叫做多世界诠释 这种诠释的观点是, 一次测量, 所有可能的结果都发生了, 但是, 世界本身分裂了, 不同的可能结果发生在分裂以后的不同平行世界里 也就是说, 在一个世界里你测到电子自旋向上, 而在另一个世界里你测到电子自旋向下 但是, 不同的平行世界只是同一个量子现实的不同分支, 而整个量子现实依然是由相干叠加的 W = c W + c W 态来描写的 根据这种多世界诠释, 从来就没有什么量子态坍缩, 有的不过是世界分裂 这种诠释的问题是, 分裂以后的两个平行世界怎么能够保持相干叠加
第十二章 * 密度算符与熵 14 从而共同构成同一个量子现实呢? 12.2 再谈密度算符与系综 这一节我们主要是推广系综的概念 密度算符集合的凸性首先我们定义一下什么是向量空间的凸子集 对于向量空间的某个子集, 如果它满足集合中任意两个点的连线段完全处于集合内部, 那么这个集合就是向量空间的一个凸子集 比如图 (12.1) 所示的多边形就是两维平面的凸子集 如果凸子集中的某点永远不能处在子集内连线段内, 而只能处于连线段的端点, 那这个点就称为极端点 比如图 (12.1) 中的 A, B, C, D, E 点就是极端点 图 12.1: 两维实向量空间的一个凸子集,A, B, C, D, E 为极端点 另外, 由于任何两个厄密算符的实系数线性组合依然是厄密算符 所以一个量子系统所有厄密算符的集合构成了一个实向量空间, 系统每一个可能的厄密算符都对应这个实向量空间里的一个向量 之所以讨论以上两个概念, 是因为, 一个量子系统的所有可能密度算符的集合构成了厄密算符向量空间的一个凸子集 具体来说, 假设 ρ 1, ρ 2,..., ρ N 是系统 N 个可能的密度算符, 则下式给出的 ρ 也必定是系统可能的密度算符 ρ = p 1 ρ 1 + p 2 ρ 2 +... + p N ρ N, (12.34)
第十二章 * 密度算符与熵 15 式中,0 p i 1, 且 N i=1 p i = 1 要证明 ρ 是密度算符, 只需验证它满足密度算符必须满足的 3 条性质 根据所给条件,ρ 的厄密性以及 Tr(ρ) = 1 这两条都很明显, 唯一需要说明的是 ρ 的正定性 对于一个厄密算符的正定性, 我们有两种等价的判定方法,1. 所有本征值大于等于 0; 2. 这个算符在任何量子态 ψ 上的期望值都大于等于 0 根据第 2 种判定正定性的方法,(12.34) 式给出来的厄密算符 ρ 的正定性也是显然的 ( 注意我们已知每一个 ρ i 都正定 ) 上一段我们刻画了密度算符集合的凸性, 实际上更符合凸子集定义的刻画方法是 : 假设 ρ 1, ρ 2 为系统两个可能的密度算符, 则这两者的连线段 ρ(t) = tρ 1 + (1 t)ρ 2 上每一个密度算符 ρ(t) 也必为系统可能的密度算符, 这里 0 t 1 这种刻画凸性的方式不仅是上一段给出来的刻画方式的特例, 而且从它出发通过使用数学归纳法我们也能反过来导出上一段的刻画方式 所以对凸性的这两种刻画方式实际上是等价的 不仅如此, 我们还可以证明, 纯态密度矩阵相应于这个密度算符凸子集的极端点 为此, 我们假设 ρ = ψ ψ, 我们用反证法, 设存在密度算符 ρ 1 和 ρ 2, 使得 ρ = tρ 1 + (1 t)ρ 2, 0 < t < 1 任意取一个与 ψ 正交的 ψ 态, 它满足 ψ ψ = 0, 则有 0 = ψ ρ ψ = t ψ ρ 1 ψ + (1 t) ψ ρ 2 ψ 进一步根据密度算符的正定性, 必有 ψ ρ 1 ψ = ψ ρ 2 ψ = 0 但是 ψ 是任意与 ψ 正交的态, 因此刚才的结果就意味着 ρ 1 = ρ 2 = ψ ψ = ρ 这就证明了纯态必为极端点 反过来, 对于混态密度算符 ρ, 由于总有 ρ = a p a a a, 式中 a a = ρ a 均为纯态密度算符, 这就说明混态密度算符必定不是极端点 这就完成了密度算符凸子集的极端点与纯态一一对应的证明 比方说对前面讨论过的单量子比特密度算符 Bloch 球体的例子, 整个 Bloch 球体就是一个凸子集, 球体表面的每一个点都是这个凸子集的极端点, 因此必定相应于纯态 这正好是我们前面已经知道的结论 不过, Bloch 球体是一个特例, 它的边界点和极端点是一回事, 但是, 图 (12.1) 告诉我们, 对于一般的凸子集, 它的极端点必定是边界点, 但是反过来, 它的边界点却不一定是极端点 具有 3 维以上希尔伯特空间的量子系统的密度算符凸子集也是这样, 它的边界点并不都是极端点 系综概念的推广 根据凸性, 假设某个密度算符 ρ 可以写成 ρ = i p iρ i, i p i = 1 则很
第十二章 * 密度算符与熵 16 显然 O = Tr(ρO) = i p i Tr(ρ i O) = i p i O i. (12.35) 这就意味着, 对于一个量子系统, 假设我们能够制备出所有的 ρ i 态, 则我 们就可以制备一个系综, 让这个系综中的每个系统以 p i 的概率处在 ρ i 态, 而 这个系综就可以由密度算符 ρ = i p iρ i 描述 密度算符 ρ 既可以看成是描述 一个系统的量子态, 也可以看成是描述刚才所说的系综, 等式 (12.35) 告诉 我们, 在物理上我们并不能区分这两者 很明显, 除了纯态以外, 任何一个密度算符 ρ 都有多种办法分解成 ρ = i p iρ i, i p i = 1 因此与密度算符 ρ 所对应的系综远不是唯一的, 而是有无穷多的可能性 比方说, 对于单量子比特 Bloch 球体内部的任何一点 ( 对 应密度算符 ρ), 我们都可以作无数条过这一点的线段与球面上的两点 ( 对应 于两个纯态密度算符 ) 相交, 每一根这样的线段都意味着我们可以将密度算 符 ρ 表示成球面上的这两个纯态密度算符的线性组合, 而 ρ 就可以看成是描 述了相应的纯态系综, 由于这样的线段有无数条, 所以 ρ 可以描述无数多个 不同的纯态系综, 在物理上这些纯态系综不可区分 比方说, 对于 Bloch 球 心的那个最大混态密度算符 ρ = 1 2 1, 我们就有无数种表达它的方式, 比如 下面的两种 ρ = 1 2 0 0 + 1 2 1 1 = 1 2 + + + 1. (12.36) 2 12.3.1 冯诺伊曼熵 12.3 量子熵 前面我们说过, 混态密度算符可以写成 ρ = a p a a a 的形式,p a 可以看成概率, 是一种不确定性, 它反映了我们对系统的某种无知 然而如何衡量这种无知呢? 一个自然的想法是将这种无知定义成某个算符的期望值, 不妨称这个算符为 无知算符, 下面我们就是要找到它的表达式 由于我们的无知反映在系统的密度算符 ρ 中, 所以这个 无知算符 应该依赖于 ρ( 而通常的物理量算符是与态 ρ 无关的 ) 而且, 如果 ρ 是一个纯态密度算符, 那它就没有任何不确定性, 从而相应的 无知算符 应该为零
第十二章 * 密度算符与熵 17 另外, 从直观上我们知道, 如果两个系统 S 1 和 S 2 相互独立, 那我们对它们的无知应该是相加的, 或者说相应的 无知算符 应该是相加的 另一方面, 假设我们记 S 1 的密度算符为 ρ S1, 记 S 2 的密度算符为 ρ S2, 则由于这两个系统相互独立, 所以两者整体的密度算符应该是 ρ S1 和 ρ S2 的乘积, 不过,ρ S1 只作用在 S 1 的希尔伯特空间 H S1 上,ρ S2 只作用在 S 2 的希尔伯特空间 H S2 上, 为了强调这一点我们常将这个乘积写成如下形式 ρ S1 ρ S2 = ρ S1 ρ S2, (12.37) 它作用在两者整体的希尔伯特空间 H S1 H S2 上 为了将密度算符的这种相乘关系转化为相加关系, 我们定义与密度算符 ρ 相应的 无知算符 如下 log(ρ). (12.38) 额外加上的负号是为了使得这个算符为一个正定算符 2 显然, 这样定义的 无知算符 的确是相加的, 满足 log(ρ S1 ρ S2 ) = log(ρ S1 ) log(ρ S2 ) 很容易验证, 对于纯态密度算符的确有 log(ρ) = 0 这是因为, 纯态密度算符满足 ρ 2 = ρ, 从而 ρ 的任何幂次都依然等于 ρ 从而对于任何一个幂级数函数 f(x), 必有 f(ρ) = f(1)ρ 现在我们按照 log(x) = log(1 + x 1) 关于 x 1 的泰勒展开级数来定义算符函数 log(ρ), 从而当然就有 log(ρ) = log(1)ρ = 0 下面我们可以将密度算符 ρ 中包含的无知定义为 无知算符 的期望值, 称作冯诺伊曼熵, 简称熵, 记为 S(ρ), 则 S(ρ) = log ρ = Tr ( ρ log ρ ). (12.39) 显然,S(ρ) 也是所有 ρ log ρ 本征值之和, 从而也有 S(ρ) = a p a log(p a ). (12.40) 这正好是香农关于经典概率分布 {p a } 信息熵的表达式, 经典信息熵衡量的是获取信息以后能够消除的不确定性, 换言之, 信息熵衡量的正是获取具体信息之前我们对它的无知, 所以冯诺伊曼熵 S(ρ) 的确衡量的是无知 很明显, S(ρ) 0, (12.41) 2 因为 ρ 的本征值 0 p a 1, 所以恒有 log(ρ) 的本征值 log(p a ) 0
第十二章 * 密度算符与熵 18 等于号仅当 ρ 为纯态密度算符时才能取到 另外, 假设系统的希尔伯特空间为 D 维, 即 (12.40) 式中的指标 a = 1, 2, 3,..., D 则由(12.40) 式可以证明, S(ρ) log D. (12.42) 等于号当且仅当 p a = 1/D 时成立, 这时候的密度算符为 ρ = 1 a a = 1 1. (12.43) D D a 这当然是一个混态密度算符, 相应的混态称之为最大混态 对于一个由 A 和 B 两部分组成的封闭系统, 它的整体 ( 我们记作系统 AB) 必定处于一个纯态, 我们可以对它进行施密特分解, 进而能够导出前面的 (12.17) 式和 (12.18) 式, 即 A 和 B 两个子部分的密度算符 ρ A,ρ B 分别为 ρ A = a p a a A a, ρ B = a p a a B a. (12.44) 从而必有 S(ρ A ) = a p a log(p a ) = S(ρ B ). (12.45) 即两个通过纠缠形成一个整体纯态的 A, B 系统, 其两个子部分的冯诺伊曼熵是相等的 正因为这个美妙的性质, 人们常常将这种情况下子部分的冯诺伊曼熵看成是对两体纠缠度的一种衡量 假设 A,B 两部分的希尔伯特空间维数相等, 均为 D 那前面关于最大混态的讨论告诉我们, 两体纠缠度最大为 log D, 这时候 p a = 1, 从而根据 D 施密特分解,AB 整体的量子态 ψ 为 ψ = 1 a A a B. (12.46) D a 由于纠缠度最大, 这被称为最大纠缠态 凹性前面我们说过, 一个系统所有可能密度算符的集合是一个凸集, 因此冯诺伊曼熵 S(ρ) 就是这个凸集上的函数, 实际上, 它是一个凹函数 为了
第十二章 * 密度算符与熵 19 证明这一点, 任取两个不同的密度算符 ρ 1, ρ 2, 然后构造 ρ(t) = tρ 1 + (1 t)ρ 2, 0 t 1, 我们要证明的是 d 2 dt 2 S(ρ(t)) 0 为此, 我们首先注意到 又注意到 log ρ = 再注意到 ρ(t) = 0, 则有 d 2 dt 2 S(ρ(t)) = d dt S(ρ(t)) = Tr( ρ log ρ ). (12.47) 0 0 ds ( 1 s + 1 1 ). (12.48) s + ρ(t) ( dstr 1 ρ s + ρ(t) ρ 1 s + ρ(t) ). (12.49) 注意这个积分式的被积函数具有 Tr(A 2 ) 的形式, 式中 A = (s+ρ(t)) 1/2 ρ(s+ ρ(t)) 1/2 为厄密算符, 所以 A 2 必定是正定算符, 从而 Tr(A 2 ) 0, 从而即有 d 2 dt 2 S(ρ(t)) 0 由凹函数的熟知性质, 我们有 p i S(ρ i ) S( p i ρ i ). (12.50) i i 式中 0 p i 1, 且 i p i = 1 即是说, 将多个密度算符 混 起来会增加冯诺伊曼熵 这个熵的增量通常称作 Holevo 信息, 记作 χ χ = S( i p i ρ i ) i p i S(ρ i ). (12.51) 12.3.2 相对熵 相对熵和互信息假设一个量子系统实际由密度算符 ρ 描写, 但是我们不知道, 我们猜测了一个描写它的密度算符 σ, 那我们这个猜测中额外包含的无知就应该是 S(ρ σ) = log σ log ρ = Tr(ρ log ρ ρ log σ). (12.52) 式中 log σ = Trρ log σ 为我们的猜测中总共包含的无知, log ρ 为系统密度算符中原本包含的信息缺失,S(ρ σ) 也称作 σ 和 ρ 的量子相对熵
第十二章 * 密度算符与熵 20 可以想见, 量子相对熵 S(ρ σ) 这种额外的无知一定大于等于零 ( 等号当且仅当 σ = ρ 时才成立 ), 即 S(ρ σ) 0, (12.53) 事实也的确如此, 证明并不复杂, 不过证明过程和我们将要进行的讨论关系不大, 因此我们推荐感兴趣的读者去阅读文献 3 特别的, 假设我们考虑一个由 A 和 B 两个子系统组成的复合系统 AB, 记 AB 的密度算符为 ρ AB, 记 ρ A = Tr B (ρ AB ) 为子系统 A 的约化密度算符, ρ B = Tr A (ρ AB ) 为子系统 B 的约化密度算符 当然, 一般来说, 由于相互作用,A 和 B 之间会存在关联, 因此 ρ AB ρ A ρ B 但是假设我们误以为 A 和 B 没有关联, 并将 ρ A ρ B 猜测为 AB 的密度算符 σ AB σ AB = ρ A ρ B. (12.54) 则我们这一猜测的额外无知为 ( ) S(ρ AB σ AB ) = Tr AB ρab log ρ AB ρ AB log σ AB ( ) = Tr AB ρab log ρ AB ρ AB log ρ A ρ AB log ρ B = S A + S B S AB. (12.55) 式中 S A = S(ρ A ) 为 A 的熵, S B = S(ρ B ) 为 B 的熵, 而 S AB = S(ρ AB ) 为 AB 的熵 类似这样的记号我们后面还会用, 将不再进行说明 人们通常称 S A + S B S AB 为 A 和 B 的量子互信息, 记为 I(A, B) = S A + S B S AB. (12.56) 则 S(ρ AB σ AB ) 0 就意味着量子互信息总是大于等于零的, 即 I(A, B) = S A + S B S AB 0. (12.57) 不过, 值得说明的是, 量子互信息这个概念完全是类比于经典信息论中的互信息概念而引入的, 但它其实并没有经典互信息的内涵 正因为如此我们这里才没有介绍经典互信息的具体含义 另外, 不等式 (12.57) 有时候也称之为熵的次可加性 (subadditivity) 3 A Mini-Introduction To Information Theory, Edward Witten,arXiv:1805.11965[hepth]
第十二章 * 密度算符与熵 21 相对熵的单调性 令人吃惊的是,Lieb 和 Ruskai 还证明量子相对熵具有一种强大的单调 性, 不过这个证明很难, 因此我们这里不会讨论, 感兴趣的读者可以阅读 原始论文 4, 或者查阅量子信息方面的专业书籍 为了说清楚什么是量子相对熵的单调性, 我们还是考察一个由 A,B 两 部分组成的系统, 记为系统 AB, 假设它有两个密度算符 ρ AB 和 σ AB, 记 ρ A = Tr B ρ AB, σ A = Tr B σ AB 为相应的两个在 A 上的约化密度算符 量子相对熵的 单调性说的是 S(ρ AB σ AB ) S(ρ A σ A ). (12.58) 即对一个系统的一部分求迹 ( 称作部分迹 ) 会降低量子相对熵 不妨让我们给出对 (12.58) 式的一个直观理解 ( 不是证明!), 其实这个 式子说的无非是, 当将我们对一个大系统 ( 这里即 AB 系统 ) 密度算符的猜测 用于它的一部分 ( 这里即是 A 部分 ) 时, 我们的额外无知将单调减少 直观上 这当然很好理解, 难的是证明 下面我们将量子相对熵的这种单调性用于一个三部分的系统 ABC, 设其密度算符为 ρ ABC, 当然我们有约化密度算符 ρ A = Tr BC ρ ABC, ρ BC = Tr A ρ ABC 我们再引入第二个密度算符 这样我们就可以计算 S(ρ ABC σ ABC ) 了, σ ABC = ρ A ρ BC. (12.59) S(ρ ABC σ ABC ) = S(ρ ABC ρ A ρ BC ) = I(A, BC) = S A + S BC S ABC (12.60). 为了应用单调性, 现在我们对 C 求迹, 从而有 ρ AB = Tr C ρ ABC, σ AB = Tr C σ ABC = ρ A ρ B. (12.61) 因此我们又可以计算求完迹以后的 S(ρ AB σ AB ), S(ρ AB σ AB ) = S(ρ AB ρ A ρ B ) = I(A, B) = S A + S B S AB. (12.62) 量子相对熵的单调性告诉我们 S(ρ ABC σ ABC ) S(ρ AB σ AB ). (12.63) 4 E. H. Lieb and M. B. Ruskai, Proof Of The Strong Subadditivity Of Quantum Mechanical Entropy, J. Math. Phys. 14 (1973) 1938.
第十二章 * 密度算符与熵 22 从而我们可以得到 S AB + S BC S B + S ABC. (12.64) 这个不等式称作熵的强次可加性 (strong subadditivity) 强次可加性有一些有趣的等价形式, 比方说, 假设我们对 ABC 系统引入一个辅助的 D 部分, 使得密度算符 ρ ABC 在这个 ABCD 系统中被纯化, 则利用我们前面证明过的美妙性质 (12.45), 我们将有 S AB = S CD ( 将 ABCD 看成是由 AB 和 CD 两部分组成 ), 以及 S ABC = S D ( 将 ABCD 看成是由 ABC 和 D 两部分组成 ), 则不等式 (12.64) 可以重写成 S CD + S BC S B + S D. (12.65) 习惯上人们会引入 S(C D) = S CD S D, 以及 S(C B) = S BC S B 这两个量, 称作条件熵, 则上面这个不等式又可以重写成 S(C D) + S(C B) 0. (12.66) 这个式子告诉我们 S(C D) 和 S(C B) 这两个条件熵不能同时为负 但是量子条件熵的确是可以取负值的, 比方说, 如果 AB 处于最大纠缠态 ( 当然是纯态 ), 则 S AB = 0, 而 S B 达到最大, 那这时候条件熵 S(A B) = S AB S B 当然就为负! 因此 (12.66) 就告诉我们,C 不能与 D 和 B 两者同时处于最大纠缠态, 这称为量子纠缠的单配性 (monogamy of entanglement) 12.4 开放系统以及热力学第二定律 12.4.1 开放系统的时间演化 我们知道, 一个封闭量子系统随时间是幺正演化的, 纯态 ψ 将演化为 ψ U ψ, 式中 U 为幺正的时间演化算符 从而密度算符 ρ 将演化为 ρ UρU. (12.67) 幺正演化意味着概率和信息的守恒 但是, 对于一个与环境相互作用的开放系统而言, 其信息可以不断泄露到环境中去, 从而其演化就不可能是幺正演化 那么, 该怎么讨论开放系统的时间演化呢? 事实上, 这时候我们可以把环境包括进来, 将我们关心的系统看成 A 系统, 而将环境看成 B 系统, 两者共同构成一个封闭的 AB 系统 下面
第十二章 * 密度算符与熵 23 当我们单独说到系统时, 指的都是我们关心的 A 系统, 而对于 AB 整体, 我们将称之为复合系统 假设环境最初处于 e 0 态, 而我们关心的系统最初处于 ψ 态, 两者没有纠缠 由于整个复合系统是封闭的, 所以复合系统将满足幺正演化, e 0 ψ U ( e 0 ψ ). (12.68) 下面我们取环境希尔伯特空间的一组正交归一矢量基 { e s }, 然后将复合系统的量子态 U ( e 0 ψ ) 按这组基展开成 U ( e 0 ψ ) = s e s ψ s. (12.69) 注意, 我们并没有说 ψ s 正交归一 下面我们引入一组作用在 A 系统上的算 符 E s, 定义为 ψ s = E s ψ, 则 e 0 ψ U ( e 0 ψ ) = s e s E s ψ. (12.70) 利用 U 的幺正性, 我们可以得到 E se s = 1. (12.71) s 所以开放系统从初态到 t 时刻态的映射完全由这组算符 E s 决定 将上面的推导照搬到密度算符上 假设系统初始的密度算符为 ρ, 环境初始的密度算符为 e 0 e 0, 则整个复合系统初始的密度算符为这两者的乘积, 不过, 为了强调 ρ 只作用在系统的希尔伯特空间, 而 e 0 e 0 只作用在环境的希尔伯特空间, 我们常常将这个乘积写成 e 0 e 0 ρ, 并简记为 ρ 则类似于上面的推导我们将有 ρ ρ = U ρu = e s e s E s ρe s. (12.72) s,s 由于我们并不关心环境, 所以我们忽略它, 即对环境的希尔伯特空间求迹, 从而得到 ρ Tr B ( ρ ) = s E s ρe s. (12.73) 我们常常把这个方程写作 ρ E(ρ) = s E s ρe s, E se s = 1. (12.74) s
第十二章 * 密度算符与熵 24 式中定义的映射 E 称作量子映射 (quantum map), 可以验证它将把密度算符映射到密度算符, 比方说很容易看出 Tr ( E(ρ) ) = Tr(ρ) = 1 反过来可以证明, 任何将密度算符映射到密度算符的线性映射, 只要满足一些自然的条件, 就必定可以表示成 (12.74) 的形式, 这就是所谓的 Kraus 表示定理,(12.74) 式中的 E s 就称作 Kraus 算符 (12.74) 式这样的量子映射有时候又称作保迹全正映射 (trace preserving, completely positive (TPCP) map) 很显然, 封闭系统的时间演化只是 (12.74) 式的一个特例, 这时候只有一个非零 Kraus 算符, 即幺正演化算符 U 但是, 一般来说,(12.74) 式的量子映射只是把初始时的密度算符 ρ 映射到 t 时刻的密度算符 E(ρ), 它却不能用于考察任意 t 时刻的密度算符如何继续随着时间演化, 这是因为, 在推导 (12.74) 式时我们有一个重要的假定, 即最初的系统和环境没有关联, 两者的密度算符是直接乘积的关系 但这个条件却不适用于任意 t 时刻, 因为随着系统与环境的相互作用, 一般来说 t 时刻系统和环境一定是纠缠和关联的 正因为如此,(12.74) 式其实不能真正看作开放系统的时间演化方程 刘维尔方程和 Lindblad 方程为了真正得到一个开放系统的时间演化方程, 我们现在假定环境是巨大的, 就好像统计物理中的恒温热源那样, 以至于系统和环境的任何关联都会在某个非常短的微观时间尺度 τ 之内丧失 假定我们关心的是系统在远大于微观时间 τ 的宏观时间尺度上的演化 这时候我们就可以推导出一个真正的时间演化方程 根据上一段的假设, 我们来考察密度算符在一个宏观无穷小时间间隔 δt 上的演化, 当然, 作为一个宏观时间, 我们依然有 δt τ 按照假设, 我们可以对任意初始时刻 t 利用 (12.74) 式, 从而有相应的演化方程 ρ(t + δt) = s E s (t + δt, t)ρ(t)e s(t + δt, t). (12.75) 对于幺正演化的封闭系统 ( 它当然与环境没有关联 ), 我们只有一个非 零 Kraus 算符, 即为时间演化算符, 记作 E 0 (t + δt, t) = U(t + δt, t) = 1 ihδt/ +... (12.76) 代入 (12.75) 式, 即得到标准的刘维尔方程 dρ dt = i[h, ρ]. (12.77)
第十二章 * 密度算符与熵 25 对于与环境相互作用的开放系统, 这时候就可能有许多非零 Kraus 算符 但是可以设想, 对于一个无穷小的 δt,e 0 (t+δt, t) 将依然是主要的, 按照 δt 进行泰勒展开依然有 E 0 (t+δt, t) = 1+O(δt), 不过当然,E 0 (t+δt, t) 不再幺正, 从而我们应该假设 E 0 (t + δt, t) = 1 i ( H i Γ ) δt/ +... (12.78) 2 式中 Γ 也是一个厄密算符 E 0 的这一假设形式显然是受前面章节对不稳定 态研究的启发 其余 Kraus 算符都是次要的, 我们假设它们 E m (t + δt, t) = O( δt), m = 1, 2, 3... 具体来说, 我们假设 E m (t + δt, t) = L m δt/ +..., m = 1, 2, 3... (12.79) 由于 Kraus 算符要满足 s E se s = 1, 从而我们有 Γ + m=1 L ml m = 0 Γ = m=1 L ml m. (12.80) 将 Kraus 算符的这些展开形式代入时间演化方程 (12.75) 就有 dρ dt = i[h, ρ] 1 ( ) Γρ(t) + ρ(t)γ + L m ρ(t)l 2 m. (12.81) m=1 这就是开放系统密度算符的时间演化方程, 称作 Lindblad 方程, 它可以看 作是量子版本的 Fokker-Planck 方程, 其中的算符 L m 称作 Lindblad 算符, 它 描写系统与环境的相互作用 12.4.2 热力学第二定律 前面冯诺伊曼熵和量子相对熵的公式最后都是一个求迹, 因此它们在幺正变换下都将保持不变, 以量子相对熵为例, 在幺正变换 ρ ρ = UρU, σ σ = UσU 的作用下, 将有 S(ρ σ ) = S(ρ σ). (12.82) 特别的, 一个封闭量子系统的时间演化就是一个幺正量子变换, 因此, 一个封闭量子系统的冯诺伊曼熵和量子相对熵在时间演化下都将保持不变
第十二章 * 密度算符与熵 26 上面结论好像和我们熟悉的热力学第二定律相矛盾, 其实不然, 因为冯诺伊曼熵是所谓的精细熵, 而通常的热力学熵是一种粗粒化熵, 孤立系统的精细熵保持不变, 但是其粗粒化熵是增长的, 这就是热力学第二定律 这一节我们就是要对与一个大的恒温热源密切接触的量子系统证明热力学第二定律 由于与恒温热源之间的能量和信息交换, 这时候的量子系统当然不是孤立系统, 甚至也不是封闭系统, 在统计物理中我们知道, 这时候的热力学第二定律其实表现为系统自由能随着时间的不断降低, 这一节就是要证明这个结论 由于我们要处理的不是封闭系统, 所以需要用到量子映射 我们将要用到的关键结果就是, 量子相对熵在量子映射下单调降低 具体来说, 假设 ρ 和 σ 为系统的两个密度算符, 在量子映射 E 之下, 它们变换为 ρ ρ = s E s ρe s, σ σ = s E s σe s. (12.83) 则我们有 S(ρ σ) S(ρ σ ). (12.84) 为了证明这一点, 我们回顾一下前面对量子映射的推导过程, 首先我们需要将密度算符与环境的 e 0 e 0 乘起来, 由于 e 0 e 0 是一个纯态, 熵是零, 所以这一步对相对熵 S(ρ σ) 没有影响, 第二步是对整个复合系统用幺正演化, 根据前面所说, 这一步也不会改变相对熵, 最后一步是对环境求部分迹, 根据量子相对熵的单调性, 这一步将使得量子相对熵单调减少, 因此综合起来我们就有 (12.84) 式 下面我们取 σ 为与恒温热源达到热平衡时的密度算符, 根据统计物理知识, σ = 1 Z e βh, (12.85) 式中 β = 1/T, T 为恒温热源的温度, 式中配分函数 Z 也可以写 Z = e βf (σ), (12.86) F (σ) 为这个热平衡态的自由能 假设 ρ 为这个与恒温热源密切接触的系统任意时刻的密度算符 我们可
第十二章 * 密度算符与熵 27 以计算量子相对熵 S(ρ σ), 有 S(ρ σ) = log σ S(ρ) = βh βf (σ) S(ρ) = βe(ρ) S(ρ) βf (σ) = β [ F (ρ) F (σ) ]. (12.87) 式中 E(ρ) = H = Tr(ρH), 而 F (ρ) = E(ρ) T S(ρ) 为 ρ 态的自由能 下面我们将与系统接触的恒温热源看成系统所处的环境, 它的存在定 义了一个量子映射 E, 由于热平衡态 σ 在这样的恒温环境下将保持不变, 因 此这个量子映射 E 将把 σ 映射到 σ 本身 因此由 (12.84) 式和 (12.87) 式, 我们 即有 S(ρ σ) S(ρ σ) β [ F (ρ) F (σ) ] β [ F (ρ ) F (σ) ] F (ρ) F (ρ ). (12.88) 也即是说, 这个系统的自由能是随着时间递减的 这就完成了我们的证 明