obxygene

以自己的意志,抵达结局吧

最近利用LLM写东西以及润色东西的频率太高,以至于写东西的是LLM而不是我自己,这样可能对未来独立写作的能力不好。借着这次食贫道更新了<首尔夏天>讨论了韩国社会的一些现象的机会,简单地写一些东西。

<首尔夏天>[1],主要以采访纪实的形式,分别采访了(主要)五个对象,包括女作家郑智我(朝鲜),海女,教育群体(修能考试),追星产业链以及梦想成为明星的练习生。 这些对象也和国内对韩国的一些印象相吻合。像是朝韩关系,韩国人不睡觉,韩国K-pop产业等。至少从我个人的角度而言,可以看到这些背后和国内文化有许多相似之处。

这篇短文主要想从教育的方面来谈。拿视频中的其中一个片段举例[2]

0:57:02

若是非理工的人来看,可能会认为中学生能灵活应用如此多的知识而感到惊讶,但若是稍微了解一些便会发现这一段话基本上是名词的堆砌。仅仅是将一本书名进行了推广,然后用一些看似高深的专有名词在语言上进行了加工。

用高大上的词汇描述简单的事情的行为并不少见。但是在韩国选拔人才作为全国性的事件中,作为一个评价标准就有些奇怪了(至少在我看来)。国内的高考相对而言考察的都是知识本身(至少明面上),因而较少出现这样的名词堆砌的情况,这样相对而言要更加考察知识的细节,毕竟细节才是最重要的,这样才能够有能力上的区分度。但若是过于强调包装和论述,反而失去了选拔人才本身的意义,且另一层面来说,也更有利于部分具有包装能力的人取得更好的成绩。

0:48:26

若是以当下的文化来形容,应当是“卷”[3]文化。卷文化的底层逻辑是社会生产的蛋糕大小增量变少,个体(甚至群体)要在增量中获取和之前相同的份额,就必须付出更大的努力,进一步发展则会导致恶性竞争。韩国教育作为卷文化的代表可谓是极致,视频中的也提到,韩国高度内卷的修能考试实质上的促使一部分学业欠佳的学生走上练习生的道路。然而过多的人力涌入也带来了追星企业的内卷,大部分娱乐公司自身难保,也自然没有足够的资源去推动公司的练习生出道以及之后的发展。由此或许可以一定程度上地推广到韩国社会其他的产业。

1:3:51

极致的内卷化导致人生活成本的大幅度提升,诸多社会现象也因此出现,而其中相对尖锐的矛盾当是出生率。韩国的出生率自60年代后急速地下落,面临严重的人口老龄化及少子化问题,并于2020年首次出现死亡人口大于出生人口的人口自然减少情况。其总和生育率仅为0.84,在世界上属于最低水平。由此也可看出,在现代化社会中,人的生活成本过高时对生育本能的抑制性是非常大的。资源的有限性和人的追求的矛盾是如此的尖锐,以至于每个人都不愿意卷,但每个人都在卷。

Wikipedia

当然,视频中除了教育的视角,还有许多其他的视角。尤其是作家郑智我对韩国历史以及社会的分析,在韩国这个(我看来)相对割裂且受美国影响严重的国家中,提供了一个相对完整的介绍韩国历史的视角(当然与朝鲜关系极大)。整个3小时的视频我分了两次看完,还是非常建议去看一下的(充电视频大概10块钱)。

3:13:39

后记:本文或是距离十年前高考后第一次写一篇作文,所以简单记录一下。没有用GPT润色写作,基本上是看完食贫道的节目后萌生出锻炼写作的想法。实际上除了<首尔夏天>以外,食贫道的<你好美国>,<时尚圣经>等都通过采访的方式记录了许多我在现实中不曾接触的一面。尽管多数看完之后有“原来还有这种事”的感觉,但是却没有能力用一种方法来将“这种感觉”来刻画出来。颇有一种“梦中有一个幻想中的角色,但是等实际落笔时却完全不行”的意思。

在写的时候也大为苦恼如何开头,谈什么内容,本来想把视频中的几个人都写一写,但是发现如果想说的太多,以目前的表达能力来看反而哪个都说不好,并且有许多内容是只参照了食贫道的视频,未免有失偏颇,所以选择了教育这个角度。写的时候也试着看了一下卢昌海的文章来借鉴,来尽量保证自己开始从一个写作者而非阅读者的角度,来学习一些写作上的技术。就结果来看,尽管字数才一千多字,写出来的结果也十分不满意,难以想象没有gpt辅助的情况下在写学术论文时读者该有多吃力。不过迈出去的一步也是一步,以后如果还有这般热情,应该还是多锻炼。


  1. 1.副标题为South of the 38th parallel, 38线以南 ↩︎
  2. 1.B站链接 ↩︎
  3. 2.图中内容为 概率与统计以医学相关职业为目标的学生,调查了统计学在医学发展中的作用。通过阅读《掌握统计学与大数据》一书,理解以证据为基础的医学是医生治疗病人的依据,并将其写入报告中。通过临床试验进行数据分析、利用文献进行元分析时会使用到技术统计和推理统计,并进行了说明。还说明了最基本的事实是:专家意见或背景知识也通过条件概率来使用。在深入探究活动中,探究了教材中所学内容与医学诊断之间的关联。通过掌握正态分布中,平均值附近的数值比两侧的数值频率更高这一事实,说明了照片编辑时,通过平均值改变周围像素值的高斯滤波处理过程。对与统计相关的各种技术中,“期望值出现的概率较高”这一点产生了深刻印象。通过高斯滤波处理的照片为例,发现该技术也正在用于诊断中。为了确认阿尔茨海默症的重要原因——β-淀粉样蛋白的积聚,提到了通过脑PET拍摄时使用高斯滤波来清晰显示图像的内容。 ↩︎
  4. 3.内耗、内卷化(英语:involution),又译过密化、包裹化,简称内卷,原是一个社会学概念,指一种文化模式发展到一定水准后,无法突破自身,只能在内部继续发展、复杂化的过程。内卷化是人类社会独有的现象,和生物学中的“退化”和“进化”都截然不同。内卷不会帮助人类从一个低效的阶段进步到高效的阶段,但也不会让人们退化掉某种能力。大约从2018年开始,“内卷”一词在中国大陆变得广为人知,并引申表示付出大量努力却因递减定律而得不到等价的回报,必须在竞争中超过他人的社会文化,包含了恶性竞争、逐底竞争等更为负面的含义。内卷化 Wikipedia ↩︎

9.2 过渡到S矩阵

真空波函数

如前文所述,我们可以轻松地将第9.1节的一般量子力学结果转换为适合量子场论的记号,即让指标\(a\)遍历空间中的点\(\mathbf{x}\)和自旋及种类指标\(m\),并用\(Q_m\left(\mathbf{x},t\right)\)\(P_m\left(\mathbf{x},t\right)\)分别替换\(Q_a\left(t\right)\)\(P_a\left(t\right)\)。式(9.1.38)则变为[1]

\[ \begin{align} &\langle q';t'|T\left\{\mathcal{O}_A\left[P\left(t_A\right),Q\left(t_A\right)\right], \mathcal{O}_B\left[P\left(t_B\right),Q\left(t_B\right)\right], \cdots \right\}|q;t\rangle \nonumber\\ &= \int_{q_m\left(\mathbf{x},t\right) = q_m\left(\mathbf{x}\right)} ^{q_m\left(\mathbf{x},t'\right) = q'_m\left(\mathbf{x}\right)} \prod_{\tau,\mathbf{x},m} dq_m\left(\mathbf{x},\tau\right)\prod_{\tau,\mathbf{x},m} \frac{dp_m\left(\mathbf{x},\tau\right)}{2\pi} \nonumber\\ &\times \mathcal{O}_A\left[p\left(t_A\right),q\left(t_A\right)\right] \mathcal{O}_B\left[p\left(t_B\right),q\left(t_B\right)\right] \cdots \nonumber\\ &\times \exp\left[i\int_t^{t'} d\tau \left\{\int d^3\mathbf{x} \sum_m \dot{q}_m\left(\mathbf{x},\tau\right)p_m\left(\mathbf{x},\tau\right) - H\left[q\left(\tau\right),p\left(\tau\right)\right]\right\}\right]. \label{eq:9.2.1} \end{align} \]

然而,在场论中式\(\eqref{eq:9.2.1}\)并不完全是我们想要的。实验家不测量量子场\(Q\)的本征态\(\langle q';t'|\)\(|q;t\rangle\)之间跃迁的概率幅,而是测量S矩阵元,即在远过去时刻\(t = -\infty\)包含各种粒子的确定数目状态与在远将来时刻\(t' = +\infty\)包含各种粒子的确定数目状态之间跃迁的概率幅。这些被称为'入'和'出'态,\(|\alpha,\text{in}\rangle\)\(|\beta,\text{out}\rangle\),其中\(\alpha\)\(\beta\)表示以各种粒子的动量、自旋\(z\)分量(或螺旋度)和种类为特征的粒子集合。为了计算这种态之间的时间序乘积(可能是空的)矩阵元,我们需要将式\(\eqref{eq:9.2.1}\)乘以在任意固定时刻\(t\)\(t'\)的'波函数'\(\langle\beta,\text{out}|q';t'\rangle\)\(\langle q;t|\alpha,\text{in}\rangle\)(为方便起见在此取为\(-\infty\)\(+\infty\)),然后对这些波函数的宗量\(q'_m\left(\mathbf{x}\right)\)\(q_m\left(\mathbf{x}\right)\)进行积分。但与其通过条件

\[ \begin{align} q_m\left(\mathbf{x},+\infty\right) &= q'_m\left(\mathbf{x}\right), \label{eq:9.2.2a}\\ q_m\left(\mathbf{x},-\infty\right) &= q_m\left(\mathbf{x}\right) \label{eq:9.2.2b} \end{align} \]

来约束路径积分中的\(q_m\left(\mathbf{x},\tau\right)\),然后对\(q'_m\left(\mathbf{x}\right)\)\(q_m\left(\mathbf{x}\right)\)进行积分,我们可以同样进行对\(q_m\left(\mathbf{x},\tau\right)\)(以及\(p_m\left(\mathbf{x},\tau\right)\))的无约束积分,并将波函数的宗量设置为式(9.2.2)给出的值:

\[ \begin{align} &\langle\beta,\text{out}|T\left\{\mathcal{O}_A\left[P\left(t_A\right),Q\left(t_A\right)\right], \mathcal{O}_B\left[P\left(t_B\right),Q\left(t_B\right)\right], \cdots \right\}|\alpha,\text{in}\rangle \nonumber\\ &= \int \prod_{\tau,\mathbf{x},m} dq_m\left(\mathbf{x},\tau\right)\prod_{\tau,\mathbf{x},m} \left(dp_m\left(\mathbf{x},\tau\right)/2\pi\right) \nonumber\\ &\times \mathcal{O}_A\left[p\left(t_A\right),q\left(t_A\right)\right] \mathcal{O}_B\left[p\left(t_B\right),q\left(t_B\right)\right] \cdots \nonumber\\ &\times \exp\left[i\int_{-\infty}^{+\infty} d\tau \left\{\int d^3\mathbf{x} \sum_m \dot{q}_m\left(\mathbf{x},\tau\right)p_m\left(\mathbf{x},\tau\right) - H\left[q\left(\tau\right),p\left(\tau\right)\right]\right\}\right] \nonumber\\ &\times \langle\beta,\text{out}|q\left(+\infty\right);+\infty\rangle \langle q\left(-\infty\right);-\infty|\alpha,\text{in}\rangle. \label{eq:9.2.3} \end{align} \]

顺便说一下,这个结果立即[2]导致式(6.4.3),这是我们反复用来将不在壳(off-shell)费曼图的和与海森堡绘景算符之间的确切能量本征态的矩阵元联系起来的定理。

现在有必要考虑如何计算式\(\eqref{eq:9.2.3}\)中作为最后一对因子出现的波函数。让我们首先考虑最简单也是最重要的情况,即真空。(我们在第6.4节中看到,从真空期望值可以很容易地计算S矩阵元的时间序乘积。)我们照常假设对于\(t \to \pm\infty\),矩阵元可以按没有相互作用的方式计算。'入'和'出'真空因此可以由条件定义

\[ \begin{align} a_{\text{in}}\left(\mathbf{p},\sigma,n\right)|\text{VAC},\text{in}\rangle &= 0, \label{eq:9.2.4a}\\ a_{\text{out}}\left(\mathbf{p},\sigma,n\right)|\text{VAC},\text{out}\rangle &= 0, \label{eq:9.2.4b} \end{align} \]

其中\(a_{\text{in}}\)\(a_{\text{out}}\)是分别出现在算符\(Q_m\left(\mathbf{x},t\right)\)\(t \to -\infty\)\(t \to +\infty\)\(\exp\left(i\mathbf{p} \cdot \mathbf{x} - iEt\right)\)平面波展开系数中的算符。例如,对于中性无自旋粒子的实标量场,我们实际上有

\[ \begin{equation} \Phi\left(\mathbf{x},t\right) \stackrel{t \to \mp\infty}{\longrightarrow} \left(2\pi\right)^{-3/2} \int d^3\mathbf{p} \left(2E\right)^{-1/2}\left[a_{\text{in/out}}\left(\mathbf{p}\right)e^{ip\cdot x} + \text{H.c.}\right], \label{eq:9.2.5} \end{equation} \]

\[ \begin{equation} \Pi\left(\mathbf{x},t\right) \stackrel{t \to \mp\infty}{\longrightarrow}\dot{\Phi}(\mathbf{x},t) \stackrel{t \to \mp\infty}{\longrightarrow}-i\left(2\pi\right)^{-3/2} \int d^3\mathbf{p} \left(E/2\right)^{1/2}\left[a_{\text{in/out}}\left(\mathbf{p}\right)e^{ip\cdot x} - \text{H.c.}\right], \label{eq:9.2.6} \end{equation} \]

其中\(p^0 \equiv E \equiv \sqrt{\mathbf{p}^2 + m^2}\),我们在这里使用传统的\(\Phi\)\(\Pi\)而不是\(Q\)\(P\)表示标量场,并省略不必要的标签\(m,\sigma,n\)。反演傅里叶变换并取结果表达式的线性组合,我们有

\[ \begin{equation} a_{\text{in/out}}\left(\mathbf{p}\right) = \lim_{t \to \mp\infty} \frac{e^{iEt}}{\left(2\pi\right)^{3/2}} \int d^3\mathbf{x} e^{-i\mathbf{p} \cdot \mathbf{x}} \left[\sqrt{\frac{E}{2}}\Phi\left(\mathbf{x},t\right) + i\sqrt{\frac{1}{2E}}\Pi\left(\mathbf{x},t\right)\right]. \label{eq:9.2.7} \end{equation} \]

如第9.1节所述,'动量'\(\Pi\left(\mathbf{x},t\right)\)\(\phi\)基中作为变分导数\(-i\delta/\delta\phi\left(\mathbf{x},t\right)\)作用于波函数,所以在这个基中条件(9.2.4)变为

\[ \begin{equation} 0 = \int d^3\mathbf{x} e^{-i\mathbf{p} \cdot \mathbf{x}} \left[\frac{\delta}{\delta\phi\left(\mathbf{x}\right)} + E\left(\mathbf{p}\right)\phi\left(\mathbf{x}\right)\right] \langle\phi\left(\mathbf{x}\right);\mp\infty|\text{VAC},\text{in/out}\rangle. \label{eq:9.2.8} \end{equation} \]

对应的常微分方程有众所周知的高斯解,所以让我们在这里尝试高斯ansatz:

\[ \begin{equation} \langle\phi\left(\mathbf{x}\right),\mp\infty|\text{VAC},\text{in/out}\rangle = \mathcal{N} \exp\left(-\frac{i}{2}\int d^3\mathbf{x} d^3\mathbf{y} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right)\phi\left(\mathbf{x}\right)\phi\left(\mathbf{y}\right)\right), \label{eq:9.2.9} \end{equation} \]

其中核\(\mathcal{E}\)和常数\(\mathcal{N}\)待定。将此代入式\(\eqref{eq:9.2.8}\),我们看到真空波泛函的泛函微分方程对所有\(\phi\)都满足,如果

\[ \begin{equation} 0 = \int d^3\mathbf{x} e^{-i\mathbf{p} \cdot \mathbf{x}} \left[\int d^3\mathbf{y} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right)\phi\left(\mathbf{y}\right) - E\left(\mathbf{p}\right)\phi\left(\mathbf{x}\right)\right], \label{eq:9.2.10} \end{equation} \]

或者,换句话说,如果

\[ \begin{equation} \int d^3\mathbf{x} e^{-i\mathbf{p} \cdot \mathbf{x}}\mathcal{E}\left(\mathbf{x},\mathbf{y}\right) = E\left(\mathbf{p}\right) e^{-i\mathbf{p} \cdot \mathbf{y}}. \label{eq:9.2.11} \end{equation} \]

通过反演傅里叶变换很容易找到解

\[ \begin{equation} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right) = \left(2\pi\right)^{-3} \int d^3\mathbf{p} e^{i\mathbf{p} \cdot \left(\mathbf{x}-\mathbf{y}\right)}E\left(\mathbf{p}\right). \label{eq:9.2.12} \end{equation} \]

(回忆\(E\left(\mathbf{p}\right) \equiv \sqrt{\mathbf{p}^2 + m^2}\)。)这实际上是核\(\mathcal{E}\)最有用的表示,但我们可以顺便注意到对于\(\mathbf{x} \neq \mathbf{y}\)\(\mathcal{E}\)也可以写成负阶Hankel函数的形式

\[ \begin{equation} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right) = \frac{m}{2\pi^2 r} \frac{d}{dr}\left(\frac{1}{r}K_{-1}\left(mr\right)\right), \label{eq:9.2.13} \end{equation} \]

其中\(r \equiv |\mathbf{x} - \mathbf{y}|\)。式\(\eqref{eq:9.2.9}\)中的常数\(\mathcal{N}\)可以形式上从真空态的归一化条件获得,但我们不需要这个结果。

小虚部\(i\epsilon\)

根据式\(\eqref{eq:9.2.9}\),在标量场理论中计算真空期望值时,式\(\eqref{eq:9.2.3}\)中最后两个因子的乘积是

\[ \begin{align} &\langle\text{VAC},\text{out}|\phi\left(\infty\right);+\infty\rangle \langle\phi\left(-\infty\right);-\infty|\text{VAC},\text{in}\rangle \nonumber\\ &= |\mathcal{N}|^2 \exp\left(-\frac{1}{2}\int d^3\mathbf{x} d^3\mathbf{y} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right)\left[\phi\left(\mathbf{x},+\infty\right)\phi\left(\mathbf{y},+\infty\right)+\phi\left(\mathbf{x},-\infty\right)\phi\left(\mathbf{y},-\infty\right)\right]\right) \label{eq:9.2.14a}\\ &= |\mathcal{N}|^2 \exp\left(-\frac{1}{2}\epsilon \int d^3\mathbf{x} d^3\mathbf{y} \int_{-\infty}^{+\infty} d\tau \mathcal{E}\left(\mathbf{x},\mathbf{y}\right)\phi\left(\mathbf{x},\tau\right)\phi\left(\mathbf{y},\tau\right)e^{-\epsilon|\tau|}\right), \label{eq:9.2.14b} \end{align} \]

其中\(\epsilon\)是正无穷小量。为了得到最终表达式,我们使用了对任何合理光滑函数\(f\left(\tau\right)\)的事实,

\[ \begin{equation} f\left(+\infty\right) + f\left(-\infty\right) = \lim_{\epsilon \to 0^+} \epsilon \int_{-\infty}^{+\infty} d\tau f\left(\tau\right) e^{-\epsilon|\tau|}. \label{eq:9.2.15} \end{equation} \]

将式(9.2.14)插入式(9.2.3)后给出

\[ \begin{align} &\left\langle\text{VAC},\text{out}\left|T\left\{\mathcal{O}_A\left[\Pi\left(t_A\right),\Phi\left(t_A\right)\right], \mathcal{O}_B\left[\Pi\left(t_B\right),\Phi\left(t_B\right)\right], \cdots \right\}\right|\text{VAC},\text{in}\right\rangle \nonumber\\ &= |\mathcal{N}|^2 \int \prod_{\tau,\mathbf{x}} d\phi\left(\mathbf{x},\tau\right)\prod_{\tau,\mathbf{x}} \left(d\pi\left(\mathbf{x},\tau\right)/2\pi\right) \mathcal{O}_A\left[\pi\left(t_A\right),\phi\left(t_A\right)\right] \nonumber\\ &\times \mathcal{O}_B\left[\pi\left(t_B\right),\phi\left(t_B\right)\right] \cdots \exp\left[i\int_{-\infty}^{+\infty} d\tau \left\{\int d^3\mathbf{x} \dot{\phi}\left(\mathbf{x},\tau\right)\pi\left(\mathbf{x},\tau\right)\right.\right. \nonumber\\ &\left.\left.-H\left[\phi\left(\tau\right),\pi\left(\tau\right)\right] + \frac{i}{2}\epsilon \int d^3\mathbf{x} d^3\mathbf{y} \mathcal{E}\left(\mathbf{x},\mathbf{y}\right)e^{-\epsilon|\tau|}\phi\left(\mathbf{x},\tau\right)\phi\left(\mathbf{y},\tau\right)\right\}\right]. \label{eq:9.2.16} \end{align} \]

我们将在第9.4节中看到,式\(\eqref{eq:9.2.16}\)中指数宗量的最后一项的整个效果是在动量空间的标量场传播子分母中提供\(-i\epsilon\)\(\mathbf{p}^2 + m^2 \to \mathbf{p}^2 + m^2 - i\epsilon\)。我们不会在这里详述一般自旋场的相应细节,而是简单地说明,一般情况下

\[ \begin{align} &\left\langle\text{VAC},\text{out}\left|T\left\{\mathcal{O}_A\left[P_A\left(t_A\right),Q\left(t_A\right)\right], \mathcal{O}_B\left[P_B\left(t_B\right),Q\left(t_B\right)\right], \cdots \right\}\right|\text{VAC},\text{in}\right\rangle \nonumber\\ &= |\mathcal{N}|^2 \int \left[\prod_{\tau,\mathbf{x},m} dq_m\left(\mathbf{x},\tau\right)\right]\left[\prod_{\tau,\mathbf{x},m} \frac{dp_m\left(\mathbf{x},\tau\right)}{2\pi}\right] \mathcal{O}_A\left[p\left(t_A\right),q\left(t_A\right)\right] \nonumber\\ &\times \mathcal{O}_B\left[p\left(t_B\right),q\left(t_B\right)\right] \cdots \exp\left[i\int_{-\infty}^{+\infty} d\tau \left\{\int d^3\mathbf{x} \sum_m \dot{q}_m\left(\mathbf{x},\tau\right)p_m\left(\mathbf{x},\tau\right)\right.\right. \nonumber\\ &\left.\left.-H\left[q\left(\tau\right),p\left(\tau\right)\right] + i\epsilon \text{ terms}\right\}\right], \label{eq:9.2.17} \end{align} \]

其中'\(i\epsilon\) terms'正好具有在所有传播子分母中放入正确\(-i\epsilon\)的效果。

这里是提及式(9.2.17)中诸如常数\(|\mathcal{N}|^2\)等与场无关因子并不重要的好地方。这是因为这种因子也对矩阵元\(\langle\text{VAC},\text{out}|\text{VAC},\text{in}\rangle\)有贡献。在计算时间序产品的真空期望值的连通部分(或S矩阵)时,我们通过除以\(\langle\text{VAC},\text{out}|\text{VAC},\text{in}\rangle\)来消除不连通真空涨落子图的贡献,任何真空期望值中的常数因子在这个比值中抵消。

我们可以继续计算多粒子态之间的矩阵元,方法是在式(9.2.3)中插入适当的'波泛函'。这些可以通过应用第9.2.7节所述的湮灭算符来计算,就像刚才对谐振子态那样,这些波泛函最终会变成场乘真空高斯的厄米多项式。我们不需要在这里全部计算出来,因为如第6.4节所示,真空期望值(9.2.17)是我们为了能够计算S矩阵元所需要的全部。


  1. 1.我们现在用方括号写\(H\)\(\mathcal{O}\),以提醒我们\(H\left[q\left(t\right),p\left(t\right)\right]\)\(\mathcal{O}\left[p\left(t\right),q\left(t\right)\right]\)是在固定时刻\(t\)\(q_m\left(\mathbf{x},t\right)\)\(p_m\left(\mathbf{x},t\right)\)的泛函。 ↩︎
  2. 2.只需要注意的是,对于哈密顿量\(H\left[P\left(t\right),Q\left(t\right)\right] + \sum_A \int d^3\mathbf{x} \epsilon_A\left(\mathbf{x},t\right)O_A\left(\mathbf{x},t\right)\),S矩阵由式(9.2.3)给出为 \[ \langle\beta,\text{out}|\alpha,\text{in} \rangle_\epsilon = \int \prod_{\tau,\mathbf{x},m} dq_m\left(\mathbf{x},\tau\right)\prod_{\tau,\mathbf{x},m} \left(\frac{dp_m\left(\mathbf{x},\tau\right)}{2\pi}\right) \] \[ \times \exp\left[ i\int_{-\infty}^{+\infty} d\tau \left[\int d^3\mathbf{x} \sum_m \dot{q}_m\left(\mathbf{x},\tau\right)p_m\left(\mathbf{x},\tau\right) - H\left[q\left(\tau\right),p\left(\tau\right)\right] - \sum_A \int d^3\mathbf{x} \epsilon_A\left(\mathbf{x},\tau\right)O_A\left(\mathbf{x},\tau\right) \right] \right] \] \[ \times \langle\beta,\text{out}|q\left(+\infty\right);+\infty\rangle \langle q\left(-\infty\right);-\infty|\alpha,\text{in}\rangle. \] 式(6.4.3)的左端通过关于\(\epsilon_A\)\(\epsilon = 0\)处对这个表达式的导数获得,然后使用式(9.2.3)立即给出式(6.4.3)的右端。 ↩︎

本文为路径积分中的小虚部的介绍。通常从正则量子化的方法中会从物理上因为因果律的需要给出小\(\epsilon\),但是对于路径积分中的讨论偏少,这个内容在Steven Weinberg的The Quantum Theory of Fields Vol. I一书中有详细介绍。本文主要是对该书中小虚部的内容(主要在9.1-9.2两节中)进行翻译和整理。文中多数内容来自经个人审查的GPT翻译。

引论

在第7章和第8章中,我们应用了正则量子化的算符方法,推导了多种理论的费曼规则。在许多情况下,比如带有导数耦合的标量场或具有零/非零质量的矢量场,虽然推导过程直接,但实际上相当繁琐。相互作用哈密顿量包含一个协变项,等于拉格朗日中相互作用项的负号,以及一个非协变项,用于抵消传播子中的非协变项。在电动力学的情形下,这个非协变项(库仑能)甚至在空间上不是局域的,尽管它在时间上是局域的。然而最终的结果却非常简单:费曼规则正是我们用协变传播子、并用拉格朗日中相互作用项的负号计算顶点贡献时应得到的结果。获得这些简单结果的过程非常繁琐,在第7、8章讨论的理论中已经很麻烦,对于更复杂的理论(如第二卷将讨论的非阿贝尔规范理论和广义相对论)则几乎无法忍受。我们当然希望有一种方法能直接从拉格朗日量出发,得到最终洛伦兹协变形式的费曼规则。

幸运的是,这样的方法确实存在,这就是路径积分方法。路径积分最早由费曼在其普林斯顿博士论文中提出,最初用于非相对论量子力学,目的是直接用拉格朗日量而非哈密顿量进行计算。在这方面,它受到早期狄拉克工作的启发。路径积分方法也在费曼后来推导其图示规则时发挥了作用(当然也有灵感猜测的成分)。不过,尽管费曼图在20世纪50年代被广泛使用,大多数物理学家(包括我自己)还是倾向于用Schwinger和Tomonaga的算符方法推导这些规则,Dyson在1949年证明这些方法与费曼自己的方法得到的图规则是一致的。

路径积分方法在20世纪60年代末被重新重视,Faddeev和Popov以及De Witt展示了如何将其应用于非阿贝尔规范理论和广义相对论。对大多数理论物理学家来说,转折点出现在1971年,'t Hooft利用路径积分方法推导了自发对称性破缺的规范理论(第二卷讨论),特别是弱相互作用和电磁相互作用理论的费曼规则,并采用了一种使高能行为透明的规范。不久之后,也是在第二卷中讨论的,人们发现路径积分方法可以考虑S矩阵中在耦合常数为零时具有本质奇点的贡献,这些贡献在任何有限阶微扰理论中都无法发现。从那以后,这里介绍的路径积分方法成为所有使用量子场论的物理学家的必备工具。

此时读者可能会疑惑,如果路径积分方法如此方便,为什么第7章还要介绍正则形式主义。事实上,费曼最初似乎也把路径积分方法当作普通正则量子力学的替代方案。之所以要从正则形式主义出发,有两个原因。第一是原则性问题:虽然路径积分形式主义为我们提供了显然洛伦兹协变的图规则,但它并没有明确说明用这种方法计算得到的S矩阵为何是幺正的。据我所知,唯一能证明路径积分形式主义给出幺正S矩阵的方法,是用它重建正则形式主义,在后者中幺正性是显然的。这其实是一种“麻烦守恒”:我们可以用正则方法,幺正性显然但洛伦兹协变性不明显;也可以用路径积分方法,协变性显然但幺正性不明显。由于这里的路径积分方法是从正则方法推导出来的,我们知道两种方法给出相同的S矩阵,因此S矩阵必然既协变又幺正。

第二个原因更实际:有些重要理论中,最简单版本的费曼路径积分方法(即直接从拉格朗日量取传播子和顶点)其实是错误的。一个例子是非线性\(\sigma\)模型,其拉格朗日密度为\(\mathcal{L} = -\frac{1}{2}g_{kl}(\phi)\partial_\mu\phi^k\partial^\mu\phi^l\)。在这类理论中,直接用拉格朗日密度推导的“天真”费曼规则会得到错误甚至非幺正的S矩阵,且结果还依赖于我们如何定义标量场。在本章中,我们将从正则形式主义推导路径积分形式主义,从而看到需要在最简单的路径积分费曼规则基础上补充哪些额外的顶点。

9.1 路径积分的一般公式

无穷小区间的跃迁振幅

我们从一个一般的量子力学系统出发,设有厄米算符“坐标”\(Q_a\)和共轭“动量”\(P_b\),它们满足正则对易关系: \[ \begin{equation} [Q_a, P_b] = i\delta_{ab} \label{eq:9.1.1} \end{equation} \] \[\begin{equation} [Q_a, Q_b] = [P_a, P_b] = 0 \label{eq:9.1.2} \end{equation}\]

(本节及接下来的三节我们只讨论玻色子算符,即满足对易关系的算符。对费米子算符的推广将在9.5节给出。)在场论中,指标\(a\)通常包括空间位置\(\mathbf{x}\)和离散的洛伦兹及种类指标\(m\),我们约定写作

\[\begin{equation} Q_{x,m} \equiv Q_m\left(\mathbf{x}\right) \label{eq:9.1.3} \end{equation}\] \[\begin{equation} P_{x,m} \equiv P_m\left(\mathbf{x}\right) \label{eq:9.1.4} \end{equation}\]

同时,\(\eqref{eq:9.1.1}\)中的Kronecker delta在场论中解释为

\[\begin{equation} \delta_{x,m;y,n} \equiv \delta^3\left(\mathbf{x}-\mathbf{y}\right)\delta_{mn} \label{eq:9.1.5} \end{equation}\]

不过,为了简便,本文将继续使用\(\eqref{eq:9.1.1}\)\(\eqref{eq:9.1.2}\)的紧凑记号,这些是“薛定谔绘景”下的算符,取定某一时刻(如\(t=0\))。海森堡绘景下的时变算符将在后文讨论。

由于所有\(Q_a\)都对易,我们可以找到一组共同本征态\(|q\rangle\),其本征值为\(q_a\)

\[\begin{equation} Q_a|q\rangle = q_a|q\rangle \label{eq:9.1.6} \end{equation}\]

这些本征矢可以取为正交归一的:

\[\begin{equation} \langle q'|q\rangle = \prod_a \delta\left(q'_a - q_a\right) \equiv \delta\left(q' - q\right) \label{eq:9.1.7} \end{equation}\]

因此完备关系为

\[\begin{equation} 1 = \int \prod_a dq_a\, |q\rangle\langle q| \label{eq:9.1.8} \end{equation}\]

同理,我们可以找到\(P_a\)的正交归一本征态\(|p\rangle\)

\[\begin{equation} P_a|p\rangle = p_a|p\rangle \label{eq:9.1.9} \end{equation}\] \[\begin{equation} \langle p'|p\rangle = \prod_a \delta\left(p'_a - p_a\right) \equiv \delta\left(p' - p\right) \label{eq:9.1.10} \end{equation}\] \[\begin{equation} 1 = \int \prod_a dp_a |p\rangle\langle p| \label{eq:9.1.11} \end{equation}\]

\(\eqref{eq:9.1.1}\)可知,这两组完备本征态的标量积为

\[\begin{equation} \langle q|p\rangle = \prod_a \frac{1}{\sqrt{2\pi}} \exp\left(iq_a p_a\right) \label{eq:9.1.12} \end{equation}\]

在海森堡绘景下,\(Q\)\(P\)算符具有如下时间依赖性:

\[\begin{equation} Q_a\left(t\right) \equiv e^{iHt} Q_a e^{-iHt} \label{eq:9.1.13} \end{equation}\] \[\begin{equation} P_a\left(t\right) \equiv e^{iHt} P_a e^{-iHt} \label{eq:9.1.14} \end{equation}\]

其中\(H\)为总哈密顿量。这些算符的本征态分别为\(|q;t\rangle\)\(|p;t\rangle\)

\[\begin{equation} Q_a\left(t\right)|q;t\rangle = q_a|q;t\rangle \label{eq:9.1.15} \end{equation}\] \[\begin{equation} P_a\left(t\right)|p;t\rangle = p_a|p;t\rangle \label{eq:9.1.16} \end{equation}\]

它们由如下关系给出:

\[\begin{equation} |q;t\rangle = e^{iHt}|q\rangle \label{eq:9.1.17} \end{equation}\] \[\begin{equation} |p;t\rangle = e^{iHt}|p\rangle \label{eq:9.1.18} \end{equation}\]

(注意\(|q;t\rangle\)\(Q_a(t)\)的具有本征值\(q_a\)的本征态,而不是\(|q\rangle\)演化时间\(t\)后的结果。这就是为什么时间依赖性是由\(e^{iHt}\)给出而非\(e^{-iHt}\).)这些态满足完备性和正交性:

\[\begin{equation} \langle q';t|q;t\rangle = \delta\left(q' - q\right) \label{eq:9.1.19} \end{equation}\] \[\begin{equation} \langle p';t|p;t\rangle = \delta\left(p' - p\right) \label{eq:9.1.20} \end{equation}\] \[\begin{equation} \int \prod_a dq_a\, |q;t\rangle\langle q;t| = 1 \label{eq:9.1.21} \end{equation}\] \[\begin{equation} \int \prod_a dp_a\, |p;t\rangle\langle p;t| = 1 \label{eq:9.1.22} \end{equation}\]

并且

\[\begin{equation} \langle q;t|p;t\rangle = \prod_a \frac{1}{\sqrt{2\pi}} \exp\left(iq_a p_a\right) \label{eq:9.1.23} \end{equation}\]

如果在\(t\)时刻测量系统处于\(|q;t\rangle\),则在\(t'\)时刻测量为\(|q';t'\rangle\)的概率幅为\(\langle q';t'|q;t\rangle\),本章的中心问题就是计算这个标量积。

\(t'\)\(t\)无穷接近时,设\(t' = \tau + d\tau\)\(t = \tau\),有 \[ \begin{equation} \langle q';\tau + d\tau|q;\tau\rangle = \langle q';\tau|e^{-iH d\tau}|q;\tau\rangle \label{eq:9.1.24} \end{equation} \] 哈密顿量\(H\)可写为\(H(Q,P)\),但由于\(\eqref{eq:9.1.13}\)\(\eqref{eq:9.1.14}\)是相似变换,并且\(H\)与其自身对易,可以写为关于\(Q(t)\)\(P(t)\)相同函数:

\[\begin{equation} H \equiv H\left(Q,P\right) = e^{iHt} H\left(Q,P\right) e^{-iHt} = H\left(Q\left(t\right), P\left(t\right)\right) \label{eq:9.1.25} \end{equation}\]

我们可以采用标准形式,使所有\(Q\)都在\(P\)的左边。例如\(P_a Q_b P_c\)可重写为\(Q_b P_a P_c - i\delta_{ab}P_c\)。这样,\(Q_a(t)\)可用其本征值\(q'_a\)替换。为处理\(P(t)\),用\(\eqref{eq:9.1.23}\)\(|q;\tau\rangle\)\(|p;\tau\rangle\)基展开,得到 \[ \begin{align} \langle q';\tau + d\tau|q;\tau\rangle &= \int \prod_a dp_a\, \langle q';\tau|e^{-iH\left(Q\left(\tau\right),P\left(\tau\right)\right)d\tau}|p;\tau\rangle \langle p;\tau|q;\tau\rangle \nonumber \\ &= \int \prod_a \frac{dp_a}{2\pi} \exp\left[-iH\left(q',p\right)d\tau + i\sum_a \left(q'_a - q_a\right)p_a\right]\label{eq:9.1.26}\\ \end{align} \]

有限区间的跃迁振幅

对于有限时间区间\(t\)\(t'\),将区间分为\(N+1\)段,每段 \[ \begin{equation} \tau_{k+1}-\tau_k=d\tau = \left(t' - t\right)/\left(N+1\right) \end{equation} \label{eq:9.1.27} \] 在每个\(\tau_k\)插入完备集: \[ \begin{equation} \langle q';t'|q;t\rangle = \int dq_1 \cdots dq_N \langle q';t'|q_N;\tau_N\rangle \langle q_N;\tau_N|q_{N-1};\tau_{N-1}\rangle \cdots \langle q_1;\tau_1|q;t\rangle \label{eq:9.1.28} \end{equation} \] 代入\(\eqref{eq:9.1.26}\)\[ \begin{align} &\langle q';t'|q;t\rangle = \int \left[\prod_{k=1}^N \prod_a dq_{k,a}\right] \left[\prod_{k=0}^N \prod_a \frac{dp_{k,a}}{2\pi}\right]\nonumber\\ &\quad\times \exp\left\{i\sum_{k=1}^{N+1} \left[\sum_a \left(q_{k,a} - q_{k-1,a}\right)p_{k-1,a} - H\left(q_k, p_{k-1}\right)d\tau\right]\right\} \label{eq:9.1.29} \end{align} \] 其中 \[ \begin{equation} q_0 \equiv q, \quad q_{N+1} \equiv q' \label{eq:9.1.30} \end{equation} \]

内插函数

结果\(\eqref{eq:9.1.29}\)能够写为更加优雅的形式。定义平滑插值函数\(q(\tau)\)\(p(\tau)\),使得 \[ \begin{equation}\label {eq:9.1.31} q_a\left(\tau_k\right) = q_{k,a}, \quad p_a\left(\tau_k\right) = p_{k,a} \end{equation} \] 则当\(N \to \infty\)时,\(d\tau \to 0\),时,式\(\eqref{eq:9.1.29}\)中的指数宗量变为关于\(\tau\)的积分 \[ \begin{align} &\sum_{k=1}^{N+1} \left[\sum_a \left(q_{k,a} - q_{k-1,a}\right)p_{k-1,a} - H\left(q_k, p_{k-1}\right)d\tau\right] \nonumber\\ &= \sum_{k=1}^{N+1} \left[\sum_a \dot{q}_a\left(\tau_k\right)p_{a}\left(\tau_k\right) - H\left(q\left(\tau_k\right), p\left(\tau_k\right)\right)\right]d\tau+O\left(d\tau^2\right) \nonumber\\ &\to \int_t^{t'} \left[\sum_a \dot{q}_a\left(\tau\right)p_a\left(\tau\right) - H\left(q\left(\tau\right), p\left(\tau\right)\right)\right]d\tau \label{eq:9.1.32} \end{align} \] 此外,可以将积分定义为对函数\(q(\tau)\)\(p(\tau)\)的积分\[ \begin{equation} \int \prod_{\tau,a} dq_a\left(\tau\right) \prod_{\tau,b} \frac{dp_b\left(\tau\right)}{2\pi}\cdots \equiv \lim_{d\tau \to 0} \int \prod_{k,a} dq_{k,a} \prod_{k,b} \frac{dp_{k,b}}{2\pi} \label{eq:9.1.33} \end{equation} \] 最终,路径积分表达式为 \[ \begin{align} \langle q';t'|q;t\rangle &= \int_{q_a\left(t\right)=q_a}^{q_a\left(t'\right)=q_a'}\prod_{\tau,a}dq_a\left(\tau\right)\prod_{\tau,b} \frac{dp_b\left(\tau\right)}{2\pi}\nonumber\\ &\times \exp\left\{i\int_t^{t'} d\tau \left[\sum_a \dot{q}_a\left(\tau\right)p_a\left(\tau\right) - H\left(q\left(\tau\right), p\left(\tau\right)\right)\right]\right\} \label{eq:9.1.34} \end{align} \] 这就是路径积分(path integral)表达式,因为我们对所有从\(q\)\(q'\)的路径\(q(\tau)\)以及所有\(p(\tau)\)进行积分。

以这种方式写出矩阵元的一大优势是,当在\(H\)中展开为耦合常数的幂次时,路径积分很容易计算。

时序乘积下的矩阵元

路径积分形式主义允许我们不仅计算跃迁概率幅如\(\langle q';t'|q;t\rangle\),还可以计算时间序乘积的任意算符\(\mathcal{O}\left(P\left(t\right),Q\left(t\right)\right)\)在给定初态\(\langle q';t'|\)和末态\(|q;t\rangle\)之间的矩阵元。定义这些算符(与\(H\)不同)使所有\(P\)移到左边,所有\(Q\)移到右边,会很方便。然后通过在式\(\eqref{eq:9.1.26}\)中插入任何这样的算符\(\mathcal{O}\left[P\left(t\right),Q\left(t\right)\right]\),我们有

\[ \begin{align} &\langle q';t'+dt|\mathcal{O}\left(P\left(t\right),Q\left(t\right)\right)|q;t\rangle \nonumber\\ &= \int \prod dp_a\times \langle q';t|\exp\left(-iH\left(Q\left(t\right),P\left(t\right)\right)dt\right)|p;t\rangle\langle p;t|\mathcal{O}\left(P\left(t\right),Q\left(t\right)\right)|q;t\rangle\nonumber\\ &= \int \prod_a\frac{dp_a}{2\pi} \exp\left[-iH\left(q',p\right)dt + i\sum\left(q'_a - q_a\right)p_a\right] \mathcal{O}\left(p,q\right). \label{eq:9.1.35} \end{align} \]

为了计算形如\(\mathcal{O}_A\left(P\left(t_A\right),Q\left(t_A\right)\right)\mathcal{O}_B\left(P\left(t_B\right),Q\left(t_B\right)\right)\cdots\)的算符乘积的矩阵元,其中\(t_A > t_B > \cdots\),我们可以在式\(\eqref{eq:9.1.28}\)中的适当态之间插入\(\mathcal{O}\)算符,并使用式\(\eqref{eq:9.1.35}\)。例如,如果时间\(t_A\)落在\(\tau_k\)\(\tau_{k+1}\)之间,则在\(\langle q_{k+1};\tau_{k+1}|\)\(|q_k;\tau_k\rangle\)之间插入\(\mathcal{O}_A\left(P\left(t_A\right),Q\left(t_A\right)\right)\)。注意在式\(\eqref{eq:9.1.28}\)中每个连续的态求和都在后面的时间,所以这只有在我们假设\(t_A > t_B > \cdots\)时才可能。按照与之前相同的步骤,我们现在找到一般路径积分公式

\[ \begin{align} &\langle q';t'|\mathcal{O}_A\left(P\left(t_A\right),Q\left(t_A\right)\right)\mathcal{O}_B\left(P\left(t_B\right),Q\left(t_B\right)\right)\cdots|q;t\rangle \nonumber\\ &= \int_{q_a\left(t\right)=q_a}^{q_a\left(t'\right)=q_a'} \prod_{a,\tau} dq_a\left(\tau\right)\prod_{b,\tau} \frac{dp_b\left(\tau\right)}{2\pi} \mathcal{O}_A\left(p\left(t_A\right),q\left(t_A\right)\right)\mathcal{O}_B\left(p\left(t_B\right),q\left(t_B\right)\right)\cdots \nonumber\\ &\times \exp\left[i\int_t^{t'} d\tau \left\{\sum \dot{q}_a\left(\tau\right)p_a\left(\tau\right) - H\left(q\left(\tau\right),p\left(\tau\right)\right)\right\}\right]. \label{eq:9.1.36} \end{align} \]

这个结果只有在时间有序时才有效,即 \[ \begin{equation}\label{eq:9.1.37} t' > t_A > t_B > \cdots > t. \end{equation} \]

然而,式\(\eqref{eq:9.1.36}\)右边没有任何内容涉及时间参数的顺序。因此,如果我们遇到像式\(\eqref{eq:9.1.36}\)右边这样的路径积分,其中\(t_A,t_B,\cdots\)的顺序是任意的(全部在\(t\)\(t'\)之间,且\(t < t'\)),那么这个路径积分将等于像式\(\eqref{eq:9.1.36}\)左边这样的矩阵元,但算符按时间递减的顺序排列(从左到右)。也就是说,对于任意顺序的\(t_A,t_B,\cdots\),我们有

\[ \begin{align} &\langle q';t'|T\left\{\mathcal{O}_A(P(t_A),Q(t_A)), \mathcal{O}_B(P(t_B),Q(t_B)), \cdots \right\}|q;t\rangle \nonumber\\ &= \int \prod_{a,b} dq_a(\tau)\prod \frac{dp_b(\tau)}{2\pi} \mathcal{O}_A(p(t_A),q(t_A))\mathcal{O}_B(p(t_B),q(t_B))\cdots \nonumber\\ &\times \exp\left[i\int_t^{t'} d\tau \left\{\sum \dot{q}_a(\tau)p_a(\tau) - H(q(\tau),p(\tau))\right\}\right]. \label{eq:9.1.38} \end{align} \] 其中\(T\)表示时间序乘积算符。

运动方程

应该强调的是,式\(\eqref{eq:9.1.38}\)中的复数函数\(q_a(\tau), p_a(\tau)\)仅仅是积分变量,特别是受经典哈密顿动力学运动方程的约束

\[ \begin{align} \dot{q}_a\left(\tau\right) - \frac{\partial H\left(q\left(\tau\right),p\left(\tau\right)\right)}{\partial p_a\left(\tau\right)} &= 0, \label{eq:9.1.39}\\ \dot{p}_a\left(\tau\right) + \frac{\partial H\left(q\left(\tau\right),p\left(\tau\right)\right)}{\partial q_a\left(\tau\right)} &= 0. \label{eq:9.1.40} \end{align} \]

(因此,式\(\eqref{eq:9.1.38}\)中的哈密顿量\(H\left(q\left(\tau\right),p\left(\tau\right)\right)\)\(\tau\)是常数。)尽管如此,路径积分在有限意义上确实尊重这些运动方程。假设式\(\eqref{eq:9.1.38}\)中的某个函数,比如\(\mathcal{O}_A\left(p\left(t_A\right),q\left(t_A\right)\right)\),恰好是式\(\eqref{eq:9.1.39}\)或式\(\eqref{eq:9.1.40}\)的左边。我们注意到(对于\(t < t_A < t'\)

\[ \begin{align} \left(\dot{q}_a\left(t_A\right) - \frac{\partial H\left(q\left(t_A\right),p\left(t_A\right)\right)}{\partial p_a\left(t_A\right)}\right) \exp\left(iI\left[q,p\right]\right) &= -i\frac{\delta}{\delta p_a\left(t_A\right)} \exp\left(iI\left[q,p\right]\right), \label{eq:9.1.41}\\ \left(\dot{p}_a\left(t_A\right) - \frac{\partial H\left(q\left(t_A\right),p\left(t_A\right)\right)}{\partial q_a\left(t_A\right)}\right) \exp\left(iI\left[q,p\right]\right) &= i\frac{\delta}{\delta q_a\left(t_A\right)} \exp\left(iI\left[q,p\right]\right), \label{eq:9.1.42} \end{align} \]

其中\(iI\)是式\(\eqref{eq:9.1.38}\)中指数的宗量:

\[ I\left[q,p\right] \equiv \int_t^{t'} d\tau \left\{\sum \dot{q}_a\left(\tau\right)p_a\left(\tau\right) - H\left(q\left(\tau\right),p\left(\tau\right)\right)\right\}. \label{eq:9.1.43} \]

只要\(t_A\)不接近\(t\)\(t'\),对\(q_a\left(t_A\right)\)\(p_a\left(t_A\right)\)的积分是无约束的,所以在关于收敛性的合理假设下,这种变分导数的积分必须消失。因此,如果\(\mathcal{O}\left(p,q\right)\)取为运动方程\(\eqref{eq:9.1.39}\)\(\eqref{eq:9.1.40}\)之一的左边,路径积分\(\eqref{eq:9.1.38}\)就消失。

这个简单规则只有在积分变量\(q_a\left(t_A\right), p_a\left(t_A\right)\)独立于任何其他变量\(q_a\left(t_B\right), p_a\left(t_B\right)\)等出现在式\(\eqref{eq:9.1.38}\)的其他函数\(\mathcal{O}_B, \mathcal{O}_C\)等中时才适用,因此只有当我们禁止\(t_A\)接近\(t_B, t_C\)等以及\(t\)\(t'\)时才成立。当\(t_A\)接近,比如\(t_B\)时,路径积分将涉及正比于\(\delta\left(t_A - t_B\right)\)或其导数的非零项。这些delta函数与在算符形式主义中隐含在时间序乘积定义中的阶跃函数的时间导数相同。

在计算路径积分\(\eqref{eq:9.1.34}\)\(\eqref{eq:9.1.38}\)时,我们只需要知道经典哈密顿量,即c数函数\(H\left(q,p\right)\)。如果我们要用路径积分定义理论,问题自然会出现,什么样的量子力学哈密顿量\(H\left(Q,P\right)\)(其中\(Q\)\(P\)算符的顺序不同)对应这些路径积分。我们的推导已经给出了答案:量子哈密顿量应取所有\(Q\)在左边,所有\(P\)在右边。但太重视该规则反而会成为一个错误。解释在路径积分\(\eqref{eq:9.1.34}\)\(\eqref{eq:9.1.38}\)中出现的测度\(\prod dq_a\left(\tau\right) \prod dp_b\left(\tau\right)\)有很多种方式。我们的规定,即将所有\(Q\)放在所有\(P\)的左边,只有在测度按照式\(\eqref{eq:9.1.31}\)-\(\eqref{eq:9.1.33}\)解释时才合适。其他测度会导致哈密顿量中算符排序的其他规定。这个问题不是紧迫的,因为哈密顿量中不同项的算符排序差异只对应哈密顿量中各种项的c数常数,我们一般将这些常数作为任意参数留下。

使用式\(\eqref{eq:9.1.38}\)中的一般路径积分进行数值计算或作为严格定理的来源是困难的。为了这些目的,更好的方法是使用路径积分方法在欧几里得空间中计算振幅,其中\(t\)被一个虚数量\(-ix_4\)替换,式\(\eqref{eq:9.1.38}\)的指数宗量是负实数量。这样,相比于实时间中锯齿路径会产生快速的振荡,虚时间则可以将这些快速震荡的路径以指数的方式抑制掉。

本文主要参照J M Zhang以及R X Dong一文精确对角化方法,以Bose-Hubbard模型为例,给出了对应的哈密顿量的构建方法。代码以matlab给出。

Bose-Hubbard模型

Bose-Hubbard模型指的是满足如下哈密顿量的模型:

\[\begin{equation} \hat{H}=-t\sum_{\langle ij\rangle}(a_{i}^{\dagger}a_{j}+a_{j}^{\dagger}a_{i})+\frac{U}{2}\sum_{i=1}^{M}\hat{n}_{i}(\hat{n}_{i}-1) \end{equation}\]

其中\(a_{i}(a_{i}^{\dagger})\)是湮灭(生成)一个在格点\(i\)上粒子的玻色算符,而数算符\(\hat{n}_{i}=a_{i}^{\dagger}a_{i}\)则计数在格点\(i\)上的粒子。由于该模型是玻色模型,每个格点上可以有多于两个粒子的共存。我们考虑有限个一维格点,假设总共有\(M\)个格点,若总原子数为\(N\)个,则总的Hilbert空间可以通过隔板法可以求得:

\[\begin{equation} D=\frac{(N+M-1)!}{N!(M-1)!} \end{equation}\]

可以发现该空间维数以指数增长。尽管可以通过对称性削减基的数量,在这里我们只考虑一个基础的数值方法,故在这里不作对称性分析。

本文的主要内容参考自相关文献[1],给出了如何构建用于精确对角化的Bose-Hubbard模型的算法。为简便起见,这里采取周期性边界条件

基的构建

由于我们需要考虑\(N\)个粒子分布在\(M\)个格点上的所有可能,尽管用循环的方式可以生成基,但其速度是相对慢的。事实上,对于Fock态,我们可以定义一个字典序(Lexicographic order)去排列所有的基。

给定两个Fock基向量\(|n_{1},n_{2},\cdots,n_{M}\rangle\)\(|\bar{n}_{1},\bar{n}_{2},\cdots,\bar{n}_{M}\rangle\),那么一定存在一个给定的编号\(1\le k\le M-1\)使得对于\(1\le i\le M-1\)\(n_{i}=\bar{n}_{i}\),而\(n_{k}\neq \bar{n}_{k}\)。我们定义,若\(n_{k}\ge\bar{n}_{k}\)(\(n_{k}\le\bar{n}_{k}\)),则称向量\(|n_{1},n_{2},\cdots,n_{M}\rangle\)优于(superior)(劣于inferior)向量\(|\bar{n}_{1},\bar{n}_{2},\cdots,\bar{n}_{M}\rangle\)。可以证明,这样的序关系可以在基向量之间定义一个全序关系。此时明显有\(|N,0,\cdots,0\rangle\)优于其他所有基向量,而\(|0,0,\cdots,N\rangle\)劣于其他所有基向量。

借由这样构造的全序关系,我们可以从\(|N,0,\cdots,0\rangle\)以降序的方式生成其他所有占据数的基。给定一基向量\(|n_{1},n_{2},\cdots,n_{M}\rangle\)满足\(n_{m}<N\),则我们生成劣于该向量的规则如下:

\(n_{k}\neq0\),且对所有的\(k+1\le i\le M-1\)都有\(n_{i}=0\)时,下一个基向量\(|\bar{n}_{1},\bar{n}_{2},\cdots,\bar{n}_{M}\rangle\)应当满足:

  • \(1\le i\le k-1\)时,有\(\bar{n}_{i}=n_{i}\)
  • \(\bar{n}_{k}=n_{k}-1\)
  • \(\bar{n}_{k+1}=N-\sum_{i=1}^{k}\bar{n}_{i}\),且对于\(i\ge k+2\)\(\bar{n}_{i}=0\)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
% Initialize the basis through cell
Basis = repmat({zeros(1, N_Sites)}, Dimension, 1);
% Set the first basis as (N, 0, 0...)
Basis{1}(1) = N_atoms;
% Basis Generation
for ii = 2: Dimension
% find the index of k
Count = find(Basis{ii-1}(1:end-1)~=0, 1, 'last');
temp = Basis{ii-1};
if Count <= N_Sites - 1
if temp(Count) ~= 0 && ~any(temp(Count+1:end-1))
Basis{ii}(1:Count-1) = Basis{ii-1}(1:Count-1);
Basis{ii}(Count) = Basis{ii-1}(Count) - 1;
Basis{ii}(Count + 1) = N_atoms - sum(Basis{ii}(1:Count));
end
end
end
Basis = cell2mat(Basis);

通过这样的计算,我们可以得到所有的基,得到的Basis将是一个\(D\times M\)的矩阵,每一行代表一个基,而一个基的每个分量则代表这个格点上的占据数。

哈密顿量的构建

建立好基之后,便可以开始构建哈密顿量的分量:

\[\begin{equation} H_{uv}=\langle u|H|v\rangle \end{equation}\]

一般情况下我们需要的哈密顿量是稀疏矩阵,我们只需要找到对应的非零元。Bose-Hubbard哈密顿量分为两个部分,一个部分为动能跃迁项\(H_{\text{kin}}\),另一个部分相互作用项\(H_{\text{int}}\)。因为在占据数表象下相互作用项是对角的,所以主要问题在于如何构建跃迁项。

一个直接的想法是将所有基向量都循环一遍——这个方法当然是可行的,但是当希尔伯特空间维数达到百万时,要遍历整个哈密顿量的矩阵所需要的时间是极久的。考虑到我们要写的动能项的哈密顿量形如\(a_{i}^{\dagger}a_{j}\),由于这样的跃迁总是近邻跃迁(例如一维情况下,考虑\(M>3\)个格点,则格点2上有从\(2\to 3\)\(2\to1\)两种跃迁),对于\(M\)个格点而言,最多只有\(2M\)个跃迁项,于是一个更简单的方法是,首先将基排好序,然后给定一个对应于哈密顿量第\(v\)列的基向量\(|v\rangle\),找到动能项哈密顿量作用在基上后的两个跃迁后的基,再乘上跃迁系数,就得到了对应的非零项,而这两个基对应的序列则给出了哈密顿量非零元的行指标。例如考虑一个5格点3个粒子的情形,给定基\(|0,3,0,0,0\rangle\),该向量的两种跃迁为\(|1,2,0,0,0\rangle\)\(|0,2,1,0,0\rangle\),则对应的哈密顿量第\(v\)列的非零行就是这两个基的位置。然后再遍历所有列,就可以写出动能部分哈密顿量。通过上面的方法,问题被转化成了如何找到经过哈密顿量作用后的非零向量所处的序列,这对应到哈密顿量的行列指标。

在对应非零基向量时,相比于挨个挨个地对应值,我们可以利用一种哈希技术(Hashing technique)来更快地找到对应地向量。简单来说,哈希算法给每个基向量都定义一个标签(Tag),从而要比较两个向量是否相同时,只需要比较他们的标签是否一致即可。

由于我们在生成基向量的时候已经定义了字典序,我们在这里可以进一步的利用字典序来定义一个标签函数。一个可选方案是:

\[\begin{equation} T(|v\rangle)=\sum_{i=1}^{M}\sqrt{p_{i}}v_{i} \end{equation}\]

其中\(p_{i}\)可以是第\(i\)个质数。由于matlab的prime函数生成质数的速度不快,可以参考文章[1]中直接可以使用\(p_{i}=100i+3\)

在给基编好号之后,为了更快地查找,还可以通过tag值对基向量进行排序,这样可以利用二分法进行查找,从而对于\(D\)个基向量,要找到对应的向量只需要\(\log_{2}D\)次寻找。

1
2
3
Tags = Basis * sqrt(100 * (1: N_Sites) + 3)';
% Sort the Tag function
[Tags, ind] = sort(Tags);

这样一来,最后就只需要找到对应的非零元的行列以及对应的值,就可以利用sparse命令建立动能部分哈密顿量。对应的matlab代码为:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
for ii = 1: Dimension
ind_nonzero = find(Basis(ii,:));
for jj = 1: length(ind_nonzero)
% Nearest hopping
% Left hopping matrix element
temp = Basis(ii,:);
temp(ind_nonzero(jj)) = temp(ind_nonzero(jj)) - 1;
temp_site = ind_nonzero(jj) - 1;
if temp_site == 0
temp_site = N_Sites;
end
temp(temp_site) = temp(temp_site) + 1;
temp_Tag = temp * Tag_function(N_Sites)';
col(Count) = ii;
row(Count) = ind(abs(Tags - temp_Tag) < Accuracy);
val(Count) = sqrt(Basis(ii,ind_nonzero(jj)) * (Basis(ii, temp_site)+1));
Count = Count + 1;

% Right hopping matrix element
temp = Basis(ii,:);
temp(ind_nonzero(jj)) = temp(ind_nonzero(jj)) - 1;
temp_site = ind_nonzero(jj) + 1;
if temp_site == N_Sites + 1
temp_site = 1;
end
temp(temp_site) = temp(temp_site) + 1;
temp_Tag = temp * Tag_function(N_Sites)';
col(Count) = ii;
row(Count) = ind(abs(Tags - temp_Tag) < Accuracy);
val(Count) = sqrt(Basis(ii,ind_nonzero(jj)) * (Basis(ii, temp_site)+1));
Count = Count + 1;
end
end
H_kinetic = sparse(row, col, val);

这里采取的方法是,给定一个基向量\(|v\rangle\)记为列指标,仅对于其占据数非零的格子进行遍历,然后分别考虑向右跃迁和向左跃迁的情况,并找到对应的向量指标记为行指标,同时将其跃迁带来的值进行记录,最后利用sparse命令生成即可。

注意在多粒子体系中有:

\[\begin{equation} a_{i}^{\dagger}a_{j}|v\rangle=\sqrt{(v_{i}+1)v_{j}}|\cdots,v_{i}+1,\cdots v_{j}-1,\cdots\rangle \end{equation}\]

会带来额外的粒子系数。

最后则是对角的相互作用部分,可以轻易地用一行指令写下:

1
H_interaction = spdiags(sum(Basis .* (Basis - (Basis>0)),2), 0, Dimension, Dimension);

合在一起,便得到了Bose-Hubbard模型的哈密顿量:

1
2
H = -t * H_kinetic + U/2 * H_interaction;
spy(H)
alt text
左图为M=10且N=10的格点图,右图为对应的哈密顿量的稀疏矩阵

  1. 1.J M Zhang and R X Dong. Exact diagonalization: The Bose–Hubbard model as an example. European Journal of Physics, 31(3):591–602, May 2010. ↩︎

Kernel Polynomial Method (KPM)

Kernel polynomial method (KPM) 是一种利用数值 Chebyshev 多项式展开来降低计算复杂度的方法。传统计算谱时常需 \(O(N^3)\) 的对角化方法,而 KPM 则将问题转化为矩阵与一组较小向量的乘法,大幅降低复杂度。同期发展的还有 Lanczos 算法,Lanczos 适合求本征态,KPM 更适合谱性质和关联函数的计算 [1]

KPM 源自函数的正交多项式展开。定义权重函数 \(w(x)\) 及区间 \([a,b]\) 后,两个可积函数 \(f,g:[a,b]\to\mathbb{R}\) 的内积为:

\[ \begin{equation} \langle f|g \rangle = \int_a^b w(x) f(x) g(x) dx \end{equation} \]

通过 Schmidt 正交化可得正交多项式 \(p_n(x)\),满足:

\[ \begin{equation} \langle p_n|p_m \rangle = \delta_{nm}/h_n \end{equation} \] 其中 \(h_n = ⟨p_n|p_n⟩\)。任意函数可展开为: \[ \begin{equation} f(x) = \sum_{n=0}^\infty \alpha_n p_n(x), \quad \alpha_n = \frac{1}{h_n}\langle p_n|f \rangle \end{equation} \] 通常意义上任何正交多项式都可以用来展开函数从而使用KPM,但经过历史和经验的检验,第一类和第二类Chebyshev多项式由于其优秀的收敛性以及与傅里叶变换的相似性而被认为是最佳选择。 ### Chebyshev 多项式 Chebyshev 多项式定义在区间 \([a,b]=[-1,1]\) 上。第一类 Chebyshev 多项式 \(T_n(x)\) 的权重函数为 \(w(x)=\frac{1}{\pi\sqrt{1-x^2}}\),第二类 \(U_n(x)\) 的权重函数为 \(w(x)=\pi\sqrt{1-x^2}\)。可以验证:

\[ \begin{equation} \begin{split} T_n(x) &= \cos\left[n \cos^{-1}x\right] \\ U_n(x) &= \frac{\sin\left[(n+1)\cos^{-1}x\right]}{\sin\left[\cos^{-1}x\right]} \end{split} \end{equation} \]

两类 Chebyshev 多项式都存在递推关系。对于第一类:

\[ \begin{equation} \begin{split} T_0(x) &= 1, \\ T_{-1}(x) &= T_1(x) = x, \\ T_{n+1}(x) &= 2xT_n(x)-T_{n-1}(x) \end{split} \end{equation} \]

对于第二类:

\[ \begin{equation} \begin{split} U_0(x) &= 1, \\ U_{-1}(x) &= 0, \\ U_{n+1}(x) &= 2xU_n(x)-U_{n-1}(x) \end{split} \end{equation} \]

此外还有乘积关系:

\[ \begin{equation} \begin{split} 2T_m(x)T_n(x) &= T_{m+n}(x)+T_{m-n}(x), \\ 2(x^2-1)U_{m-1}(x)U_{n-1}(x) &= T_{m+n}(x)-T_{m-n}(x) \end{split} \end{equation} \]

两种权重函数分别给出两种内积定义:

\[\begin{equation} \begin{split} \langle f|g \rangle_1 &= \int_{-1}^{1} \frac{f(x)g(x)}{\pi\sqrt{1-x^2}} dx, \\ \langle f|g \rangle_2 &= \int_{-1}^{1} \pi\sqrt{1-x^2} f(x)g(x) dx \end{split} \end{equation}\]

对应的正交性关系为:

\[\begin{equation} \begin{split} \langle T_n|T_m \rangle_1 &= \frac{1+\delta_{n,0}}{2}\delta_{n,m} \\ \langle U_n|U_m \rangle_2 &= \frac{\pi^2}{2}\delta_{n,m} \end{split} \end{equation}\]

定义 \(\phi_n(x)=\frac{T_n(x)}{\pi\sqrt{1-x^2}}\),则在第二种内积下有:

\[\begin{equation} \langle \phi_n|\phi_m \rangle_2 = \frac{1+\delta_{n,0}}{2}\delta_{nm} \end{equation}\]

可以验证任意函数都可以展开为:

\[\begin{equation} \begin{split} f(x) &= \sum_{n=0}^{\infty} \frac{\langle f|\phi_n \rangle_2}{\langle \phi_n|\phi_n \rangle_2} \phi_n(x) \\ &= \frac{1}{\pi\sqrt{1-x^2}}\left(\mu_0 + 2\sum_{n=1}^{\infty} \mu_n T_n(x)\right) \end{split} \end{equation}\]

其中系数\(\mu_n\)叫做矩,定义为:

\[\begin{equation} \mu_n = \langle f|\phi_n \rangle_2 = \int_{-1}^{1} f(x) T_n(x) dx \end{equation}\]


核多项式与 Gibbs 现象

实际计算中通常需要截断展开,直接截断会导致严重的 Gibbs 现象。为此常引入阻尼 kernel 系数 \(\mu_n \to g_n \mu_n\) 修正展开系数:

\[\begin{equation} \begin{split} f(x) &= \frac{1}{\pi\sqrt{1-x^2}}\left(\mu_0 + 2\sum_{n=1}^{\infty} \mu_n T_n(x)\right) \\ &\to \frac{1}{\pi\sqrt{1-x^2}}\left(\mu_0 g_0 + 2\sum_{n=1}^{N-1} \mu_n g_n T_n(x)\right) \end{split} \end{equation}\]

常用的 Jackson 核为:

\[\begin{equation} g_n^{\text{J}} = \frac{1}{N+1}\left[(N-n+1)\cos\frac{\pi n}{N+1} + \sin\frac{\pi n}{N+1}\cot\frac{\pi}{N+1}\right] \end{equation}\]

格林函数计算中常用 Lorentz 核:

\[\begin{equation} g_n^L = \frac{\sinh\left[\lambda\left(1-\frac{n}{N}\right)\right]}{\sinh \lambda} \end{equation}\]

其中参数 \(\lambda \in \mathbb{R}\),通常取 \(3\sim5\)


态密度计算

区间缩放

Chebyshev 展开定义在 \([-1,1]\),对于矩阵运算需保证本征值 \(\{E_k\}\) 也在 \([-1,1]\)。可作线性变换:

\[\begin{equation} \begin{split} \tilde{H} &= \frac{H-b}{a} \\ \tilde{E} &= \frac{E-b}{a} \end{split} \end{equation}\]

其中 \(a, b\) 由哈密顿量最大最小本征值 \(E_{\text{max}}, E_{\text{min}}\) 决定:

\[\begin{equation} a = \frac{E_{\text{max}}-E_{\text{min}}}{2-\epsilon} \\ b = \frac{E_{\text{max}}+E_{\text{min}}}{2} \end{equation}\]

参数\(\epsilon\) 用于避免谱边界刚好处于或超过 \([-1,1]\),通常取 \(0.01\)

最大最小本征值可用 Lanczos 算法(如 Matlab 的 eigs)获得:

1
2
3
4
5
E_max = eigs(H_sparse, 1, 'largestreal')
E_min = eigs(H_sparse, 1, 'smallestreal')
a = (E_max - E_min)/(2 - epsilon);
b = (E_max + E_min)/2;
H_tilde = sparse((H_sparse - b)/a);

离散余弦傅里叶变换

在对函数 \(f(x)\) 展开作截断并利用核多项式修正后,对于给定点 \(x\),有如下展开式:

\[ \begin{equation} f(x) = \frac{1}{\pi\sqrt{1-x^2}}\left(\mu_0 g_0 + 2\sum_{n=1}^{N-1} \mu_n g_n T_n(x)\right) \end{equation} \]

利用 Chebyshev 多项式的性质,还可以进一步减少计算时间。定义核多项式修正后的矩系数为

\[ \begin{equation} \tilde{\mu}_n = \mu_n g_n \end{equation} \]

此时展开式可以写为

\[ \begin{equation} f(x) = \frac{1}{\pi\sqrt{1-x^2}}\left(\tilde{\mu}_0 + 2\sum_{n=1}^{N-1} \tilde{\mu}_n T_n(x)\right) \end{equation} \]

如果采样点 \(x\) 取为特殊的 \(x_k\),满足

\[ \begin{equation} x_k = \cos\frac{\pi(k+1/2)}{\tilde{N}},\quad k=0,\ldots,(\tilde{N}-1) \end{equation} \]

则有

\[ \begin{equation} T_n(x_k) = \cos\left[n\cos^{-1}x_k\right] = \cos\left[\frac{n\pi(k+1/2)}{\tilde{N}}\right] \end{equation} \]

这些点被称为 Chebyshev 节点 [2]\(\tilde{N}\) 通常取 \(2N\)。在这些点上,\(f(x_k)\) 可以通过对 \(\tilde{\mu}_n\) 作第三类离散余弦变换(DCT-III)得到:

\[ \begin{equation} y[k] = \frac{1}{2}x_0 + \sum_{n=1}^{N-1} x_n \cos\left[\frac{n\pi(k+1/2)}{N}\right] \end{equation} \]

由于第三类余弦变换可以利用快速傅里叶变换(FFT)加速,因此比直接乘积更快。Matlab 示例代码:

1
2
3
omega_dct = cos(pi * ((0:N_points-1)+0.5)/N_points);
Moments_Kernel(1) = Moments_Kernel(1)/sqrt(2);
DOS = dct(Moments_Kernel,N_points,'Type', 3) .*(pi * sqrt(1 - omega_dct.^2));

注意:第二行对矩的第一个元素除以了 \(\sqrt{2}\),这是由于 Matlab 的 dct 定义与上述第三类余弦变换的系数在第一项与剩余项之间相差一个 \(\sqrt{2}\),若不修改,会导致余弦变换的系数收敛到零的速度变慢,给出错误的态密度。

矩的计算

KPM 展开可以被应用到算符上,例如哈密顿量 \(\hat{H}\)。在利用 KPM 计算时需要关注两种形式的矩:

其一是两个态的期望: \[ \begin{equation} \mu_n = \langle \beta | T_n(\tilde{H}) | \alpha \rangle \end{equation} \]

其二为算符 \(\hat{A}\) 与多项式的迹: \[ \begin{equation} \mu_n = \mathrm{Tr}[A T_n(\tilde{H})] \end{equation} \]

对于第一种情况,可以利用迭代关系直接计算。令 \(|\alpha_n\rangle = T_n(H)|\alpha\rangle\),有

\[ \begin{equation} \begin{split} |\alpha_0\rangle &= |\alpha\rangle \\ |\alpha_1\rangle &= \tilde{H}|\alpha_0\rangle \\ |\alpha_{n+1}\rangle &= 2\tilde{H}|\alpha_n\rangle - |\alpha_{n-1}\rangle \end{split} \end{equation} \]

随即可算出矩 \(\mu_n = \langle \beta | \alpha_n \rangle\)。整个过程只涉及到矩阵乘法,且可以利用稀疏矩阵方法提升大尺寸运算效率。如果 \(|\beta\rangle = |\alpha\rangle\),还可以进一步简化。利用乘积关系可验证,对于偶数次矩有

\[ \begin{equation} \begin{split} 2\langle \alpha_n | \alpha_n \rangle - \mu_0 &= 2\langle \alpha | T_n(\tilde{H})^\dagger T_n(\tilde{H}) | \alpha \rangle - \mu_0 \\ &= 2\langle \alpha | T_n(\tilde{H}) T_n(\tilde{H}) | \alpha \rangle - \mu_0 \\ &= \langle \alpha | \left(T_0(\tilde{H}) + T_{2n}(\tilde{H})\right) | \alpha \rangle - \mu_0 \\ &= \langle \alpha | \alpha_0 \rangle + \langle \alpha | \alpha_{2n} \rangle - \mu_0 \\ &= \mu_{2n} \end{split} \end{equation} \]

奇数次矩有

\[ \begin{equation} \begin{split} 2\langle \alpha_{n+1} | \alpha_n \rangle - \mu_1 &= 2\langle \alpha | T_{n+1}(\tilde{H})^\dagger T_n(\tilde{H}) | \alpha \rangle - \mu_1 \\ &= 2\langle \alpha | T_{n+1}(\tilde{H}) T_n(\tilde{H}) | \alpha \rangle - \mu_1 \\ &= \langle \alpha | \left(T_1(\tilde{H}) + T_{2n+1}(\tilde{H})\right) | \alpha \rangle - \mu_1 \\ &= \langle \alpha | \alpha_1 \rangle + \langle \alpha | \alpha_{2n+1} \rangle - \mu_1 \\ &= \mu_{2n+1} \end{split} \end{equation} \]

因此当 \(|\alpha\rangle = |\beta\rangle\) 时,可将矩的计算减半:

\[ \begin{equation} \begin{split} \mu_{2n} &= 2\langle \alpha_n | \alpha_n \rangle - \mu_0 \\ \mu_{2n+1} &= 2\langle \alpha_{n+1} | \alpha_n \rangle - \mu_1 \end{split} \end{equation} \]

对于第二种情况,以态密度为例。假设本征态 \(\tilde{H}|k\rangle = E_k|k\rangle\),态密度定义为

\[ \begin{equation} \rho(E) = \sum_k \delta(E-E_k) = \mathrm{Tr}\left[\delta(E-\tilde{H})\right] \end{equation} \]

\(\delta\) 函数可用 Chebyshev 多项式展开为矩:

\[ \begin{equation} \begin{split} \mu_n &= \int_{-1}^{1} \rho(E) T_n(E) dE \\ &= \int_{-1}^{1} \sum_k \delta(E-E_k) T_n(E) dE \\ &= \sum_k T_n(E_k) \end{split} \end{equation} \]

利用 \(T_n(H)|k\rangle = T_n(E_k)|k\rangle\),可得

\[ \begin{equation} \mu_n = \sum_k \langle k | T_n(H) | k \rangle = \mathrm{Tr}[T_n(H)] \end{equation} \]

由于 Chebyshev 多项式存在递推关系,有

\[ \begin{equation} \begin{split} |\alpha_n(k)\rangle &= T_n(H)|k\rangle \\ |\alpha_{n+1}(k)\rangle &= 2H|\alpha_n(k)\rangle - |\alpha_{n-1}(k)\rangle \end{split} \end{equation} \]

此时矩变为

\[ \begin{equation} \mu_n = \sum_k \langle \alpha_0(k) | \alpha_n(k) \rangle = \sum_k \langle k | T_n(H) | k \rangle \end{equation} \]

注意到之前公式中我们可以将态密度转换为了展开系数的计算,而上式表明,展开系数的计算只需要计算两个向量的内积,又因为\(|\alpha_n(k)\rangle\)各阶项实际上是一个矩阵乘法运算,通过上述的步骤,我们可以跳过高复杂度的对角化方法,仅通过矩阵乘法就可以得到态密度的展开系数。

实际上,计算迹时并不需要对所有本征态求和,只需对少量随机归一化向量 \(|r\rangle\) 取平均即可获得对 \(\mu_n\) 的良好估计:

\[ \begin{equation} \mu_n = \mathrm{Tr}[A T_n(H)] \approx \frac{1}{R} \sum_{r=1}^R \langle r | A T_n(H) | r \rangle \end{equation} \]

其中 \(|r\rangle = \frac{1}{\sqrt{D}} \sum_{i=1}^D \xi_{rk} |k\rangle\)\(\xi_{rk}\) 为复随机的归一化向量,满足

\[ \begin{equation} \begin{split} \mathbb{E}[\xi_{rk}] &= 0 \\ \mathbb{E}[\xi_{rk}\xi_{r'l}] &= 0 \\ \mathbb{E}[\xi^*_{rk}\xi_{r'l}] &= \delta_{rr'}\delta_{kl} \end{split} \end{equation} \]

\(\xi_{rk}=e^{i\phi}\)\(\phi\in[0,2\pi]\) 满足均匀或高斯分布,可以获得相当精确的结果。


  1. 1.Weiße A., Wellein G., Alvermann A., Fehske H., 2006, RvMP, 78, 275. doi:10.1103/RevModPhys.78.275 ↩︎
  2. 2.尽管matlab中内置有Chebyshev多项式chebyshevT,但实际上直接利用cos去定义Chebyshev多项式时,其速度远快于调用chebyshevT ↩︎

引论

通常在学物理/做物理的人之间会有一个专有名词叫物理图像(Physical Picture),有时也简称为物理。例如交流的时候会说"你这篇文章的物理(图像)是什么"。然而维基百科上并没有关于这个词的明确定义,且在不同的语境下物理图像指代对象会有极大的不同。为了能够理清这一词至目前的各种含义,于是便写下了这篇杂谈。

物理模型

作为自然学科的基础之一,物理的核心在于研究自然。而要研究自然,目前最有效的方式是根据现实提取出对应的物理模型进行分析。

为了得到响应的物理模型,在考虑现实中的各种物理对象时,首先要对该对象进行抽象,以此得到最简单而又最能反应所关注的内容的一个物理模型.例如质点这一对象是对任意不关注其大小以及形状的物体的抽象,这一抽象对象在研究一个物体的运动,尤其是空间上的平移时时最为有效,因为我们只需要关注质点在空间中的位置即可。然而由于抽象过程中我们抛弃了太多信息,导致其缺点在于质点是一个没有大小的点,我们没有办法研究它的旋转。

若是要研究旋转,我们需要加入一些关于形状和大小的细节,这个时候将刚体的抽象要更加有利于研究。借此我们可以研究对象的旋转。若是要研究刚体在各种受力下的变化,我们就需要加入更多的细节,例如物体可以发生形变,扭曲,断裂,拼接,融合等各种现实中存在的过程。无论如何,在研究自然时,我们总是需要根据研究对象去提取出当前对象最关键的信息,通过抽象来建立一个物理对象的模型,这便是物理模型。

数学模型

在建立了物理模型后,我们需要描述其各种关心的性质以及各种性质之间的联系。而目前最好的描述工具是数学,在基于对应的物理模型的基础上,进一步用数学建立的模型可以称为数学模型。或许最广为人知的数学模型应当是牛顿的运动学第二定律 \[\begin{equation} \mathbf{F}=m\mathbf{a} \end{equation}\] 这个公式描述了一个真空中质量为\(m\)的物理对象受到的力\(\mathbf{F}\)与其因力而产生的加速度\(\mathbf{a}\)的关系,这是一个数学函数关系,因此可以认为其是一个描述任一满足特定假设[1]下用于描述物理模型数学模型。 这个数学模型的特殊性在于,与其他任意\(y=f(x)\)相比,当我们将这三个变量(两个是矢量)中任意两个变量换为任意物理对象的对应的已知参数的数据[2]时,求解得到的第三个未知的变量的数据将必然与在现实中的物理对象通过实验测得的数据在一定的误差范围内相同。这一重要区别使得一个物理模型所对应的数学模型具有了一定程度的预测现实的功能。

物理理论

在阐明了物理模型以及的对应的数学模型后,便可以开始讨论物理理论。一个物理理论是一类物理事件的模型。由于对现实的一对一建模是不可能的事情,因此人们更希望通过一系列有限的物理模型来提取出一个(或一类)更加本质的模型,当遇到全新的对象时,直接利用这个本质的模型去套用即可分析新的对象,这就是物理理论。它的评判标准是其预测与实证观察的一致性程度。物理理论的质量还取决于它做出新预测的能力,这些预测可以通过新的观察来验证。这一套采用数学模型和物理对象和系统的抽象来合理化、解释和预测自然现象[3]对应为理论物理学。亦即,理论物理学是研究物理理论的学科。

对于物理理论的描述,通常是利用数学模型来描述一类物理模型的性质以及其之间的关系。一个物理理论通常会包含多个物理模型以及其对应的数学模型。例如牛顿力学便是一个物理理论,其包含了质点、刚体等多个物理模型,以及对应的牛顿定律等数学模型。

然而,以纯粹物理理论的严格性和信息量而言,要想直接对其进行讨论是非常困难的。因此,通常人们会在讨论物理理论时,使用物理图像来进行描述。在这之前,需要对图像这个词进行一些意义的拓展

图像

图,或者图像,是一般人每时每刻都需要的一种信息。借用维基百科的介绍[4], > 图像或图片是一种视觉表示形式。图像可以是二维的,例如绘图、绘画或照片,也可以是三维的,例如雕刻或雕塑。

作为含有信息量最丰富的对象,其直观与简洁对于理解事物具有极大的帮助性。例如描述圆的时候,数学上通常用解析几何的方法,来定义满足方程 \[\begin{equation} x^2+y^2=r^2 \end{equation}\] 的点集(x,y)构成的集合,而图像上可以很简单的给出 alt text 从这个角度来说,图像作为信息的载体,其特征在于简洁直观。 ## 物理图像 在介绍完了物理模型和图像后,物理图像简单来说便是指一类简洁直观物理模型。需要注意的是,物理图像并不指代物理实在,而是指一个方便理解的抽象对象。因为只有在有了对象之后,才可以谈及对象之间的关系,也即物理关系。而所谓常说的"新物理",也是指一类新的物理图像以及其对应的之前所未探明的物理关系。

总结

物理图像作为一种简洁直观的物理模型,其主要是在简单的讨论中,避免涉及过多的计算但是却能理清复杂的物理关系的工具。利用物理(图像),即便是不甚了解一个理论内部的数学关系,也可以理清楚不同物理对象之间的关系,这极大的降低了交流成本。除此之外,物理图像的重要意义在于,通过考察物理图像对应的自然现实,有时甚至可以跳过严格的数学构造和推导,直接抽取出可能的物理关系。例如已知牛顿第二定律是一个二阶微分方程,对于匀速运动而言其解需要首先求解该微分方程,得到解 \[\begin{equation} \boldsymbol{s}=\frac{1}{2}a t^2+bt+c \end{equation}\] 然后带入初始条件,计算后才能得到 \[\begin{equation} \boldsymbol{s}=\boldsymbol{v}t+\boldsymbol{s}_0 \end{equation}\] 但是,如果直接考虑一个匀速运动的物体,我们应当可以很轻易地直接写下 \[\begin{equation} \boldsymbol{s}=\boldsymbol{v}t+\boldsymbol{s}_0 \end{equation}\] 这种方法甚至在分数量子霍尔效应中诞生过诺贝尔奖,其得主Robert Laughlin在没有任何数学推导的情况下,直接写出了分数量子霍尔效应的物理图像,并且成功地解释了实验结果。

题外话

作为一个个人的观点,实际物理学中的解释并非对现实行为的解释,而是基于物理图像的对物理模型的解释。因为现实世界是极其复杂的,如果一个理论能够解释现实,那么现实就不应该存在无法解释的对象,然而客观上现实中存在无法利用理论解释的现象,这实际上正是物理理论作为物理模型的集合的局限性所在。而所谓的解释,实际上是基于物理模型对该框架下的可能的物理图像的解释[5]


  1. 1.牛顿定律仅在低速宏观领域下成立,当关注的对象处于高速宏观领域时,我们需要用到相对论力学,而处于低速微观领域时需要量子力学,处于高速微观领域下则需要量子场论。 ↩︎
  2. 2.之所以是数据而非数字,在于单位。 ↩︎
  3. 3.WikiPedia 理论物理学 ↩︎
  4. 4.WikiPedia 图片 ↩︎
  5. 5.本文中部分论述使用copilot润色。 ↩︎

本文为2020至2021年LX老师上课的量子场论笔记整理,主要内容是Spin-0部分。仅供一些细节上的参考,内容并未做太多整理,所以稍显混乱

本文为复习超导的一些基本概念和计算,参考自D-wave Superconductivity[1]

超导的基本概念

超导现象(Superconductivity)是具有零直流电阻完全抗磁性的电磁材料。零电阻意味着超导体是理想导体,且利用超导传输线进行电能输运时没有能量损耗。此外,超导体还表现出完全抗磁性(迈斯纳效应),即超导体会将内部的磁通线排出体外。零电阻与迈斯纳效应是两个无法用传统单电子理论理解的特征性质。

区分超导体和理想导体的关键点在于冷却过程。在降温后,对于理想导体而言,磁场仍然会滞留在系统内;而对于超导体而言,磁场会被排除在外。因此,对于理想导体,冷却前有场与零场存在差别;而对于超导体,无论其外场和历史如何,磁场在体态中都会变为零。

二流体模型与London方程

二流体模型核心假设为超导体内存在两种电子

  • 正常电子(Normal electrons)
  • 超导电子(Superconducting electrons)

利用这两种电子,可以解释零电阻现象,但是还不能解释迈斯纳效应,故还需要London方程,即在库伦规范下\(\nabla\cdot\mathbf{A}=0\) [2],超导电流密度可以写为 \[\begin{equation} \mathbf{J}_s=-\frac{n_se^2}{m}\mathbf{A} \end{equation}\] 需要强调的是,该方程不能从 Maxwell 方程中导出,且应当被视为超导体作为一类特殊的电磁介质所满足的独立的电磁方程,London 方程只有在超导体的微观理论建立后才能被严格推导。

一个历史上的启发性推导: 假设电子在超导体中无摩擦地前进, \[\begin{equation} m \dot{\mathbf{v}} = -e \mathbf{E} \end{equation}\] 其中 \(\mathbf{v}_s\) 是超导电子速度,\(\mathbf{E}\) 是电场。超电流 \(\mathbf{J}_s = -e n_{s} \mathbf{v}_{s}\) 则为: \[\begin{equation} \frac{\partial \mathbf{J}_{s}}{\partial t} = \frac{e^{2} n_{s}}{m} \mathbf{E} \end{equation}\] 这是第一 London 方程。利用 Maxwell 方程: \[\begin{equation} \nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t} \end{equation}\] 可立即得到: \[\begin{equation} \frac{\partial}{\partial t} \left( \nabla \times \mathbf{J}_{s} + \frac{e^{2} n_{s}}{m} \mathbf{B} \right) = 0 \end{equation}\] 该方程描述了理想导体的行为。但为了描述迈斯纳效应,积分常数必须选为零,从而: \[\begin{equation} \nabla \times \mathbf{J}_{s} + \frac{e^{2} n_{s}}{m} \mathbf{B} = 0 \end{equation}\] 这是第二 London 方程。结合 Ampere 定律: \[\begin{equation} \nabla \times \mathbf{B} = \mu_{0} \mathbf{J}_{s} \end{equation}\] 可得到磁场满足 Helmholtz 方程: \[\begin{equation} \nabla^{2} \mathbf{B} = \frac{\mu_{0} n_{s} e^{2}}{m} \mathbf{B} \end{equation}\] 假设一半无限超导体,其表面垂直于 \(x\) 方向,其解为: \[\begin{equation} B(x) = B(x_{0}) e^{-(x - x_{0}) / \lambda} \end{equation}\] 其中: \[\begin{equation} \lambda = \sqrt{\frac{m}{\mu_{0} n_{s} e^{2}}} \end{equation}\] 是描述外磁场在超导-真空界面处的 London 穿透深度。当 \(x - x_{0} \gg \lambda\) 时,磁场衰减到零,这给出了迈斯纳效应的现象学描述。

库伯对

1956 年,Cooper 考虑了两电子过程,说明如果存在一个有效的吸引相互作用,无论其多弱,在存在费米海的背景下,费米面将不再稳定,费米面上的电子会相互配对形成束缚态,从而降低基态能量。配对电子的束缚态称为库伯对。Cooper 找到两电子形成束缚态的束缚能为:

\[\begin{equation}\label{eq:binding} \Delta E = 2 \Delta = -2 \hbar \omega_{D} e^{-2 / N_{F} g} \end{equation}\]

其中 \(N_{F}\) 是费米面的态密度,\(g\) 是耦合强度,\(\omega_{D}\) 是决定诱导吸引作用机制或源头的特征能量。当吸引相互作用由电声相互作用诱导时,\(\omega_{D}\) 为声子频率,即德拜频率。这一结果表明,费米面在具有微小吸引相互作用下是不稳定的。

\(\eqref{eq:binding}\)表明束缚能对相互作用强度 \(g\) 的依赖是奇异的,这也说明超导的微观理论不能通过基于正常导电态的微扰计算得到,这是超导机制的主要困难。

为了理解 Cooper 配对能,可以求解零温下向费米海加入两个电子的问题。为减少不相容原理导致的排斥相互作用,假设两电子形成自旋单态,使空间波函数对称,且最低能态应具有零动量,因此两电子具有相反动量,波函数可写为:

\[\begin{equation} |\Psi\rangle = \sum_{\mathbf{k}} \alpha(\mathbf{k}) c_{\mathbf{k}\uparrow}^{\dagger} c_{-\mathbf{k}\downarrow}^{\dagger} |0\rangle \end{equation}\]

其中 \(|0\rangle\) 是刚性费米海真空。

两电子相互作用由以下哈密顿量控制:

\[\begin{equation} H = \sum_{\mathbf{k}} (\epsilon_{\mathbf{k}} - \mu) c_{\mathbf{k}\sigma}^{\dagger} c_{\mathbf{k}\sigma} - \sum_{\mathbf{k}, \mathbf{k}'} V_{\mathbf{k} \mathbf{k}'} c_{\mathbf{k}\uparrow}^{\dagger} c_{-\mathbf{k}\downarrow}^{\dagger} c_{-\mathbf{k}'\downarrow} c_{\mathbf{k}'\uparrow} \end{equation}\]

其中 \(\epsilon_{\mathbf{k}}\) 是电子色散能量,\(\mu\) 是化学势,\(V\) 是库伯对的散射势。为简单起见,假设 \(V\) 不依赖于动量:

\[\begin{equation} V_{\mathbf{k}, \mathbf{k}'} = \frac{g}{V} \end{equation}\]

其中 \(V\) 是系统体积。从薛定谔方程:

\[\begin{equation} H |\Psi\rangle = E |\Psi\rangle \end{equation}\]

可求得系数 \(\alpha(\mathbf{k})\) 满足:

\[\begin{equation} 2 \xi_{\mathbf{k}} \alpha(\mathbf{k}) - \frac{g}{V} \sum_{\mathbf{k}'} \alpha(\mathbf{k}') = (E - E_{0}) \alpha(\mathbf{k}) \end{equation}\]

其中 \(E_{0}\) 是填充费米海的能量,\(\xi_{\mathbf{k}} = \epsilon_{\mathbf{k}} - \mu\)。上式可重写为:

\[\begin{equation} \alpha(\mathbf{k}) = \frac{g}{2 \xi_{\mathbf{k}} - \Delta E} \frac{1}{V} \sum_{\mathbf{k}'} \alpha(\mathbf{k}') \end{equation}\]

其中 \(\Delta E = E - E_{0}\) 是系统的能隙。对两边所有 \(\mathbf{k}\) 求和后,\(\alpha\) 的因子可消去,得到能隙方程:

\[\begin{equation} \frac{1}{g} = \frac{1}{V} \sum_{\mathbf{k}} \frac{1}{2 \xi_{\mathbf{k}} - \Delta E} = N_{F} \int_{0}^{\hbar \omega_{D}} d\xi \frac{1}{2 \xi - \Delta E} \end{equation}\]

求解该方程可得:

\[\begin{equation} \frac{1}{g} = \frac{N_{F}}{2} \ln \frac{2 \hbar \omega_{D} - \Delta E}{-\Delta E} \approx \frac{N_{F}}{2} \ln \frac{2 \hbar \omega_{D}}{|\Delta E|} \end{equation}\]

从而得出式\(\eqref{eq:binding}\)

BCS平均场论

1957年,Bardeen,Cooper和Schrieffer基于库伯配对给出了超导微观理论。在BCS框架中,对于超导凝聚的形成有两个预先条件。其一为通过吸引相互作用形成的库伯对,其二为库伯对之间发展的相位相干性。库伯对是靠近费米面附近的电子形成的束缚态,因为库伯对保有玻色子的特征,从而可以消除电子的费米统计带来的有效排斥力,并通过相干性凝聚形成超流态,从而是超导的前置条件。到目前为止,库伯对在所有已发现的超导体中都存在,从而提供了BCS理论强力的支撑。

BCS平均场从考虑式\(\eqref{eq:binding}\)的哈密顿量开始,由于该式强调了配对通道而忽略了其他通道的相互作用,因而是对复杂的电子相互作用的化简。尽管该式适用于自旋单态配对,该哈密顿量经过细微的修改后也可拓展到描述自旋三重态的超导中。该哈密顿量描述的库伯对具有零质心动量,因而忽略了有限质心动量的贡献。由于有限质心动量配对的相空间受到费米面几何以及动量守恒的强烈限制,零动量配对在物理上要更加可能。然而,在外加磁场的情况下,费米面上下自旋电子会劈裂,从而有限质心动量的配对是可能的。此外,在载流超导态中库伯对也具有有限配对动量,然而配对能被抑制,且当电流超过临界电流时,配对能变为零。

现在来考虑BCS平均场的计算,定义 \[\begin{equation} A=\sum_{\mathbf{k}}c_{-\mathbf{k}\downarrow}c_{\mathbf{k}\uparrow} \end{equation}\]

可以将BCS约化哈密顿量写为 \[\begin{equation} H=\sum_{\mathbf{k}\sigma}\xi_{\mathbf{k}}c^{\dagger}_{\mathbf{k}\sigma}c_{\mathbf{k}\sigma}-\frac{g}{V}A^{\dagger}A \end{equation}\]

取相互作用项的平均场近似 \[ \begin{align} -A^{\dagger}A &= -(\langle A^{\dagger}\rangle+\delta A^{\dagger})(\langle A\rangle+\delta A)\nonumber\\ &= -\langle A^{\dagger}\rangle\langle A\rangle-\langle A^{\dagger}\rangle\delta A-\delta A^{\dagger}\langle A\rangle-\cancel{\delta A^{\dagger}\delta A}\nonumber\\ &= -\langle A^{\dagger}\rangle\langle A\rangle-\langle A^{\dagger}\rangle(A-\langle A\rangle)-(A^{\dagger}-\langle A^{\dagger}\rangle)\langle A\rangle\nonumber\\ &= -\langle A^{\dagger}\rangle A-\langle A\rangle A^{\dagger}+\langle A^{\dagger}\rangle\langle A\rangle \end{align} \]

最后可以得到BCS的平均场哈密顿量 \[\begin{equation} H_{MF}=\sum_\mathbf{k}\left( \sum_{\sigma}\xi_{\mathbf{k}}c_{\mathbf{k}\sigma}^{\dagger}c_{\mathbf{k}\sigma}+\Delta c_{\mathbf{k}\uparrow}^{\dagger}c_{-\mathbf{k}\downarrow}^{\dagger}+\Delta^{*}c_{-\mathbf{k}\downarrow}c_{\mathbf{k}\uparrow}\right)+\frac{V}{g}|\Delta|^{2} \end{equation}\]

\(\langle A\rangle\)代表算符\(A\)的期望,\(\Delta\)是超导序参量,由下式决定 \[\begin{equation}\label{eq:Gap} \Delta=-\frac{g}{V}\langle A\rangle=-\frac{g}{V}\sum_{\mathbf{k}}\langle c_{-\mathbf{k}\downarrow}c_{\mathbf{k}\uparrow}\rangle \end{equation}\]

其中\(\langle c_{-\mathbf{k}\downarrow}c_{\mathbf{k}\uparrow}\rangle\)取决于\(\Delta\)的值。需要注意的是,上式便是BCS能隙方程。它完全决定了超导态的低能准粒子激发谱,通过自洽求解这个方程,可以得到所有的热力学量。

需要注意的是,\(H_{MF}\)并不遵循粒子数守恒,而是总自旋守恒,\(\sum_{\mathbf{k}}\sigma c_{\mathbf{k}\sigma}^{\dagger}c_{\mathbf{k}\sigma}\)以及库伯对总动量守恒。\(H_{MF}\)可以通过Bogoliubov变换的幺正矩阵来对角化

\[\begin{equation} \begin{pmatrix} c_{\mathbf{k}\uparrow}\\c_{-\mathbf{k}\downarrow}^{\dagger} \end{pmatrix}= \begin{pmatrix} u_{\mathbf{k}}&v_{\mathbf{k}}\\-v_{\mathbf{k}}^{*}&u_{\mathbf{k}}^{*} \end{pmatrix} \begin{pmatrix} \alpha_{\mathbf{k}}\\\beta_{\mathbf{k}}^{\dagger} \end{pmatrix} \end{equation}\]

经过对角化后哈密顿量变为 \[\begin{equation} \sum_\mathbf{k}E_{\mathbf{k}}\left(\alpha_{\mathbf{k}}^{\dagger}\alpha_{\mathbf{k}}+\beta_{\mathbf{k}}^{\dagger}\beta_{\mathbf{k}}\right)+\sum_{\mathbf{k}}\left(\xi_{\mathbf{k}}-E_{\mathbf{k}}\right)+\frac{V}{g}|\Delta|^{2} \end{equation}\]

\(\alpha_{\mathbf{k}}\)\(\beta_{\mathbf{k}}\)是Bogoliubov准粒子的湮灭算符,它们描述了超导能隙上的单粒子激发,对应为二流体模型的正常电子。准粒子激发能为

\[\begin{equation} E_{\mathbf{k}}=\sqrt{\xi_{\mathbf{k}}^{2}+\Delta^{2}} \end{equation}\]

在费米面上时\(\xi_{\mathbf{k}}=0\),从而\(E_{\mathbf{k}}=|\Delta|\),从而\(\Delta_{\mathbf{k}}\)为动量空间的准粒子能隙方程。Bogoliubov变换的矩阵元满足归一化条件\(u_{\mathbf{k}}^{2}+v_{\mathbf{k}}^{2}=1\),由下式决定

\[\begin{equation} u_{\mathbf{k}} = \sqrt{\frac{1}{2}+\frac{\xi_{\mathbf{k}}}{2E_{\mathbf{k}}}} \end{equation}\]

\[\begin{equation} v_{\mathbf{k}} = -\text{sgn}(\Delta)\sqrt{\frac{1}{2}-\frac{\xi_{\mathbf{k}}}{2E_{\mathbf{k}}}} \end{equation}\]

通过计算配对关联函数,可以将能隙方程表示为 \[\begin{equation}\label{eq:gap-1} 1=\frac{g}{V}\sum_{\mathbf{k}}\frac{1}{E_{\mathbf{k}}}\tanh\frac{\beta E_{\mathbf{k}}}{2} \end{equation}\]

能隙的温度依赖性可以通过自洽求解该方程得到,更多的,超导转变温度\(T_{c}\)可以通过设置\(\Delta=0\)求解上式得到。

在零温下不存在准粒子激发,从而\(\langle\alpha_{\mathbf{k}}^{\dagger}\alpha_{\mathbf{k}}\rangle\)\(\langle\beta_{\mathbf{k}}^{\dagger}\beta_{\mathbf{k}}\rangle\)都为零,从而基态波函数可以通过将\(\alpha\)\(\beta\)类型的准粒子从任意不与基态正交的初始态\(|\Psi_{0}\rangle\)中投影得到

\[\begin{equation} |\Psi\rangle=\prod_{\mathbf{k}}\left(1-\alpha_{\mathbf{k}}^{\dagger}\alpha_{\mathbf{k}}\right)\left(1-\beta_{\mathbf{k}}^{\dagger}\beta_{\mathbf{k}}\right)|\Psi_{0}\rangle \end{equation}\]

为了能将\(|\Psi_0\rangle\)变为真空态\(|0\rangle\),需要对上式进行归一化得到

\[\begin{equation}\label{eq:BCSvariation} |\Psi\rangle=\prod_{\mathbf{k}}\left(u_{\mathbf{k}}+v_{\mathbf{k}}c_{\mathbf{k}\uparrow}^{\dagger}c_{-\mathbf{k}\downarrow}^{\dagger}\right)|0\rangle=\prod_{\mathbf{k}}u_{\mathbf{k}}\exp\left(\frac{v_{\mathbf{k}}}{u_{\mathbf{k}}}c_{\mathbf{k}\uparrow}^{\dagger}c_{-\mathbf{k}\downarrow}^{\dagger}\right)|0\rangle \end{equation}\]

此式即为BCS变分波函数,而\(v_{\mathbf{k}}^{2}\)是配对概率。在上式中,费米海内外的态可以被划分为

\[\begin{equation} |\Psi\rangle=\prod_{|\mathbf{k}|>k_{F}}\left(u_{\mathbf{k}}+v_{\mathbf{k}}c_{\mathbf{k}\uparrow}^{\dagger}c_{-\mathbf{k}\downarrow}^{\dagger}\right)\prod_{|\mathbf{k}|<k_{F}}\left(u_{\mathbf{k}}c_{-\mathbf{k}\downarrow}c_{\mathbf{k}\uparrow}+v_{\mathbf{k}}\right)|\text{Fermi Sea}\rangle \end{equation}\]

从上式也可以看到,位于费米面内外的动量的准粒子激发对应为电子/空穴激发,注意这里对电子/空穴的定义与正常导体中一致。

由于准粒子算符\(\alpha_{\mathbf{k}}\)\(\beta_{\mathbf{k}}\)同时包含电子的产生湮灭算符,因此它们并不是粒子数的本征算符。尽管如此,可以验证这样的粒子数算符可以保证电荷守恒,且准粒子激发与通过其描述的相关的物理量都是物理可观测量。

利用超导准粒子的平均场解,可以将上式写为积分方程 \[\begin{equation} \Delta=gN_{F}\int_{-\hbar\omega_{D}}^{\hbar\omega_{D}}d\xi \frac{\Delta}{2\sqrt{\xi^{2}+\Delta^{2}}}\tanh\frac{\beta\sqrt{\xi^{2}+\Delta^{2}}}{2} \end{equation}\]

在零温\(T\to0^{+}\)下,\(\tanh \beta\to1\),上式变为 \[\begin{equation} \frac{1}{gN_{F}}=\int_{0}^{\hbar\omega_{D}}d\xi\frac{1}{\sqrt{\xi^{2}+\Delta^{2}}}=\sinh^{-1}\frac{\hbar\omega_{D}}{\Delta} \end{equation}\]

当取\(\omega_{D}\gg \Delta\)\(gN_{F}\ll1\)时,上式进一步约化为 \[\begin{equation}\label{eq:gap-2} \Delta\approx 2\hbar\omega_{D}e^{-1/gN_{F}} \end{equation}\]

可以看到这个结果与\(\eqref{eq:binding}\)在指数上相差了一个2,这是由于二体Cooper问题中,只有费米面以上的激发被考虑了,然而在BCS平均场中,在费米面上下的激发都应被考虑。

另一方面,在临界温度\(T_{c}\)处,能隙\(\Delta\)趋近于0,此时能隙方程变为 \[\begin{equation} \frac{1}{gN_{F}}=\int_{0}^{\hbar\omega_{D}}d\xi\frac{1}{\xi}\tanh\frac{\beta_{c}\xi}{2}=\int_{0}^{\frac{1}{2}\beta_{c}\hbar\omega_{D}}dx\frac{\tanh x}{x} \end{equation}\]

\(a\)足够大时,右侧的积分可以被估计为 \[\begin{equation} \int_{0}^{a}d x\frac{\tanh x}{x}\approx\ln 2.28 a \end{equation}\]

从而在极限\(k_{B}T_{c}\ll\hbar\omega_{D}\)时,有 \[\begin{equation}\label{eq:SCTc-1} k_{B}T_{c}=1.14\hbar\omega_{D}e^{-1/gN_{F}} \end{equation}\]

若超导配对由电声相互作用驱动,\(\omega_{D}\)为德拜频率,该频率反比于原子质量\(M\)的平方根,这意味着 \[\begin{equation} T_{c}\propto M^{-\frac{1}{2}} \end{equation}\]

这个超导相变温度的同位素效应已经在许多超导体中观测到。

由于零温能隙\(\Delta\)与相变温度\(T_{c}\)都极度敏感地依赖于\(gN_{F}\),这意味着上述两式都不具备很强的预言能力。然而,其比例在弱耦合极限下\(gN_{F}\ll1\)却是一个普适常数 \[\begin{equation} \frac{2\Delta}{k_{B}T_{c}}\approx 3.53 \end{equation}\]

而与微观细节无关。这是BCS理论的显著结果,这个结果被广泛地用于区分强弱耦合超导体。对于强耦合的超导体这个值要比\(3.53\)略高,例如对于汞和铅而言分别为\(4.6\)\(5.2\)

Bogoliubov-de Gennes Formalism

上面的BCS能隙方程与其他公式都是基于平移不变性得到的,当处理杂质或磁性涡旋这样的平移对称性破缺的系统时需要修正。为了描述超导序参量在空间上的变化以及其他相关的物理量,通常直接在坐标空间上工作要比动量空间更加方便。

在一个空间不均匀的体系中,如果没有磁性杂质或其他破坏时间反演对称性的源时,BCS平均场方程可以被表述为

\[\begin{equation}\label{eq:BdG-Hamil} H_{MF}=\int d\mathbf{r}d\mathbf{r}'\begin{pmatrix} c_{\mathbf{r}\uparrow}^{\dagger}&c_{\mathbf{r}\downarrow} \end{pmatrix}\begin{pmatrix} H_{0}(\mathbf{r})\delta(\mathbf{r}-\mathbf{r}')&\Delta(\mathbf{r},\mathbf{r}')\\ \Delta^{*}(\mathbf{r},\mathbf{r}')&-H_{0}(\mathbf{r})\delta(\mathbf{r}-\mathbf{r}') \end{pmatrix}\begin{pmatrix} c_{\mathbf{r}'\uparrow}\\c_{\mathbf{r}'\downarrow}^{\dagger} \end{pmatrix} \end{equation}\]

其中 \[\begin{equation} H_{0}=-\frac{\hbar^{2}}{2m}\nabla^{2}+U(\mathbf{r})-\mu, \end{equation}\]

以及\(U(\mathbf{r})\)是标量散射势。在实空间下,能隙函数\(\Delta(\mathbf{r},\mathbf{r}')\)被定义为两个位于\(\mathbf{r}\)\(\mathbf{r}'\)处电子的配对序参量 \[\begin{equation} \Delta(\mathbf{r},\mathbf{r}')=-g\langle c_{\mathbf{r}\uparrow}c_{\mathbf{r}'\downarrow}\rangle \end{equation}\]

该方程应当被自洽地决定。

从BdG哈密顿量形式可以看到其为二次型,且迹为零。由粒子空穴对称性,可以说明,若\(E_{n}\)\(H_{MF}\)的本征值,那么\(-E_{n}\)也是。利用Bogoliubov变换可以对角化\(H_{MF}\)

\[\begin{equation} \begin{pmatrix} c_{\mathbf{r}\uparrow}\\c_{\mathbf{r}\downarrow}^{\dagger} \end{pmatrix}=\sum_{n}\begin{pmatrix} u_{n}(\mathbf{r})&-v_{n}^{*}(\mathbf{r})\\v_{n}(\mathbf{r})&u_{n}^{*}(\mathbf{r}) \end{pmatrix} \begin{pmatrix} \alpha_{\mathbf{n}}\\\beta_{\mathbf{n}}^{\dagger} \end{pmatrix} \end{equation}\]

对于没有时间反演对称性的超导体系而言,例如在外磁场存在的情况下,自旋上下电子通过Zeeman相互作用耦合时,一个类似的Bogoliubov变换可以被定义用于求解BdG哈密顿量。然而此时\(2\times2\)变换矩阵需要被推广为\(4\times4\)矩阵。

\(u_{n}(\mathbf{r})\)\(v_{n}(\mathbf{r})\)定义了Bogoliubov准粒子的波函数,他们通过\(H_{MF}\)的本征方程决定

\[\begin{equation}\label{eq:bdg-1} \int d\mathbf{r}'\begin{pmatrix} H_{0}(\mathbf{r})\delta(\mathbf{r}-\mathbf{r}')&\Delta(\mathbf{r},\mathbf{r}')\\ \Delta^{*}(\mathbf{r},\mathbf{r}')&-H_{0}(\mathbf{r})\delta(\mathbf{r}-\mathbf{r}') \end{pmatrix} \begin{pmatrix} u_{n}(\mathbf{r}')\\v_{n}(\mathbf{r}') \end{pmatrix}=E_{n}\begin{pmatrix} u_{n}(\mathbf{r})\\v_{n}(\mathbf{r}) \end{pmatrix} \end{equation}\]

在准粒子表示下,能隙函数可以用\(u_{n}(\mathbf{r})\)\(v_{n}(\mathbf{r})\)表示为

\[\begin{equation}\label{eq:bdg-2} \Delta(\mathbf{r},\mathbf{r}')=-\frac{g}{2}\sum_{n}\left[u_{n}(\mathbf{r})v_{n}^{*}(\mathbf{r}')+u_{n}(\mathbf{r}')v_{n}^*(\mathbf{r})\right]\tanh\frac{\beta E_{n}}{2} \end{equation}\]

上式是Bogoliubov-de Gennes(BdG)自洽方程。他们被广泛地用于求解杂质散射,涡旋线周围的元激发,表面态以及Andreev反射等问题中。

BdG自洽方程等价于超导在平均场下的格林函数理论。在空间不均匀的体系中,格林函数\(G(\mathbf{r},\mathbf{r}')\)依赖于\(\mathbf{r}\)\(\mathbf{r}'\)而非两者之差\(\mathbf{r}-\mathbf{r}'\)。此时,通常求解BdG方程要比格林函数简单,因为BdG波函数\((u_{n}(\mathbf{r}),v_{n}(\mathbf{r}))\)只依赖于单个坐标\(\mathbf{r}\)

区分自旋的BdG形式

BdG形式一般的BCS二次量子化形式为 \[\begin{equation} \hat{\mathcal{H}} = \sum_{\sigma\sigma'}\int d\mathbf{r}\psi_{\sigma}^{\dagger}\mathcal{H}_{\sigma\sigma'}\psi_{\sigma'} + \int d\mathbf{r}\int d\mathbf{r}'\Delta(\mathbf{r},\mathbf{r}')\psi^{\dagger}_{\uparrow}(\mathbf{r})\psi^{\dagger}_{\downarrow}(\mathbf{r})+\Delta^{*}(\mathbf{r},\mathbf{r}')\psi_{\downarrow}(\mathbf{r})\psi_{\uparrow}(\mathbf{r}') \end{equation}\]

其中\(\psi\)为单体算符,\(\Delta\)为自旋单态的超导配对势,若只考虑局域相互作用\(\Delta(\mathbf{r},\mathbf{r}')=\Delta\delta(\mathbf{r}-\mathbf{r}')\),可以引入Nambu旋量 \[\begin{equation} \hat{\Psi}(\mathbf{r})=\left(\hat{\psi}_{\uparrow}(\mathbf{r}),\hat{\psi}_{\downarrow}(\mathbf{r}),\hat{\psi}^{\dagger}_{\downarrow}(\mathbf{r}),-\hat{\psi}^{\dagger}_{\uparrow}(\mathbf{r})\right) \end{equation}\]

从而哈密顿量可以写为BdG形式 \[\begin{equation} \hat{\mathcal{H}}=\frac{1}{2}\int d\mathbf{r}\hat{\Psi}^{\dagger}(\mathbf{r})\hat{H}_{BdG}\hat{\Psi}(\mathbf{r})+\text{constant} \end{equation}\]

其中有 \[\begin{equation} \hat{H}_{BdG}=\begin{pmatrix} \mathcal{H}_{\uparrow\uparrow}(\mathbf{r})&\mathcal{H}_{\uparrow\downarrow}(\mathbf{r})&\Delta&0\\ \mathcal{H}_{\downarrow\uparrow}(\mathbf{r})&\mathcal{H}_{\downarrow\downarrow}(\mathbf{r})&0&\Delta\\ \Delta^{*}&0&-\mathcal{H}^{*}_{\downarrow\downarrow}(\mathbf{r})&\mathcal{H}^{*}_{\downarrow\uparrow}(\mathbf{r})\\ 0&\Delta^{*}&\mathcal{H}^{*}_{\uparrow\downarrow}(\mathbf{r})&-\mathcal{H}^{*}_{\uparrow\uparrow}(\mathbf{r}) \end{pmatrix} \end{equation}\]

注意到由于BdG形式考虑了电子和空穴的激发,新的旋量场扩张了一倍的自由度,从而在哈密顿量前有\(\frac{1}{2}\)的系数。在此基础上,时间反演算符可以表示为 \[\begin{equation} \mathcal{T}=i\tau_{0}\sigma_{y}\mathcal{K} \end{equation}\]

其中\(\mathcal{K}\)是共轭算符,同样的,荷共轭算符可以表示为 \[\begin{equation} \mathcal{C}=-i\tau_{y}\sigma_{0} \end{equation}\]

两个对称操作的组合即为粒子-空穴对称 \[\begin{equation} \mathcal{P}=\mathcal{CT}=\tau_{y}\sigma_{y}K=\begin{pmatrix} 0&0&0&-1\\ 0&0&1&0\\ 0&1&0&0\\ -1&0&0&0 \end{pmatrix}\mathcal{K} \end{equation}\]

容易证明 \[\begin{equation} \mathcal{P}\hat{\Psi}=\hat{\Psi}\quad\text{and}\quad\{\mathcal{P},\mathcal{H}_{BdG}\}=0 \end{equation}\]

荷与概率的流密度算符

由于Bogoliubov准粒子不是电子数算符的本征态,总电子数不守恒,而这意味着准粒子的概率\(\rho_{P}(\mathbf{r})\)将不正比于电子密度\(\rho_{Q}(\mathbf{r})\)。相对应的,准粒子的流密度\(J_{P}(\mathbf{r})\)也不正比于电流密度\(J_{Q}(\mathbf{r})\)。这个差别是Cooper对凝聚带来的。这个概念的理解对规范不变性以及超导体内的电子散射非常重要。

Bogoliubov准粒子的流密度荷电流密度依赖于能隙函数\(\Delta(\mathbf{r},\mathbf{r}')\)的对称性。在一个各向同性的\(s\)波超导中,配对相互作用是局域的,这些量可以相对简单地定义,从而Bogoliubov波函数\(u\)\(v\)由下面的方程决定

\[\begin{equation} i\hbar\frac{\partial}{\partial t}\begin{pmatrix} u(\mathbf{r})\\v(\mathbf{r}) \end{pmatrix}= \begin{pmatrix} H_{0}(\mathbf{r})&\Delta(\mathbf{r})\\\Delta^{*}(\mathbf{r})&-H_{0}(\mathbf{r}) \end{pmatrix}\begin{pmatrix} u(\mathbf{r})\\v(\mathbf{r}) \end{pmatrix} \end{equation}\]

其中\(\Delta(\mathbf{r})=\Delta(\mathbf{r},\mathbf{r}')\delta(\mathbf{r}-\mathbf{r}')\)是超导序参量,而在\(d\)波或者其他非常规超导中,能隙函数变得非局域,且有一些非对角非局域项需要加入这些定义中。

在各向同性\(s\)波超导体中,能隙函数与动量无关,即\(\Delta_{\mathbf{k}}=\Delta\),从而准粒子密度包含了粒子\(u\)和空穴\(v\)的贡献 \[\begin{equation} \rho_{P}(\mathbf{r})=|u(\mathbf{r})|^{2}+|v(\mathbf{r})|^{2} \end{equation}\]

可以验证其时间倒数满足 \[\begin{equation} \frac{\partial}{\partial t}\rho_{P}+\nabla\cdot\mathbf{J}_{P}=0 \end{equation}\]

基于此方程,可以找到准粒子流定义为 \[\begin{equation} \mathbf{J}_{P}=\frac{\hbar}{m}\Im \left(u^{*}\nabla u-v^{*}\nabla v\right) \end{equation}\]

正如预期,对概率流密度而言,粒子和空穴有相反的贡献。

由于粒子和空穴携带相反的电荷,超导准粒子的荷密度定义为 \[\begin{equation} \rho_{Q}(\mathbf{r})=e\left (|u(\mathbf{r})|^{2}-|v(\mathbf{r})|^{2}\right ) \end{equation}\]

\(u\)\(v\)的时间演化来看,可以找到荷密度满足方程 \[\begin{equation} \frac{\partial}{\partial t}\rho_{Q}(\mathbf{r})+\nabla\cdot\mathbf{J}_{Q}(\mathbf{r})=\frac{4e}{\hbar}\Im(\Delta u^{*}(\mathbf{r})v(\mathbf{r})) \end{equation}\]

其中 \[\begin{equation} \mathbf{J}_{Q}(\mathbf{r})=\frac{e\hbar}{m}\Im(u^{*}\nabla u+v^{*}\nabla v) \end{equation}\]

是准粒子的电荷流密度。与概率守恒方程相比,电荷守恒方程包含了一个额外项,由超导配对电子贡献,这一项正比于Bogoliubov本征态的粒子空穴波函数的积,如果我们定义超电流密度算符为 \[\begin{equation} \nabla\cdot\mathbf{J}_{S}(\mathbf{r})=-\frac{4e}{\hbar}\Im\left [\Delta u^{*}(\mathbf{r})v(\mathbf{r})\right ] \end{equation}\]

则荷守恒变为 \[\begin{equation} \frac{\partial}{\partial t}\rho_{Q}(\mathbf{r})+\nabla\cdot\left[\mathbf{J}_{Q}(\mathbf{r})+\mathbf{J}_{S}(\mathbf{r}) \right]=0 \end{equation}\]

在平移不变的系统中,动量\(\mathbf{k}\)是好量子数,此时Bogoliubov准粒子波函数由BCS平均场方程决定。而在实空间中有

\[\begin{equation} u(\mathbf{r}) = \frac{1}{\sqrt{V}}e^{i\mathbf{k}\cdot\mathbf{r}}\sqrt{\frac{1}{2}+\frac{\xi_{\mathbf{k}}}{2E_{\mathbf{k}}}} \end{equation}\]

\[\begin{equation} v(\mathbf{r}) = -\frac{1}{\sqrt{V}}e^{i\mathbf{k}\cdot\mathbf{r}}\sqrt{\frac{1}{2}-\frac{\xi_{\mathbf{k}}}{2E_{\mathbf{k}}}} \end{equation}\]

\(\mathbf{k}\)为实数时,概率流密度等于 \[\begin{equation} \mathbf{J}_{P}=\frac{\hbar\xi_{\mathbf{k}}\mathbf{k}}{mVE_{\mathbf{k}}} \end{equation}\]

作为比较,正常荷流\(\mathbf{J}_{Q}\)与超电流\(\mathbf{J}_{S}\)\[\begin{equation} \mathbf{J}_{Q}=\frac{e\hbar\mathbf{k}}{mV} \end{equation}\] \[\begin{equation} \mathbf{J}_{S}=0 \end{equation}\]

这说明具有实动量\(\mathbf{k}\)的Bogoliubov准粒子不会通过与另一个准粒子形成库伯对从而衰变产生超电流,从而\(\mathbf{J}_{S}=0\)。尽管\(\mathbf{J}_{P}\)\(\mathbf{J}_{Q}\)都正比于动量\(\hbar\mathbf{k}\),但\(\mathbf{J}_{P}\)多包含了因子\(\xi_{\mathbf{k}}/E_{\mathbf{k}}\)。荷电流密度的方向与\(\mathbf{k}\)一样。对于粒子型准粒子,有\(\xi_{\mathbf{k}}>0\),其概率流密度也平行于\(\mathbf{k}\)。然而对于空穴型准粒子,由于\(\xi_{\mathbf{k}}<0\),其概率流密度反平行于\(\mathbf{k}\)

另一方面,若动量包含一个小虚部,例\(\mathbf{k}=\mathbf{k}_{0}+i\eta\hat{x}\),其中\(\eta>0\),准粒子的波函数将会在\(\hat{x}\)方向上指数衰减,此时准粒子的荷流变为 \[\begin{equation} \mathbf{J}_{Q}=\frac{e\hbar\mathbf{k}_{0}}{mV}e^{-2\eta x} \end{equation}\]

即也在\(x\)方向上衰减。超电流在\(y\)\(z\)方向上依然为0,然而在\(x\)方向上是有限的 \[\begin{equation} J_{S}^{x}=-\frac{e\Delta^{2}}{\eta\hbar V}(1-e^{-2\eta x})\Im\frac{1}{E_{\mathbf{k}}} \end{equation}\]

\(\eta\ll|\mathbf{k}_{0}|\)时,\(J_{S}^{x}\)近似为 \[\begin{equation} J_{S}^{x}=\frac{e\Delta^{2}\hbar\xi_{k_{0}}k_{0,x}}{mVE_{k_{0}}^{3}}\left (1-e^{-2\eta x}\right ) \end{equation}\]

这说明准粒子的荷流被转变为库伯对的超电流。准粒子动量的虚部的逆\(\eta^{-1}\)是一个描述准粒子形成凝聚的超导库伯对的特征长度。


  1. 1.D-Wave Superconductivity. Cambridge University Press; 2022. ↩︎
  2. 2.这里符号加粗表明该量是一个向量 ↩︎

有一些看过的有意思的资料,因为没办法塞进笔记里,放文件夹又容易忘掉,于是在这里做个记录

Physics in Two Dimensions.(二维物理)

由A.J. Leggett给出的二维体系物理的lecture note,包含局域化,Ginzburg-Landau,BKT相变,QHE,拓扑绝缘体,Kitaev模型等

DMRG笔记-iDMRG

由知乎用户零零撰写的DMRG参考代码

关济寰的个人网站

Robert Littlejohn的量子力学lecture

最近做事情总觉得不很顺畅,一方面是科研上本就是从事前人未知的路,一方面也算是自己不擅长于沟通,进而往往自己缺少什么事情都没办法表达出来,所以只能说是有些彷徨。只是人生要做些事情总是有这些情况的。主要还是因为今天发现之前有趣的数值模拟的结果之一可以用很简单的讨论去解释,一个曾经看上去可以发文的idea就没了,还是有些想叹气的。

今天刷知乎的时候看见一篇谈论哈耶克的文章,久闻哈耶克的大手之名,于是便找了一些关于哈耶克的译作来看,随即发现了一有趣的文章,即哈耶克1945年发表在《美国经济评论(The American Economic Review)》上的《知识在社会中的运用(The Use of Knowledge in Society)》,是他最重要的短文之一。这篇文章在知乎上有搬运哈耶克:知识在社会中的运用(无删减版),这里就不做多赘述。引起我注意的是最后几段,

所以,即使我们能证明,所有的事实如果为一个人所了解(就像我们假设他们被观测力强的经济学家掌握那样),会由他独自决定解决方法,问题也丝毫未得到解决。相反,我们必须表明,如何通过只掌握部分知识的个人的相互作用来解决这个问题。如果以为所有的知识都应由一个人所获得——同样假设这些知识都归我们这样的经济学家,那就是假设不存在问题,无视现实世界中重要而意义重大的一切事物。 像Schumpeter教授这样一个经济学家的立场,会由此而跌入由“数据”一词的含糊意义给粗心者造成的陷阱,这不能仅被解释为一个简单的失误。这表明,这种方法有某种根本性的错误,这种方法习惯性地忽视我们所必须应付的一个重要现象的本质部分——人类的知识具有不可避免的不完美性,因而需要一个不断沟通和获得知识的过程。任何实际上以人们的知识与客观事实是一致的这一假设为出发点的方法,诸如许多有联立方程式的数理经济学的方法,都完全忘掉了我们所要解释的主要任务。我决不否认,在我们的体系中,均衡分析起着有益的作用。但是现在到了这样一个紧要关头,一些著名学者误以为它所叙述的情形与解决实际问题直接有关。是我们记住这一点的时候了——均衡分析与社会过程根本无关,而仅能作为研究主要问题前的有益的准备

这段话可以做许多种阐释,但我认为这里最重要的事情是如何通过不完备的知识储备去做一件事情。首先一件显而易见的事情是,没有人具备所有的知识,进而准备足够充分地去做一件事情是一件理论上不可能地事情。其次,客观的工作量,存在上限的效率,以及时间三者所共同构成的约束,使得个人能力再强也无法单独完成一件复杂的事情。所以在面对一个事情时,考虑如何利用不太靠谱的基础部件(人),去完成一个靠谱的任务是一件更加现实且具有可行性的研究课题。 同样的概念可以类比钱学森与宋健的《工程控制论》第三版4.11一书所提到的

某种特定的系统结构能不能保证系统的所有状态坐标都受到控制作用的制约,在一个复杂的系统中这并不是显而易见的特征。 在多维系统中常有一部分坐标是不能控制的;还有一部分只能通过别的坐标间接地受到控制。 弄清给定系统的能控性不仅具有实际意义,在理论分析中它尤其是一个重要概念。... 从能控性和能观测性观点来看 ,一个线性系统总可以分解成四个部分,即能控、能观测部分,能控、不能观测部分,能观测、不能控部分,不能控、不能观测部分

这样一来,从控制论的角度而言,又可以将事情从可控制与可观测两个角度划分为四个部分,在做事的时候,对于不靠谱的基础部分,利用这个角度来看可以尽量的将个人的劳动力进行恰当的划分,比如能观测但不可控的部分就尽量保持其在视界内用于修正未来的路线,无需花太多精力在控制不可控的事情上。

(虽然从这个角度而言,科研看上去既不可以观测,也不可控,哈哈)

0%