[返回四海同心首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

现代数学和理论物理已经发展到怎样一个令人震惊的水平了?

送交者: 院子[♂★★★理性但荒谬★★★♂] 于 2021-07-28 4:24 已读 666 次  

院子的个人频道

+关注
现代数学和理论物理已经发展到怎样一个令人震惊的水平了?

作者:Max Snow
链接:https://www.zhihu.com/question/304611853/answer/553540524
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

丛观整个物理学史,我认为真正令人震惊的不是公式变得有多复杂(地心说搞得也挺复杂的。。。),而是物理学已经越来越脱离直观了


牛顿时期:


老祖宗牛顿真是开了个好头啊,为了建立物理理论自己先搞出来了微积分,算是数学和物理结合的最初典范,简简单单的三个公式上能预测天体运动下能解释斜坡上的小滑块,真是让人不服不行。


牛顿力学的基本物理量是空间坐标x,时间t,质量m,还有能量,这几个量正常人都能很直观地理解是什么意思,在自然语言中也经常使用。


而且微积分这个东西直观性也非常好,想想我们解高数题的时候用到了很多形象思维,比如说我们可以把微分理解为小量,把积分理解为求和,仔细想想和初等数学差别不大。


后牛顿时期:


牛顿之后就是统计力学,麦克斯韦电磁学,分析力学这些了。虽然这些理论一定程度上独立于牛顿力学,但是和牛顿力学没有根本世界观上的矛盾。而且这些理论需要的数学也不过就是初等数学+微积分。


其中电磁学的基本物理量是电场和磁场,统计力学引入了熵,热这些量,总的来说直观性还是杠杠的。而分析力学比较微妙,虽然理论体系和牛顿力学完全等价,但是却以拉格朗日量和哈密顿量为基本物理量,之所以定义这两个量完全出于数学上的考量,没有直观性。后来证明这兄弟俩在现代物理中发挥了极其重要的作用。


爱因斯坦时期:


自从爱因斯坦降临于世,物理学就开始向变态的方向发展了。。。


在牛顿时期,是先有物理学的直观,然后才发展出了所需要的数学。而爱因斯坦时期恰恰相反,有一些之前数学家随便瞎玩的东西,本来没觉得和现实世界有任何关系,在这一时期却被引入了物理学,具体来说指的是微分流形,群论等。


狭义相对论告诉我们,时间空间地位相当,都是四维时空矢量的分量,切换惯性系实际上是在对四维时空进行旋转,我们可以类比三维旋转来理解。而动量,波矢,电磁场这些物理量都可以找到相应的四维协变形式。


广义相对论告诉我们,时空不是平坦的而是拧在一起的,我们之所以感觉是平坦的完全是因为我们周围没有密度特别大的东西所以时空弯曲效应不明显(当然这是在把地球造成的时空弯曲解释为引力的前提下说的),时间和空间第一次在物理学里发生了如此深刻的关联!真正描述时空的不是欧式几何而是黎曼几何(怒打康德脸)。总的来说,爱因斯坦用微分流形的语言取代了正常人对时空naive的理解,我们发现直观上想当然是对的东西不一定真是对的(如几何学里的平行线公理在现实世界就不对)。不过我们还是可以用可直观的二维三维空间弯曲来理解四维时空的弯曲。除了强调时空几何以外,相对论并没有比牛顿力学多引入任何基本物理量,只是把物理量整理成Lorentz协变的形式。


然后再说量子力学,尽管这家伙用到的数学没有广义相对论复杂,但真是太反直观了。


1. 它沿袭了分析力学里面哈密顿量,广义坐标的概念。


2. 牛顿力学里面用坐标和速度来描述一个粒子的状态,而量子力学不认为一个粒子有确定的坐标和速度,因此用波函数来表征粒子的状态,波函数的模方正是粒子的概率密度分布。除了坐标和动量以外,其他物理量也是概率性的。


3. 量子力学不认为物理量是个数,而是算符,或者说是线性代数里面的线性变换(Hermite的),(所以公式里两个物理量的位置就不能像以前那样按照乘法交换律随意交换),代数第一次在物理学里面被提到这么高的地位!


4. 它用的线性代数还不是大多数本科生学的实数域上的线代,而是复数域上的。没错,量子力学基本方程薛定鄂方程里面含有虚数!和电动力学里那种为了计算方便而引入的虚数不同,量子力学理论本身就需要复数结构!看上去不可能有物理意义的虚数居然出现在基本方程里面,这是何等的疯狂!


量子场论时期:


场论是现代物理的基本语言。其中基本物理量叫做场算符,包括标量场,矢量场和旋量场。Free theory的标量场定义为这样:

。如果说量子力学里面的波函数还可以通过概率密度来建立直观,那现在这个场算符就真的一点直观都没有了(实际上应该理解为一大堆谐振子的叠加,但是这样想对我来说很难受,谁关心谐振子啊。。orz),这样定义的一个很大的好处是它在Lorentz变换下的变换性质和普通的标量场一样。


学狭义相对论的时候我们一般把Lorentz变换理解为一些固定的四维矩阵,但是场论里自旋(spin)的概念让我们认识到,真正最重要的不是那个Lorentz矩阵,而是矩阵背后的Lie代数,或者说是Lorentz群。那个矩阵只不过是Lorentz群的一个四维表示(representation)而已,而像旋量这种二维的东西是按照二维的表示进行变换的。试问在相对论性量子力学建立之前,无论是数学家还是普通人,谁能想到群论这种高度抽象的东西能和自然界有这么深刻的联系?


场论对何谓粒子的理解也是高度抽象的,不是我们平常脑子里想的一个个小球,我引用Schwartz教材里的话: Particles transform under irreducible unitary representations of the Poincare group. This statement can even be interpreted as the definition of what a particle is. 很多人总是好奇反粒子到底是啥东西,其实在场论里,对反粒子的定义也是纯粹抽象的,没人能直观地告诉你为啥存在反粒子。


另外,场论把对称性的重要性提到了前所未有的高度,一个拉格朗日量之所以是其所是的样子,通常就是出于对对称性(包括Lorentz不变性)的考虑。很显然这是一个数学的理由而不是一个直观的理由。


再之后就是弦论,我暂时还不懂就不说了。


总结:


可以说整个物理学史是有从直观向抽象发展的趋势的。数学和物理如此深度的统一,在物理学之外的任何自然科学,社会科学,工科,商科都不曾出现过,这就是理论物理对我来说最令人震惊的地方。基于这个原因,数学和物理的统一体在我心中是人类文明最闪耀的两颗巨星中的一颗。




——————————————————————————————————————


我昨天发现了一篇讲数学物理关系的一篇文章:《数学与物理桥梁下的鸟瞰》 ,一开篇就讲共形场论和弦论。。反正我是看不懂orz。。如果看我写的这篇答案不过瘾可以继续看他这篇文章。


编辑于 2019-02-14

星玫

xixichen08

 等 11,168 人赞同了该回答

来简单说一下当前可以确认的理论物理的高度。我们最早的理论物理是为实验服务的。在那个年代,我们依然处于做大量的实验,然后总结规律的阶段。所以在这一阶段涌现出了一系列比较初等的定律,比如


热力学第n定律Snell 定律(光的折射定律)万有引力定律Coulomb 定律(静电相互作用)Faraday 定律 (电磁感应定律)

等等。这个时候物理学理论和其它任何科学分支的理论没有本质上的差别。


后来,我们开始发现不同的定律之间有一些相同之处,尤其是发现电学和磁学之间的巨大相似性,进而发现原来电和磁是同一样东西。于是我们开始做抽象,把电学和磁学(以及一部分波动光学)的规律都吸收到了一套理论中,这就是 Maxwell 的电磁理论。这一阶段的画风是这样的


一切电磁相关的现象均可被 Maxwell 电磁理论描述一切引力相关的现象均可被 Einstein 引力理论描述一切热学相关的现象均可被 统计理论描述

…………


再接下来,我们还发现不同的理论之间还有一些相同之处。于是我们开始了进一步的抽象,创造了所谓的 theory generator,或者说是一种通用的,用于生产理论方法。典型的案例包括 Lagrange 动力学,Hamiltonian 力学等等。这一阶段的画风是这样的


一切经典理论均可由如下原理生成:



这里面 

 是作用量, 
 被称为 Lagrangian。为了得到 Maxwell 电磁理论,你只需要
 ,为了得到广义相对论,你只需要
 。是的,你只要指定一个 Lagrangian,然后上述原理就可以自动给你生成一个理论。


这看上去好像用处不是非常大。事实上在牛顿那个年代之后不久,这种方法的雏形就已经出现了。不过真正让它焕发光彩的是 1918 年(正好100年前)的一件大事:著名数学物理学家 Emmy Noether 提出了 Noether 定理,这一定理利用上述原理证明了 Lagrangian 的对称性可以导致守恒量


这是非常强大的一条数学定理。要知道,物理学的对称性几乎就等同于普适性,而普适性是一套理论作为科学理论的底线级要求。所以,这条定理几乎就是在说任何物理理论里均存在守恒量,并且只要你写出 Lagrangian,我们就能用一套标准流程把这些守恒量找出来!


一个重要的例子就是能量。能量是与时间对称性绑定的一个守恒量,或者换句话说,我们会把能量定义为与时间对称性相关联的那个守恒量。更具体一点,我们写出一个具有时间对称性的 Lagrangian,Noether 定理就能给出一个对应的守恒量,而这个量就被定义为能量。自此,能量守恒便不再是所谓的经验定律,而是一条有严格证明的定理


除了上述的两个经典的 theory generator,现在我们熟知的量子力学(当然你得把 Schroedinger 方程写成 

 这样的抽象形式),量子场论,以及曾经火过两回的弦理论,都是 theory generators。它们当中都有类似于 Lagrangian 或 Hamiltonian 这一类的抽象的量,在给定这些量的情况下,就自动生成理论。


总结来说,我们最早根据实验得到了一些定律,然后发现定律之间有共同点,于是把这些定律抽象成了理论,然后又发现理论之间也有共同点,于是又抽象成了 theory generator。反过来,给定 theory generator 里面所需要的量,它就会自动给我们生成理论,将理论应用于不同的情景,我们又可以获得具体的一些定律。




其实现在 theory generators 的威力还远不止于此。不过这已经涉及到目前最前沿的理论物理。你点个赞,我看看要不要继续写。



感谢大家的热情,那我更一波。不过这些内容可能就未必像之前那么好懂,也未必如 Noether 定理一般精彩,不过我会尽量写得通俗易懂一些。


一般的 Lagrangian 是某个动力学变量(比如粒子的位置 

 或者某个场 
 )以及它的导数(比如速度 
 或者场的梯度 
 )的函数。我们通常把含导数的项称为动能项,其余的称为势能项。


先来看动能项。我们发现无论是哪一种理论,动能项往往能够被写成一阶导数的平方,比如通常经典力学里的动能项 

 就是速度的平方,再比如标量场的动能项 
 也是一阶导数的平方。个别例子中有出现仅仅是一阶导数,没有平方,比如 Dirac 场的动能项。不过无论如何,我们基本没有见过动能项中含有超过两个求导算子的情况。这并不是偶然,因为如果动能项中含有超过两个求导算子,就会造成一种被称为 Ostrogradsky Instability 的现象。


具体来说,就是这样的理论会允许物理系统可以有一直到负无穷的能量。为了理解这一点,我们需要 Hamiltonian。Hamiltonian 是 Lagrangian 经过一个简单的变换生成的,它的主要作用是告诉你这个系统的能量可以取哪些值。举个例子,一个经典的自由粒子的 Hamiltonian 是 

 ,其中 
 是动量, 
 是质量。动量可以从 
 一直取到 
 ,此时 Hamiltonian 可以取 
 ,也就告诉你自由粒子的能量一定是 
 的。


但是如果你的 Lagrangian 中含有超过两个求导算子,那么我们可以证明,Hamiltonian 会出现如下的形式



其中 

 是某种动量(术语上叫广义动量), 
 是某个坐标。这个时候我们发现如果 
 可以随意在 
 中取值,那么 Hamiltonian 的范围也是 
 。这就造成了一个严重的问题,如果能量没有下界,那么这个系统(或者其中一部分)就会无止境地向能量较低的状态去演化,从而造成强烈的不稳定性,这是不可接受的。


因此,现在主流的基本理论都只含有两个一下的求导算子。含超过两个求导算子的理论其实也存在,比如用于解决某些特定问题的宇宙学模型。不过在这种情况下,我们会被迫引入一系列约束条件来消除 Ostrogradsky instability。如果你希望你的理论具有一定的普适性,这么做其实得不偿失。不过针对某些特定问题有时候还是有点用。




再来看势能项。势能项只包含我们的动力学变量(比如坐标 

 或者某个场 
 ),因此我们可以将其进行展开(类似于微积分里面的 Taylor 展开)。展开之后具有幂级数的形式



每一个 

 之前都会有一个系数 
 ,这个系数控制了对应的相互作用的强度。比如,我们知道弹簧系统的势能项是



这并不意味着其它的项前面的系数都是0,它们可能只是很小,从而使得相应的相互作用很弱因而被忽略。


这个系数的量纲是一个很值得说道的东西。在这之前我们需要知道自然单位制,没见过的同学看文末[1]。在量子场论中,这个系数并不是标准的“常数”,而是一个会随系统能标(可以是系统总能量,或者其中某个实体的能量)而变化的一个量。也就是说,相互作用的强度会随着能标而变化。


如果某个项的系数具有正的质量量纲,比如标量场论中,系数是 

 ,质量量纲是+2,那么它的强度会随着能标的下降而上升,这种项被称为 relevant;反过来,如果系数具有负的质量量纲,比如引力常量 
 ,那么它的强度会随着能标的下降而下降,这种项被称为 irrelevant。而没有量纲的被称为 marginal。


这个事情有什么用呢?通常情况下我们的能标是较低的,至少我们目前还不能做到让一个系统达到任意能标。在较低能标的情况下,所有 relevant 的项具有较高的强度,所有 irrelevant 的项具有较低的强度。因此我们只需要考虑 relevant 的项即可。


在场论中,Lagrangian 的量纲是+4,标量场 

 是+1,因此 
 的项就是 marginal 了, 
 及以上就是 irrelevant 了。于是低能情况下我们只需要考虑至多3个项。这个结论对于很多理论均适用,也即 relevant 的项总是有限个,因此低能下只需要考虑有限个势能项。


所以这是不是意味着我们通常是见不到这些 irrelevant 的项的作用呢?并不是。在高能标下,一切都要倒过来,也即 relevant 项会很弱,而 irrelevant 项很强。要获得高能标,除了注入能量以外还可以注入质量。所以在注入足够多质量以后,我们发现了 irrelevant 项的作用 —— 这就是引力。引力相互作用的系数是引力常量 

 ,具有负的质量量纲。




就先讲这么多,希望大家可以感受到现代理论物理工具的强大。通过 theory generators,我们可以高屋建瓴地做一些判断,可以得到一些对许多理论都适用的结论。我们不需要知道Lagrangian 太多的细节,就可以根据 Noether 定理断言守恒量的存在。对于量子场论甚至弦理论这样的 generators 也一样。我们现在对弦理论依然知之甚少,不过已经足以让我们推测量子引力和量子纠缠很可能是一回事(所谓的 ER=EPR)。我们可以对 Lagrangian 进行细致的分析,从而判断出怎样的形式会带来怎样的结果。因此,对于现在的理论物理学家来说,与其说我们是在从现实中寻找规律从而创立理论,不如说我们在尝试设计一些理论。正如我们提到的,Lagrangian 不是可以随便写的,否则就要出问题。这些探索的经验让我们知道,这个自然界之所有有这些规律,这些规律之所以是这些形式,都是有更深层次的原因的。这也是为什么理论物理吸引了如此多的顶级智力为之工作。




[1] 在自然单位制下, 

 。也就是说,我们把长度单位定义为光在1秒内走过的距离,这样光速的就是1。这样一来我们有 
 ,也就是说从量纲角度上讲,长度和时间的量纲是一样的。同理根据 
 我们有 
 。这个故事就是告诉你长度,时间,质量三个量纲,现在我们只需要一个,这里我们选质量。



编辑于 2018-12-24

赞同 1.1 万

悲剧Cuddles

2,646 人赞同了该回答

数学已经发展到不会让普通人震惊的水平了——因为根本看不懂。绝大部分数学论文的题目,对普通人来说每个字都不认识,连在一起更不认识。连论文里研究的基本对象是什么都不知道,连对象具有的某个性质是什么意思都不懂,哪里还会震惊啊。
理论物理已经发展到跟数学一样“艰深晦涩”的水平。但得益于科普,有些论文题目中好歹能遇到一两个媒体反复提到的热词,能够让普通人“望文生义”一下,虽然想当然式的理解与理论物理中实际概念可能是天壤之别,至少表现得比数学“亲民”一点。不过大部分人面对理论物理可能是这个状态:

编辑于 2018-12-17
喜欢院子朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]