费马原理(Fermat's principle)是描述光波传播规律的基本原理之一,其在几何光学中的表述为:光线沿光程为平稳值的路径而传播的规律。具体内容为光线在两点之间传播的实际路径,与其他可能得邻近的路程相比,其光程为极值,该极值可为极小值、极大值或常量,其又叫“最短时间原理”“平稳时间原理”“时间极值原理”“光程极值原理”。利用费马原理推导出几何光学的三大基本定律:光的直线传播定律,折射定律,
光的反射定律。并将这三大定律以光程的概念统一归纳为一条原理。
这一原理最早由
法国数学家
皮耶·德·费玛(Pierre de Fermat)于1662年提出,最初名为“最短时间原理”,即光线传播的路径是需时最少的路径。该原理可推导出光的直线传播定律、光的反射定律、光的折射定律以及光路可逆性原理,随着研究的日臻完善,费马原理关于最短光程原理、物像等光程性等相关理论得到推广,在光学、数学、
管理学等交叉学科领域的应用研究得到发展,在电磁兼容问题和大气折射等实际工程的应用亦变得广泛。
历史
原理提出
费马原理的提出与
折射率研究有关。十七世纪,望远镜的问世,要求有正确的理论来指导怎么提高放大
倍数,改善性能,因此,人们进一步探讨了光的折射现象。
1611年,
约翰尼斯·开普勒(Johannes Kepler)在几何光学著作《屈光学》中,通过光在两种透明介质界面上发生折射现象的实验,指出折射角一部分与
入射角成正比,另一部分与入射角的余割成正比,同时还得出玻璃折射角不超过42°的结论,利用光的可逆性从反面倒推出光的全反射现象。但是却错误地认为,介质的折射能力与介质的密度成正比。
1621年,斯涅耳(Snell Willibrord)从实验中正确地给出光的折射定律,指出“对给定的两种介质,入射角和折射角的余割之比总是保持相同的值”,但没有进行理论推导,对式中常量的物理意义亦没有进行探讨。后续费马原理为折射定律提供了依据,并对斯涅尔定律表达式进行了优化。
1637年,
勒内·笛卡尔(Rene Descartes)在《
方法论》中给出折射定律的
正弦形式,指出
入射角的正弦值与折射角的正弦值之比为折射
光速与入射光速之比。笛卡尔采用微粒说,用球的运动来阐述光的折射,并且提出三条假设,即光在光密介质中的传播速度比在光疏介质中大;在同一介质,光速对各种入射角都相同;在折射过程中,仅速度的垂直分量变化,而与界面平行的速度分量守恒。
1662年,
法国皮耶·德·费玛(Pierre de Fermat)对
勒内·笛卡尔的三条假设提出质疑,得出了与笛卡尔完全相反的结论。费马按照经济原则“自然界的作用总是尽可能在最少的时间内完成”,认为只有光在光密介质中比在光疏介质中传播速度慢,才符合这条原则,并用数学
极值方法进行了证明,设光线从密度小的介质进入密度大的介质,在两种媒质界面发生折射,并将其转化成求点在圆周什么位置时相应图形面积最小的问题,进而得出“线DF与DH之比等于密介质的阻力与疏介质的阻力之比”,且“光线从疏介质进入密介质,会转向垂线”的结论。人们称这种极值思想为费马原理。
原理优化
费马原理是说,光经两种介质的界面时,无论是发生反射还是折射,光总是沿用时间最短的路径运行。他认为光的传播所遵从的
极值原理是最小值。费马原理用
数学证明的极值思想,所用的极值条件只是必要条件(一阶变分变为0),而非充分条件。
费马原理被认为是“
形而上学的空想”,遭到了
勒内·笛卡尔派和莱布尼茨派的否定,笛卡尔质问“光线不可能记得自己的过去,它怎么能够在遇到分界面时进行计算而选择一条时间最少的行进路径呢?”
戈特弗里德·莱布尼茨则从物理学的原则考虑,认为光线应当选择一条阻力最小的路径,而不是时间最少得路径。
费马原理的第一个真正的证明是由
克里斯蒂安·惠更斯(Christiaan Huygens)在波动理论的基础上给出,并得出两种介质
折射率之比等于光在这两种介质中的运行速度之比。但是光的
相速度,还是群速度,并没有指明,直到量子力学创立时,才由
路易·德布罗意(Louis Victor de Broglie)彻底弄清,费马原理中的速度是相速度。
原理延续
1696年,
约翰·白努利(Johann Bernoulli)在最速落径问题中提出在无穷多的曲线中哪一条曲线串珠下落得最快,并称这条曲线为速降线(brachistochrone)。将
皮耶·德·费玛最小时间原理,力学的能量守恒原理以及微积分结合起来,便可得到速降线的
微分方程。伯努利速降线问题的解法是
变分法的历史根源,对后续学者的研究有着深远的影响。
1744年,
皮埃尔·莫佩尔蒂(Maupertuis)兼顾
勒内·笛卡尔和
皮耶·德·费玛两人的理论,在“关于笛卡尔和其他人在自然定律方面的显著错误”一文中,提出最小作用原理,并导出杠杆平衡原理。
1808年,
马吕斯(Étienne Louis Malus)提出
马吕斯定理(Marius theorem),给出了光在两个波面传播时不同路径的光程之间的关系,与费马原理相互等价,都可以作为几何光学的基本定律。
1830~1832年,
哈密顿相继完成“论光线系统的理论”的附录,对光学的费马原理和粒子的莫培督原理进行了深入研究,哈密顿利用了
哈密顿力学的方法,将光线的传播视为一种
动力学过程,其中光线相当于经典粒子,而物理光学的场则相当于量子力学中的
波函数。
1919年,
英国天文学家阿瑟·爱丁顿(Arthur Eddington)第一次观测到引力透镜现象。
引力透镜现象是指在一个恒定的引力场中,由于质量的存在导致时空的弯曲,光沿着弯曲的路径传播。在引力场中运用费马原理发现了引力场中光路的
曲率及其对引力
透镜和大质量物体引起的星光偏转等现象。
定义
文字表述
一般表述为:光在任意介质或一组不同介质中从一点传播到另一点时,沿所需时间最短的路径传播。
更为严格的表述为:光线沿其实际路径从一个点到另一个点的传播时间相对于该路径的微小变化是平稳的。所谓的平稳是数学上的
导数概念,可以理解为一阶
偏导数为零,它可以是极大值,极小值,甚至是
拐点。根据定义,介质的
折射率是真空中
光速与介质中相应光速之间的比值。因为光线传播所花费的时间与介质中的光速成反比,而介质中的光速又与其折射率成反比,所以费马原理也可以如下所述:光线沿其实际路径从一个点到另一个点的光程是平稳的。其中,光程等于几何路径长度乘以介质的折射率。光路长度在某种意义上是恒定的,即路径与实际光线路径之间的偏差的一阶小量所产生的光程差,至少是一个二阶小量。
通用的表述为:光在任意介质或一组不同介质中从一点传播到另一点时,沿所需时间为
极值(或与相邻路径
相等)的路径传播。即光传播过程的光程可以取极小值、极大值或与周围路径相等的值。
特别地,在一阶或近轴成像系统中,所有的连接光源和对应像点的光路具有相同的光程。
光学名词审定委员会公布(2021年)费马原理在几何光学中的表述为:光线沿光程为平稳值的路径而传播的规律。
光程定义
光程等于光在介质n中走过距离d的相同时间内,在真空中所走的距离,表达式为。
数学表述
基于变分概念的表述为:在光线的实际路径上光程的一阶变分为零,即,其中,表示光程,即光在介质中通过的几何路程与该介质
折射率的乘积;且介质折射率连续变化。
光程随路径变化的关系有几种形式,在平面坐标系中,横坐标表示光线路径,纵坐标表示光程,A点切线均为水平方向,一阶变分为零。
严格数学表述为:光线实际路径和相邻路径的光程差,即,其中、分别为相邻路径和实际路径长度的
导数元素,表示关于的更高阶幂级函数。
推导
光程在复杂情况下,存在极大值光程、极小值光程、
常数值光程和光程函数
拐点,以二维平面内椭圆的情况进行推导,其中为椭圆的焦点,
单射光线从焦点出发,反射光线经过焦点。
极小值光程推导
如图1,当椭圆与外切圆界面相切于点时,实际光线(实线)的光程为极小值。
极大值光程推导
如图2,当椭圆与内切圆界面相切于点时,实际光线(实线)的光程为极大值。
常数值光程推导
如图3,当椭圆与内切椭圆界面相切于点时,实际光线(实线)的光程为恒定
常数。
光程函数拐点推导
如图4,当椭圆与弯曲界面(与椭圆部分外接,部分内切)相交于点时,实际光线(实线)的光程对应光程函数拐点。
射线角度推导
费马原理从射线角度分析,即为波沿射线传播的时间最短。
光的反射推导
如图5,光在介质内传播速度为,光线从A点
单射,经过界面NM反射到B点,由
光的反射定律可知
入射角与反射角
相等。取B点关于NM的对称点B'点,则有,则光传播的时间为:
当A、O、B'在一条直线上时,OA+OB'最小,即光的传播时间t最小,而当入射角与反射角相等时,A、O、B'在同一条直线,所以光的反射是沿着所需时间最短(
极值)的路径传播的。
光的折射推导
如图6,光从
折射率为的介质1中的A点
单射,经过界面NM折射到折射率为的介质2中的B点,其中,在介质1的传播速度为,在介质2的传播速度为,则由折射定律可得。
当入射点向右微小移动到O'(即)时,光在介质1中的传播时间减少,在介质2中传播时间增加,因为O'在O的右边,所以,所以,即光的传播时间增加。
同理,当
单射点向左微小移动时,易得光的传播时间增加。
所以,只有入射光线经过O点时,光的传播时间最短,所以光的折射沿着所需时间最短(
极值)的路径传播。
能量路径推导
如图7,Q是点源M0发出的任意时刻的波前位置,半径为,振幅为A,圆频率为,任意小面元为,M是Q外一点,与dQ的距离为r,是法线n与r的夹角。
根据波动理论可知M0到达dQ的振动为,将圆
波数用表示,省略周期因子(指标数谐和震动的形状,与振幅无关),则到达的振动为,根据惠更斯原理,把波前面Q的小面积元dQ看作二次震源,则M点扰动为,通过求导计算可得整个波前面Q在M点的总扰动为。
其中k(θ)是与θ有关因子,称作倾斜因子,而,所以当夹角θ为零时,即波沿
射线传播时,倾斜因子有最大值,当θ逐渐增大时,倾斜因子急剧减小,当θ为90°时,倾斜因子
绝对值衰减到最大值的一半,所以波沿着射线传播的方向能量最强。
局限性
皮耶·德·费玛原理适用于几何光学光束,当光线在两种介质的界面及其几何投影附近和按照几何光学规律出现光线相交的点两种情况时,光场的振幅或
相位梯度随
空间位置会有显著变化,费马原理有可能失效,即费马原理不适用于波动光学和
量子光学。
相关推论
用
导数或
变分法可以从费马原理导出以下三个几何光学定律:
最短光时线可以有多条,例如光线从椭圆面焦点A经过反射到另一焦点B,可以有无数条路径,所有这些路径的光线传播时间都
相等。
光的直线传播定律
光在均匀介质中沿直线传播。
光程,
又两点之间直线最短,
所以(其中,为曲线路程),
由此费马原理推导出光的直线传播定律。
光的反射定律
平面反射
如图8,光从P点出发射向距离刻度x点,反射到Q点。
P点到x点的距离,Q点到x点的距离,从点P到点Q的光程D为
.
根据费马原理,光线在真空中传播的路径是光程为
极值的路径。取光程D对x的
导数,令其为零:
,
其中:
,
,
,
.
球面反射
球面的半径=R,光线从直径一端Q射向球面,反射到直径另一端P,光程:
,
因:
,
所以:
,
根据费马原理,
,
解之, 得,代入D得到:光程,乃是一个极大值=2.8R;(极小值光程是从直径一端到Q另一端P,光程=2R)。
光的折射定律
折
射线位于入射面内,折射线与入射线分居法线两侧,
入射角的正弦与折射角的正弦之比为一与入射角无关的
常数,而与两种介质的
折射率有关。
证明:设在
均匀介质中且在镜面反射条件下,以镜面为建立直角坐标系,则:
光线的坐标分别为 ,
光线经过镜面上点的坐标为,介质折射率分别为,于是,
光程
,
根据费马原理,光程的一阶变分为零,则 ,即,
,
所以,
即,其中,为
入射角的正弦值,为折射角的正弦值,由此费马原理推导出光的折射定律。
光路可逆性原理
光线的方向反转时,其将逆着原来的路径传播。
证明:根据费马原理几何语言表达式,定积分上下限()互换时,其值不变(不涉及方向),即光程,
由此费马原理推导出光路可逆性原理。
相关理论
最短光程原理
定义为实际光线沿着光程为
极值(或稳定值)的路线传播,该路线即为最短光程。在正则光场中描述光波传播行为的费马原理的具体表述,即沿着光波电子运动轨迹的介质
折射率的线积分为光程函数,则其光线轨迹是使该光程函数取极值的曲线。
因为实际光线为极值,则和实际光线间隔为一阶微量的其他路线对应的光程,与实际光线光程差为二阶或高阶微量。光程是指光在介质中几何路程s和介质折射率n的乘积,表达式为L= n s,利用最短光程原理,借助光程函数的极值特点,不仅对于主轴上物点的球面反射和球面折射过程,得到实际光线满足的几何
方程。对于较复杂的情况,如主轴外物点的球面反射和球面折射过程,让光程函数取
极值,对其求导让其为零得到一级近似方程,进而得到研究物像公式。
最小光程原理多用于平面镜,凹面镜,椭球面镜和成像面镜等多种光学系统中,以确定光线路径,达到成像效果。
最小作用量原理
费马原理是最小作用量的基础,使得最小作用量原理由最短距离推广到最短时间,让定理更具有了普遍化。费马原理特别关注于光的传播路径,而最小作用量原理则提供了一种更广泛的框架,用于描述各种物理系统中的
最优化问题。两者之间的联系在于它们都试图解释自然界中存在的一种最优状态,无论是在时间上的最短路径还是在能量消耗上的最小化。
物理学中最小作用量原理(英语:least action principle),或更精确地,平稳作用量原理(英语:stationary action principle),是一种
变分原理,当应用于一个机械系统的作用量时,可以得到此机械系统的
运动方程。这原理的研究引导出经典力学的
约瑟夫·拉格朗日表述和哈密顿表述的发展。卡尔·雅可比特称
最小作用量原理为分析力学之母。
在现代物理学里,这原理非常重要,在
相对论、量子力学、
量子场论里,都有广泛的用途。在现代数学里,这原理是莫尔斯理论的研究焦点。本篇文章主要是在阐述最小作用量原理的历史发展。关于数学描述、推导和实用方法,请参阅条目作用量。最小作用量原理有很多种例子,主要的例子是
皮埃尔·莫佩尔蒂原理(Maupertuis' principle)和
哈密顿原理。
在最小作用量原理之前,有很多类似的点子出现于测量学和光学。
古埃及的拉绳测量者(rope stretcher)在测量两点之间的距离时,会将固定于这两点的绳索拉紧,这样,可以使间隔距离减少至最低值。
克罗狄斯·托勒密在他的著作《
地理学指南》(Geographia)第一册第二章里强调,测量者必须对于直线路线的误差做出适当的修正。古希腊数学家
欧几里得在《反射光学》(Catoptrica)里表明,将光线照射于镜子,则光线的反射路径的
入射角等于反射角。稍后,亚历山大的希罗证明这路径的长度是最短的。
莫佩尔蒂原理
1741年,莫佩尔蒂在“Loi du repos des corps (物体静止的定律)”一文中提出:一个静止的系统,会达到这样的位置,其任何变化会造成某个量之最小的变化。
1744年,莫佩尔蒂正式提出最小作用原理,即自然界总是通过最简单的方法产生作用,如果一个物体必须没有任何阻碍地从一点到另一点,自然界就利用最短的途径和最快的速度来引导它。
后莫佩尔蒂在1750年出版的“Essai de cosmologie (宇宙学文集)”一书中诠释了这个思想,他认为这个量是物体的质量、走过的距离与速度的乘积,并花费了二十年发展这个思想,最终为
最小作用量原理的发展奠定了基础。但
皮埃尔·莫佩尔蒂并没有给出该原理严格的数学表达式,后来在
莱昂哈德·欧拉和
约瑟夫·拉格朗日的努力下,将最小作用量原理定量化,即作用量最小的路径,应满足
方程。
哈密顿原理
哈密顿原理(Hamilton's principle,又译为汉密尔顿原理)是指力学系统在给定时间的一切可能运动中,使
哈密顿作用量(主函数)取
极值的运动才是真实发生的运动,数学表达式为。
哈密顿原理与最小作用原理相似,但
最小作用量原理是不等时变分,它是等时变分,即所有变更路径必须在同一时间内完成。1835年,哈密顿引入了一个新函数H,即系统的总能量,被称为哈密顿量,,并得到系统运动的正则
方程。哈密顿的光学-力学类比以及正则方程对现代物理学的产生和发展产生了巨大影响。
惠更斯原理
在某一时刻t由振源发出的波扰动传播到了波面S,则S上的每一面元可认为是次波的波源。该原理是惠更斯(C.Huygens)在1678年提出关于波面传播的理论。根据惠更斯原理,我们可以给出
折射率的物理意义,即光在两种介质中的速度之比。
惠更斯认为每个点上的波前可视为次波源,次波源发出的新波前是原波前的切线上的每一点上的新次波源的整体波峰。这些次波源在介质中传播,形成了新的波前。在
均匀介质中,新波前是原波前的切线上的每个点作为次波源产生的新次波峰的包络面。该原理解释了波是如何在传播过程中扩展的,在光学中,惠更斯原理可以解释光的传播和衍射现象。
最早成功解释衍射现象的是
奥古斯丁·菲涅耳(Fresnel),他将惠更斯原理进一步用光的干涉理论进行补充并发展。
马吕斯定理
1808年,马吕斯提出,后由杜平等人推广。马吕斯定理给出了光波在光学系统传播时,两个波面之间光沿不同光路传播时光程之间的关系。具体指光线垂直于入射波面入射时,经过任意次的反射和折射,光线依旧垂直出射波面射出,并且两个波面间的所有光路的光程都
相等。
费马其它理论
费马二平方和定理:形式为4n+1的每个质数可用唯一方式写成二平方数之和。
费马末定理:若n\u003e2,则不能为任何正整数所满足。
应用
运动学
伯努利家族的约翰·伯努利在解决
最速降线问题时曾利用到费马原理。他将小球运动类比作光线的运动,从而得出最速降线为
摆线。
通过将光的传播与匀速运动类比,利用费马原理来解决运动学的最值问题,如两过程匀速运动时间
极值问题。
交叉学科领域
科学研究领域
学者可利用费马原理探讨光学元件成像规律,推导出当反射和折射界面满足何种条件时,能将同光轴平行光束的反射和折射汇聚在一点,进而得到近轴光线条件下光学元件的成像规律,并使用相应软件进行模拟以便获得各光学元件的模拟光路图。
费马原理还被用于推导厚
透镜的物像方程,以及近轴近似条件下厚透镜、柱形透镜的物像方程,这对于增强学生的科学探究能力具有重要意义。
数学领域
在数学领域,学者发现可利用费马原理求解
直线运动最短问题,在解决该类问题中,将物体的运动比作光的传播,可以直接确定运动路径,从而简化解题过程。
还可将费马原理应用到凸函数,通过引入次
梯度——
导数概念得到凸函数极小值的充要条件,从而将费马原理的应用范围扩大到凸函数。
经济领域
在经济领域中,利用费马原理,基于生存策略调节与控制,将生存函数最大化,建立
经济系统的动态最优模型,从而分析经济系统生存域拓展和生存迁移情况下的最优生存问题。主要体现在其对
最优化问题的解决上,例如,Markov字段的概念可以应用于
经济学中的决策理论,其中决策者需要在不同选项之间选择以最大化某种收益或最小化损失。
实际工程应用
在实际工程领域,随着
信息技术的发展,电磁兼容和电磁环境问题受到关注,对于大型复杂器件而言,反射场和直射场占比较大,因而反射
射线寻迹的快速性和准确性比较重要,利用费马原理推导反射点的解析式,可缩短反射线寻迹时间,提高反射线寻迹精度。利用费马原理推导射线描迹法,模拟电磁波传播偏移路径,在实际工程中得到广泛应用,如对大气折射进行修正,用于
计算机模型和导弹防御系统仿真和测控站
对流层传播介质修正。