李 斐,袁 敏
(西北大学 数学与科学史研究中心, 陕西 西安 710127)
·科学技术史·
施瓦兹《分布理论》探源
李斐,袁敏
(西北大学 数学与科学史研究中心, 陕西 西安710127)
施瓦兹在1950—1951年出版的两卷本《分布理论》是广义函数理论的经典著作。他1944—1948年间的三篇相关论文已经奠定了《分布理论》的核心思想,在这三篇文章的基础上,施瓦兹对其早期工作进行补充和完善,完成了《分布理论》。对施瓦兹早期的这三篇文章进行探究表明,他的主要研究思路是,从古典函数的运算入手,将其表示成泛函的形式,进而运用对偶思想,得到分布的相关运算。
施瓦兹;分布;卷积;傅里叶变换
“函数”是数学中的重要概念。自从德国数学家维尔斯特拉斯(K. Weierstrass,1815—1897)在1861年引入处处连续但处处不可微函数的例子之后,数学家开始由规则的、充分光滑的函数转向对包括不规则函数的更大范畴函数概念的研究。在函数概念的发展史上,广义函数概念的引入无疑是一次突破性进展。许多数学家以不同方式对这一概念进行过引入。米库辛斯基(J. Mikusinski)和莱特希尔(M.J.Lighthill,1924—1998)从函数序列的极限角度引入了广义函数[1-2],索伯列夫(S.L.Sobolev,1908—1989)把广义函数定义为s阶连续线性泛函[3]等。虽然许多数学家都曾引入过广义函数的定义,但首次为它创建完整理论的数学家却是施瓦兹(L.Schwarzt,1915—2002)。1945年,施瓦兹把广义函数定义为基本函数空间上的连续线性泛函,并称其为分布[4]。随后,他创建了分布理论。在施瓦兹分布论的基础上,盖尔范德(I.M.Gel′fand,1913—)和希洛夫(G.E.Shilov,1917—1975)推广了已有理论,建立了急增函数的傅里叶变换,从而扩大了该理论的应用范围[5]。
施瓦兹在其引入的分布概念的基础上,以布尔巴基学派的结构数学思想为指导,运用对偶思想在分布空间上引入了序结构、拓扑结构和代数结构。他的这一研究思路在其1950—1951年的两卷本著作《分布理论》中清楚地呈现了出来,而该著作也成为广义函数理论的奠基性工作。然而,在1944—1948年,施瓦兹已经有3篇文章为他的著作《分布理论》奠定了坚实的基础。但就笔者所知,目前国内外关于施瓦兹在分布方面工作的研究,其大都集中在他的《分布理论》著作上,而对这3篇文章的研究则少有涉及[6-9]。有鉴于此,笔者在研读施瓦兹相关原始文献的基础上,对他在分布理论方面的最初贡献进行探析,进而使人们能够更加全面地了解施瓦兹关于分布理论的工作,以及他开展科学研究工作的方式。
1944年10月,施瓦兹在《法国数学学会通报》上发表了文章《一些非基本连续函数族》(SurCertainesFamillesnonFondamentalesdeFonctionsContinues),该文章仅由一个定义和两个定理构成[10]。这篇文章是对萧凯(G. Choquet,1915—)同年7月发表的《调和函数与多重调和函数的一些性质》的推广。
在这篇文章中,施瓦兹想要做的事情就是将萧凯的文章推广到任意常系数微分算子上。正是在这种动机之下,他开始研究微分方程的广义解。首先,他引入系数不全为零的常系数偏微分方程的广义解:
“若连续函数U在紧集上是系数不全为零的常系数偏微分方程
通常意义下解的一致极限,则称函数U为上述偏微分方程的广义解。”[10]
接着,他指出双曲型偏微分方程有不同于通常意义下的解,并证明连续函数在进行平移、位移变换之后必为微分方程的广义解。随后,他还提出并证明了迭代拉普拉斯方程的广义解为多重调和函数的论断。这些工作是施瓦兹在分布方面的起始性工作,1944年的这篇文章可以看作是他引入分布概念的源头。对此,施瓦兹在著作《分布理论》第一卷的引言中这样写道:
“1944年的文章出现在我的分布理论之前,它是我引入分布概念的源泉。”[11]
1945年,施瓦兹在《格勒诺布尔大学学报》上发表了文章《函数、微商、傅里叶变化概念的推广及其在数学物理中的应用》(GénéralisationdelaNotiondeFonction,deDérivation,deTransformationdeFourieretApplicationsMathématiquesetPhysiques),这篇文章基本涵盖了他的分布理论的主要思想和概念[4]。
2.1分布概念的引入
物理学中海维赛德函数的一阶导数,即狄拉克函数,以及数学自身发展的需要均暴露出古典函数概念的局限性,经典函数概念亟需推广。正是在恢复函数概念灵活性的驱使下,施瓦兹才在1945年引入分布概念。在1945年这篇文章的引言中,施瓦兹这样写道:
“自从海维赛德(O.Heaviside,1850—1925)引入符号运算法则之后物理学家运用它取得了普遍成功,尽管它没有在数学上得到严格证明。”[4]
为了通过引入新的数学语言来冲破经典分析学中存在的局限性,施瓦兹先对分析学中最基本的概念——函数进行了推广;然后在此基础上建立了一套新的数学语言。现在先来看他是如何推广函数概念的。
首先,施瓦兹重新定义了测度。测度在过去被定义为关于集合的完全可加函数,也就是说测度把集合与被称为该集合的测度的复数对应起来,这其实就是一个泛函。由此,施瓦兹把测度重新定义为在有限区间外为零的连续函数构成的函数空间上的泛函,并指出该泛函是连续线性的。值得注意的是,在《分布理论》中他对测度的泛函定义做了适当修正,让函数空间中的元素是“在紧集外为零”而不是这里的“在有限区域外为零”的连续函数[11]。
然后,他论证测度是古典函数概念的推广。他证明了可以将在有限区间内可和的函数f与密度为f且满足μ(φ)=∬…∫f(x)φ(x)dx的测度μ一一对应起来,从而测度是在有限区间内可和函数类的推广。在《分布理论》中,他用“紧集”替换了这里的“有限区间”。
接着,他从物理角度出发,引入了广义函数概念。施瓦兹指出有必要定义物理学家早就在位势理论中使用的比质点更为复杂的概念——多层。他发现通过测度的泛函定义能够把偶极子定义成关于函数φ的泛函,这里要求函数φ具有一阶导数。由此,他意识到若要定义多层,就必须让函数具有足够多次的导数。因此,他引入由无限可导且在有界集外为零的函数构成的集合Φ,且该集合的元素具有紧核;然后他称定义在函数空间Φ上的连续线性泛函为分布,即他引入的广义函数概念;施瓦兹称所有分布构成的向量空间为分布空间D。需要指出的是,《分布理论》中的“支集”就是这里的“核”,基本函数空间D就是由这里的集合Φ中的元素构成的,分布空间D′就是这里的空间D[11]。
“任意分布是无限可微的,并且可以交换求导顺序。……这就使得连续函数(甚至是在有界区域内可积的函数)无穷可微;通常情况下,它的微分既不是函数也不是测度,而是广义函数。然而,通常意义下连续可微函数的微分与它的广义函数微分是一致的。”[4]
2.2分布空间的结构
两个分布可以相加,也可以用实数或复数与分布相乘,因此分布可以构成向量空间。在引入分布及其微分定义之后,施瓦兹便开始研究分布空间上的三大结构,即序结构、代数结构和拓扑结构。正如他说道:
“……因此,我们可以在分布空间上定义各种有趣的结构,研究它们的性质。”[4]
从这句话可以看出,接下来施瓦兹想要做的事情就是研究分布空间上的结构。首先,他定义了分布大于等于零的序结构,这即为《分布理论》中非负分布的定义。
然后,他研究分布空间上的代数结构,引入了分布的乘法、张量积和卷积运算。他把分布与无穷可微函数的乘积定义为αT(φ)=T(αφ),其中函数φ是基本函数空间中的任意元素。显然,他是通过对偶把分布与无穷可微函数的乘积转换成基本函数空间上的元素与无穷可微函数之间的乘积,这一思想是他引入分布空间上各种代数结构的基本方法。注意到,这里施瓦兹用无穷可微函数与分布做乘法,而不是两个分布相乘,对此他在这里没有做出任何解释。但是,在《分布理论》中,他明确指出、并说明任意两个分布为什么不能相乘。关于两个分布之间的张量积,他通过对单变量函数张量积进行推广而得到任意两个分布间的张量积,下面将看到定义张量积的主要目的在于定义卷积。施瓦兹在这篇文章中写道:
“但是,在整个分布理论中最重要的‘积’是‘合成积’。……合成积在分析领域中起着越来越重要的作用[4]。
合成积是施瓦兹分布理论中的核心内容之一,对该代数运算,他仍然从函数的情形出发、寻求启示。他的研究思路是:先把函数看成分布,引入函数合成积的泛函定义;然后把函数合成积的泛函定义推广到分布上;再通过分布的张量积、并借助富比尼定理来确定合成积的值。这里我们强调,《分布理论》中的“卷积”就是这里的“合成积”。施瓦兹之所以称这种运算为合成积,是因为他受到韦伊(AWeil,1906—1998)的影响和启发。施瓦兹在其自传《与时代拼搏的数学家》中写道:
“韦伊在其1940年的著作《拓扑群上的积分及其应用》中研究了合成积,并对它进行了广泛的应用。……从我在1941年阅读了韦伊的著作的那一刻起,合成积就在我的研究中有着至关重要的作用。”[12]
毫无疑问,韦伊在《拓扑群上的积分及其应用》中把“卷积”称作“合成积”。之所以我们现在用“卷积”代替“合成积”的名称,是因为“合成积”的概念太过模糊,从而在英语中用“卷积”来代替。
接着,施瓦兹研究分布空间的拓扑结构。在这篇文章第五节的开始他写道:
“为了定义分布序列的收敛,在分布空间中引入拓扑结构是有利的。”[4]
也就是说,施瓦兹研究分布空间拓扑结构的主要目的在于研究分布序列的收敛。通过分布的收敛定义他立刻给出分布求导的新定义,该定义是通常求导定义的推广,从而分布的导数便是微分商的极限。另外,他指出求导是一种连续线性运算,但在这里他并未给出论证,在《分布理论》中他对此进行了详细论证。
《分布理论》的第一部分是关于分布概念及其各种性质的研究,第二部分对分布的导数进行了探究,第三部分探讨分布空间的拓扑结构,第四、五、六部分分别讨论了分布的张量积、乘法和卷积。通过上述考察、分析可知,这六部分均是在他1945年这篇文章基础之上完成的,1945年的这篇文章基本涵盖了他关于分布的所有内容,除了分布的傅里叶变换之外。这就充分显示出这篇文章的重要性和价值,数学家玻尔(H.Bohr,1887—1951)称这篇文章是他们那个时代中最优秀的数学论文之一[13]。
1948年,施瓦兹又在《格勒诺布尔大学学报》上发表了一篇题为《分布论和傅里叶变换》(Théorie des Distributions et Transformation de Fourier)的文章,这篇文章主要探讨分布傅里叶变换的问题[14]。
在这篇文章的引言中施瓦兹给出了一系列概念,其中大部分是他在1945年那篇文章中引入的,但以下3个概念除外。其一,他明确提出函数空间D是由所有无穷可导且在紧集外为零的函数构成的。其二,他引入名词——支集,用它替代1945年那篇文章中的“核”。其三,他用记号D′取替1945年那篇文章中的广义函数空间D。
傅里叶变换把一个n元函数变成另一个n元函数,再通过反演变换又可得到原来的函数。但通常情况下傅里叶变换及其逆变换仅在一些非常强的限制条件下才有意义,这使施瓦兹慢慢地意识到不可能将任意一个分布的傅里叶变换定义成另一个分布,这里必须有一些限制,他在这篇文章第二节的最后一段中说道:
“我们想定义一般的分布的傅里叶变换,并且给出和通常函数的傅里叶变化一致的定义及其反演公式。但是在一般的分布空间中定义其傅里叶变换是不可能的,我们必须在这里定义具有限制条件的分布空间,在该空间上可以定义其傅里叶变换。”[14]
“傅里叶变换非常适合于研究常系数线性偏微分方程。如果记常系数线性偏微分方程为DT=0。由求导是一种卷积运算可知该方程等价于卷积方程Dδ*T=0。若T为球形分布,则由卷积定理可知傅里叶变换把卷积方程Dδ*T=0转化为乘积方程HV=0。”[14]
毋庸置疑,这段话表明傅里叶变换能够把微分方程转换为代数方程,这就为求解微分方程提供了一条途径。《分布理论》的第七部分是关于分布傅里叶变换的,那里的“缓增分布”就是这里的“球面分布”。施瓦兹之所以在《分布理论》中称球面分布为缓增分布,是因为他利用增长性对球面分布进行了刻画[11]。
施瓦兹在20世纪50年代初出版的《分布理论》是广义函数的第一部专著,书中的很多重要结果和思想在当今的学术研究中仍然具有很大的参考价值。著名数学家、数学史家迪厄多内(J.Dieudonné,1906—1992)评价说,施瓦兹对广义函数理论所起的作用和牛顿、莱布尼茨在微积分历史上所起的作用一样[7],这就再次印证了该著作的重要性和价值。然而,该著作的主要内容和核心思想都体现在他1944—1948年的3篇学术论文中。《分布理论》是在他初期的这3篇文章基础之上完成的,是对他初期发表的这3篇文章的进一步补充和完善。另外,从施瓦兹早期的这3篇文章中可以窥视出他的研究思路:在古典函数概念及其运算的基础之上,应用泛函及对偶的思想对其进行推广,从而得到相应的分布的概念和运算。这一研究思路体现出他的工作方式中蕴含着“一般性”和“统一性”的思想,而这恰是20世纪数学发展的趋势之一,这为他的《分布理论》能够取得如此大的成功提供了根本保障。因此,对施瓦兹早期的这3篇文章进行探析,不仅为我们提供了一种可资借鉴的数学研究方法,而且为反观20世纪数学发展的特征提供了一条途径。
[1]MIKUSINSKI J. Une definition de distribution[J].Bull Acad Polon Sci,1955, 3:589-591.
[2]LIGHTHILL M J. Introduction to Fourier Analysis and Generalized Functions[M].New York:Cambridge University Press,1958.
[3]SOBOLEV S L. Méthode nouvellerésoudre le problème de cauchy pour Lès equations linéaires hyperboliques normales[J].Matematiceskij Sbornik,1936,43(1):39-72.
[4]SCHWARTZ L. Généralisation de la notion de fonction, de dérivation, de transformation de Fourier et applications mathématiques et physiques[J]. Annales de l′Université de Grenoble, 1945,21:57-74.
[5]GEL′FAND I M,SHILOV G E. Fourier transforms of rapidly increasing functions and questions of uniqueness of the solution of Cauchy′s problem[J].Uspehi Matem,1953,8:3-54.
[6]HORVATH J. An introduction to distributions[J].American Mathematical Monthly, 1970,77(3):227-240.
[7]DIEUDONNE J. History of Functional Analysis[M]. New York:North-Holland,1981:221-232.
[8]张光远.近现代数学发展概论[M].重庆:重庆出版社,1991:298-299.
[9]胡作玄.近代数学史[M].济南:山东教育出版社,2001:650-653.
[10] SCHWARTZ L. Sur certaines familles non fondamentales de fonctions continues[J].Bulletin de la Société Mathématique de France, 1944,72:141-145.
[11] SCHWARTZ L. Theorie des distributions[M].Paris: Hermann, 1950-1951:13-43,67-82,96-123,142-273.
[12] SCHWARTZ L. Un Mathématicien Aux Prises Avec Le Siècle[M].Paris: Odile Jacob, 1997:213.
[13] BOHR H. Address of Professor Harold Bohr[R].Cambridge:International Congress of Mathematicians, 1950.
[14] SCHWARTZ L. Théorie des distributions et transformation de fourier[J].Annales de l′université de Grenoble, 1947-48, 23:7-24.
(编辑亢小玉)
Study on the source of Schwartz′s monographDistributionTheory
LI Fei, YUAN Min
(Center for the History of Mathematics and Science, Northwest University, Xi′an 710127, China)
Schwartz′s bookDistributionTheorypublished in 1950 and 1951 is the first classical of the generalized function theory. However, his three articles published from 1944 to 1948 had already sketched out the outline of his monograph.DistributionTheoryis done on the basis of his earlier work and is the supplement and perfection of his earlier work. Based on the original materials, this paper studies Schwartz′s initial work toward generalized function theory, and reveals that Schwartz′s work has an important influence on his monograph. What′s more, this paper can help to understand better how Schwartz worked.
L. Schwartz; distribution; convolution; Fourier transform
2015-04-11
中国博士后科学基金资助项目(2014T70932); 西北大学研究生自主创新基金资助项目(YZZ14080)
李斐,女,陕西西安人,西北大学博士生,从事近现代数学史研究。
N091
A
10.16152/j.cnki.xdxbzr.2016-03-028