数理统计与物理 1 —— 概率论与数理统计简史

​ 这是一篇起源于糊弄文献综述时产生的废稿, 梳理概率论与数理统计的发展历史,标记一下物理中可能涉及的概率问题, 计划后续整理物理中具体的概率相关的话题.

概率预测未来

统计研究现实

​ 随机事件——占卜

​ 概率问题早期被讨论是出现在赌博中,最为著名的是 17 世纪三粒骰子最容易出现的总点数是 9 还是 10 的问题。当时赌博的人根据他们的经验,感到出现 10 的情况更多,而当时人们的认知里,总点数为 9 的数字组合为 6 种: $(1,2,6)$,$(1,3,5)$, $(1,4,4)$,$(2,2,5)$, $(2,3,4)$, $(3,3,3)$。 总点数为 10 的数字组合也为 6 种:$(1,3,6)$, $(1,4,5)$, $(2,2,6)$,$(2,3,5)$, $(2,4,4)$,$(3,3,4)$。意大利科学 Galileo $\cdot$ Galilei 注意到人们认知中的分析没有将三个骰子区分开,用现在的数学语言说人们分析可能性时使用了组合数,Galileo 认为应当将它们区分开,即使用排列数。比如 $(1,2,6)$ 对应的排列有 $A_3^3=3!=6$ 种。这样分析总点数为 9 有 25 种排列方式,总点数为 10 有 27 种排列方式。

Gerolamo Cardano 概率的古典定义。

​ 概率论通常被认为起源于 17 世纪法国数学家 Blaise Pascal 和 Pierre de Fermat 的通信中. 当时一位法国贵族 De Méré 对赌博很感兴趣, 他对赌博中的一些问题感到困惑, 向 Pascal 请教, 具体问题是, A 和 B 两人赌博, 先赢 3 局为胜利, 但是在 A 赢了 2 局, B 赢了 1 局, 但是赌博意外终止, 那么应当如何分配两人预押的赌金才算公平. 假设两人赢得每局的概率都是 $1/2$. A 若赢得第 4 局, 他直接获胜. 若 A 输了第 4 局但是赢了第 5 局, 这件事发生的概率是 $1/4$. 因此 A 获胜的概率是 $3/4$, B 获胜的概率是 $1/4$. 因此奖金应按照 3:1 分配. 这个问题的分析中已经涉及到了概率的加法定理和乘法定理. 更进一步地, Pascal 提出了 Pascal 三角形解决 A 之后 $r$ 胜, B 之后 $s$ 胜的情况如何分配赌金.

​ 随后荷兰科学 Christian Huygens 学习了 Pascal 与 Fermat 关于概率论的工作, 发表了 ⌈论赌博中的机会⌋ (De Ratiociniis in Aleae Ludo), 被认为是概率论诞生的标志, 这一时期, 数学期望等概念已经出现, 概率被解释为事件在重复独立实验中发生的频率, 这一观点现在被称为频率学派 (Frequentist), 概率论在频率学派的方向上发展.

​ 17世纪末和18世纪初, 瑞士数学家 Jacob Bernoulli 对概率论进行了深入的研究, 撰写了 ⌈猜测的艺术⌋, 在这本书中提出了大数定律. 同时另一位法国数学家 De Moivre 在 ⌈机会学说⌋ 中提出了统计的独立性, 19 世纪, 英国数学家 Thomas Bayes 18 世纪的工作受到关注, 法国数学家 Pierre-Simon Laplace 撰写了 ⌈概率论的解析理论⌋ 其中提出了一些概率论的概念, 包括贝叶斯定理, 贝叶斯学派 (Bayesian) 开始萌芽. 贝叶斯学派与前文中提到的频率学派被称之为概率论中的两大学派. 与频率学派不同, 贝叶斯学派将概率解释为关于不确定性的量度.

统计

国势学 政治算术

​ 19 世纪时,概率论的主流仍然是频率学派,这得益于德国数学家 Carl Friedrich Gauss、 法国数学家 Siméon Denis Poisson 和俄罗斯数学家 Andrey Markov 等人的研究. Gauss 在误差分析和正态分布的研究中为概率论的发展做出了重要贡献. Poisson 的贡献体现在泊松分布和泊松过程的研究上. Markov 提出了 Markov 链, 开拓了随机过程的研究.

​ 19 世纪也有一些与贝叶斯学派相关联的理论在发展, 比如 Augustin-Louis Cauchy 提出的柯西分布. 柯西分布在统计学中经常被用作先验分布, 先验分布是一个贝叶斯学派的概念. 贝叶斯学派强调利用先验概率来描述基于经验、知识或者数据对事件的先前认识, 通过贝叶斯定理, 观测数据可以用来更新先验概率, 得到后验概率, 从而对事件的概率进行修正. 主观贝叶斯主义强调概率是一种主观度量, 反映了个体的信念, 这与频率学派的客观性观点形成了对比.

​ 20 世纪初, R. A. Fisher 提出了参数估计的概念, 并且指出参数估计应该使观测数据的似然函数最大化, 于是提出了最大似然估计的方法, 用于估计概率分布的参数. Fisher 引入了一致性, 有效性, 充分性的概念评价估计的好坏.

​ 20 世纪 30 年代, 俄罗斯数学家 Andrey Kolmogorov 发表了 ⌈概率论基础⌋, 提出了概率论的公理化框架.

​ 20 世纪 40 年代, Claude Shannon 提出了信息论的基本概念, 将概率论引入了信息论的领域.

​ 20 世纪 50 年代,John Tukey 和 James Wilkinson 提出了著名的蒙特卡洛方法, 利用随机抽样来解决数值计算问题.

​ Bradley Efron 和 Charles Stein 等统计学家在 20 世纪 60 年代至 70 年代提出 Bootstrap 方法和 Stein 估计. Judea Pearl 在 20 世纪 80 年代至 90 年代提出了因果推断, 将概率论和因果关系相结合, 推动了因果推断领域的发展.

​ 20 世纪 90 年代, Fisher 的学生 C. R. Rao 证明了 Cramér–Rao 不等式.

​ …

Ref

  1. 牛顿科学世界-图解统计与概率

  2. 058550-01.pdf (tsinghua.edu.cn) 可能是《高等概率论基础及极限理论》