切比雪夫不等式,描述了这样一个事实,事件大多会集中在平均值附近。

比如,假设中国男人平均身高1.7m,那么不太可能出现身高17m的巨人。事实上我们从来没有见过这种“怪物”。

下面结合一个热门话题:“年薪百万”来讲解一下。

优质回答的100个经验_优质回答的标准是什么_优质回答经验100字左右

站在知乎一眼望去,似乎年薪百万的人到处都是,而且经常有人会提出“怎样才能年薪百万”这样的问题。

我们从数学的角度来解答一下,年薪百万难不难?

1 马尔科夫不等式

切比雪夫不等式是马尔科夫不等式的特殊情况,所以我们先来看看马尔科夫不等式。

1.1 马尔科夫不等式与直观感受

马尔科夫不等式是这么写的(本文代数只讨论离散的情况):

{\displaystyle P (X\geq a)\leq {\frac{E (X)}{a}}}\\

其中 X \geq 0 。

我们通过 \mu =1.3,\sigma =0.25 的正态分布解释下,首先, P(X\geq a) 就是指的是曲线下X\geq a 部分的面积:

优质回答经验100字左右_优质回答的100个经验_优质回答的标准是什么

来感受一下马尔科夫不等式:

优质回答的标准是什么_优质回答的100个经验_优质回答经验100字左右

可见,越大于平均值,概率越低。

1.2 马尔科夫不等式与年薪百万

看看这个怎么去计算百万年薪的概率。

我随便搜索了下,查到以下数据:

人均收入的标准差,我确实查不到。至少免费的我没有查到,有哪位同学知道望告知。

咱们就用上面的数据近似一下,粗糙的认为:

好,开始我们的计算。根据马尔科夫不等式:

{\displaystyle P (X\geq 1000000)\leq {\frac{51350}{1000000}}}\approx 5.14\% \\

也就是说,最多在20个人中有一个。

全国985院校的录取率是低于 5\% 的,看起来似乎基本上能进入985,就能年薪百万(如果我们认为收入和教育程度正相关的话)。

是吗?似乎看起来比例比我想象的更高啊。

1.3 马尔科夫不等式的证明

证明的方式很多,我找了一种我觉得容易理解的方式,不过不是很严格,大家权且当作一种证明思路的说明吧。

试证: 0">{\displaystyle P (X\geq a)\leq {\frac{E (X)}{a}}}\quad X\geq 0,a > 0

下面的证明虽然是用正态分布来演示的,但是实际是与分布无关的。

之前我们说过, P(X\geq a) 就是指的是曲线下 X\geq a 部分的面积:

优质回答经验100字左右_优质回答的标准是什么_优质回答的100个经验

要扩大这部分面积很简单,就是让曲线 X\geq a 的部分变得“高”一些,至于 X < a 的部分嘛,怎么变化完全没有关系,反正这部分和计算面积没有关系:

优质回答经验100字左右_优质回答的100个经验_优质回答的标准是什么

很显然, P(X\geq a) 是小于扩大后的面积的。

通过什么数学方式让 X\geq a 的部分变得“高”一些呢?

根据下图:

优质回答的100个经验_优质回答的标准是什么_优质回答经验100字左右

我们很容易得到:

\left. \begin{aligned} X \geq 0\\ X\geq a \end{aligned} \right\} \implies \frac{X}{a} \geq 1 \\

那问题就很简单了,乘上 \frac{X}{a} :

P(X\geq a)=\int _ a^{+\infty }f(x)dx \leq \int _ a^{+\infty }\frac{X}{a}f(x)dx\\

根据期望的定义有:

E(\frac{X}{a})=\int _{-\infty }^ a\frac{X}{a}f(x)dx + \int _ a^{+\infty }\frac{X}{a}f(x)dx\\

显然:

\int _{-\infty }^ a\frac{X}{a}f(x)dx \geq 0\\

因此有:

P(X \geq a) \leq \int _ a^{+\infty }\frac{X}{a}f(x)dx \leq E(\frac{X}{a})\\

综上,得到要证的目标:

P(X \geq a) \leq E \left( \frac Xa \right) = \frac{E(X)}{a} \\

其中 X \geq 0 。

2 切比雪夫不等式

切比雪夫不等式是马尔科夫不等式的特殊情况,而且还有进一步的关系:这两个不等式的作者是师生关系。

优质回答经验100字左右_优质回答的100个经验_优质回答的标准是什么

安德雷·马尔可夫

马尔科夫不等式是以俄国数学家安德雷·马尔可夫命名的。

优质回答的标准是什么_优质回答经验100字左右_优质回答的100个经验

巴夫尼提·列波维奇·切比雪夫

而切比雪夫不等式是以马尔科夫的老师巴夫尼提·列波维奇·切比雪夫命名的。

2.1 切比雪夫不等式与直观感受

切比雪夫不等式是这么写的:

P(|X-\mu | \geq k\sigma ) \leq \frac1{k^2}\\

其中 0">k > 0 , \mu 是期望, \sigma 是标准差。

我们还是通过 \mu =1.3,\sigma =0.25 的正态分布来感受一下切比雪夫不等式:

优质回答经验100字左右_优质回答的100个经验_优质回答的标准是什么

可见,越远离平均值,概率越低。

2.2 切比雪夫不等式与年薪百万

根据之前的数据,我们来算下切比雪夫认为年薪百万的概率是多少?

P(|X-51350| \geq 21\times 44000) \leq \frac1{21^2}=0.22\% \\

晕倒,切比雪夫认为最多只有千分之二的概率,比之前大大降低。

应该说切比雪夫不等式预测的准确率要远远高于马尔科夫不等式。

2.3 切比雪夫不等式的证明

马尔科夫不等式是这样的:

{\displaystyle P (X\geq a)\leq {\frac{E (X)}{a}}}\\

我们把 |X-\mu | 代入:

a)\leq {\frac{E(|X-\mu |)}{a}}}\\">{\displaystyle P (|X-\mu | > a)\leq {\frac{E(|X-\mu |)}{a}}}\\

很显然等价于:

{\displaystyle P((X-\mu )^2 \geq a^2) \leq \frac{E((X-\mu )^2)}{a^2}=\frac{\sigma ^2}{a^2}}\\

令 k=\frac{a}{\sigma } ,容易得到 0">k > 0 :

{\displaystyle P(|X-\mu | \geq k\sigma )\leq \frac{1}{k^2}}\\

3 总结

如果我们把人群的收入分布计算出来,我估计应该是个正态分布,那么年入百万的概率就更低了,知乎有人算出来是 万分之四 。

所以马尔科夫不等式、切比雪夫不等式只是对概率的一个估计,有可能不是很准确,但总比瞎想要准确。

百万年薪固然很难,但是根据 贝叶斯定理 ,或许增加一些条件,可以大大增加概率:


本文由转载于互联网,如有侵权请联系删除!