|
从平均数谈起
原创 月冷塘寒 绿森林里的故事 2025 年 06 月 23 日 北京
今天我们来讨论几个与平均数相关的小问题。
一、基本定义
相信大家对于均值不等式都不陌生。考虑两个正实数a和b,可以定义它们的几种平均数:
那么它们满足 H ≤ G ≤ A ≤ S ,且等号只在 a = b 的时候取到,这就是两变量时的均值不等式。当然,上述定义也可以自然地推广到有 n 个正实数的情形,这里就不详细展开了。
对于 n = 2 情形的均值不等式来说,它有一个很不错的几何解释(可惜这个不是我原创,忘了是在哪儿看到的了……)。
如上图所示,A、B、C 三点共线,令 AC=a ,BC=b ,然后以 AB 为直径作半圆,设圆心为 O 。
作 OE 和 CD 垂直于 AB ,分别交半圆于点 E 和 D ,那么显然橙色的线段 OE 为半圆的半径,为 a 与 b 的算术平均数。
由三角形相似知 CD/AC=CB/CD ,于是绿色的线段 CD 为 a 和 b 的几何平均数。
过点 C 作 CG 垂直于 OD ,则青色的 DG 为 a 和 b 的调和平均数。
最后平方平均数在哪儿呢?就是图中红色的线段 CE 。
很明显能看出,CE>OE=OD>CD>DG,亦即 S>A=A>G>H 。
二、平均数与级数
可能有不少人在学习级数时都有下面的困惑:为什么无穷项的等差数列又叫算术级数,无穷项的等比数列又叫几何级数?
其实这些级数的名字和平均数密切相关。不难验证,算术级数中的每一项(除了首项之外,下同),都是前后两项的算术平均数;几何级数中的每一项,都是前后两项的几何平均数。
那这些平均数的名字又是怎么来的?
算术平均数看起来比较自然,毕竟加法是最基本的算术,因此它也是大家通常默认的平均数。
几何平均数则多半与几何相关。例如作一个正方形,使其面积与某已知的长方形相等,则正方形的边长就是长方形两边长的几何平均数。
那调和平均数呢?
个人认为调和平均数可能来自调和级数(harmonic progression),亦即自然数的倒数数列 1,1/2,1/3 …… 不难发现,这个级数的每一项,恰好也是前后两项的调和平均数!
而调和级数的名字怎么来的呢?据说是因为古希腊人发现,当两根琴弦的长度之比为 1/2、1/3 等简单分数时,听到的声音比较和谐,于是有了 harmonic 的说法。
三、平均数的统一
上述四种平均数的形式上看起来有点乱,既不方便记忆,也不方便理解其内在联系,能否想个办法把它们统一起来?
答案是肯定的,甚至简单得出乎意料。
设 f1 和 f2 为两个变量,f为它们的某种平均。由于要考虑不同种类的平均数,我们需要预先分配一个参数k来标记其类型。
这个参数 k 应该放在哪儿?简单的想法是放在指数上,于是就有了如下猜测形式:
当 k = 2、1 和 -1 时,不难验证它们分别对应于平方平均数、算术平均数和调和平均数!看起来只剩几何平均数还没有纳入这个框架了。
2、1 和 -1 这几个数强烈暗示我们,k=0 或许就是几何平均数。虽然 k = 0 时,f 的 0 次方直接等于 1 ,看起来和没说一样,但是真的如此么?
不妨来假定 k 是一个很小但不为 0 的量,然后外推到 k = 0 ,看看会出现什么。
当 k 很小但不为 0 时,总可以作麦克劳林展开(其实也就是泰勒展开):
于是原来的式子就化为
两边消去 1 并约掉 k 后,就有
这样就有
恰好是几何平均数!
至此,我们就成功地统一了上述四种平均数。
四、加权平均
中学数学课中讲过一个加权平均的概念,即当各数据的重要程度不一样时,需要分别乘上一个权重系数来求和,这很好理解。
例如二元体系当两种组分的含量不同时,体系的总体性质肯定不是两个组分性质的简单平均值,而必须要考虑它们的体积分数或者质量分数。
设两组分的含量分别为 x 和 1-x 。在最简单的线性情形下,可以认为总体性能随着 x 线性变化:
这个形式可以看作是 f1 和 f2 的加权算术平均数。那其他的平均数能不能类似操作?
其实也可以的,而且形式一如既往地简单:
上图中红、绿、蓝、青色曲线分别代表利用两组分含量加权后的平方平均、算术平均、几何平均和调和平均值,此时两组分各自的值分别是 5 和 15 。可以发现,此时均值不等式仍然成立。
五、混合
在实际生活和研究中常常碰到所谓“混合”的问题。当不存在特别复杂的相互作用时,“混合”的结果都落在两组分各自的值之间,此时可以用某些平均数来估计其范围。
需要指出的是,能用平均数来直接估计的性质应当是体系的强度量,而非广延量。强度量与体系规模无关,例如体系的密度、温度、电阻率等;而广延量则与体系的大小相关,例如体系的质量、内能、电阻值等。
举个例子,在平行板电容器的两极板之间填充两块等大的平板状电介质。假设这两块电介质的界面平行于电容器的极板,那么该体系的等效介电常数是二者介电常数的调和平均值;而如果这两块电介质的界面垂直于电容器极板,体系的等效介电常数将会是二者介电常数的算术平均值。
如果电介质的厚度不相同呢?用加权平均即可。
如果电介质不止两种呢?用多组元的加权平均就好。
那如果电介质有很多块,也不是平行排列,而是以某种不规则密堆方式填满极板之间的空间呢?
此时就没有显式表达式了,但是我们总可以根据各组分的介电常数和体积分数,求出相应的调和平均 H 和算术平均 A ,等效的结果应当落在 (H, A) 这个区间之中。
博主曾经猜测,如果两组分充分均匀混合,那么等效的介电常数可能会取加权几何平均的形式。后来博主在豆包和 DS 两位老师的指导下了解到,有两种经验模型可以描述均匀混合体系的介电常数。
第一种是显式的 Lorentz-Lorenz 公式:
代入两组分的体积分数即可求出等效介电常数 ε 。
第二种是隐式的 Bruggeman 公式:
此时上式不能直接解出,只能用数值方法求解。
上图中洋红色虚线为 Bruggeman 公式给出的结果,黑色虚线为 Lorentz-Lorenz 公式给出的结果。一般认为 Bruggeman 公式更精确一些,而它与蓝色的加权几何平均也更为接近。
六、神奇的 lnx
最后来谈一个小问题。
很久以前知乎上有人提问,说其他幂函数的原函数都是幂函数,只有 1/x 的原函数是对数函数 lnx ,这背后有没有更深层的原因?
然后曾经有朋友问我,为什么在讨论算法时间复杂度的时候,经常出现 O(lnN) 的形式?
博主觉得,或许可以换一个观点来看待对数函数 lnx 。在某种程度上,它具有“零阶多项式函数”的一些特点。前面关于几何平均数可以认为是 k=0 情形的讨论,可以作为一个佐证。
另一方面,如果将对数函数 lnx 视为“零阶多项式函数”,就可以对上面的两个问题给出不错的回答。
大家都知道,多项式函数积分一次则次数升一,那么 1/x 的原函数应该是个 0 次的函数,常函数显然不满足要求,那就是 lnx 了;而在讨论时间复杂度的时候,如果要比 O(N2) 、O(N) 更快,那么次数就得再降 1 ,于是对数函数再次以 O(lnN) 的面貌出现。
在计算机科学里有些时候会提到,如果算法优化到 O(lnN) 的程度,那和常数时间复杂度没什么差别。从上述观点来看,那可太自然了,毕竟这俩都相当于零阶多项式!
那如果用一阶的 x 除以“零阶”的 lnx ,会得到什么呢?
毫无疑问,x/lnx 的增长速度肯定远大于 lnx ,但会低于 x ,这个比较平凡。真正有意思的是,x/lnx 大致刻画了在 (1, x) 这个区间内质数的数量!
所以,lnx 真的无处不在。
绿森林里的故事 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|