数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 6|回复: 0

概率论为什么这么难学,这 5 个颠覆性的数学问题讲透概率论的本质!

[复制链接]
发表于 2026-6-19 01:09 | 显示全部楼层 |阅读模式
概率论为什么这么难学,这 5 个颠覆性的数学问题讲透概率论的本质!

大学里《概率论与数理统计》这门学科的难度不在于其定理的繁杂和公式推导的艰辛,而在于真正地理解地公式背后的现实生活意义。这也是众多学子不断挂科的重要原因。

下面我们就通过几个例子,来一探概率论的本质!

图书 | 《浴缸里的惊叹:256 道让你恍然大悟的趣题》

作者:顾森

01

为了调控男女比例,某个国家制定了一个政策:每对新婚夫妇都必须生孩子,如果生出的是男孩儿就不能再生了,如果生出的是女孩儿就必须继续生下去,直到生出第一个男孩儿为止。若干年后,该国的男女比例会发生怎样的变化?

有人或许会认为,这种“不生出男孩儿不罢休”的政策会让男孩儿数量逐渐变多;有人或许会认为,这种“如果不再是女孩儿了就赶快作罢”的政策会导致女孩儿数量逐渐变多。实际上呢?该国的男女比例将会保持不变,仍然是 50∶50 。

道理很简单。不妨假设有一大批新婚夫妇,他们同时开始进行一轮一轮的生小孩儿游戏。第一轮里,有一半的夫妇得到了男孩儿,退出了游戏;另一半夫妇得到了女孩儿,进入第二轮。在第二轮里面,又有一半由于生出男孩儿而退出,另一半由于生出女孩儿而进入第三轮……注意到,在每一轮里,新生男孩儿和新生女孩儿都是一样多的,因此把所有轮数合在一起看,男孩儿的总数和女孩儿的总数也一定是相同的。

这个问题非常考验人的直觉思维。有的人听完这个问题之后会说,该国的男女比例显然不会变化呀!如果问他为什么,他或许会说:因为生男生女的概率就是 50∶50 ,这永远不会变呀!没错,其实最简单的解释就是这样。如果你还没体会到的话,不妨这么来想:假如你是这个国家里唯一的妇产科医生,不管是谁在什么时候生小孩儿,全部靠你来接生;若干年后,你会毫不犹豫地断定,该国的男女比例仍然不变,因为在你接手的所有产妇中,生男生女的比例就是 50∶50 ,这是永远不会变的。

这个问题有一些有趣的应用。设想你在网上玩围棋游戏,已知你获胜的概率是 50%(姑且假设游戏没有平局)。某天晚上,你连着输了好几次,终于有一次获胜,此时你决定见好就收,立即关机睡觉。你或许会突发奇想:如果每天都玩到首次获胜为止,个人战况统计中的“胜率”一栏会慢慢变高吗?和刚才的道理一样,这种技巧是无法提高你的胜率的。你的胜率是多少就是多少。

02

平均算下来,男性会比女性拥有更多的姐妹吗?

很多人或许会想,男性平均拥有的姐妹的数量会更多一些,因为在计算一个女性的姐妹数量时,我们需要把她自己排除掉。有人甚至会举出一些确凿的例子来:假如 1 个家庭里有 1 个男孩儿 2 个女孩儿,那么每个男孩儿都有 2 个姐妹,每个女孩儿只拥有 1 个姐妹,这不就说明平均每个男孩儿的姐妹数量更多吗?然而,这个推理是有问题的:同样是有 3 个小孩儿,这个家庭里是 1 个男孩儿 2 个女孩儿,别的家庭里有可能是 2 个男孩儿 1 个女孩儿,或者 3 个都是男孩儿,或者 3 个都是女孩儿呀!让那些家庭也来参与调查,平均下来的结果可能就不一样了。

不妨让我们对所有只有 3 个小孩儿的家庭做一个具体的分析。首先注意到,3 个小孩儿的性别一共有 8 种组合:男男男、男男女、男女男、女男男、女女男、女男女、男女女、女女女。不妨假设有 8 个家庭,分别对应上面这 8 种情况。让我们来算一下,这 24 个小孩儿各自都有多少姐妹。

● 家庭 #1(男男男):一共有 3 个男孩儿,每个男孩儿都没有姐妹;该家庭没有女孩儿。

● 家庭 #2(男男女):一共有 2 个男孩儿,每个男孩儿都有 1 个姐妹;只有 1 个女孩儿,她没有姐妹。

● 家庭 #3(男女男):同上。

● 家庭 #4(女男男):同上。

● 家庭 #5(女女男):只有 1 个男孩儿,他有 2 个姐妹;一共有 2 个女孩儿,每个女孩儿都有 1 个姐妹。

● 家庭 #6(女男女):同上。

● 家庭 #7(男女女):同上。

● 家庭 #8(女女女):该家庭没有男孩儿;一共有 3 个女孩儿,每个女孩儿都有 2 个姐妹。

这 24 个小孩儿中有12个男孩儿,其中 3 个男孩儿的姐妹数量为 0 ,6 个男孩儿的姐妹数量为 1 ,3 个男孩儿的姐妹数量为 2 ,平均每个男孩儿拥有 1 个姐妹。同时,这 24 个小孩儿中还有 12 个女孩儿,其中 3 个女孩儿的姐妹数量为 0 ,6 个女孩儿的姐妹数量为 1 ,3 个女孩儿的姐妹数量为 2 ,平均每个女孩儿拥有 1 个姐妹。果然,平均每个男孩儿的姐妹数量和平均每个女孩儿的姐妹数量是一样的!

当然,还有很多家庭并不是 3 个小孩儿。不过没关系,放眼一般情况(即在整个社会当中),平均每个男性拥有的姐妹数量仍然和女性一样多。下面是一个直观的想法。假如我们在路上看见一个陌生的男孩儿,问他有几个姐妹。我们得到的回答将会取决于他的家庭里还有多少个小孩儿,以及这些小孩儿各自的性别。现在,如果把陌生男孩儿换成陌生女孩儿,那么得到的回答将会取决于她的家庭里还有多少个小孩儿,以及这些小孩儿各自的性别。在这两种情况下,我们得到的回答应该是一样的。因此,平均算下来,男性和女性拥有的姐妹数量相等。

03

同时抛掷 10 枚硬币,正面朝上的硬币数量为偶数的概率大,还是为奇数的概率大?

答案:一样大。事实上,把 10 换成任意正整数,这个问题的答案都不会变——正面朝上的硬币个数是奇是偶的概率一样大。

让我们把这个问题先修改一下:同时抛掷 5 枚硬币,正面朝上的硬币数量为偶数的概率大,还是为奇数的概率大?有趣的是,新的问题突然有了一种非常简单的解法。我们可以把同时抛掷 5 枚硬币的结果分成六大类:0 个正面 5 个反面、1 个正面 4 个反面、2 个正面 3 个反面、3 个正面 2 个反面、4 个正面 1 个反面、5 个正面 0 个反面。我们把这六类情况分成3组:

(1) 0 正 5 反,5 正 0 反

(2) 2 正 3 反,3 正 2 反

(3) 4 正 1 反,1 正 4 反

注意,每一组里的前后两类情况出现的概率都是相同的,然而前面那类总是属于有偶数个正面的情况,后面那类总是属于有奇数个正面的情况。因而总的来说,有偶数个正面的情况和有奇数个正面的情况将会概率均等地出现。

回到原问题。如果是 10 枚硬币的话,又该怎么办呢?大家或许想要故技重施,但却发现这回不管用了。虽然“0 正 10 反”和“10 正 0 反”出现的概率仍然相等,但它们都是有偶数个正面的情况,这样就没法推出奇偶两种情况各占一半的结论了。不过,我们另有奇招。把这 10 枚硬币分成两组,每一组各有 5 枚硬币。根据刚才的结论,每组硬币里面出现偶数个正面和出现奇数个正面的概率是相同的,因而,同时抛掷这两组硬币后,检查两组硬币正面朝上的数量分别有多少,会产生“偶偶”、“偶奇”、“奇偶”、“奇奇”这四种等概率的组合。在第一种情况和最后一种情况中,最终正面朝上的硬币数量为偶数;在第二种情况和第三种情况中,最终正面朝上的硬币数量为奇数。可以看到,正面朝上的硬币数量是奇是偶的概率相等。

我们还有另一种更简单的方法来说明,同时抛掷 10 枚硬币后,正面朝上的硬币数量是奇是偶的概率的确相同。假设你已经抛掷了 9 枚硬币,正准备抛掷最后一枚硬币。不管前 9 枚硬币抛掷成啥样,最后这枚硬币的正反都将会起到决定性的作用,具体情况分为两种,视前9枚硬币的抛掷结果而定:

A. 如果最后一枚硬币是正面,总的正面个数就是偶数;如果最后一枚硬币是反面,总的正面个数就是奇数;

B. 如果最后一枚硬币是正面,总的正面个数就是奇数;如果最后一枚硬币是反面,总的正面个数就是偶数。

容易看出,不管是 A 和 B 中的哪种情况,总的正面个数是奇是偶的概率都是相等的。因此,即使出现情况 A 和出现情况 B 的概率不相等(当然,事实上它们是相等的),最终总的正面个数是奇是偶的概率也是相等的。

04

A、B 两人为一件小事争执不休,最后决定用抛掷硬币的办法来判断谁对谁错。不过,为了让游戏过程更刺激,A 提出了这样一个方案:连续抛掷硬币,直到最近三次硬币抛掷结果是“正反反”或者“反反正”。如果是前者,那么 A 获胜;如果是后者,那么 B 获胜。

B 应该接受 A 的提议吗?换句话说,这个游戏是公平的吗?

乍看上去,B似乎没有什么不同意这种玩法的理由,毕竟“正反反”和“反反正”的概率是均等的。连续抛掷三次硬币可以产生 8 种不同的结果,上述两种各占其中的 1/8 。况且,序列“正反反”和“反反正”看上去又是如此对称,获胜概率怎么看怎么一样。

不过,实际情况究竟如何呢?实际情况是,这个游戏并不是公平的—— A 的获胜概率是 B 的 3 倍!虽然“正反反”和“反反正”在一串随机硬币正反序列中出现的频率理论上是相同的,但别忘了这两个序列之间有一个竞争的关系,它们要比赛看谁先出现。一旦抛掷硬币产生了其中一种序列,游戏即宣告结束。这样一来,B 就处于了一个非常窘迫的位置:不管什么时候,只要掷出了一个正面,如果 B 没赢的话,B 就赢不了了——在出现“反反正”之前,A的“正反反”必然会先出现。

事实上,整个游戏的前两次硬币抛掷结果就已经决定了两人最终的命运。只要前两次抛掷结果是“正正”、“正反”、“反正”中的一个,A都必胜无疑,B 完全没有翻身的机会;只有前两次掷出的是“反反”的结果,B才会赢得游戏的胜利。因此,A、B 两人的获胜概率是 3∶1 ,A 的优势绝不止是一点。

似乎是还嫌游戏双方的胜率差异不够惊人,2010 年,数学家 Steve Humble 和 Yutaka Nishiyama 提出了上述游戏的一个加强版。去掉一副扑克牌中的大小王,洗好剩下的 52 张牌后,一张一张翻开。一旦出现连续三张牌,花色依次是红黑黑,那么玩家 A 加一分,同时把翻开了的牌都丢掉,继续一张张翻没翻开的牌;类似地,一旦出现连续三张牌恰好是黑黑红,则玩家 B 得一分,弃掉已翻开的牌后继续。

容易看到,加强版游戏相当于是重复多次的掷硬币游戏,因而毫无疑问,在这个新游戏中,玩家 A 的优势还会进一步放大。电脑计算显示,A 获胜的概率高达 93.54% ,B 获胜的概率则只有可怜的 2.62% 。另外 3.84% 则是两人平手的概率。然而,即使是这样,这个游戏看上去也会给人一种公平的错觉!

这个例子告诉我们,在赌博游戏中,直觉并不是准确的,求助概率论是很有必要的。

其实,概率论的诞生本来就和赌博游戏是紧紧联系在一起的。提到概率论的诞生,不得不提一位名叫 Antoine Gombaud 的法国作家。这人 1607 年出生于法国西部的一个小城市,他并不是贵族出身,却有着“骑士”的光辉头衔——只不过是他自封的而已。他借用了一个自己笔下的人物形象名称,自封为 de Méré 骑士。后来,这个名字便逐渐取代了他的真名 Antoine Gombaud 。不过,de Méré 骑士并没有凭借自己的文学作品名扬天下,真正让他声名远扬的是他的赌博才能。而足以让他在历史上留名的,则是他对一个赌博游戏的思考。

在 17 世纪,法国赌徒间流行着一个赌博游戏:连续抛掷一颗骰子 4 次,赌里面是否会出现至少一个 6 点。这个游戏一直被视为是一个公平的赌博游戏,直到 1650 年左右,de Méré 在另一个类似的游戏中莫名其妙地输得四个荷包一样重。当时,de Méré 参加了这个赌博游戏的一个“升级版”:把两颗骰子连续抛掷 24 次,赌是否会掷出一对 6 点来。

de Méré 自己做了一番思考。同时抛掷两颗骰子出现一对 6 点,比抛掷一颗骰子出现 6 点要困难得多,前者的概率是后者的 1/6 。要想弥补这个减小了的概率,我们应当把两颗骰子连续抛掷 6 次。为了追上连续抛掷 4 次骰子出现 6 点的概率,则应当把两颗骰子抛掷 24 次才行。de Méré 果断地得出结论:在升级版游戏中掷出一对 6 点的概率,与传统游戏中掷出 6 点的概率是相等的,升级版游戏换汤不换药,与原来的游戏本质完全一样。

不过,这毕竟是不严格的直觉思维,事实情况如何还得看实战。在以前的游戏中,de Méré 总是赌“会出现 6 点”,经验告诉他这能给他带来一些细微的优势。于是这一回,de Méré 也不断押“会出现一对 6 点”。不料,这次他却赔得多赚得少,最终输了个精光。

这是怎么一回事儿呢?作为一个业余数学家,de Méré 感到里面有玄机。但是,凭借自己的数学知识,他没有能力解决这个难题。无奈之下,他只好求助当时的大数学家布莱士·帕斯卡(Blaise Pascal)。

帕斯卡可是真资格的数学家。他很快便意识到,这种问题的计算不能想当然,事实和直觉的出入可能会相当大。比方说,de Méré 的直觉就是有问题的:重复多次尝试确实能增大概率,但这并不是成倍地增加。买一张彩票能中奖的概率是 1% ,并不意味着买两张彩票能中奖的概率就提升到了 2% 。否则,按此逻辑,买 100 张彩票能中奖的概率就变成了 100% ,这显然是荒谬的。类似地,把两颗骰子连续抛掷 6 次而非 1 次,出现一对 6 点的概率也并不会提升到原来的 6 倍。

看来,概率不能简单地加加减减,每一步推理都要有凭有据。帕斯卡考虑了游戏中所有可能出现的情况,算出了在新旧两种版本的游戏中,会出现一个(或一对)6 点的概率分别是多少。

连续抛掷 4 次骰子,总共会产生 6^4 ,也就是 1296 种可能。不过在这里面,一个 6 点都没有的情况共有 5^4 ,也就是 625 种。反过来,至少有一个 6 点就有 1296-625=671 种情况,它占所有情况的 671/1296≈51.77% ,恰好比 50% 高出那么一点点。看来,de Méré 的经验是对的——众人公认的公平游戏并不公平,赌 6 点会出现确实能让他有机可乘。

那么,连续投掷两颗骰子 24 次,能出现一对 6 点的概率又是多少呢?这回计算的工程量就有点大了。两颗骰子的点数有 36 种组合,连投 24 次则会有 36^24 ,大约是 22.45 万亿亿亿亿种情况。而 24 次投掷中,从没产生过一对 6 点的情况数则为 35^24 ,大约为 11.42 万亿亿亿亿。可以算出,如果赌 24 次投掷里会出现一对 6 点,获胜的概率是 49.14% 。又一个非常接近 50% 的数,只不过这次是比它稍小一些。

原来,升级版游戏并不是换汤不换药。两种游戏胜率虽然接近,但正好分居 50% 两边。这看似微不足道的差别,竟害得我们的“骑士”马失前蹄。

后来,这个经典的概率问题就被命名为“ de Méré 问题”。在解决这个问题的过程中,帕斯卡提出了不少概率的基本原理。因此,de Méré 问题常被认为是概率论的起源。

当然,de Méré 的故事多少都有一些杜撰的成分,大家或许会开始怀疑,在现今世界里,有没有什么还能玩得到的“伪公平游戏”呢?答案是肯定的。为了吸引玩家,赌场想尽各种花样精心设计了一个个迷魂阵一般的赌局。在那些最流行的赌博游戏中,庄家一方总是会稍占便宜;但游戏规则设计得如此之巧妙,以至于乍看上去整个游戏是完全公平,甚至是对玩家更有利的。“骰子掷好运”(chuck-a-luck)便是一例。

“骰子掷好运”的规则看上去非常诱人。每局游戏开始前,玩家选择 1 到 6 之间的一个数,并下 1 块钱的赌注。然后,庄家同时抛掷三颗骰子。如果这三颗骰子中都没有你选的数,你将输掉那 1 块钱;如果有 1 颗骰子的点数是你选的数,那么你不但能收回你的赌注,还能反赢 1 块钱;如果你选的数出现了 2 次,你将反赢 2 块钱;如果三颗骰子的点数都是你选的数,你将反赢 3 块钱。用赌博的行话来说,你所押的数出现了 1 次、2 次或者 3 次,对应的赔率分别是 1∶1 、1∶2 、1∶3 。

用于抛掷三颗骰子的装置很有创意。它是一个沙漏形的小铁笼子,三颗骰子已经预先装进了这个笼子里。庄家“抛掷”骰子,就只需要把整个沙漏来个 180 度大回旋,倒立过来放置即可。因此,“骰子掷好运”还有一个别名——“鸟笼”。

18 世纪英国皇家海军的水手间流行过一种叫做“皇冠和船锚”(Crown and Anchor)的赌博游戏,其规则与“骰子掷好运”一模一样。唯一不同之处只是骰子而已。普通骰子的 6 个面分别是 1 点到 6 点,而“皇冠和船锚”所用骰子的 6 个面则是 6 种不同的图案——扑克牌的黑、红、梅、方,再加上皇冠和船锚两种图案。之后,“赌博风”又蔓延到了商船和渔船上,“皇冠和船锚”也就逐渐走出了皇家海军的圈子。一般认为,这也就是“骰子掷好运”的起源了。现在,很多赌场都提供了“骰子掷好运”的赌博项目。

对玩家而言,这个游戏看上去简直是在白送钱:用三颗骰子掷出 6 个数中的一个,怎么也会有一半的概率砸中吧,那玩家起码有一半的时间是在赚钱,应当是稳赚不赔呀。其实,这是犯了和 de Méré 一样的错误—— 一颗骰子掷出玩家押的数有 1/6 的概率,并不意味着三颗骰子同时抛掷就会有 3/6 的概率出现此数。在抛掷三颗骰子产生的所有 6^3 种情况中,玩家押的数一次都没出现有 5^3 种情况,所占比例大约是 57.87% 。也就是说,大多数时候玩家都是在赔钱的。

不过,考虑到赚钱时玩家有机会成倍地赢钱,这能否把输掉的钱赢回来呢?一些更为细致的计算可以告诉我们,即使考虑到这一点,游戏对玩家仍然是不利的:平均每赌 1 块钱就会让玩家损失大约 8 分钱。不过,我们还有另一种巧妙的方法,无需计算便可看出这个游戏对玩家是不利的。

这显然是一个没有任何技巧的赌博游戏,不管押什么胜率都是一样的。因此,不妨假设有 6 名玩家同时在玩这个游戏,这 6 个人分别赌 6 个不同的点数。此时玩家联盟的输赢也就足以代表单个玩家的输赢了。

假设每个人都只下注 1 块钱。抛掷骰子后,如果三颗骰子的点数都不一样,庄家将会从完全没猜中点数的 3 个人手中各赚 1 块,但同时也会赔给另外 3 人各 1 块钱;如果有两颗骰子点数一样,庄家会从没猜中点数的 4 个人那里赢得共 4 块,但会输给另外两人 3 块;如果三颗骰子的点数全一样,庄家则会赢 5 块但亏 3 块。也就是说,无论抛掷骰子的结果如何,庄家都不会赔钱!虽然一轮游戏下来有的玩家赚了,有的玩家亏了,但从整体来看这 6 名玩家是在赔钱的,因此平均下来每个玩家也是在不断输钱的。

05

有一趟公交车,平均每 10 分钟发一班车(但具体的发车时间很不固定)。如果你在某个时刻来到车站,等到下一班车平均要花多长时间?

很多人或许都觉得,平均等待时间应该是 5 分钟,毕竟平均间隔时间是 10 分钟嘛。然而事实上,平均等待时间是大于 5 分钟的。这是因为,10 分钟的发车间隔只是一个平均值,实际间隔有时是几分钟,有时是十几分钟。如果你出现在车站的时刻,正好位于几分钟的间隔中,你的平均等待时间显然就会小于 5 分钟;但如果你出现在车站的时刻,正好位于较长的间隔中,那么你的平均等待时间就会大于 5 分钟。关键就在这里:你出现在车站的时刻,更有可能落在了较长的发车间隔中。因而,平均等待时间会偏向于大于 5 分钟的情况。

倘若公交车发车的时间足够随机,概率均等地分布在时间轴上(但平均间隔仍是 10 分钟),那么当你来到车站时,平均需要多久才能等到公交车呢?答案或许很出人意料——平均等待时间就是 10 分钟。

我们可以用数学计算来证明这一点,但下面这种思考方式或许更具启发性一些。假设一个骰子有 600 个面,分别标有数字 1 到 600 。因此,平均每扔 600 次才能扔出一个 1 点。如果每秒扔一次骰子的话,那么平均每 10 分钟才能看到一个 1 点。现在,如果有人扔了一阵子之后,你突然插进来说“换我来扔吧”,那么从你接手骰子开始,到下次扔出 1 点,平均需要多长时间?显然,还是 10 分钟。

是的,这一刻的命运由这一刻决定,与过去发生过的事情无关。这就好比抛掷硬币的游戏一样,即使连续 9 次抛掷硬币的结果都是反面,第 10 次掷出正面的概率仍然是 50% 。同样地,虽然平均每 10 分钟应该出现一个 1 点,但完全有可能出现连续一个小时都没有出现 1 点的罕见情况。那么,下次掷出的数字正好是 1 点的概率有多大?仍然是 1/600 。为了看到一个 1 点,平均还需等待多长的时间?仍然是 10 分钟。

我们常常把下面这类错误的想法称为“赌徒谬误”(gambler's fallacy)。

● 连续 9 次抛掷硬币的结果都是反面,下次是正面的概率总该大一些了吧。

● 这班车平均每 10 分钟来一班,都过了 20 分钟了还没来,说明快来了。

● 老家刚发生了一次百年一遇的大地震,今后几十年再发生地震的概率就很小了。

● 连续好几天买彩票中奖,运气被用光了,看来要开始倒霉了。

大数定律(law of large numbers)是概率论中最为基本的定律之一,它告诉我们,实验次数越多,统计结果会越接近理论上的平均情况。但这绝不意味着,老天会有意识地矫正偏差,寻求平衡。出现偏差没有关系,后面还有无穷多次实验,最终统计结果会自然地靠近理想情况的。

图灵新知  2026 年 6 月 17 日 10:00  北京
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2026-6-19 04:00 , Processed in 0.162225 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表