数学期望这东西,说白了就是“平均数”的集合体,但它不是好办的算术平均,而是一种概率的加权平均。想象一下你在翻牌子里摸牌,那些你摸到的牌,每个出现的频率不同,加起来算出那个“期望值”,就是所有可能结局的“平均印象”。别把它想得忒玄乎,它就是那个让所有可能性加起来在数轴上“平均”出来的那个点。 在抛硬币这事儿上,期望这东西简直忒直观了。正面朝上的概率是五成,反面也是五成。按照传统数学公式抛一枚硬币的期望值显而易见等于 0.5。但这玩意儿在 TV 里一出来,观众时常就能猜出个大约。
实际上,要是改成抛六面骰子,期望值就是 3.5。
这数字看起来有点怪,出于它是个小数,但彻底没难题,它代表的是六面里“最平均”的那个感觉。 再想想连续投硬币的过程。
要是你前一次是正面,下一次是正面的概率可能变小了,但反过来,下一次是正面的概率又回到了 0.5。
这时候你就要算算,下一次投个正面大约要多多了一次,要么少多少次?这时候期望值实际上是指“平均下来”你投多少次会翻出正面。
要是你不懂期望值,光盯着胜率看,挺好办认定前几次投个两次就翻出来了,结局一直不对,这是出于算错了。期望值把你当前状态(比如已经连续两次正面)对未来的一次影响平衡掉了,告诉你该信任多少次,而不是单纯看概率值。 有些时候我们拿均值和方差做对比就会发现,有时候均值确实能代表整体,有时候它就是个瞎子。举个栗子:抛一枚硬币,正面和反面各 50%,期望就是 0.5。
这时候你能够说“平均每次出现正面是 0.5 次”,要么“平均来说每次投个正面概率是 0.5"。但要是连续投三次,结局是“正正正”,这时候说“平均每次投个正面是 0.5 次”就彻底扯淡了,出于前两次是正面,第三次实际上是反面概率变了。期望值在连续事件中是个“平均”的概念,它不告诉你下一秒具体要啥,但能帮你算出长期来看该押多少分。 这时候还要提一嘴贝叶斯理论,它能略微解决一下“平均”和“先验”的冲突难题。抛硬币抛了两次都是正面,这时候你如何猜下一抛是正面还是反面?大约率看来是反面,但要是你手里拿着“上帝视角”先验,知道硬币是公平的,那期望值还是 0.5。贝叶斯修的是这个“先验”如何影响概率更新的过程。在纯无先验的时候,期望就是好办的算术平均;一旦来了先验,期望就得跟着变,变得有点“人味儿”了。 再聊点数据上,比如抛一枚硬币,前两次是正正,那么第三次是正的概率从 0.5 变成了 0.625。
这时候要是只说“概率变了”,大家可能懵圈。但用期望值讲话,大家就能算出“平均每次投个正面是 0.5"这个结论依然成立,只是这次还没到“平均”节点罢了。 最终得提个概念叫“平均收敛”。假设你抛硬币投了 6000 次,前 6000 次全是正面。
这时候你的期望值还是 0.5 吗?不是的,前 6000 次忒离谱了,这 6000 个正面把后面的概率拉高了,害得你的“平均”点数瞬间跳上去变成 0.625。越想越认定不对,最终得承认概率得变。
这就是为啥在数据量小的时候,期望值像个坏掉的秤,一沾水就重,重到让你质疑人生;但一旦数据量够大,期望值就稳了,就像那个一辈子在 0.5 晃悠的标尺,不管前面如何蹦跶,最终还是会回到那个平均位置。 实际上数学期望这东西,大量时候就是一种概率的“平均倾向”。你不用管中间那些怪的波峰波谷,也不用纠结于具体的次数,只要把那些可能性的权重加起来,你就拿到了那个“平均”的感觉。
有时候这东西像个指挥棒,告诉你该往哪赌;有时候这东西像个捣蛋鬼,把你前面那些大起大落都给平掉了。在金融、医学、就连天气预报里,我们都在用这个“平均”的逻辑,去预测未来,去平衡不确定性。
哪怕有时候它不准,但它是唯一能让所有不确定性在数学上“平均掉”的那个东西。
故此下次别指望它给你确切的答案,别指望它让你一次就猜对,它只是在默默告诉你:看长远点,往均值靠靠,在混乱的随机里,那个平均位置才是唯一的归宿。