世界杯当庄能赢吗(为什么赌球的庄家总是稳赚不赔?)

什么是信息?

信息是消除了的不确定性。

心灵鸡汤是信息吗?

不是。

因为你看完心灵鸡汤之后世界该怎么发生的规律你依旧不知道。

人们过去绞尽脑汁试图从信息的内容出发,通过对比重要性,度量信息。

对于一条信息,重要的是找出其中有多少信息量,要搞清楚“信息量”,就要对信息进行量化的度量。

但人们始终没找到量化度量信息的桥梁,也就是缺少一个合适的“衡量单位”,比如你用天平称重,需要在另一边摆放相应重量的砝码,那衡量信息的砝码是什么呢?

就是“比特”。

“比特”是这样定义的:

如果一个黑盒子中有A和B两种可能性,它们出现的概率相同,那么要搞清楚到底是A还是B,所需要的信息量就是一比特。

如果我们对这个黑盒子有一点知识,知道A的概率比B大,那么解密它们所需要的信息就不到一比特。

那么如果是多于A、B这两种可能性,更复杂的黑盒子,要消除它的不确定性需要多少信息呢?

比如我们做选择题四选一,或者猜世界杯足球赛的冠军是谁,他们想知道结果需要多少信息呢?

有人说四选一需要四比特,猜出32个足球队参加的世界杯的冠军需要32比特。

这其实是不对的。如果我们对选择题的答案一无所知,去向一个知道答案的预言家请教,他每给你一个是非的答案,收取你一块钱。

对我们来讲,有效的提问方式不是问他“是否答案是A,或者是否答案是B”,而应该先问他,“是否答案在A、B中”。

如果他回答“是”,我们就圈定答案的范围是A或者B,与C、D无关。

接下来,再问一个问题就能确定是A还是B了。

反之,当我们知道答案不在A、B中,我们也可以用第二个问题确定是C还是D。这样我们一共付2块钱就可以了。

类似地,对于世界杯足球赛的问题,我们问五个问题,付5块钱就可以了。你可以自己在心里算一下。

当然,在信息论中不用钱来当信息的单位,而采用了比特。

也就是说,要确定四选一问题的答案需要2比特信息,确定世界杯冠军的问题需要5比特信息。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

我们把这样充满不确定性的黑盒子就叫做“信息源”,它里面的不确定性叫做“信息熵”,而“信息”就是用来消除这些不确定性的(信息熵),所以搞清楚黑盒子里是怎么一回事,需要的“信息量”就等于黑盒子里的“信息熵”。

我们知道,熵其实是一个热力学的概念,表示一个系统的无序状态,或者说随机性。

比如把冰水倒进一杯开水中,它们会彼此融合,杯子里的“熵”,也就是混乱程度会增加;在信息系统中也是如此,信息熵则表示一个系统内部的不确定性。

我们都知道,一个系统中的状态数量,也就是可能性,越多,不确定性就越大;在状态数量保持不变时,如果各个状态的可能性相同,不确定性就很大;

相反,如果个别状态容易发生,大部分状态都不可能发生,不确定性就小。这段原理其实很简单,你先记住它,接下来我给你详细讲解。

信息熵也可以计算了。信息熵的公式:

H(x) = E[I(xi)] = E[ log(2,1/P(xi)) ] = -∑P(xi)log(2,P(xi)) (i=1,2,..n)

我们大家不用搞懂公式,但要明白这个公式的原理。我先解释什么叫“一个系统中的状态数量(即可能性)越多,不确定性就越大”。

比如,你买,只有两个号,其中一个必中彩,不确定性就小,那么这个问题的信息熵就小。如果有10000个号,也是其中有一个必中彩,那不确定性就大了。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

接下来,我再解释这半句:“在状态数量保持不变时,如果各个状态的可能性相同,不确定性就很大……”我们现在假定可能性的数量是固定的,比如在只有两种情况时,也就是非A即B的情况,

信息熵的变化图类似一个抛物线:图中的横轴是A发生的概率,它从0到1分布,纵轴就是熵,也就是确定它发生,你需要的信息量。你会发现,当A发生的概率正好是1/2时需要的信息熵达到顶峰,是一比特。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

这就类似抛一枚均质的硬币,谁也猜不好结果,因为正反两种结果发生的概率一样,都是1/2。

但是,如果这枚硬币没造好,一面重,一面轻,那就大概率是重的那面朝下,需要确定它哪面朝下的信息量就小。

这告诉我们,永远不要听那些正确率总是50%的专家的建议,因为那相当于什么都没说,没有提供能够减少“信息熵”的“信息量”。

这是今天的第一个知识点。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

最后半句:“相反,如果个别状态容易发生,大部分状态都不可能发生,不确定性就小。”其实是这个意思:如果你买要从10000个号里选出一个中奖的,不确定性就大多了。

不过,如果其中一个号中彩的可能性是99%,剩下所有的号加起来的可能性只有1%,这个问题就比较确定,熵就小。

现在,你明白什么叫“一个系统中的状态数量,也就是可能性越多,不确定性就越大;

在状态数量保持不变时,如果各个状态的可能性相同,不确定性就很大;

相反,如果个别状态容易发生,大部分状态都不可能发生,不确定性就小。”这个原理了吧?

好,你知道了信息有单位,还可以通过公式计算,那又有什么用呢?

大家都知道球的庄家总是稳赚不赔,就觉得里面猫腻很多,这次我带你从信息论的角度来看清这个问题。你会发现其实很多类似的复杂难题都是信息熵的计算问题。

假如,我们能提前确定各个球队获得世界杯冠军的概率,设定它们分别是P1,P2,……,P32。那么我们套用上面的公式,就可以算出这件事需要多少信息,或者说这个问题的信息熵。

我们假定为3.4比特,或者说对应于3.4块钱。如果有一个人提一次问题支付一块钱,从理论上讲,所有参加局的人只要平均支付3.4块钱就能得到谁是冠军这个信息。

但是如果设定局的人将收费标准略微提高,提高到一个人平均4元。这里面的盈余就被设局的人拿走了。

那你会说,我们不可能提前知道概率,那每个球队得冠军的概率是如何预估的?其实这是我们这些下注的人告诉设局的人的。

如果大家都往德国队身上下注,结果预测德国获冠军的概率就很高,所以押注的多少其实就是大家给出的概率。

而开局的,只要收费比信息实际的价值高,都是稳赚不赔的。这里面的细节大家不用太在意,总之记住一点,就是开局的从来不是拿自家的钱和你对,而是让你们彼此互相,他通过变相多收费盈利。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

很多人会讲,我不参加局,不会被开局的人赚走钱。其实上述这类局在金融市场更多。

你可能听说过“结构化的投资证券”,比如说石油的价格上涨到100美元以上,每1美元高盛就付给你1.5美元。

但是,如果没有到100美元,你需要每个月付给高盛1美元。这种投资工具,就被做成一种结构化的投资证券。

像航空公司或者运输公司因为害怕油价浮动太高,会购买这样的投资产品。

那么你以为是高盛在和石油公司,或者其他人对么?

不是的,因为高盛转手就将和它完全相反的投资产品,卖给了希望油价波动的人。

当然,高盛会包装得很好,让两边都感谢它,其实它才是真正挣钱的一方。

世界杯当庄能赢吗(为什么球的庄家总是稳赚不赔?)

你可能听说过金融数学这个专业,那里面的人天天做的事情就是设计这种不容易为人所看懂的,自己永远不赔钱的金融产品。

而所谓的基金经理,很多就是把这样的产品卖给你的人。

因此,多了解信息论和基本的数学常识,可以在生活中省下不少冤枉钱。

这是今天我想告诉你的第二个知识点,希望你知道,很多交易和产品都是利用了信息的可度量性,知道了这点,就可以看清很多复杂交易背后的原理。

掌握了信息量化度量的原理,你还可以用它来对付当今“信息过载”的问题,比如如何判断一篇报道里到底有多少信息量。

信息说到底是用于消除不确定性的。如果讲的事情大部分大家都知道,信息量就很少。

这也是为什么那些心灵鸡汤的文章大家不愿意读,并非是它们说的不对,而是没有信息量。

启发:如何在信息过载的时代进行有效阅读?

少看那些信息量少,给不出什么有效信息的视频,文章。

因为你看再多,这个世界对你来说还是一片未知。但是,“啃硬书”“学硬课”虽然累,但是你理解的每一行字都提供了有效信息。

-