字号:

数据是证明你观点的最佳武器 数据帝的炼成

时间:2012-04-28 作者:colg-花葬、柔情 【投稿】
文 章
摘 要

  什么决定一个论坛可以称作技术性论坛?我想这绝不是因为论坛里面有那么一些人会分析,必然是整个论坛人均技术较高,有一个良好的氛围。

  这就是从前的COLG,我初来乍到时,我深深地被感染着,和一群人愉快交流经验。我选择了长期驻扎在此。

  可能是因为COLG研究的严谨准确,逐渐积攒起来人气,于是,来的人多了,鱼龙混杂,难免就有些人的分析大失水准,甚至误人子弟。这是我不愿看到的。

  人可以不懂,但不要不懂装懂。俗语曰:半壶水,响叮当。是的,没有金刚钻,就不要揽瓷器活。

  经常会在贴吧、论坛看到类似《生2孩子,一个是男孩,另一个是男孩概率多少?》、《某人买烟给100,店主没零钱,借钱找零,发现假币,赔钱,问损失》

  或者《某3人各自付款10元租房,老板优惠5元,叫服务生退客人,服务员私吞2元,给他们每人1元,这样每人花了(10-1)*3+服务员2元=29元,还有一元在那里?》的帖子。

  答案是众说纷纭,什么理论都能扯出来。

  如果你不能清晰解决以上3个问题,说明了你逻辑思维能力还有所欠缺,要成为一个分析帝,理性地生活,掌握自己的命运还显得有点遥远。

  第一个问题:生2个孩子,其中一个是男孩,另外一个是男孩概率是多少?

  有人说1/3有人说1/2。各自有各自的理论依据,很显然,真理只有一个。在回答这个问题之前,我想问问解题的各位,你们搬出的理论,适用条件是什么?每个理论都是有条件的,不能生搬硬套。任何一个理论模型,它的条件是否满足、以及模型的精度都会影响到最终的结果。因而成为分析帝、数据帝第一把钥匙就是——key1:掌握有相当精度的数学模型,并且充分了解其适用条件。

  有了这把钥匙,你才能有一个理论支撑,才能让你的数据有据可依,才能获得最终的正确结论。如果不遵循理论适用的条件,盲目生搬硬套,结论自然也就站不住脚了。

  eg:我是学自动化的,专业核心课是自动控制原理,其中一个重要的数学工具是传递函数。所谓传递函数,就是在零初始条件下,线性定常系统输出拉氏变换与输入拉氏变换之比。很多这个专业的都知道,G(s)=Y(s)/R(s),但是盲目用不对,因为这个关系得出是有条件的。3个关键点:零初始条件、线性系统、定常系统,任何不满足3条件之一的系统,这个课程里面的理论没有一个可以用来分析。当然,这个例子或许太专业,回到这个题目本身。概率是什么?我首先要问。回去翻翻书吧。

  事情可以分成2类,一类同性电荷相斥、太阳每天从东方升起这些叫做确定性现象;还有一些譬如抛硬币,可能是正面也可以是反面,用大炮射击目标,弹着点位置不尽相同,但是人们长期实践发现,这些现象在大量重复试验观察中呈现出固有的规律性,虽然个别试验结果不确定,但是大量重复试验中其结果又有规律,这就叫随机现象。概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。

  概率有2个重要理论:大数定律、中心极值定理。有人说,生2孩子,按照排列组合有4种等可能结果(不要说4种情况,是4种等可能结果):男孩、女孩(排序在前表示先出生);男、男;女、男;女、女。因为题目说其中一个是男孩,并未说他是哥哥还是弟弟,所以满足条件有3个:男女、男男、女男。所以另外一个也是男孩就是1/3的概率。看上去很合理。

  我想说,太荒谬了。其中一个是男孩,100%是男孩,是确定事件,不属于概率研究的范畴(侠义范畴)。如果是4个等可能结果,必然是2*2(生男生女等可能,所以生一个孩子2可能,2个孩子4可能),但是,注意,其中一个是男孩,所以只有2种可能,另外一个是女孩,或者另外一个是男孩。因为是等可能的可能,所以另外一个是男孩概率为1/2。

  这个可以用概率中的古典概型这个模型来计算。(所谓古典概型,1、可能结果是有限个;2、各个可能结果出现是等可能的。满足古典概型的条件)如果非要把第一个孩子纳入到概率中研究(因为题目中的男孩在没出生的时候还是随机事件,可以纳入到理论中计算),这里我们用条件概率模型来计算。设A={一个孩子是男孩};B={另一个孩子也是男孩}我们求的是两个孩子都是男孩,根据条件概率公式P(B|A)=P(AB)/P(A),其中P(B|A)为A发生的条件下B发生的概率(题目已知A发生);P(AB)为AB都发生的概率,2孩子都是男孩。

  显然P(AB)=1/4,P(A)=1/2。代入得P(B|A)=(1/4)/(1/2)=1/2。又因为P(AB)=P(A)*P(B)=1/4满足事件独立性的定义,所以AB两个事件独立。即假设你有一个哥哥或者姐姐,你的性别不受他们的性别影响,这就像抛硬币,第一块正反不影响第二块。用不同的定律或者模型(都满足定理的条件)都可以证明1/2才是唯一答案。有的人说这是一个生物题,不要忘记,数学是工具,生物也是要用数学知识算的。就算学科不同,也不可能有2个答案,如果通过2理论分别用正确的解答过程得到2答案,则2理论必有一个有错。参考《两个铁球同时落地》的故事。要是真有2个解,那必然是轰动世界的大发现。

  如果DNF强化符合概率模型的条件,自然可得垫子无用。就算计算机伪随机,对结论最后影响有多大呢?当然垫子作用不讨论这里。这里主要强调的是模型的正确使用对结论有非常重要的影响。

  所谓模型,不外乎就是一些数学公式之类的东西,那么,DNF有哪些成熟的数学模型呢?

  PS:这里仅是基础模型,其他很多都可以据此类推。其他更多模型请自行查阅资料(真伪可自行验证)。

DNF专题

DNF游戏神灯 - 连发双开

DNF双开 DNF连发 DNF换装 DNF双开同步控制 极速游戏模式等功能

DNF热门文章

视频周排行