第四章 质量控制的工具
大数法则
收集尽可能多的数据并计算出平均值。某些情况下,你可以相当随机地的把完全不同的数据分成两类,一类表示有利的结果,其它表示不利的结果。然后,假如你收集了大量的数据,便可以一个个剔除掉变形的数据。一量你得到平均值,你便得到了接近事实的数字了。这就是大数法则。
在第二章,我谈过了彩色电视机调谐器的问题。电视机或多或少都有不同,并且没有两台电视是在同样的环境下使用的。一些电视从早到晚开着,一些则很少使用;一些观众常常从一个频道调到另一个频道,另一些人则很踏实地看一个频道;一些电视放在厨房里,并且不久就积了一层油烟,另一些则放安置在无尘的卧室里。在这样一个变化巨大的环境里,任何东西都可能造成电视机功能错乱,从生产工序中的一个错误,到一个落进机中的尘垢或厨房中的油污或其它任何东西。不管你怎样紧密地联系每一个单机的故障来研究,你都不会找出哪一个型号比其它型号的机子更容易出问题。
尽管如此,如果你收集的调谐故障的数据有成千个甚至上万个,并且求出其平均值,那么在制造的好的电视机中,调谐故障的数字会统一的低,而在那些差的电视机中,故障数字会统一的高。这也是大数法则。
统计表明,近年来出生的日本人身高要比第二次世界大战后出生的人高,但仍然有些四十年前出生的日本人身材很高,就象一些近年出生的人身材很矮一样。关于日本人身高的精确描述,只能在调查了大量数据并做出比较后才能得出。这样,这些数字便可以说明,在平均值上,日本人已经长高了,这才是可信赖的。如果我在前面提到的那位教授能够收集不是一间而是几间医院的数据,他可能会避免他犯的错误。毫无疑问,他是他自己先入为主的受害者。
在解释数据时,重要的是让数据来说话。重要的是把你可能会有的任何偏见或理论放在一边,并把手中可能和不可能作出结论的数据划出明显的差别。你可以划出线来考虑,但是在这样做的时候,你不能够强迫数据来支持你的观点。