假设检验中两类错误的成因

维普资讯 http://www.cqvip.com

假设检验中两类错误的成因　发生概率及其相关问题　

以单个总体均值检验为例　

李文华，雷金星　

（广西师范大学政管学院，广西桂林５１０）４０１　

摘

要：本文以单个均值检验为例，首先分析了统计检验中两类理论错误发生的原因：错误由Ｏｔ　

实际推断原理引起；错误由逻辑谬误引起；ｐ之后，分别计算了它们发生的概率大小并与之相关的问　

题做出了解释；此基础上，在笔者简要说明了“ 否证” 思想在实证研究中的合理性。　关键词：两类错误；因；原概率；否证 ” “ 　

中图分类号：２　０　１

文献标识码：　Ａ

文章编号：０２６８（０）２０　 — ３１０ —４７０５－１７０　２０１

解释，这种解释是相关解释而不是因果解释。这种思想认为　

１问题的缘起　如果运用定量的方法来研究社会现象之间是否存在差　异，需要借助统计学中假设检验这个手段。统计检验的假设　形式为：　

科学研究的目的不是实证一个理论，而是竭力去否证～种猜　想。　

“ 在统计检验中，会犯无法避免的错误”这是事实。，但它　不是我们视而不见的理　，而是学术懒惰的借口。本文的宗　旨就是以单个总体均值的检验为例，针对如下几个问题试图　作出回答：　１、在统计检验中，为什么会出现错误Ｏ与Ｂｔ错误？　２、分别怎样计算出现这两种错误出现的概率？　３、如何理解Ｏ错误和Ｂ错误之间关系的一些命题？ｔ　４、统计检验为什么首先关注的是虚无假设，而不是研　

究假设？　

虚无假设（原假设）ｉ事物之问不存在差异；ｒ：ｏ　

研究假设（备择假设）．Ｈ：事物之间存在差异。　在给定的显著性水平下，当反映事物的数据之间不存在　

显著性差异时，接受” 则“ 虚无假设，拒绝” “ 研究假设，即认为　

现象之间的差异是不存在的；当数据之间存在差异时，不　则“ 拒绝” 研究假设，拒绝” “ 虚无假设，即认为现象之间的差异是　存在的。细心的读者也许察觉到了上面这段话语中用词的微　妙：在数据没有显著性差异的时候，研究者可以果断地“ 拒　

统计检验为科学研究特别是实证研究所提供的不仅仅　

是数据处理的手段本身，更为重要的是，它可以为研究者和　

绝” 研究假设而“ 接受” 原假设；，但是在数据存在显著性差异　

的时候，研究者却谨慎地“ 不拒绝” 研究假设。在后面这种情　况下，为什么不干脆“ 接受” 研究假设呢？还有

一个问题，研究　

者的目的是探寻事物之间的差异，么把研究假设放在原　为什

读者树立科学的观念、端正科学的态度、审视研究的结果尽　

到一份责任。这正是本篇论文的意义所在。　

２ａ错误和１错误产生的原因　　３

Ｏ错误和Ｂｔ错误都是相对于虚无假设而言的。ｔＯ错误又　叫弃真的错误，弃真就是否定了研究总体的未知均值的真实　状态。把实际上为真的虚无假设拒绝了。ｐ错误又叫纳伪错　误，纳伪就是接受了未知的不真实状态，把错误的虚无假设　当成了真。抽象的定义可以通过如下统计检验实例来具体　

化。Ｉｌｌ　

假设之后呢？或者，研究者为什么首先关心的是虚无假设呢？　也许，在一些研究者看来，以上问题似乎显得多余，甚至有人　

认为这是统计检验中心照不宣的约定和共识。然而，在笔者　

看来，这些问题并非空穴来风。第一个问题与统计检验中可　

能会犯两种类型的错误有关。在统计检验中，不管研究的过　程多么完美，都不可避免的会犯Ｏ错误或者Ｂｔ错误，当然对　

一

个具体的研究而言，只可能犯其中之一。这是我们为什么　

谨慎的用“ 不拒绝” 而不是“ 接受” 的直接原因。至于第二个问　

题，则可以用当代著名的科学哲学波普尔的“ 否证” 思想作出　

基金项目：中国（广西）东盟研究（４ＫＤ９　与０ＳＺ０）

例子：一个公司有员工３０人（００研究的总体）为了检验　，

公司员工工资统计报表的真实性，研究者作了５人的大样　０

统计与决策２０２下）０５年月（　

１７１　

维普资讯 http://www.cqvip.com

本随机抽样调查，收入的调查结果是：人均　

能是真实的。相反，如果结果Ｂ是真实的，那么能否就此得出　

Ａ必定是真实的结论呢？我们的回答是不能。如果我们这么　做，就会犯逻辑学家称之为以推论结果来证实前提的谬误。　如果Ｂ是真实的，我们可以说Ａ也许是真的。因为可以有许　

ｘ样本均值）８１ｓ标准差）２元　（＝７元；（＝１

问能否认为统计报表中人均收入Ｉ＝８ｘ８０元的数据是真　ｏ实的？（显著性水平５０５。＝．）０　研究假设：　虚无假设Ｈ：。调查数据８１７元与报表数据８０元之间没　８

多其它的前提，也都能推出Ｂ之正确来。我们不能肯定Ａ必　定是真的，除非我们同时还能证明不存在其他有效的备择理　

论Ｄ使Ｄ＋。，ＩＢ遗憾的是这几乎不可能做到。如果Ｂ是真实　的，

我们又没有否定Ａ我们就会冒犯“ 而，纳伪 ” 的错误的风　

有显著性差异，公司员工工资均值的真实情况为８０　８元；

研究假设Ｈ：调查数据和报表数据之间有显著性的差　。

异，公司员工工资均值的真实情况不是８０　８元。

完成以上统计检验遵循这样的法则：　

险，因为Ａ实际也许是错的。这就是Ｂ错误出现的原因。田　

对以上两种错误的出现，我们还应作如下说明。首先，在　

命题Ａ大样本平均数（的分布服从正态分布。：ｘ）如果被　

假设的真实情况８０元确实为真，样本平均数的区间估　８那么

Ｃ　

第一次具体的检验中，只可能犯两类错误之中的一种或没犯　

错误，但到底是哪种情况发生是不知道的。我们分析错误的　发生是指 “ 错误的发生的可能性即概率 ” 。其次，发生　错误　

计为：￣． ÷ ２１６９

Ｖ　　ｎ

，８４１元－８５２　即７．－８．元；８８

和Ｂ错误的前提条件是不同的。错误发生的前提条件是虚　　

无假设为真；相反，错误发生的前提条件是虚无假设为伪。Ｂ　

命题Ｂ如果在一次抽样调查中，本的平均数落在以：样　上区间之内，么就认为被假设的真实情况为真，那即接受虚　无假设，研究假设；拒绝反之，拒绝虚无假设，则不拒绝研究　假设。　

３出现两类错误的概率ｉ－　－算ｉ

旦了解了统计检验中两种错误发生的原因，为我们　就

命题ｃ由于在这次实际的抽样调查中，：样本的平均数　为８１没有超出以上估计区间，７元，所以，接受虚无假设，拒　

绝研究假设，即认为这个公司员工工资的实际平均数为８０８　

兀。　

一

对它们出现的概率的计算奠定了基础。从前面的分析中，我　

们知道，错误是由实际推断原理引起的，小概率事件不　　即“ 会发生 ” 的假定所引起的，以有理由将所有小概率事件发　所生的概率之和或者即显著性水平（＝．）５０５看作　错误发生　０的概率，换言之，　错误发生的概率为检验所选择的显著性　

从上面的检验逻辑和操作过程中，可以看到如下两　我们个方面的问题，正是由于这两个问题，分别产生了错误和　　Ｂ错误　第一个问题是，们只抽了一个样本，我而个别的样本可　能是特殊的，管你的抽样多么符合科学抽样的要求。理论　不上讲，３０个员工中随机抽取５人作为调查样本，很　在

０００有多种构成样本的可能性，当于３０选５，个数目是很　相０００这大的。这样，在理论上就有存在很多个样本平均数。样理论　抽

水平。如果是单侧检验，弃真错误的概率则为５２　／。犯Ｂ错误的概率的计算是比较复杂的，由于Ｂ错误的出　现原因是纯属逻辑上的，所以在总体参数不知道的情况下是　

无法计算它出现概率的大小的。　

为此，我们在以上例子的基础上进一步设计：这个公司　职员的实际工资不是８０，８元而是８０虚无假设为伪，７元，仍　然假设实际工资是８０８元。这样我们就可以在总体均值为　８０７元和８０８元两种情况下，分别作出两条正态分布曲线（　Ａ线和Ｂ，线）见图１。　

图１　

告诉我们，这些平均数的分布是正态的。如果真实的情况是　

８０，８元那么这些样本平均数的平均数也就是８０。但是，８元　

这不等于说任何一个样本的平均数都是８０按照正态分　８元。布的理论，在这些平均数中，也有５％的样本平均数不在（ ± Ｘ　

１６．　９

Ｖ　　ｎ

，４１元－８５２元）ｇ８．７８－８．８ｆ围之内，样的事件称　这

为小概率事件。由于我们实际上只作了一次调查，只有一个　

样本平均数，所以我们无法知道，这个样本平均数是否为小　

概率事件。如果这个平均数超出了（７．元一８５２）　８４１８８．元的８

范围，而且是小概率事件发生的结果（是否小概率事件我们　

并不知道，在操作上，我们假设了小概率事件是不发生的），　那么我们必然要根据前面提到的检验逻辑拒绝虚无假设。也　

就是说，由于小概率事件的出现，我们把本来真实的虚无假　

在图１我们可以很清楚的看到，中，在理论上存在的若　干个样本均值中，只要某个样本均值Ｘ８４１时，．７．＞８我们将误　认为总体均值为８０，８元也就是不拒绝虚无假设。由于总体　

的真实情况是８０元，７这样我们就犯了Ｂ错误，即纳伪的错　

误。　

设拒绝了。这就是　错误出现的原因。　

第二个问题是，统计检验的逻辑犯了从结论推断前提的　

错误。命题Ｂ是由命题Ａ经演绎推论出来的，或写作符号　Ａ， —Ｂ命题Ｃ是我们在检验中所依据操作法则。如果Ａ是真　

的，且我们从Ａ到Ｂ的演绎推论如果也是正确的，那么Ｂ可　

犯Ｂ错误的概率大小就是相对正态曲线Ａ而言，图１　中阴影部分的面积：　

１８

统计与决策２０１　０５年２月（）下　

维普资讯 http://www.cqvip.com

Ｚｌ１４１；Ｚ２５５　ｘ＝．ｘ．９＝

论。】果笔者的判断没有错误的话，的“ 　女口他否证 ” 想主要受　思到了爱因斯坦理论，准确的说是爱因斯坦广义相对论的命运　的影响。我们知道，因斯坦的广义相对论发表于１１年，爱９５　刚开始，人们无法用实验或者观察来实证它的正确性。为此，　爱因斯坦声称：如果广义相对论是对的， “ 那么光线通过引力　

查标准正态分布表可知，－，　一ｚ）０７３３ｔＺ１ｃ（）　（　＝．９　０结果表明，如果总体的真值为８０，而虚无假设为　７元８０８元的话，那么，平均而言每１０次抽样中，０将约有８次把　真实情况当作８０８元被接受，即犯Ｂ错误的概率大小是　

００９　．７３。

场时，就会发生弯曲。　反言之， ” 如果实证资料表明，光线通　

过引力场时没有发生弯曲，那么理论就是错误的。１１年，９９　英国皇家学会和皇家天文学会利用全日的机会，量出太　食测

和前面几个命题联系起来看，Ｂ错误确实是逻辑上的谬　

误所致，因为不同的样本均值（统计结果）以对应同一个假　可设前提（虚无假设）。　

阳附近（一个很强大的引力场）的光线是弯曲的。ｌ，　从此爱因　

斯坦的广义相对论才被逐渐科学界所认可。处在这个时代并　

４对相关命墨的说ｎ！／　命题１在统计检验中，：在样本容量一定的条件下，　错　误和Ｂ错误不可能同时减小。这个命题可以借助前面的图形　

１来理解，一旦正态分布Ａ的拒绝域减小即错误减小，　则　（　叉）Ｘ一　这个区域将增大，图Ａ上阴影部分的面积（而Ｂ错　

误）也将增大。　

拜会过爱因斯坦的波普尔不会不知道这个经典的科学故事。　

他显然受到这个事件的启发：的正确性和是否存在实证　理论

的观察没有关系，因为即使没有天文资料，爱因斯坦的理论　也是对的。换言之，能否被经验的事实所证实，并不是衡量理　

论的科学性的标准。在这样的起点上，尔的思想走的更　波普

远。认为即使理论被一个有限的经验所证实，也不能肯定其　

在任何条件下正确，因为归纳法的作用是有限的：理论，一个　

一

命题２真实的总体参数（与假设的总体参数（之　：　）　）间的差异（　） △ 越小，Ｂ错误的概率越大。这个命题也可　犯

以从

图形１得到说明。因为 △ 越小，　两个正态图就相距越　近，阴影部分面积就增大。　

万次被证实．不能说明它的正确；相反，一次否证就完全可　

以摧毁整个理论大厦。在这样的逻辑下，－习波普尔决心与传统　

的实证主义分道扬镳，出“ 提否证 ” 才是评判理论科学性的标　

准。　

命题３犯　错误的概率和犯Ｂ错误的概率之和不为１：。　错误的概率是在图Ａ上被指示的显著性水平的大小，Ｂ而　错误的概率是图Ａ上阴影部分的面积。既然假设的总体均　值并不与真值相等（这是错Ｂ误产生的前提），图Ａ与图Ｂ　就不可能重合，因此　和之Ｂ和不可能为１　５虚无假设优先－－究假设 — — 统计检验　ｑ研＇Ｖ

中的否证思想　

确实探寻事物之间差异的存在是研究的目的，我们　也是

的研究假设，但是，在研究的策略上，我们必须以差异的不存　在作为出发点。所以我们把虚无假设放在较研究假设更为优　先的地位，这与从波普尔的“ 否证” 思想不谋而合。这个问题　的另一方面还在于，即使统计检验的结果表明差异是显著　

的，我们也不能草率地“ 接受” 研究假设，充其量，我们只能　

“ 不拒绝” 研究假设。这不仅仅是因为有Ｂ错误出现的可能，　而且， “ 按照否证 ” 想的精神，的正确性都是相对的，思理论暂　时正确的理论，被更为有效的理论所否证。１必将６］　

在假设检验中，我们把“ 不存在显著性差异” 作为首先要　

检验的假设，而且，于检验的结果，对如果统计上不存在显著　

参考文献：　

性差异，就果断“ 接受” 而不是“ 不拒绝” 虚无假设。为什么要　

首先考虑的是虚无假设呢？　

［Ｐ淑华．１ｌ社会统计　Ｍ．】北京：北京大学出版社，９、１８９　

［２儿美】莱洛克．统计学［．元等译．布社会Ｍ】沈德北京：学出版社，科　

１８７　９．

在科学史上，一些重要的研究假设其实都是以否定的形　式提出的。例如，热力学就是以不存在永动机为前提的；爱因　斯坦的相对论的基本假设就是不存在绝对运动等。当代著名　的科学哲学家波普尔发现了这一点，并提出了“ 否证” 思想。　那么，什么是“ 否证”呢？它反映了波普尔关于科学划界　

［［渡普尔．３英】】客观知识［】Ｍ．舒炜光等译、上海：上海译文出版社，Ｏ　２ｌＯ

［［克威利克＇因斯坦与相对论［】文华译．：４￣１１爱Ｍ．赵北京商务印书

馆，　

１９．９４　

● 　

［】尔．穷的探索［】５波普无Ｍ、邱仁宗译．：南京江苏人民出版社，００　２０．　、［［彭加勒．学的价值［】醒民译．阳：宁教育出版社，６法】】科Ｍ．李沈辽　

∞ ０．　

问题中的重要思想。波普尔自己承认，他的哲学思想的来源　

有三：马克思主义，一是二是弗洛伊德学说，三是爱因斯坦理　

（任编辑／责李友平）　

统计与决策２０年２（　０５月下）

１９１　

假设检验中两类错误的成因

相关文章