假设检验中两类错误的成因

维普资讯 http://www.cqvip.com

假设检验中两类错误的成因  发生概率及其相关问题 

以单个总体均值检验为例 

李文华, 雷金星 

( 广西师范大学 政管学院,广西 桂林 5 10 ) 40 1 

要: 本文以单个均值检验为例, 首先分析了统计检验 中两类理论错误发生的原因: 错误由 O t  

实际推断原理引起; 错误 由逻辑谬误引起; p 之后, 分别计算了它们发生的概率大小并与之相关的问  

题做 出了解释 ; 此基础上 , 在 笔者简要说 明了“ 否证” 思想在 实证研 究 中的合理性。   关键词 : 两类错误 ; 因; 原 概率 ;否证 ” “  

中图分类号:2  0  1

文献标识码:  A

文章编号:02 68( 0)20  — 3 10 —47 05 - 17 0  2 0 1

解释 , 这种解释是 相关解释 而不 是因果解 释。这 种思想认为 

1 问 题 的 缘 起  如果运用定量的方法来研究社会现象之间是否存在差  异, 需要借助统计学中假设检验这个手段。统计检验的假设  形式为:  

科学研究 的 目的不是实证 一个理论 , 而是竭力去 否证 ~种猜  想。  

“ 在统计检验中, 会犯无法避免的错误”这是事实。 , 但它  不是我们视而不见的理  , 而是学术懒惰的借 口。本文的宗  旨就是以单个总体均值的检验为例 , 针对如下几个问题试图  作出回答:   1 、在统计检验中, 为什么会出现错误 O与 B t 错误?   2 、分别怎样计算出现这两种错误出现的概率?   3 、如何理解 O错误和 B错误之间关系的一些命题? t   4 、统计检验为什么首先关注的是虚无假设, 而不是研 

究假设 ?  

虚无假设( 原假设)i 事物之问不存在差异; r: o  

研究假设( 备择假设) . H: 事物之间存在差异。   在给定的显著性水平下, 当反映事物的数据之间不存在 

显著性差异时, 接受” 则“ 虚无假设,拒绝” “ 研究假设 , 即认为 

现象之间的差异是不存在的; 当数据之间存在差异时, 不  则“ 拒绝” 研究假设 ,拒绝” “ 虚无假设 , 即认为现象之间的差异是  存在的。 细心的读者也许察觉到了上面这段话语中用词的微  妙: 在数据没有显著性差异的时候 , 研究者可以果断地“ 拒 

统计检验为科学研究特别是实证研究所提供的不仅仅 

是数据处理的手段本身 , 更为重要的是 , 它可以为研究者和 

绝” 研究假设而“ 接受” 原假设; , 但是 在数据存在显著性差异 

的时候, 研究者却谨慎地“ 不拒绝” 研究假设。在后面这种情  况下, 为什么不干脆“ 接受” 研究假设呢? 还有

一个问题 , 研究 

者的 目的是探寻事 物之间的差异 , 么把研究假设放 在原  为什

读者树立科学的观念、 端正科学的态度 、 审视研究的结果尽 

到一份责任。这正是本篇论文的意义所在。  

2 a 错 误 和 1 错 误 产 生 的原 因    3

O错误和 B t 错误都是相对于虚无假设而言的。 t O错误又  叫弃真的错误 , 弃真就是否定了研究总体的未知均值的真实  状态。 把实际上为真的虚无假设拒绝了。p错误又叫纳伪错  误, 纳伪就是接受 了未知的不真实状态, 把错误的虚无假设  当成了真。抽象的定义可以通过如下统计检验实例来具体 

化。I l l  

假设之后呢? 或者, 研究者为什么首先关心的是虚无假设呢?   也许 , 在一些研究者看来 , 以上问题似乎显得多余, 甚至有人 

认 为这是统计检验 中心照不宣 的约定和共识 。然而 , 在笔者 

看来 , 这些问题并非空穴来风。第一个问题与统计检验中可 

能会犯两种类型的错误有关。在统计检验中, 不管研究的过  程多么完美 , 都不可避免的会犯 O错误或者 B t 错误, 当然对 

个具体的研究而言, 只可能犯其中之一。这是我们为什么  

谨慎的用“ 不拒绝” 而不是“ 接受” 的直接原因。 至于第二个问 

题, 则可以用当代著名的科学哲学波普尔的“ 否证” 思想作出  

基金项 目: 中国( 广西) 东盟研 究(4 K D 9  与 0S Z 0 )

例子: 一个公 司有员工 30 人( 00 研究的总体)为了检验  ,

公司员工工资统计报表的真实性 ,研究者作了 5 人的大样  0

统计与决策 20 2 下) 05年 月(  

17 1 

维普资讯 http://www.cqvip.com

本随机抽样调查 , 收入的调查结果是 : 人均  

能是真实的。 相反, 如果结果 B 是真实的, 那么能否就此得出  

A必定是真 实的结论呢?我们 的回答是不能 。如果我们这么  做 ,就会犯逻 辑学家称 之为 以推论结 果来证实 前提 的谬误 。   如果 B 是真实 的 , 我们可 以说 A也许 是真的。因为可以有许 

x 样本均值)8 1 s标准差 )2 元  ( =7 元;( =1

问能否认 为统计报表 中人均 收入 I=8 x 80元的数据是 真  o 实的?( 显著性 水平 5 0 5 。 =. ) 0   研究假设 :   虚无假设 H : 。调查数 据 8 1 7 元与报表数据 80元之间没  8

多其它的前提 , 也都能推出 B之正确来。我们不能肯定 A必  定是真的, 除非我们同时还能证明不存在其他有效的备择理 

论 D 使 D +。 , IB 遗憾 的是这几乎不 可能做 到。如果 B是真实  的 ,

我们 又没有 否定 A 我 们就 会 冒犯“ 而 , 纳伪 ” 的错误 的风 

有显著性差异, 公司员工工资均值的真实情况为 80   8 元;

研究 假设 H :调 查数据 和报 表数 据之间有 显著性 的差  。

异, 公司员工工资均值的真实情况不是 80   8 元。

完成 以上统计检验遵循这样 的法则 :  

险, 因为 A实际也许是错的。这就是 B错误出现的原因。田  

对 以上两 种错误 的出现 , 我们还应作如下说 明。 首先 , 在 

命题 A 大样本平均数( 的分布服从正态分布。 : x) 如果被 

假设的真实情况 80元确实为真 , 样本平均数 的区间估  8 那么

C 

第一次具体的检验中, 只可能犯两类错误之中的一种或没犯 

错误 , 但到底是 哪种情况发生是 不知道 的。我们分析错误 的  发生是指 “ 错误 的发 生的可能性 即概率 ” 。其次 , 发生  错误 

计为: ̄ . ÷ 2 16 9

V    n

, 841 元- 85 2   即 7. - 8. 元; 8 8

和B 错误的前提条件是不同的。 错误发生的前提条件是虚   

无假设 为真 ; 相反 , 错 误发生的前提 条件 是虚无假设为伪 。 B  

命 题 B 如果在 一次抽 样调查 中 , 本 的平均 数落 在 以 : 样   上 区间之 内 , 么就认 为被 假设 的真实情 况 为真 , 那 即接 受虚  无假设 , 研究 假设 ; 拒绝 反之 , 拒绝虚无 假设 , 则 不拒绝 研究  假设 。  

3 出 现 两 类 错 误 的 概 率 i-   -算 i

旦了解 了统计检 验 中两种错误 发生 的原 因 , 为我们  就

命题 c 由于在这次实际的抽样调查中, : 样本的平均数  为 81 没有超出以上估计区间, 7 元, 所以, 接受虚无假设 , 拒 

绝研究 假设 , 即认 为这 个公 司员工工 资的实 际平均数 为 80 8 

兀 。  

对它们出现的概率的计算奠定了基础。从前面的分析中, 我 

们 知道 , 错误是 由实 际推断原理 引起 的 , 小概率事 件不    即“ 会发生 ” 的假 定所引起 的 , 以有理 由将所 有小概 率事件 发  所 生 的概 率之 和或者 即显著性 水 平 (= . ) 5 0 5看作  错误 发生  0 的概率 ,换 言之 ,  错误 发生的概率 为检验所选 择的显 著性 

从上 面的检验逻辑 和操 作过程 中 , 可以看到 如下两  我们 个 方面的 问题 , 正是 由于这 两个 问题 , 分别产 生 了 错误 和    B 错误  第一个 问题是 , 们只抽 了一个 样本 , 我 而个别 的样本 可  能是特殊 的 , 管你的抽样 多么符合科学抽 样的要求 。理论  不 上 讲 , 30 个员 工 中随机抽取 5 人作 为调查 样本 , 很  在

00 0 有 多种构 成样 本 的可能性 , 当于 30 选 5 , 个数 目是 很  相 00 0这 大 的。 这样 , 在理论上就有存在很 多个样本平 均数 。 样理论  抽

水平。如果是单侧检验 , 弃真错误的概率则为 5 2  /。 犯B 错误的概率的计算是比较复杂的, 由于 B错误的出   现原因是纯属逻辑上的, 所以在总体参数不知道的情况下是 

无法计算它 出现概率 的大小的。  

为此 , 我们在以上例子的基础上进一步设计: 这个公司  职员的实际工资不是 80 , 8 元 而是 80 虚无假设为伪 , 7 元, 仍  然假设实际工资是 80 8 元。这样我们就可以在总体均值为  80 7 元和 80 8 元两种情况下 , 分别作出两条正态分布曲线(  A 线和 B , 线)见图 1 。  

图1  

告诉我们, 这些平均数的分布是正态的。如果真实的情况是 

80 , 8 元 那么这些样本平 均数 的平均数也就是 80 。但是 , 8元  

这不等于说任何一个样本的平均数都是 80 按照正态分  8 元。 布的理论, 在这些平均数中, 也有 5 %的样本平均数不在( ± X 

16 .  9

V    n

, 41 元-85 2元 )g 8 . 7 8 - 8. 8 f 围之 内 , 样 的事 件称  这

为小概率事件 。由于我们实 际上 只作 了一次 调查 , 只有一个 

样本平均数 , 所以我们无法知道 , 这个样本平均数是否为小 

概率事件 。 如果这个平均数超 出了(7 . 元一 85 2 )   841 8 8. 元 的 8

范围, 而且是小概率事件发生的结果( 是否小概率事件我们 

并不 知道 , 在操作 上 , 我们假 设 了小 概率 事件是 不发 生 的) ,   那么我们必然要根据 前面提到的检验逻辑拒绝 虚无假设 。 也 

就是说, 由于小概率事件的出现, 我们把本来真实的虚无假 

在图 1 我们可以很清楚的看到, 中, 在理论上存在的若  干个样本均值中, 只要某个样本均值 X 841 时, .7. > 8 我们将误  认为总体均值为 80 , 8 元 也就是不拒绝虚无假设 。由于总体 

的真实情 况是 80元 , 7 这样我们 就犯 了 B错误 , 即纳伪 的错 

误。  

设拒绝了。这就是  错误出现的原因。  

第二 个问题是 , 统计检验 的逻辑犯 了从结 论推断前提 的  

错误。命题 B 是由命题 A经演绎推论出来的,或写作符号  A , —B 命题 C是我们在检验中所依据操作法则。 如果 A是真 

的, 且我们从 A到 B的演绎推论如果也是正确的, 那么 B可 

犯B 错误的概率大小就是相对正态曲线 A而言,图 1   中阴影部分的面积 :  

1 8

统计 与决策 20 1  05年 2月( ) 下  

维普资讯 http://www.cqvip.com

Z l 141 ; Z 2 5 5   x= . x .9 =

论 。】 果笔者的判断没有错误 的话 , 的“  女 口 他 否证 ” 想主要受  思 到了爱 因斯 坦理论 , 准确 的说 是爱 因斯坦 广义相对论 的命运  的影 响。我们知道 , 因斯坦 的广义相 对论发表 于 11 年 , 爱 95   刚开 始 , 人们无法 用实验或者观察来实证 它的正确性。 为此 ,   爱因斯坦声称 :如果广义相对论 是对 的, “ 那么光线通 过引力 

查标准正态分布表可知, -,   一 z )0 73 3 tZ 1 c( ) (  = . 9  0 结果表明,如果总体的真值为 80 ,而虚无假设为  7元 80 8 元的话, 那么 , 平均而言每 10次抽样中, 0 将约有 8 次把  真实情况当作 80 8 元被接受 ,即犯 B错误的概率大小是 

00 9   .7 3。

场时, 就会发生弯曲。  反言之 , ” 如果实证资料表明, 光线通 

过 引力场时 没有发生 弯曲 , 那么理 论就是错 误 的。11 年 , 99   英国皇家学 会 和皇家天文学会利用 全 日 的机 会 , 量出太  食 测

和前面几个命题联系起来看, B错误确实是逻辑上的谬 

误所致 , 因为不 同的样本 均值 ( 统计结果 ) 以对 应 同一个假  可 设前提 ( 虚无假设 ) 。  

阳附近( 一个很强大的引力场) 的光线是弯曲的。 l ,  从此 爱因 

斯坦的广义相对论才被逐 渐科 学界所认可 。 处在这个时代并 

4 对 相 关 命 墨 的 说 n! /  命题 1在统计检验中, : 在样本容量一定的条件下,  错  误和 B错误不可能同时减小。 这个命题可以借助前面的图形 

1 来理解 ,一旦正态分布 A的拒绝域 减小 即 错误 减小 ,   则  (  叉) X一  这个 区域将 增 大 , 图 A上 阴影 部 分 的面积 ( 而 B错 

误) 也将增 大 。  

拜会过爱因斯坦的波普尔不会不知道这个经典的科学故事。  

他显然受到这个 事件 的启 发 : 的正确性 和是否存在实证  理论

的观察没有关系, 因为即使没有天文资料 , 爱因斯坦的理论  也是对的。 换言之, 能否被经验的事实所证实, 并不是衡量理 

论 的科学性 的标准 。在这样 的起点上 , 尔的思想走 的更  波普

远。认为即使理论被一个有限的经验所证实, 也不能肯定其 

在任何 条件 下正确 , 因为归纳 法的作用是有 限的 : 理论 , 一个  

命题 2 真实的总体参数( 与假设 的总体参数( 之  :  )  ) 间的差异(  ) △ 越小 , B错误的概率越大。这个命题也可  犯

以从

图形 1 得到说 明。因为 △ 越小 ,   两个正态 图就相距 越  近, 阴影部分面积就增大 。  

万次被证实. 不能说明它的正确; 相反, 一次否证就完全可 

以摧毁整个理论大厦。 在这样的逻辑下, - 习 波普尔决心与传统 

的实证主义分道扬镳 , 出“ 提 否证 ” 才是 评判理论科学性 的标 

准。  

命题 3犯  错误的概率和犯 B错误的概率之和不为 1 : 。   错误的概率是在图 A上被指示的显著性水平的大小, B 而   错误的概率是图 A上阴影部分的面积。既然假设的总体均  值并不与真值相等 ( 这是错 B 误产生的前提) ,图 A与图 B   就不可能重合, 因此  和之 B和不可能为 1   5 虚 无 假 设 优 先 -- 究 假 设 — — 统 计 检 验   q研 ' V

中的否证思想 

确实探寻事 物之间差异 的存 在是研究 的 目的 , 我们  也是

的研究假设, 但是, 在研究的策略上, 我们必须以差异的不存  在作为出发点。 所以我们把虚无假设放在较研究假设更为优  先的地位, 这与从波普尔的“ 否证” 思想不谋而合。这个问题  的另一方面还在于,即使统计检验的结果表明差异是显著 

的, 我们也不能草率地“ 接受” 研究假设, 充其量 , 我们只能 

“ 不拒绝” 研究 假设 。这不仅仅是 因为有 B错误 出现 的可能 ,   而且 , “ 按照 否证 ” 想 的精神 , 的正确性都是相 对的 , 思 理论 暂  时正确的理论 , 被更为有效的理论所否证 。1 必将 6 ]  

在假设检验中, 我们把“ 不存在显著性差异” 作为首先要 

检验 的假设 , 而且 , 于检验的结果 , 对 如果统 计上不存 在显 著 

参考文献 :  

性差异 , 就果断“ 接受” 而不是“ 不拒绝” 虚无假设。为什么要 

首先考虑的是虚无假设 呢?  

[ P淑华. 1 l 社会统计  M . 】 北京: 北京大学出版社, 9 、 18 9  

[ 2 儿美】 莱洛 克. 统 计 学[ . 元 等译 . 布 社会 M】 沈德 北京 : 学 出版社 , 科  

1 87  9 .

在科学史上, 一些重要的研究假设其实都是以否定的形  式提出的。 例如, 热力学就是以不存在永动机为前提的; 爱因  斯坦的相对论的基本假设就是不存在绝对运动等。 当代著名  的科学哲学家波普尔发现了这一点, 并提出了“ 否证” 思想。   那么, 什么是“ 否证”呢? 它反映了波普尔关于科学划界 

[ [ 渡普尔. 3 英】 】 客观知识[】 M. 舒炜光等译、 上海: 上海译文出版社, O  2 l O

[ [ 克威利克' 因斯坦与相对论[ 】 文华译. : 4  ̄1 1 爱 M. 赵 北京 商务印书

馆 ,  

19 . 9 4 

●  

[】 尔. 穷的探 索[】 5波普 无 M、 邱仁宗译. : 南京 江苏人 民出版社 ,00   20 .  、 [ [ 彭加 勒. 学的 价值 [】 醒民 译. 阳 : 宁教 育 出版 社 , 6 法】 】 科 M. 李 沈 辽  

∞ 0.  

问题中的重要思想。波普尔自己承认 , 他的哲学思想的来源 

有三 : 马克思 主义 , 一是 二是弗洛伊德 学说 , 三是爱因斯 坦理 

( 任编辑/ 责 李友 平)  

统计与决策 20 年 2 (   05 月 下)

19 1 


相关文章

  • 毕业论文我国通货膨胀成因与对策的统计研究
  • 题目:我国通货膨胀成因与对策的统计研究 目 录 一.摘要 ----------------------------1 二.文献综述 ----------------------2 三.数据分析 ----------------------- ...

  • 第5章假设检验思考与练习参考答案
  • 第5章 假设检验 思考与练习参考答案 一.最佳选择题 1. 样本均数比较作t检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小. A.0.01 B. 0.05 C. 0.10 D. 0.20 E. 0.30 2. ...

  • 基于SSpace模型的中国房地产泡沫研究
  • 金融教学与研究 (总第130期)2010年第2期 基于SSpace模型的中国房地产泡沫研究 张朝洋 (江西财经大学金融学院,南昌330013) 摘要:将房地产基础价值看作一种状态变量,借助于协整理论,建立基于房地产供求的SSpace模型,并 ...

  • 生物统计附试验设计复习题及答案
  • 目 录 1生物统计附实验设计(明道绪__第四版) 复习题及答案 2生物统计附试验设计 A 卷 生物统计附试验设计A 卷 标准答案 3生物统计附试验设计 (B 卷) 生物统计附试验设计(B 卷)标准答案 4生物统计附试验设计(水产专业) A ...

  • 麦肯锡解决问题的7步骤
  • 麦肯锡解决问题的7步骤 如果说到全球最具声望的企管顾问公司,那就一定是「麦肯锡」.这家收费昂贵.却从不作广告的明星企业,长年位居美国MBA最想进入工作的企业榜首,长久以来,全球顶尖大企业付费给麦肯锡的顾问,为他们思考问题,提出解决方案.到底 ...

  • 孙凯丽假设检验在质量管理中的应用
  • 本科毕业论文(设计) 题 目 假设检验在质量管理中的应用 院(系) 数学系 专 业 数学与应用数学 学生姓名 孙凯丽 学 号 11003028 指导教师 马永梅 职称 副教授 论文字数 完成日期:13年5 月31 日 巢湖学院本科毕业论文( ...

  • 教科版五年级科学地球的运动
  • 第四单元:地球的运动 1.昼夜交替现象 一.教材简析: 教科书从让学生让学生从熟悉的昼夜现象开始研究地球的运动,试着从地球和太阳的运动关系人手,来解释昼夜现象.学生的解释可能是多种多样的,但所有的解释都要求得到模拟实验的证据支持.通过实验, ...

  • 27.小水滴的旅行
  • 27.小水滴的旅行 教材分析: 本课是<义务教育课程标准实验教科书·科学>(青岛版)五年级上册第六单元<水循环>的最后一课.遵循小学生心理和生理的发展需要,以学生对小水滴在自然界中不同状态的生活体验为基础,通过研究小 ...

  • 统计学简答题(final)
  • 1.什么是统计学?为什么统计学可以通过对数据分析达到对事物性质的认识? 答:(1)统计学是一门收集.整理.显示和分析统计数据的科学,其目的是探索数据内在的数量规律性.(2)这是由客观事物本身的特点和统计方法的特性共同决定的.a.从客观事物方 ...

  • 基本极限分布理论和线性检验统计量的构造
  • 基本极限分布理论和线性检验统计量的构造 一.基本极限分布理论 1.对于序列a N ,如果对于任意ε,存在N ε使得对于N >N ε时,有|a N -a | p 3.依概率收敛:对于所有T ≥N ,有Pr ob {|X T -c |&g ...

© 2024 范文参考网 | 联系我们 webmaster# 12000.net.cn