数据处理.描述性统计.多元回归分析.回归诊断

一、数据描述及数据处理 因变量:年度票房

因电影票房收入差距过大,为尽量消除异方差的影响,对因变量y 做取10为底的对数处理

自变量:

1、档期:0,1变量,分类:贺岁档,暑期档,黄金周档,平日档。设定虚拟变量,将对应类型赋值为1,不是则为0。设定贺岁档,暑期档,黄金周档这3个虚拟变量

2、技术效果:0,1变量,分类:3D ,IMAX ,2D 。设定虚拟变量,将对应类型赋值为1,不是则为0。设定3D ,IMAX 这2个虚拟变量

3、电影类型:0,1变量,分类:动作片、爱情片、喜剧片、科幻片、惊悚片、动画片,其他片。设定虚拟变量,将对应类型赋值为1,不是则为0。设定动作片、爱情片、喜剧片、科幻片、惊悚片、动画片这6个虚拟变量

4、电影评分:0-10分

5、CPI :2011年~2016年各年的城镇居民人均可支配收入

6、CPI 增幅

7、电影产地:0,1变量,国内(包括港澳台地区)取1,其他取0

二、描述性统计

使用条形图、直方图、箱线图等对数据进行表示

二、多元线性回归分析

1、最小二乘估计(OLS ) 并求出R 方,复相关系数R ,得出回归方程对原有数据的拟合程度

并进行回归方程显著性检验 F 检验

并进行回归系数显著性检验 T 检验

2、多重共线性检验

画出相关系数矩阵并对其进行显著性检验

3、逐步回归(挑选出对因变量有显著影响的自变量)变量选择,避免多重共线性,

注意引入自变量的显著性水平小于剔除自变量的显著性水平

进行F 检验和T 检验,看逐步回归后的模型是否整体通过F 检验,每个被选入的自变量通过T 检验

计算出选出的模型的R 方,看拟合程度是否足够高

4、主成分分析和因子分析 解决多重共线性

(1)主成分分析

计算各主成分的方差贡献率和累计方差贡献率,特征根和特征向量

画出主成分分析的载荷矩阵和碎石图

获取主成分得分

选择标准:主成分累计方差贡献率达到80%以上的前几个主成分

特征根小于1,不再选作主成分

(2)因子分析

画出协方差阵和相关系数矩阵

画出因子分析的载荷矩阵和碎石图

采用斜交旋转提取因子

绘制正交、斜交图形

得到因子得分

三、回归诊断

1、异方差检验(在逐步回归的过程中画残差图,观察是否存在异方差,如果存在,消除异方差)

因数据为截面数据,很容易出现异方差性

采用方法为残差图分析法

当回归模型满足所有假定,残差图上的点为随机的

修正方法:加权最小二乘法 权重的取值(残差绝对值的倒数)

2、自相关性检验(随机扰动项存在序列相关检验)

自相关指随机误差项之间存在自相关现象,指一个变量前后期数值之间的相关关系

采用方法为DW 检验法:检验随机扰动项具有一阶自回归的序列,若DW 值在2左右时,不存在自相关

修正方法:box-cox 变换或迭代法

3、异常值的诊断分析

(1)因变量异常

计算删除学生化残差,若绝对值大于3,则判定为异常值

(2)自变量异常

计算库克距离和中心化杠杆值

库克距离1,认为是异常点

若中心化杠杆值大于二倍的中心化杠杆值平均值,则认为异常点

4、残差正态性检验

绘制加权后的P-P 图和Q-Q 图

绘制加权后的残差直方图


相关文章

  • 实验8_多元线性回归分析与非线性回归分析
  • SAS 软件与统计应用实验徐雅静.汪远征编著实验 8多元线性回归分析与非线性回归分析多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验.参 数的估计与检验.回归诊断与预测. 很多非线性回归问题都可以转化为线性回归问题处 ...

  • 关于糖尿病发病率研究的论文
  • 关于糖尿病发病率问题的讨论与研究 摘要 糖尿病是由遗传和环境因素相互作用而引起的常见病,临床以高血糖为主要标志,常见症状有多饮.多尿.多食以及消瘦等.糖尿病可引起身体多系统的损害.引起胰岛素绝对或相对分泌不足以及靶组织细胞对胰岛素敏感性降低 ...

  • 一.临床医学专业本科预防医学教学大纲
  • 公共卫生与预防医学教研室教学大纲 一.临床医学专业本科预防医学教学大纲 (一)前言 预防医学(preventive medicine)是通过研究环境中物理.化学.生物.社会.心 理和行为诸因素对人群健康影响的规律,应用卫生实验技术.医学统计 ...

  • 心理学研究方法自学笔记(1)
  • 1.科学研究的特点:系统性和有控制.①系统的理论框架与目的②控制的机制③严密的分析. 2.科学研究的目的:①描述对象的状况②解释对象的活动过程③预测对象将来的发展.科学研究的过程:从各种事实中归纳出一定的理论,即从个别或特殊的知识中概括出一 ...

  • 多元回归分析方法应用实证分析与比较
  • 第28卷第9期2010年9月 文章编号:1004-3918(2010)09-1083-06 河南科学 HENANSCIENCE Vol.28No.9Sep.2010 多元回归分析方法应用实证分析与比较 白秀琴1,李瑞阁2 (1.平顶山工业职 ...

  • 椭圆形油罐中油料贮量测算实用方法
  • 椭圆形油罐中油料贮量测算实用方法 作者: 作者单位: 刊名: 英文刊名: 年,卷(期): 被引用次数:毕珍平, 韩八晓, 聂武军, Bi Zhen-ping, Han Ba-xiao, Nie Wu-jun内蒙古公路工程局,呼和浩特,010 ...

  • 北京市老年医保患者住院费用及影响因素分析
  • 史堡医睦壁堡盘查:!!i生!旦笠:!鲞筮!塑堡b也』垡旦塑垒鱼里i!!』!!z:!!!!y!!:!!!盟!:! ・499・ ・医疗保障制度・ 北京市老年医保患者住院费用及影响因素分析 宋颖周子君 [摘要]目的分析北京市老年医保患者的住院费用 ...

  • 公共卫生资料的种类和特点
  • 第九期流行病学应用与实践系列培训 公共卫生资料的种类和特点 控 防 预 病 疾 大纲 2015.5 西安 制 孙谨芳 [email protected] 中 公 室 2015年5月,陕西西安 国  公共卫生资料概述 中  流行病学研究数 ...

  • 计量经济学+重点
  • 计量经济学 重点 第一章 经济计量学的特征及研究范围 (1)经济计量学是利用经济理论.数学.统计推断等工具对经济现象进行分析的一门社会科学: (2)经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数 ...

  • 多元统计分析在地学中的应用
  • 多元统计分析在地学中的应用 [摘要]多元统计分析是数理统计的一个重要分支.随着理论的完善和计算机技术的进步,被广泛应用解决地学问题.地学回归分析.判别分析.聚类分析以及主成分分析的应用,呈现出多样化发展,并成为解决地学问题的利器. [关键字 ...

© 2024 范文参考网 | 联系我们 webmaster# 12000.net.cn