首页> 中文会议>2008第四届海峡两岸应用统计学术研讨会 >以資料爲基礎日回歸模型建構分析——以房屋價格爲例

以資料爲基礎日回歸模型建構分析——以房屋價格爲例

摘要

本文主要以房屋价格资料爲基础,结合决策树(Decision Tree)建构线性回归模型之案例分析,研究模型之诊断与变数选把程序问题.将成对变数系利用CART法(Classification and RegressionTrees)的分析工具,逐次搜索各种属性水准组合,进行因子水准的合并,而降低模型中因子之水准数目,适切掌握因子间的相关与互动,再进一步作资料分析并建构模型後再精简变数,使线性回归模型能更有效反应母群体的结构.在一个预测变数(predictorvariable)之水准反应的改变依赖於另一预测变数水准的变化,且存在交互作用现象,在此情形下,各预测变数之相加性质,常不足於反应个别预测变数之重要性.因此,仅从线性模型中精简模型,很容易误导结果,这显示传统统计分析是不足的.在解决问题上,同时将资料挖掘(Data Ming)与模型建构之整合是很有必要的.各预测变数之间不仅具有相关关系,而且具有互动关系.当二个或二个以上之变数之间存在着互动现象时,某一变数娈值之改变所引起的反应,将受其他变数值大小的影响,有下列之状况:1.变数间之互动关系不一定是乘法关系.2.变数的交叉乘积(如X1X2或X1X2X3) rn 通常和原始的变数(X1、X2或X3)有高度相关的现象.在这些交互作用发生的时候,在线性模型之传统变数选把方法中,如果忽略了它们的存在,即可能导致建立偏差的模型.本篇文章以资料爲基础,找出控制各种相关与互动的变数、并降低属性之水准数;提出多重决策程序(Multiple Decision Procedures)并兼顾暂定模型候设的检验,及进一步诊断模型选择的适切性;量後再提出选把变数之凖则.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号