回归诊断
数学与计算机科学49 阅读
鲍克斯(G. E. P. Box)提出所谓统计的数据分析,是以假想的统计模型应用于数据的过程,和用现实数据验证该模型的稳妥性的过程作为反复学习过程。把后者的程序叫做模型诊断,而把回归分析作为对象时叫做回归诊断。模型诊断与统计的估计、检定相比较,往往依靠分析者主观经验的技术因素。作为回归诊断的具体方法有:①残差分析,特别是用图象推敲;②对各观测值估计的结果或观测值组的影响程度的分析,同时评价估计结果的稳定性;③鲍克斯·柯克斯变换等数据适当的变量变换;④检出具有多层共线性等,其目的是使数据适当,同时还有构成再现性高的模型和数据自身性质的评价。在①、②中残差及杠杆率(leverage)是重要工具。作为线性模型中回归模型以Y=Xβ+ε(X为n×p的说明变量行列)表示时,产生预测值的哈特(Hart)行列。X (X′X)-1X′的对角因素含有杠杆率hi;(含常数项时的下限为1/n)残差Yi-■i的方差是用误差方差σ2构成σ2 (1-hi)形式。用观测值总数也能确定1/hi,■i。反之,也可以认为其观测值决定hi个参数。