统计假设检验
统计假设检验就是证明或推翻关于一定客体、现象和过程所研究特征的统计上相互联系假说的一种程序。 统计假设就是关于总体属性的假设,这一假设可根据抽样观察资料进行检验。受到检验的这个假设就是关于统计上相互联系的和特征值分布的假设。譬如,被研究的特征值的集合(专业工会或受中等专业教育的工人数)按正态分布的这一假说就是统计假设(参见词条“正态分布”)。在社会学研究中经常检验两个特征分布的同一性假设,平均值、方差相等的假设,某一客体属于一定总体的假设等等。统计假设检验过程就是从统计上证明所提假设的真实性(虚无性)。 人们将检验过的主要假设称为零假设,并用符号H0表示。除零假设外,还应探讨一个或几个备择假设。备择假设就是与零假设相对立的竞争假设,如果零假设被推翻,那么我们就可以采用备择假设,用符号H1或H0表示。如果提出几个备择假设,那么就称为合成假设;如果提出了一个相对立的假设,这称为简单假设。 要进行统计假设的检验,必须利用各种不同的判据,即利用规则来选择。假设的采用与拒绝,通常在判据的前件中应有某个数量指标(称为统计判据)。根据判据方式,假设分为参数假设和非参数假设。按照参数统计结论,通常应提出被研究特征在总体中分布的具体形式,因为在这种情况下,统计学通常是以分布参数(平均值、方差、回归系数)的利用为依据的。非参数判据的优点是能把判据用于只靠名义级或次序级完成的特征度量上。 否定零假设的判据值总体能构成否定域。如果某一点能将否定域与接受零假设的区域划分开来,这一点就称为临界点。 如果研究人员感兴趣的只是零假设所提出的值的误差是正还是负时,那么只进行正面假设检验。只有在正误差和负误差显著的情况下,才能证明正反面假设的真实性。在检验假设过程中或是作出正确的决定,或是犯两种错误中的一种错误:拒绝了真实的假设即犯了所谓的第一种错误,或是接受了不真实的假设即犯了第二种错误。产生这两种错误的根源在于,在证明假设时要弄清楚基于样本情报的未知总体的判据(参见词条“代表性”)。第一种和第二种错误的后果常常是完全不一样的。因此,最好使进行的检验达到两种错误的最低概率。为此就要运用各种手段,如增加分析观察数目。必须记住,减少一种错误的概率必然会引起另一种错误概率的增加。犯第一种错误的概率(真实假设的误差Hσ)就叫作统计判据的显著性水平,或称为否定域(a)的大小。在统计分析中有两种确定显著水平(a)的一般规则。第一,零假设的可靠性越大,那么a值越小;第二,否定正确零假设的值越大,a值则越小。这二种错误的概率通常用β表示,并称为备择假设的判据的操作性特征。β的余值,即(1-β)叫作判据功效。因为这些误差具有概率含义,因此它们的值在0与1之间。在应用研究中,显著水平a一般选在0.001至0.2区间内。 统计假设检验的一般图式通过利用判据进行:1)确定可行性的显著水平;2)确定检验过的假设的否定域(在显著水平和被研究样本容量已知的情况下,根据图表弄清楚临界点的值;3)根据经验材料,计算统计判据的实际值;4)计算出的统计值与否定域作比较。 假如统计判据值处在否定域之外,即小于临界点,那么就接受假设 H0。