F检验_知识百科

（Ftest）亦称方差分析，是统计学中假设检验的方式之一。它主要是指用服从F分布的统计值来检验两正态总体方差的一致性。在社会统计中，它常根据样本统计值（E2或γ）来检验总体中的定类与定距、定序与定距、定距与定距变量之间是否相关。其检验的步骤一般为：（1）根据已有资料建立假设，确定显著水平α，查F值表得到否定域的临界值；（2）由样本资料计算F值；（3）将计算所得的F值与临界值（负值都取绝对值）进行比较，若计算值大于临界值，则否定H0；反之，则承认H0。若样本统计值为相关比率E2，则F值的计算公式为：式中，df1为分子的自由度，df=k-1，df2为分母的自由度，df2=n-k，其中k为x变量的类别数即分组的数目，n为样本个案数。若样本统计值为相关系数γ，则F值的计算公式为：式中，除了将E2换成γ2之外，其余的符号均与上式相同。现根据样本的相关比率E2为例加以说明，其统计资料如下表：学生英语成绩按居住地分类统计表据上表已计算出E2=0.64。若上表中的资料是从总体中抽取的样本资料，则根据此样本资料来检验总体中两变量X与Y是否相关的步骤为：（1）建立假设；H1：总体中X与Y相关，H0：总体中X与Y不相关，因为：df1=k-1=3-1=2df2=n-k=20-3=17若确定α=0.001，查F值表则得F0.001＝10.66（2）计算F值：（3）比较F的计算值15.11与临界值10.66，显然此计算值大于临界值，知F的计算值落在否定域内，故否定H0，即总体中学生的居住地与英语成绩相关。此外，在社会统计中，F检验也可用于方差的一致性检验。这时的研究假设为总体内两部分方差不相等，虚无假设为这两部分方差相等，F的计算公式为：式中，S21是样本中较大的一组方差，S22是样本中较小的一组方差。在计算F值时，S21与S22都是根据原始数据求出离差平方和再除以自由度n-1得到。若计算所得的F值大于规定的某一显著水平下的临界值，则否定虚无假设，说明总体中两部分方差不相等，即无一致性或差异显著；反之，则接受虚无假设，即承认总体中两部分方差相等或具有一致性。（李少文）〔T检验〕（Ttest）统计学中假设检验的方式之一。T检验是用服从t分布的统计值检验正态总体平均值的方法。在社会统计中，T检验一般适用于小样本的情况。它常根据样本平均数来检验总体平均数。其检验的步骤通常为：（1）根据已有资料建立假没，确定显著水平和自由度，查t分布表得到否定域的临界值；（2）由样本资料计算l值；（3）将计算所得的l绝对值与临界t值进行比较，若计算绝对值大于临界值，则否定虚无假设H0；反之，则承认H0。例如，研究某市实行商品房制度后，使每户人平住房面积增加。若原来每户的人平住房面积为4.6平方米，可作出假设：H1：μ1＞4.6平方米H0：μ0=4.6平方米例如从全市居民户中抽取46户进行调查，得人平住房面积为■=5.8平方米，样本标准差S=2平方米，这时的自由度df=n-1=46-1=45，如要求显著水平α—0.05（一端），查t分布表得临界值t0.0■（4）=1.679；再根据计算l值的公式计算如下：＝4.025很显然，计算值远大于临界值，所以否定H0而接受研究假设H1，说明实行商品房制度后，该市居民的人平住房面积确实有所增加，并且超过了4.6平方米。此外，T检验还可用于两个平均数差异的假设检验，具体的检验步骤与上述相同，只是计算t值的公式应改为：此公式中，X1与X2、S21与S22、n1与n2分别为两个样本的平均数、方差与个案数这时查l分布表的自由度应为d∫=n1+n2-2。在社会统计中作T检验时还须注意：（1）它只能对定距或定比类型的随机变量作假设检验：（2）只能对单个或双双成对的参数值作检验；（3）不能对总体的相关程度或方差进行假设检验。（李少文）〔x2检验〕（Chi-squaretest）亦称卡方检验。统计学中假设检验的方式之一。x是一个希腊字母，x1可读音为卡方，所以译为卡方检验。卡方检验主要用于定类或定序变量的假设检验，在社会统计中应用非常广泛。卡方检验的步骤一般为：（1）建立假设，确定显著水平α与自由度df、查x2值表得到否定域的临界值；（2）由样本资料计算x2值；（3）将计算所得的x2值与临界x2值（负值都取绝对值）作比较，若计算值大于临界值，则否定H0；反之，则承认■0。计算卡方值的公式一般可表示为：式中：f0表示实际所得的次数，fe表示由假设而定的理论次数，Σ为加总符号。X2检验对于定类与定类或定类与定序变量之间的相关检验应用较多。相关检验又称独立性检验。进行相关检验时，要先根据交互分类表中的边缘次数分配来计算出各格中的理论次数feij。计算理论次数的一般公式为：式中，Fyj：表示x变量各类别的边缘次数分配，Fyj表示y变量各类别的边缘次数分配，n为总次数。例如对下面的2×2表：对于其它形式交互分类表如2×3表、3×2表，3×3表可依上面的方法分别计算它们的理论次数。现对如下资料进行相关检验。性别与最大志愿的关系第一步，根据已有资料建立对总体的假设：H1：性别与最大志愿相关H0：性别与最大志愿不相关确定α≤0.01，查x2值表得x20.01（1）≥6.635，x20.01（1）下标中的（1）表示自由度为1，因为在上面的2×2表中，df=（2-1）×（2-1）=1；第二步，根据样本资料计算x2值，因为：所以，第三步，进行比较，因为x2=47.3＞X0.02（1）=6.635所以否定对于总体的虚无假设而肯定研究假设，即总体中，性别与最大志愿是相关的X2检验还可用于检验总体的次数分配是否属于正态分布及进行成对资料的符号检验、两组或两组以上资料的中位数检验等。（李少文）〔Z检验〕（Ztest）统计学中假设检验的方式之一。Z检验的步骤通常为：（1）根据已有资料建立假设，确定显著水平a，查Z值表得到否定域的临界值；（2）由样本统计值计算Z值；（3）将计算所得的Z值与临界值作比较，若计算值大于临界值（负值都取绝对值），则否定虚无假设；反之，则承认虚无假设。在关于社会调查的统计中，Z检验一般适应于样本个案数不小于100的情况，且主要用于总体平均数与总体比率的假设检验。根据样本资料计算Z值的公式可分为：（1）对于平均数的检验：式中，Z■为需要计算的Z值，X为样本平均数，μ0为虚无假设的总体平均数，S为样本标准差，n为样本个案数。例如，抽样调查某市居民的人平住房面积，根据报纸资料建立的研究假设H1与虚无假设H0分别为：Ht∶μ1＞4.6平方米H0∶μ0＝4.6平方米现抽取900户居民做调查，得每户人平住房面积X=5平方米，S=3平方米。若确定α为0.01，查Z值表得否定域的临界值｜Z0.01｜=2.33（一端），再计算Z■值：最后比较Z■与｜Z0.01｜，因Z■=4＞｜Z0.01｜=2.33，所以否定H0，即每户人平住房面积大于4.6平方米的研究假设是可以接受的。（2）对于比率的检验：式中，Zp为根据比率计算的Z值，P为样本比率，P0为虚无假设的总体比率，n为样本个案数。现据上例资料建立假设：人平住房面积大于4.6平方米的住户在总体中占60％以上，即H1：P1＞60％H0∶P0＝60％若α≤0.01（一端），查表得：｜Z0.01｜≥2.33已知n=900，对这900户统计出人平住房面积大于4.6平方米的住户占63％，即P=63％，则：最后比较：2.33，所以承认H0，即对总体中人平住房面积大于4.6平方米的住户占60％以上的研究假设不能接受。此外，Z检验还用于两个平均数差异、两个比率差异的假设检验。其检验的具体步骤与上述相同，只是计算Z值的公式应改为：上述两式中，■1与■2、P1与P2、S1与S2、n1与n2分别为两个样本的平均数、比率、标准差和个案数。在社会统计中作Z检验还须注意：（1）它只能对定距或定比类型的随机变量作假设检验；（2）只能对单个或两两成对的参数值作检验；（3）总体必须为正态分布；（4）不便对总体的相关程度与方差作假设检验。（李少文）〔G系数〕（Gammacoefficient）计量两个定序变量之间相关程度的统计值。它的计算公式为：式中，N■表示同序对的数目，Nd表示异序对的数目。同序对是指每一对个案在两个定序变量上排列次数相同的对，异序对是指每一对个案在两个定序变量上次序相反的对。例如有甲乙丙丁四人，他们在“文化程度”与“工作能力”这两个定序变量上的排列次序为：甲的文化程度比乙高，甲的工作能力也比乙高，则甲乙二人这一对个案便是同序对；若丙的文化程度比丁高，但工作能力比丁低，则丙丁二人这一对个案就是异序对。这种情况可用交互分类表的简单形式表示为：文化程度上表中的同序对是甲乙这一对，Ns=1：异序对是丙丁这一对，Nd＝1。对于几种常用的交互分类表的同序对和异序对的计算规则可表示为：Nd＝c·dNs=a·（d+f）+c·fNd＝e·（d+b）+c·bNs＝a·（e+f）＋b·fNd＝d·（b+c）+e·cNs=a·（e+h+f+i）+d·（h+i）+b·（f+i）+e·iNd＝g·（e+b+f+c）+d·（b＋c）+h·（f+c）+e·c上面四个交互分类表各格中的字母a、b、c、d、e、f、g、h、i均表示个案数或两个变量交互分类的次数。例如调查了1000人的文化程度与工作能力，制成交互分类表：表中的■G系数的■值在-1与1之间变动。例中计算出的G系数说明：文化程度与工作能力成较强的正相关，其相关程度为0.71。G系数具有消减误差比例的性质，上例说明若以人们的文化程度去预测工作能力，可以减少71％的误差。（李少文）〔λ系数〕（Lambdacoefficient）计量两个定类变量之间相关程度的一个统计值，其计算公式为：式中，fim表示x变量每一类别中y变量分配的众数次数，Fym表示y变量边缘次数分配的众数次数，n为总次数或总体个案数，Σ为总和符号。计算λ系数时，先要将两定类变量的次数分配制成交互分类表，然后依照上述公式计算。例如，现有如下两个定类变量资料制成的交互分类表：性别与最大志愿的关系从表中x变量每一类别来看y变量的次数分配，其众数次数在“男”这一类别中为58，在“女”这一类别中为68，所以Σfim=58+68=126；从y变量的边缘次数分配看，其众数次数Fym=90，n=164，所以，λ系数除了能表示两定类变量之间的相关程度之外，它还具有消减误差比例的性质。消减误差比例即指当两个变量具有相关关系时，利用其中的自变量去预测因变量的数值时，比不利用自变量去预测要准确，也就是能够减少预测的误差。比如上例中的λ系数为0.49，即表示青年人的性别与最大志愿这两个变量之间的相关程度为0.49，同时，还表示用性别变量去预测青年人的最大志愿时，能够减少49％的误差。这对于社会学研究有重要意义，社会学研究的目的之一是要用一种社会现象去解释和预测另一种社会现象，那么误差越小、解释和预测越准确越好。（李少文）〔Ty系数〕（Tau-ycoefficient）计量两个定类变量或一个定类变量与一个定序变量之间相关程度的统计值。其计算公式为：■式中，■为交互分类各次数平方和除以相对应X变量边缘次数分配的商相加的总和，ΣF2yj为Y变量边缘次数分配的平方和，n为总次数。例如对某一乡村地区青年按性别（定类变量）与文化程度（定序变量）分类的资料制成交互分类表：青年性别与文化程度的关系先计算：■再计算：■τy系数的值在0与1之间变动。上例τy=0.19表明，该乡村地区青年的性别与文化程度之间存在着相关，其相关程度为0.19，说明该乡村地区对女青年文化程度的提高重视不够。τy系数具有消减误差比例的性质，如上例中的τy系数为0.19，即说明若用性别（自变量）去预测文化程度（因变量）的误差时，能减少19％的误差τy系数与λ系数都能计量两个定类变量之间的相关程度，但τy比λ能更充分地利用交互分类表中的数据，因此用τy系数较为精确，特别是当X变量各类别的众数次数都集中在同一横行时，λ便无法计算，而τy仍能测量出两变量间的相关程度。（李少文）〔X理论——Y理论〕（TheoryX-TheoryY）是建立在对人性的不同假定基础上的两种相反的管理观点。它是由美国社会心理学家麦克雷戈（D·McGregor）在1960年所著《企业的人性方面》（HurnanSideofEnterprises）一书中提出的。麦格雷戈围绕“人的本性”，论述了人类行为规律及其对管理的影响。他认为，每一个管理人员对其下属职工的看法实际上均有一套假定，并以此作为管理的出发点。这些假定可以归纳为两类，即所谓X理论和Y理论。麦格雷戈把那种建立在错误的人性假定上的管理观点称为X理论。X理论关于人性的假定要点是：（1）人的天性是厌恶工作的，只要有可能就会逃避工作。（2）大多数人要求安全高于一切，不愿负责。（3）人生来就以自我为中心，漠视组织的需要。（4）一般人都需要指挥和控制。持有上述看法的管理者，就喜欢采取“命令与统一”、“权威与服从”的传统管理方式。麦格雷戈提出了与这种X理论相对立的一种新管理观点，他称之为Y理论，其对人性的假定要点是：（1）要求工作是人的本能，如果工作环境好的话，工作如游戏般自然。（2）在适当条件下，人们不但愿意而且能够主动承担责任。（3）个人的需求与组织的需要并不矛盾，而是可以统一起来的。（4）在适当的激励下，人们能够自我指挥和自我控制。按照Y理论，企业管理应该注意发挥职工的积极性和主动性，用“启发和诱导”代替“命令与服从”。麦格雷戈的上述观点在西方企业界引起了广泛的重视，在企业管理中得到了实际的运用。但也有人批评其过于理想化和绝对化。（史昭乐）

F检验

百科全书 · 相关知识