方差分析(Analysis of Variance,简称ANOVA),用于比较多个总体的均值是否想等,由英国统计学家费希尔(Fisher)首先引入。目前已经广泛应用于分析心理学、生物学、工程和医药的试验数据。
消费者与产品生产者、销售者或服务提供者之间经常发生纠纷。当发生纠纷后,消费者常常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售、旅游业、航空公司、家电制造业抽取了不同的企业作为样本。其中所抽取零售业7家、旅游业6家、航空公司5家、家电制造业5家。每个行业中抽取的这些企业,服务对象、服务内容、企业规模等方面基本上相同的。然后统计出最近一年中消费者对总共23家企业投诉的次数,结果如下表:
问题:我们想知道这几个行业之间的服务质量是否有显著差异?
一般来说,被投诉次数越多,说明服务质量越差。
要分析这四个行业之间的服务质量是否有显著差异,其实就是要判断行业(自变量)对被投诉次数(因变量)是否有显著影响。
相关术语
1、图形描述
绘制出被投诉次数和行业的散点图,如下图所示。
从散点图可以看出,不同行业被投诉的次数是有明显差异的,而且,在同一个行业,不同企业被投诉的次数也明显不同。例如,家电制造业被投诉次数最多,航空公司被投诉次数较少,表明行业与被投诉次数之间有一定的关系。
说明:上方的图形通过Excel绘制,绘制折线图,然后调整样式。
2、误差分解
仅仅从散点图上观察还不能提供充分的证据证明不同行业被投诉次数之间有显著差异,也许这种差异是由抽样的随机性造成的,因此,需要更加准确的方法来检验这种差异是否显著,也就是所谓的方差分析。
在方差分析中,误差通过平方和来表述。
根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。当方差分析中只涉及一个分类型自变量时称为单因素方差分析。
单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,例如前面的例子,分析这四个行业之间的服务质量是否有显著差异。
方差分析分为三步:
1、提出假设
2、构造检验的统计量
3、统计决策
具体操作如下:
第1步:提出假设
第2、3步:构造检验的统计量及统计决策,具体计算公式及相关理论如下:
说明:Excel、SPSS等分析工具可以直接给出分析结果,所以具体计算及理论可不必深究!
下面通过单因素方差来解决前面提出的问题:
问题:我们想知道这几个行业之间的服务质量是否有显著差异?
第1步:提出假设
第2、3步:构造检验的统计量及统计决策,这里通过Excel数据分析库直接给出,具体操作如下。
这里需要用到Excel中的“数据分析”库,需要设置才能显示出来,设置方法如下。
1、文件-选项,打开如下对话框,选择加载项
2、选择“Excel加载项”,单击按钮“转到”,勾选分析工具库、分析工具库-VBA
经过以上操作,Excel中的“数据”标签最右侧会出现“数据分析”按钮。
下面通过Excel里面的“数据分析”库进行单因素方差分析:
1、单击“数据”-“数据分析”
2、选择“单因素方差分析”
3、输入区域,选择数据区域,选择范围如下图红色框线指示的区域,勾选“标志位于第一行”(因为我们选择的区域包含字段名),输出区域选择下方任意空白处
4、单击确定后,Excel会直接给出单因素方差分析的结果
分析结果说明:
Excel给出的分析结果分两块:
1、SUMMARY(概述)
数据的描述性统计量:观测数、求和、均值和方差。
2、方差分析表
关于方差分析的相关结论:
说明:从前面可以看出,进行方差分析需要进行大量的计算工作,手工计算十分繁琐,通过Excel数据分析库可以很轻松地得到结论。
统计决策:
这里看到P值约为0.04,比较小,所以拒绝原假设,即不同行业的被投诉次数的均值不完全相同。
结论:不同行业的被投诉次数的均值不完全相同,即行业对被投诉次数的影响是显著的。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。