问题:
推荐关注评论 举报
问题logo

crystalism

[学长]
已解决

谁能用浅显的语言帮忙解释下什么是卡方分析?

50分
标签:卡方 网络资料 议题 报纸 语言
回答:2   浏览:3361   提问时间:2009-03-28 19:25
哪位高手能帮忙举个简单的例子说明下什么叫卡方分析,什么情况下需要用到卡方分析,以及如何运用?例如,我想要研究两份报纸对同一个议题在报道主题上的差异,此时时候需要使用到卡方分析。我看所有相关研究中都有X的平方、df和p这三个东西,到底是什么意思呀??
谢谢!!!
2009-03-29 12:26 补充问题
请高手直接回答问题,不要贴网络资料好么。谢谢。
最佳答案 最佳答案 此答案由提问者自己选择,并不代表爱问知识人的观点
揪错评论 举报

sjg921

[智慧天尊] 向sjg921提问
卡方分析

卡方分析是用来研究两个定类变量间是否独立即是否存在某种关联性的最常用的方法。简单地说,卡方分析的方法是这样的:假设两个变量是相互独立,互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表见例1;如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。这种差值用一个卡方 统计量来表示;对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。

  要注意的是,卡方检验受样本量的影响很大,同样两个变量,不同的样本量,可能得出不同的结论。解决这个问题的办法是对卡方值进行修正,最常用的是列联系数。对较大样本,当卡方检验的的结果显著,并且列联系数也显著时(列联系数至少超过0.16),才可拒绝原假设;当卡方检验的结果显著,列联系数不显著时,不能轻易下结论。

  另外,对变量取值的不同分类会引起卡方值的改变,有可能得到不同的结论。所以在分类时不能随意,要有理论或统计上的依据。特别是对定距或定序变量,要先将变量的取值分组归类,才能使用卡方分析,而且由于分组的方法不同,也会得出不同的结论;同时,对于定距或定序变量用卡方分析,没有充分利用它们的数量信息。这都是在使用卡方分析时要注意的问题。

例:在《A品牌宣传认知情况调查》中有几个关于对广告的看法和态度的问题,其中一题是” “家电广告应当比较严谨,因为这样的方式更适合于表现家电的性能”,备选答案有“1-非常不同意”、“2-不同意”、“3-一般”、“4-同意”、“5-非常同意”5种选择。要研究对这个问题的看法与年龄有没有关系,可以使用卡方分析的方法。

  其中年龄的变量名是NND2,其取值1代表16~29岁,2代表30~39岁,3代表40~49岁,4代表50~60岁;前面所说题目的变量名是B106,为避免列联表中空格过多,在做卡方分析之前用SPSS中的Recode命令将B106的取值做变换,将“非常不同意”和“不同意”两个变量合并,用1代表,“一般”用2 代表,“同意”和“非常同意”用3代表。表16-3是用SPSS的Crosstables命令得出的两变量的卡方分析结果。

  结果中的表格叫做列联表,列联表包含了两变量取值的频数和百分比的大量信息。表中右下角的479是去掉22个缺失值之后的有效样本量;最右边一列数是行变量NND2的四个取值的频数和对有效样本量的百分比;最下边两行数是列变量B106的三个取值的频数和对有效样本量的百分比。表中每个格子中的四个数依次是:两个变量分别取某一值时的频数、行百分比、列百分比、总百分比。

  比如,第二行第三列的格子中的四个数分别表示:年龄在30~39岁且“同意”和“非常同意”(NND2取值为2,B106取值为3)的有94人;行百分比67.6表示这94人占139人的67.6%;列百分比28.5表示这94人占330人的28.5%;总百分比19.6表示这94人占479人的19.6%。

  结果中的皮尔逊卡方值(Pearson Chi-Square)是16.10219,显著度为0.01322,若在0.05的显著水平下进行检验,是显著的,参看列联系数(Contingency Coefficient)也是显著的,所以能够拒绝两变量不相关联的假设,对例3中关于家电广告说法的同意与否和年龄变量有关。

  列联表中每个格子中所列百分比与最右边一列数的百分比相比较可以看出:50~60岁年龄段中“同意”和“非常同意”的百分比是25.5%,高于有效样本中该年龄段的百分比20.9%很多;16~29岁和30~39岁年龄段中“非常不同意”和“不同意”的百分比分别是29.6%和33.3%,均高于有效样本中相应年龄段的百分比23.8%和29.0%。这些数据的比较说明,年龄越大越倾向于“同意”和“非常同意”“ 关于家电广告”说法,越是年轻则越不同意该说法。

回答:2009-03-28 19:27
提问者对答案的评价:

其它回答 共1条回答
评论 举报
回答logo

diguaganw_8t3jl

[学长] 向diguaganw_8t3jl提问
卡方分析的方法是这样的:假设两个变量是相互独立,互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表见例1;如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。这种差值用一个卡方 统计量来表示;对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。
 例如, 笔者在指导某跨国汽车企业的时候,客户需要研究不同国家的客户与使用车型之间的关联程度,以此为例,将表一中的三列数据“国家”、“车型”和“数量”分别输入到最新版的JMP7和Minitab15中,想得到汇总数据的列联表和卡方分析的结果。国家车型数量美国人家用型74美国人工作型18美国人运动型23欧洲人家用型15欧洲人工作型4欧洲人运动型21日本人家用型66日本人工作型26日本人运动型56

  表一 卡方分析的原始数据

  对比项目一:操作的便捷性。

  JMP的操作路径为:主菜单Analyze > Fit Y By X,确定Y、X、Freq三项后,即可得到如图一所示的报表;Minitab的操作路径为:主菜单Stat > Table > Cross Tabulation and Chi-Square,确定Rows、Columns、Frequencies三项后,再在Display、Chi-Square选项中做一定设置,即可得到如图二所示的报表。显然,Minitab的操作步骤稍微多了一些。其实Minitab还有另外一条可以实现卡方分析的菜单:Stat > Table > Chi-Square Test(Two-Way Table in Worksheet),但是分析内容重复,而且行变量表头以“1、2”表示,不能体现实际意义,还增加了菜单的复杂程度,感觉不如不要。

  





  图一 JMP的输出结果

  





  图二 Minitab的输出结果

  对比项目二:统计分析的具体内容。

  具体内容由两部分组成:列联表中各单元格的计数和比例;卡方分析中两种不同方法(Pearson法和似然比率法)的P值。JMP和Minitab的输出结果都是一致的,这说明两种软件背后所遵循的统计原理其实都是一样的。当然,正如大家所知道的,JMP的输出报表可以自定义,如调整小数点后的保留位数、自动将转换为数据表等等,因此显得更专业、更友好一些。

  对比项目三:统计图形的效果。

  Minitab完全是通过数字、表格来表现卡方分析的,而JMP在传统分析的基础上,还用如图三所示的“马赛克图(Mosaic Plot)”来表现不同国家的客户在选择汽车车型上的异同之处,使很多不太懂统计的人也能看懂一些明显的统计结论,使很多精通统计的人也能加深对统计结论的理解。相比之下,Minitab显得太教条、太呆板了。

  





  图三 JMP的Mosaic图

  对比项目四:统计分析的拓展性。

  JMP和Minitab都在卡方检验的基础上整合了Fisher's exact test和Mantel-Haenszel-Cochran's test等内容。但值得一提的是,JMP还在此处恰当地引入了“对应分析Correspondence analysis”的概念,并且还可以用如图四所示的统计图形展现出来对应分析的结果,此例就生动地揭示出不同国家的客户对不同的汽车车型的偏好:欧洲人喜欢运动型汽车;欧洲人喜欢工作型汽车;美国人则喜欢家用型汽车。在这一点上,JMP的菜单结构非常适合普通用户分析同一个问题时,往往从最简单的情形着手,然后步步深入探索的分析思路,这一点与Minitab罗列统计分析工具让用户自行判断选择的做法有很大的不同,相形之下,Minitab更适合对软件背后的统计学原理有相当了解的用户使用,这样才能有效防止错用统计分析工具。

  





  图四 JMP的对应分析图形

  对以上四个项目比较关注、经常使用或认真研究的用户应该都会得出一个结论:JMP在“卡方分析”方面远胜于Minitab。JMP通过图形生动结合数据报表简明地展示出卡方分析的结果,更便于用户对分析结果的解读,对用户的统计学理论基础的要求也比较低,不像Minitab那样用单纯的数据报表进行分析结果的展现,理解起来比较费劲。另外JMP的嵌套式菜单能引导用户一步一步将分析深入下去,而使用Minitab的用户须事先对分析数据的思路有一个明确的认识才能进行分析。

  以上内容供各位网友参考,笔者还将认真研究和对比这两款主流六西格玛质量管理统计分析软件的异同,希望能帮助企业在进行六西格玛统计分析软件的选择时提供一些有价值的参考。

回答:2009-03-28 19:34
欢迎登录知识人
会员名:
密 码:
记住我的登录状态
·新浪会员请直接登录



© 2012 Sina.com 免责声明