相关性
相关性并不总是意味着一个导致另一个。很有可能有第三个因素参与其中。
相关性通常有两个方向之一。这些是正的或负的。如果是正的,那么这两组数据就会一起上升。如果是负的,那么一个上升而另一个下降。
在不同的情况下,有很多不同的相关性测量方法。例如,在散点图上,人们画一条最佳拟合线来显示相关的方向。
这个散点图是正相关的。你可以知道,因为趋势是向上和向右的。红线是一条最佳拟合线。
解释关联性
强和弱是用来描述相关性的词。如果有强相关性,那么这些点都是紧密相连的。如果是弱相关,那么这些点都是分散的。有一些方法可以使数字显示相关性有多强。这些测量被称为相关系数。最著名的是皮尔逊积点相关系数(Pearson product-moment correlation coefficient)。你把数据输入一个公式,它就会给你一个数字。如果这个数字是1或-1,那么就有很强的关联性。如果答案是0,那么就没有相关关系。另一种相关系数是Spearman等级相关系数。
相关性与因果关系
相关性并不总是意味着一件事导致另一件事(因果关系),因为其他东西可能导致这两件事。例如,在炎热的日子里,人们会购买冰淇淋,人们也会去海滩,在那里有些人被鲨鱼吃掉。冰淇淋的销售和鲨鱼袭击之间存在着相关性(在这种情况下,它们都随着温度的上升而上升)。但是,冰激凌销售量上升并不意味着冰激凌销售量导致更多的鲨鱼袭击(因果关系),反之亦然。
因为相关关系并不意味着因果关系,科学家、经济学家等会通过创造孤立的环境,在其中只改变一个因素(如果这是可能的)来测试他们的理论。然而,政治家、推销员、新闻机构和其他人经常暗示,某个特定的相关性意味着因果关系。这可能是由于无知或希望劝说的缘故。因此,新闻报道可能通过说更经常消费某种产品的人有某种健康问题来吸引人们的注意,暗示一种因果关系,而实际上可能是由于其他原因。
相关页面
- Cohen, J., Cohen P., West, S.G., & Aiken, L.S. (2003).行为科学的应用多元回归/相关分析。(第三版) Hillsdale, NJ: Lawrence Erlbaum Associates.
问题和答案
问:什么是相关性?答:相关性是表示两组数据密切相关程度的一种方法。
问:相关性是否意味着一组数据会导致另一组数据?
答:不,相关性并不总是意味着一组数据导致另一组数据。事实上,这往往涉及到第三个因素。
问:相关性的两个方向是什么?
答:相关性的两个方向是正相关和负相关。
问:正相关是什么意思?
答:正相关意味着两组数据一起上升。
问:负相关是什么意思?
答:负相关意味着一组数据上升,另一组数据下降。
问:有不同的相关性测量方法吗?
答:有,在不同的情况下会使用很多不同的相关性测量方法。
问:人们通常如何在散点图上显示相关性的方向?
答:人们通常在散点图上画一条最佳拟合线来表示相关性的方向。