斯皮尔曼等级相关系数
在数学和统计学中,Spearman's rank correlation coefficient是一种相关度量,以其制造者Charles Spearman命名。It is written in short as the Greek letter rho ( ρ {\displaystyle \rho } ) or sometimes as r s {\displaystyle r_{s}} 。.它是一个显示两组数据之间紧密联系的数字。它只能用于可以按顺序排列的数据,如从高到低。
r s {displaystyle r_{s}}的一般公式为ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {displaystyle \rho =1-{cfrac {6sum d^{2}}{n(n^{2}-1)}}}。.
例如,如果你有不同电脑价格的数据,以及电脑速度的数据,你可以用r s {\displaystyle r_{s}}来查看它们是否有联系,以及它们的联系有多紧密。.
解决问题
第一步
要计算出r s {displaystyle r_{s}},你首先要对每一个数据进行排序。我们将使用计算机及其速度介绍中的例子。
所以,价格最低的电脑会有1级。比它高的就会有2。然后,一直往上走,直到全部排名完毕。你必须对两组数据都这样做。
价格($) | R a n k 1 {\displaystyle Rank_{1}}。 | 速度(千兆赫) | R a n k 2 {\displaystyle Rank_{2}}。 | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
第二步
接下来,我们要找到两个等级之间的差。Then, you multiply the difference by itself, which is called squaring.The difference is called d {displaystyle d} , and the number you get when you square d {displaystyle d} is called d 2 {displaystyle d^{2}} 的差值。.
R a n k 1 {\displaystyle Rank_{1}}。 | R a n k 2 {\displaystyle Rank_{2}}。 | d {displaystyle d} | d 2 {displaystyle d^{2}}。 |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
第三步
数一数我们有多少数据。这个数据有1到5的等级,所以我们有5条数据。这个数字叫做n {/displaystyle n} 。
第四步
最后,使用我们目前所研究出的一切公式:r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6/sum d^{2}}{n(n^{2}-1)}}}。.
∑d 2 {\displaystyle \sum d^{2}}表示我们取列d 2 {\displaystyle d^{2}}中所有数字的总和。.这是因为∑{{displaystyle \sum }意味着总。
所以,∑d 2 {displaystyle {sum d^{2}}是1+1+1+1 {displaystyle 1+1+1+1},就是4,公式中说乘以6,就是24。
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)}为5×( 25 - 1 ) {\displaystyle 5\times (25-1)},即120。
所以,要找出r s {\displaystyle r_{s}}。, 我们只需做1 - 24 120 = 0.8 {\displaystyle 1-{\cfrac {24}{120}}=0.8} .
因此,这组数据的Spearman秩相关系数为0.8。
这些数字意味着什么
r s {\displaystyle r_{s}}总是给出一个介于-1和1之间的答案,之间的数字就像一个刻度,其中-1是很强的联系,0是没有联系,1也是很强的联系。1和-1之间的区别在于,1是正相关,-1是负相关。一个r s {\displaystyle r_{s}}值为-1的数据图,除了线和点会从左上角到右下角外,其他都是如图所示。
例如,对于我们上面做的数据,r s {\displaystyle r_{s}}为0.8。所以,这意味着有一个正相关。因为它接近于1,所以意味着这两组数据之间的联系很强。所以,我们可以说,这两组数据是有联系的,而且是一起上升的。如果是-0.8,我们可以说它是有联系的,一个上升,另一个就会下降。
如果两个数字相同
有时,在对数据进行排名时,有两个或多个数字是相同的。当这种情况发生在r s {displaystyle r_{s}}中时,就会出现这种情况。我们取相同等级的平均数或平均值。这些被称为并列行列。要做到这一点,我们把并列的数字排成不并列的样子。然后,我们把它们的排名相加,除以它们的数量。例如,假设我们要对不同人在拼写测试中的表现进行排名。
测试成绩 | 排名 | 排名(含并列) |
4 | 1 | 1 |
6 | 2 | 2+3+4 3=3 {\displaystyle {\tfrac {2+3+4}{3}}}=3}。 |
6 | 3 | 2+3+4 3=3 {\displaystyle {\tfrac {2+3+4}{3}}}=3}。 |
6 | 4 | 2+3+4 3=3 {\displaystyle {\tfrac {2+3+4}{3}}}=3}。 |
8 | 5 | 5+6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}。 |
8 | 6 | 5+6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}。 |
这些数字的使用方式与普通等级完全相同。
相关网页
问题和答案
问:什么是Spearman's rank correlation coefficient?答:斯皮尔曼等级相关系数是一种衡量相关性的方法,显示两组数据之间的联系有多紧密。它只能用于可按顺序排列的数据,如从高到低。
问:谁创造了斯皮尔曼的等级相关系数?
答:查尔斯-斯佩尔曼创造了斯佩尔曼等级相关系数。
问:斯皮尔曼等级相关系数的一般公式是怎样写的?
答:斯皮尔曼等级相关系数的一般公式写为ρ=1-6∑d2/n(n2-1)。
问:什么时候应该使用Spearman等级相关系数?
答:当你想看两组数据的联系有多紧密,以及它们是否有联系时,你应该使用斯皮尔曼等级相关系数。
问:它适用于什么类型的数据?
答:它适用于任何类型的数据,可以按顺序排列,如从高到低。
问:你能举个例子说明你将在什么情况下使用这一措施吗?
答:使用这种方法的例子是,如果你有不同的计算机有多贵的数据,以及计算机有多快的数据,那么你可以用r_s查看它们是否有联系,以及它们的联系有多紧密。