Spotfire® 用户指南

数据关系卡方独立性检验算法

“卡方”选项用于在假设数据表中不存在空值的前提下计算 p 值。

注: 如果数据表中存在空值,则首先要减少数据表行数,仅保留第一列和第二列均包含值的行。

使用 n 表示值的总数;I 表示第一列中唯一值的数目;J 表示第二列中唯一值的数目。另外,对于 i = 1, ..., I,使用 ni 表示第 i唯一值出现的次数;对于 j = 1, ..., J,使用 nj 表示第 j唯一值出现的次数。现在,如果使用 nij 表示第一列包含第 i唯一值、第二列包含第 j唯一值的行数,则 Pearson 卡方统计量计算公式如下所示:



自由度为 (I-1)(J-1)

然后,根据自由度为 (I-1)(J-1) 的卡方分布计算 p 值。

引用

Rice, John A.,Mathematical Statistics and Data Analysis,2nd ed.,p 489-491。