SAS – 相关分析

SAS – 相关分析


相关分析处理变量之间的关系。相关系数是衡量两个变量之间线性关联的指标。相关系数的值始终介于 -1 和 +1 之间。SAS 提供过程PROC CORR来查找数据集中一对变量之间的相关系数。

句法

在 SAS 中应用 PROC CORR 的基本语法是 –

PROC CORR DATA = dataset options;
VAR variable;

以下是所用参数的描述 –

  • 数据集数据集的名称。

  • 选项是带有绘制矩阵等程序的附加选项。

  • 变量是用于查找相关性的数据集的变量名称。

例子

数据集中可用的一对变量之间的相关系数可以通过在 VAR 语句中使用它们的名称来获得。 在下面的示例中,我们使用数据集 CARS1 并获得显示马力和重量之间相关系数的结果。

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

执行上述代码时,我们得到以下结果 –

corr_ana_2

所有变量之间的相关性

可以通过简单地应用具有数据集名称的过程来获得数据集中所有可用变量之间的相关系数。

例子

在下面的示例中,我们使用数据集 CARS1 并获得显示每对变量之间相关系数的结果。

proc corr data = cars1 ;
run;

执行上述代码时,我们得到以下结果 –

corr_ana_1

相关矩阵

我们可以通过在PROC语句中选择绘制矩阵的选项来获得变量之间的散点图矩阵

例子

在下面的例子中,我们得到了马力和重量之间的矩阵。

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

执行上述代码时,我们得到以下结果 –

corr_ana_3

觉得文章有用?

点个广告表达一下你的爱意吧 !😁