在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
频率分布是示出数据集中的数据点的频率的表。 表中的每个条目包含特定组或间隔内的值的出现频率或计数,并且以这种方式,表概括了样本中的值的分布。 SAS提供了一个称为PROC FREQ的过程来计算数据集中数据点的频率分布。
语法SAS中计算频率分布的基本语法是: PROC FREQ DATA = Dataset ; TABLES Variable_1 ; BY Variable_2 ; 以下是使用的参数的描述:
单变量频率分布我们可以使用PROC FREQ确定单个变量的频率分布。 在这种情况下,结果将显示变量的每个值的频率。 结果还显示百分比分布,累积频率和累积百分比。 例在下面的例子中,我们找到名为CARS1的数据集的变量马力的频率分布,该数据集是从库SASHELP.CARS创建的。 我们可以看到结果分为两类结果。 一个为汽车的每一个。 PROC SQL; create table CARS1 as SELECT make,model,type,invoice,horsepower,length,weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc FREQ data=CARS1 ; tables horsepower; by make; run; 当执行上面的代码中,我们得到以下结果: 多变量频率分布我们可以找到多个变量的频率分布,将它们分组成所有可能的组合。 例在下面的例子中,我们计算按汽车类型分组的汽车制造的频率分布,以及按每种制造分组的每种类型汽车的频率分布。 proc FREQ data=CARS1 ; tables make type; run; 当执行上面的代码中,我们得到以下结果: 频率分布与重量使用权重选项,我们可以计算用变量的权重偏置的频率分布。 这里,变量的值被取为观察值的数量,而不是值的计数。 例在下面的例子中,我们计算变量make和type的频率分布,分配给马力的权重。 proc FREQ data=CARS1 ; tables make type; weight horsepower; run; 当执行上面的代码中,我们得到以下结果: |
请发表评论