后面连接的是透视(Insight)节点。数据划分(Data Partition)节点是唯一的先节点。点击
Data Partition旁的加号(),然后点击SAS_DATA_SETS旁的加号() ,显示的3个数据集合分别代表训练(TRND0ZNN)、验证(VALLTOB0)以及测试数据集合(TSTMUDA1)。如果点击一个sas数据集合,划分的数据类别显示在树图下面的描述栏。
在导入地图(Imports Map)窗口的底部选择
返回到数据(Data)标签。
点击数据(Data)标签的
,数据集合详情(Data Set Details )窗口出现,信
息(Information)标签处于活动状态。这个标签显示的是这个数据集合建立的时间以及它包含的行数和列数。
选择浏览表格(Table View)标签.
这个标签让你以表格的形式浏览当前选择的数据集合。通过点击选择盒你可以看到使用变量标签的名称。如果变量没有相关的标签,选择盒显示SAS变量名。关闭数据集合详情(Data Set Details )窗口返回到透视(Insight)节点主对话框。
选择全部数据集合(Entire data set) 在全部数据集合上运行透视(Insight)节点。 注意: 不要把很大的数据表装入透视(Insight)节点。如果数据表太大,在一个适当的样本上运行透视(Insight)节点通常会足够用来探索数据。
在新设置情况下运行透视(Insight)节点: 1 关闭透视(Insight)节点对话窗口。 2 在弹出对话框询问是否储存改动时,选择 3 从透视(Insight)节点运行流程图。
。.
4 在弹出对话框询问是否查看结果时,选择 。
注意: 你还可以在不关闭透视(Insight)节点对话框的情况下运行透视(Insight)节点。在工具箱上选择Run图标(
) ,在弹出对话框询问是否查看结果时,选择
。
在作进一步动作之前,确定透视(Insight)窗口处于活动状态。 从EM顶上的菜单中选择
查看每一个变量的分布。
1从透视(Insight)窗口上面的菜单中选择
2 把变量单上的所有变量涂黑。 3 选择 Y. 4 点击
连续变量的图表包括直方图、箱线图、以及几个描述统计量。变量LOAN 的部分输出显示如下:
滑动鼠标直到看到REASON变量的图形。没有标签的水平代表缺失REASON值的那些观测记录。
向下移动鼠标并查看YOJ的分布 (很斜的)和DEROG 的分布(有很大比率的观测记录值为DEROG=0). 注意DEROG > 0的观测记录相当少。
查看完这些分布后返回主流程图。 1 关闭分布窗口。
2 关闭透视(Insight)数据表. 3 如果以前你运行透视(Insight)节点时没有关闭该节点,关闭该透视(Insight)节点(在弹出对话框询问是否储存改动时,选择
进行变量转换
)
在你浏览了透视(Insight)节点的结果后,你会发现有些变量的分别特别偏。在特别偏的分布里,很小比例的点可能具有很大的影响。有时对输入变量进行转换会产生较好的拟和模型。为此,加入变量转换(Transform Variables)节点如下所示。
连接完节点之后,右击鼠标并选择Open以打开该节点。按缺省变量(Variables)标签会出现,它显示区间变量的统计量,例如均值、标准差、偏度和峰度(从元数据样本计算而来)。
变量转换(Transform Variables)节点可使用标准转换来快速转换区间变量。你还可以创建新变量,其数值由数据集合中其它变量计算得出。这个对话框可用的列是标有Keep 的列。你可以通过右击适当的行或者使用Actions主菜单修改计算列的公式。 你可以象在输入数据源(Input Data Source)节点里一样浏览每一个变量的分布。右击YOJ 这一行并选择浏览分布(View Distribution)可以浏览YOJ的分布。
考虑YOJ 的对数转换。这个转换是变量转换(Transform Variables)节点提供的几个简单

