作者丨Yomi

来源丨医数思维云课堂(ID:Datamedi)


01 IBM SPSS Modeler简介

作为 IBM 分析与预测解决方案的重要组成部分, IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立 预测性模型 ,并将其应用于商业活动,从而改进决策过程。随着于 2010 年其新版本 14.1 的发布,名字也由 PASW Modeler 更名为现在的 IBM SPSS Modeler

Modeler是第一款以 图形化“语法” 为用户界面的数据挖掘软件。Modeler拥有丰富的 数据挖掘算法 ,操作简单易用,分析结果直观易懂,图形功能强大,支持与数据库之间的数据和模型交换,可以使用户方便快捷地实现数据挖掘。

SPSS Modeler 提供了各种借助 机器学习、人工智能和统计学的建模 方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。其操作与数据分析的一般流程相吻合。数据分析通常通过 数据收集、数据预处理、模型建立、模型评价 等环节。Modeler形象地将这些环节表示成若干个节点,将数据分析过程看作数据在各个节点之间的流动,并通过 图形化的数据流 方式,直观表示整个数据挖掘的各个环节。

02 熟悉界面

典型的 SPSS Modeler 界面如下:

随着对 SPSS Modeler 的熟悉,您可以在收藏夹自定义常用的选项板内容。

4.使用节点和流

要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。已添加到流工作区的节点在连接之前不会形成数据流,可以将各个图标连接以创建一个表示数据流动的流,节点之间的连接指示数据从一项操作流向下一项操作的方向。

创建了流以后,可以对流进行保存、添加注解,将其添加到工程。从文件主菜单中,选择流属性还可以为流设置各种选项,如优化、日期和时间设置、参数和脚本。使用流属性对话框中的消息选项卡,可以轻松查看有关运行、优化和模型构建和评估所用时间等流操作有关的消息,流操作的错误消息也将在这里报告。

5.SPSS Modeler 管理器

可以使用 流选项卡 打开、重命名、保存和删除 在会话中创建的多个流。