作者丨Yomi
来源丨医数思维云课堂(ID:Datamedi)
01
IBM SPSS Modeler简介
作为 IBM 分析与预测解决方案的重要组成部分,
IBM SPSS Modeler
是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立
预测性模型
,并将其应用于商业活动,从而改进决策过程。随着于 2010 年其新版本 14.1 的发布,名字也由 PASW Modeler 更名为现在的
IBM SPSS Modeler
。
Modeler是第一款以
图形化“语法”
为用户界面的数据挖掘软件。Modeler拥有丰富的
数据挖掘算法
,操作简单易用,分析结果直观易懂,图形功能强大,支持与数据库之间的数据和模型交换,可以使用户方便快捷地实现数据挖掘。
SPSS Modeler 提供了各种借助
机器学习、人工智能和统计学的建模
方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。其操作与数据分析的一般流程相吻合。数据分析通常通过
数据收集、数据预处理、模型建立、模型评价
等环节。Modeler形象地将这些环节表示成若干个节点,将数据分析过程看作数据在各个节点之间的流动,并通过
图形化的数据流
方式,直观表示整个数据挖掘的各个环节。
02
熟悉界面
典型的 SPSS Modeler 界面如下:
随着对 SPSS Modeler 的熟悉,您可以在收藏夹自定义常用的选项板内容。
4.使用节点和流
要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。已添加到流工作区的节点在连接之前不会形成数据流,可以将各个图标连接以创建一个表示数据流动的流,节点之间的连接指示数据从一项操作流向下一项操作的方向。
创建了流以后,可以对流进行保存、添加注解,将其添加到工程。从文件主菜单中,选择流属性还可以为流设置各种选项,如优化、日期和时间设置、参数和脚本。使用流属性对话框中的消息选项卡,可以轻松查看有关运行、优化和模型构建和评估所用时间等流操作有关的消息,流操作的错误消息也将在这里报告。
5.SPSS Modeler 管理器
可以使用
流选项卡
打开、重命名、保存和删除
在会话中创建的多个流。