收藏
0 有用+1
0

SPSSPRO

播报 讨论 上传视频
众言科技旗下在线数据分析平台
展开 2个同名词条
SPSSPRO(Scientific Platform Serving for Statistics Professional)是众言科技旗下基于 SaaS 模式的在线数据分析平台,主要面向高校师生、市场调研及科研人员提供数据处理与分析服务 [1] [4] 。该平台采用国产自研算法,截至当前已获得7项软件著作权、3项发明专利、2项外观专利、2项商标专利,完成国内软硬件环境适配,成为信创工委会信创产品知识图谱收录的唯一专业统计建模工具 [3-4] 。平台涵盖数据编码、异常值处理、个案筛选与生成变量等预处理功能,支持Excel、csv、sav等格式文件处理,具备描述性统计、差异性分析及统计建模等分析能力,可实现数据清洗、版本保存与智能分析报告生成 [1-2] 。其算法模型黑箱化设计简化了操作流程,用户通过数据输入即可自动生成符合科研规范的分析结果。目前累计为超过80万用户生成1000万份分析报告,服务对象包括教育部考试院、 中信银行 、中国石油某研究所等机构 [3-4] ,并为 全国大学生数学建模竞赛 提供技术支持及教育资源合作 [4]
软件名称
SPSSPRO
类    型
数据处理

功能简介

播报
编辑
SPSSPRO 是一款集成专业 统计方法 与数据算法于一体的在线式数据处理与分析平台 [2] 。可广泛运用于科研、商业、数据挖掘、问卷调查等领域。 [1]

1、数据处理

标签设置:标签是给 统计数据 中的数值赋予被解读的意义,贴上一个文本标签,如 1=男,2=女,计算只识别数字,但分析结果却可以以标签的形式呈现,能被被我们轻易解读,如果没有标签就会显得很吃力。 [1]
数据编码 :标签与编码是数据处理的第一步,是将原始数据转化成计算机能识别、计算同时又能被分析解读的关键步骤。SPSSPRO 支持对原始数据的进行自动编码与归类,如 字符型数据 会转置为 定类数据 ,并将其自动编码,保留原始字符为标签。 [1]
异常值处理:原始数据中掺杂异常值或者需要得到一份指定范围的纯净数据时需要借助异常值处理功能。SPSSPRO 支持异常值范围自定义,如数字缺失、数字范围、数据 波动范围 等;同时支持将异常值处置为 空值 或替换为 平均数 中位数 众数 等功能。 [1]
个案处理:个案处理是指对一个样本的所有数据进行管理操作,目的是排除重复、无效的样本,使得整个分析数据符合研究的预期设想。SPSSPRO支持重复、无效个案筛选,筛选结果可以直接剔除,也可以标记后用户自己决定。 [1]
生成 变量:生成变量是指在原始变量数据基础上,根据一定规则生成新的变量用以进一步研究,如:体重/身高 ² 可以得到 BMI 体质指数 ,用以衡量个体肥胖程度。SPSSPRO 支持求和、乘积、Z 标准化、中心化、对数转化等基础计算与 量纲 计算,支持自编公式等。 [1]

2、数据分析

SPSSPRO 支持 描述性统计分析 频数 、交叉汇总、 正态性检验 相关分析 等;差异性分析如独立 T 检验、 方差分析 、交叉 卡方检验 等; 统计建模 回归分析 ;问卷研究如信效度、多选题、 聚类分析 等。 [1]
  1. 1.
    频数 分析: 频数分析是对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。 [1]
  2. 2.
    描述性统计: 描述性统计分析是对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势。 [1]
  3. 3.
    分类汇总 根据定类变量分类进行汇总(按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。又名列联表分析) [1]
  4. 4.
    正态性 分析: 正态性检验用于检验数据是否满足正态分布,一些算法需要数据满足正态分布。(如单样本 t 检验,独立样本 t 检验等) [1]
  5. 5.
    相关性分析 相关分析是对变量两两之间的相关程度进行分析。相关分析的计算方式有 3 种,分别是 Pearson 相关系数(适用于定量数据,且数据满足正态分布)、Spearman 相关系数(数据不满足正态分布时使用),kedall's tau-b 相关系数(有序定类变量)。 [1]
  6. 6.
    方差分析 方差分析(单因素方差分析或 F 检验)用于定类字段(X)与 1 个或 1 个以上的定量字段(Y)之间的差异性研究。需要注意的是,一个定类字段称为单因素方差分析,两个定类字段及以上称为多因素方差分析,与独立样本 T 检验不同的是,方差分析可用于多分类定类字段数据的差异性分析,T 检验只能作用于二分类定类变量。 [1]
  7. 7.
    独立样本 T 检验: 独立样本 t 检验用于分析一个定类变量与一个或者多个定量变量之间有无明显差异,需要特别注意的是,该定类变量为二分类变量(三分类及以上使用方差分析),各分类频数可以不相等。
  8. 8.
    卡方检验 卡方检验(Pearson 卡方检验)主要是比较定类变量与定类变量之间的差异性分析。通过统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为 0,表明理论值完全符合。 [1]
  9. 9.
    线性回归 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 [1]
  10. 10.
    信度分析 信度分析主要用来考察问卷中量表所测结果的稳定性以及一致性,即用于检验问卷中量表样本是否可靠可信。量表题型就是问题的选项,是分陈述等级进行设置的。比如我们对手机的喜爱从非常喜欢到不喜欢这个程度的变化。在量表里面最出名的就是李克特 5 级量表,在这种量表的选项里面主要是分为'非常同意'、'同意'、'不一定'、'不同意'、'非常不同意'五种回答,分别记为 5、4、3、2、1。 [1]

平台优势

播报
编辑

1、专业强大

涵盖专业 统计算法 模型,满足各类算法需求; [1]
智能生成分析与解释,关键术语自动注释,没有统计知识也能读懂 分析报告 [1]

2、安全可靠

数据清洗 规范、安全; [1]
数据处理步骤 自动保存 版本,关键时刻找回 原始数据 [1]

3、精准智能

原始数据上传后系统自动编码判断; [1]
系统自动输出 分析结果 ,按照科研 学术规范 表述。 [1]

4、高效便捷

支持 Excel 、csv、sav 等多格式 数据文件 处理、分析与导出; [1]
卡片式布局,极简交互,高效管理数据; [1]
支持数据按版本导出不同数据格式,按需索取,告别冗余。 [1]

5、一触即达

对接主流在线调研平台,支持在线数据分析; [1]
SaaS平台,无需下载安装客户端。
SPSSPRO