最新新闻 · 2022年9月28日

IBM SPSS Statistics29:新增六大功能及多项改进

2022年9月中旬,IBM正式宣布推出SPSS Statistics软件全新的29版,包括新的生存模型程序(survival model procedure)、新的开源扩展程序、UI界面、搜索及工作薄改进等。

新功能一:

线性OLS的替代模型:弹性网络

Linear OLS Alternatives: Elastic Net

全新线性弹性网络扩展程序可生成估算因变量对一个或多个自变量的正则化线性回归模型,正则化结合了L1(Lasso)和L2 (Ridge)的罚函数(penalties)。

该扩展包括可选的模式,以显示在给定的L1比率下,不同α值的跟踪图, 并在交叉验证的基础上选择L1比率和α超参数值。

当单一模型被拟合或交叉验证被用来选择修正率和/或α,分区的保留数据可被用来估计样本外的性能。

新功能二:

线性OLS的替代模型:套索

Linear OLS Alternatives: Lasso

全新线性套索扩展可对一个或多个自变量的因变量进行L1损失正则化线性回归模型估算,并包括显示跟踪图和根据交叉验证选择α超参数值的可选模式。如上图所示图表代表了程序的输出示例。

当单一模型被拟合或交叉验证被用来选择α时,分区的保留数据可被用来估计样本外的性能。

新功能三:

线性OLS的替代模型:脊线

Linear OLS Alternatives: Ridge

全新线性脊线扩展程序对一个或多个自变量的因变量进行L2或平方损失正则化线性回归模型估算,同样包括显示跟踪图和基于交叉验证选择α超参数值的可选模式。

当单一模型被拟合或交叉验证被用来选择α时,分区的保留数据可被用来估计样本外的性能。

新功能四:

参数化的加速失效时间(AFT)模型

Parametric Accelerated Failure Time (AFT) Models

新程序调用了参数化生存模型程序与非复现性生命时间数据。参数化生存模型假定生存时间遵循一个已知分布,而这种分析适合加速失效时间模型,其模型效应与生存时间成正比。

新功能五:

假性R² 量

Pseudo-R² Measures

假性R² 量和类内相关系数现在包括在线性混合模型和广义线性混合模型的输出中(在适当时)。决定系数R2是一个常见的统计数字,因为它代表了一个线性模型所解释的方差比例。

类内相关系数(ICC)是一个相关的统计数字,它量化了多层次/分层数据中由分组(随机)因素解释的方差比例。

新功能六:

小提琴图 Violin Plots

图形板模板选择器现在包括一个全新的小提琴图供选择,盒式图和核心密度图的混合核心密度图。小提琴图显示了统计数据中的峰值,适用于可视化数字数据的分布情况。

以往的盒式图只能显示汇总的统计数据,而小提琴图则描述了汇总统计数据和每个变量的密度情况。

改进的功能部分:

一、工作薄的改进

新增了2个工作薄工具条项目: “显示/隐藏所有语法窗口(Show/Hide all syntax windows)”和“清除所有输出(Clear all output)”

程序状态栏增加新的按钮,用于在经典(输出和语法)和工作簿模式之间切换。

二、搜索功能的改进

搜索功能现在提供在工具栏字段中直接输入术语,或在下拉窗格中查看结果的选项。

三、取消掉隐藏未选择案例功能

当选择一个案例子集时,未选择的案例在数据编辑器中不再被隐藏,也不会被丢弃了。此功能与7.0.1和更早期版本中是保持一致的设计。

四、Python和R的升级

Python 3.10.4和R语言 4.2.0改为与29程序本身一并安装,不再需要额外处理了。

除了以上介绍的新功能与改进,29新版还有更多内容等你来挖掘!同时在2023年第一季度,29.0.1版本将会如期发布,增加存活率循环模型,基于Python的最小角度回归分析,并增加暗黑模式等。

大家关心的30版SPSS Statistics则将会在明年第三季度发布,目前已经在急锣密鼓的开发过程中,30版做为数字版本大升级,将增加更多弹性网(Elastic net)逻辑回归分析,以及更多的开源算法,在状态栏等界面也会获得重生一般的全新设计,并支持为所有扩展添加显示名称,当然也会持续加强已有的各项功能。