故障排除
问题
SPSS可以估计泊松回归模型吗?
解决问题
GENLIN 过程从 SPSS 15 版开始可用,它提供了一种更直接的方式来处理泊松回归模型,一旦可用,通常应该使用它来代替 GENLOG。SPSS 帮助中的案例研究中提供了一个示例。
在早期版本的 SPSS 中处理泊松回归模型的最简单方法是使用 GENLOG 过程,该过程进行一般的对数线性和对数建模。就我们的目的而言,最简单的泊松模型类型是计数建模没有分母(即,我们建模计数而不是比率),并且所有预测变量都是分类的。Rate 模型和定量预测器在流程中引入了进一步的复杂性,但它们仍然可以处理。
如果使用最简单的模型形式,则数据集中的变量仅由预测变量和计数变量组成。如果要对rate进行建模,则添加一个表示分母的附加变量。如果对rate进行建模和/或要使用定量预测变量,则还添加一个主题 ID 变量,每个案例都有一个唯一值。通过按计数变量对数据进行加权来完成文件准备(在对话框中,单击 Data->Weight Cases,然后单击 Weight cases by 并将适当的变量移动到频率变量框中)。屏幕底部的状态栏应在其中一个框中显示“Weight On”。
GENLOG 过程中的泊松选项是统计>对数线性>常规的默认选项。如果只有分类预测变量而没有分母变量,则选择分类预测变量作为因子。未使用 count 变量(数据已被此变量加权)。通过单击模型按钮、选中自定义并指定所需的预测模型(或将其保留为全因子,如果这是所需的模型)来指定模型。继续退出模型对话框并在选项或保存对话框中进行任何所需的规范(在选项对话框中指定参数估计的打印)。完成这些后,单击“确定”,如果您想查看已创建的 GENLOG 命令,请单击“粘贴”。
如上所述,如果使用定量预测变量和/或分母变量,情况将更加复杂。此处的术语定量预测器用于表示要按原样处理以用于建模目的的预测器。也就是说,您希望直接在设计矩阵中使用该变量的值并生成单个参数估计,而不是创建一组指标变量来表示唯一级别或类别。尽管在技术上并不完全准确,但术语“连续”通常用于此类变量。
由于 GENLOG 在逐个单元格的基础上分析数据,而单元格由因子变量的组合定义,因此出现了并发症。单元格协变量是通过对主对话框中指定的因子(在 GENLOG 命令上)定义的同一单元格中的所有值进行平均来处理的。因此,除非每个案例都被视为一个单元格,否则有关单个案例值的信息将丢失。这就是为什么我们必须在有单元格协变量时使用主题 ID 变量:欺骗 GENLOG 将每个案例视为一个单元格。请注意,如果您有任何定量/连续变量,则必须以这种方式处理所有预测变量(作为单元协变量)。如果您使用除主题 ID 变量之外的任何因子,GENLOG 将在内部构建的表将包含与主题数和这些因子的水平数的乘积一样多的单元格,你不会得到想要的结果。相反,您需要创建虚拟或效应编码变量以用作单元格协变量来表示因子水平之间的对比,就像在使用分类预测变量运行 SPSS REGRESSION 过程时所做的那样。
包含一个分母变量(在其他地方可能被称为暴露变量或偏移量),有或没有定量预测因子,需要使用 ID 变量技巧,以强制 GENLOG 拟合所需的速率模型数据文件中的单独案例。只要没有定量预测变量,没有分母变量,拟合到聚合数据的对数线性模型产生的估计值与通过将案例定义为单独单元格的数据建模所产生的估计值相同(尽管拟合优度统计量不会相同) )。但是,当使用分母变量时,这不再是正确的。
要拟合具有定量预测变量和/或分母变量的模型,请转到“一般对数线性”主对话框。将您的预测变量指定为单元格协变量,并将主题 ID 变量指定为唯一因素。如果有分母变量,则将其指定为单元结构变量。然后进入模型对话框并指定一个自定义模型,其中包括所需的预测变量和任何交互,但不包括主题 ID。在其他对话框中请求任何其他规范后,单击确定或粘贴。由于您将主题 ID 变量指定为模型中未使用的因素,因此弹出警告会告诉您这一点。只需单击确定。
如果您使用的是 SPSS 12 之前的版本并且有任何 0 个计数会产生 0 个边际(使用主题 ID 技巧时任何 0 个计数都会产生),这些应该重新编码为一个小的正数(例如,1E-12 )。ML 估计仍然适用于输出上打印的尽可能多的小数。0 边际将导致程序拒绝运行。在 SPSS 12 开始的版本中,这不是必需的