相关文章推荐
爱运动的热带鱼  ·  天地图API·  9 月前    · 
纯真的鸵鸟  ·  python mysqlclient ...·  1 年前    · 

一、问题与数据

研究者想调查人们对“本国税收过高”的赞同程度:Strongly Disagree——非常不同意,用“0”表示;Disagree——不同意,用“1”表示;Agree--同意,用“2”表示;Strongly Agree--非常同意,用“3”表示。

另外,研究者也调查了一些其它情况,包括:是否是“雇主”(biz_owner:Yes——是,用“0”表示;No——否,用“1”表示)、年龄(age)和党派(politics:Lib——党派1,用“1”表示;Con——党派2,用“2”表示;Lab——党派3,用“3”表示)。部分数据如下图:

二、对问题的分析

使用有序Logistic进行回归分析时,需要考虑4个假设。

假设1:因变量唯一,且为有序多分类变量,如城市综合竞争力等级可以分为高、中、低;某病的治疗效果分为痊愈、有效、无效等。

假设2:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。

假设3:自变量之间无多重共线性。

假设4:模型满足“比例优势”假设。意思是无论因变量的分割点在什么位置,模型中各个自变量对因变量的影响不变,也就是自变量对因变量的回归系数与分割点无关。

有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归,例如本例中因变量“本国的税收过高”的赞同程度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs 2+3)、(0+1+2 vs 3),均是较低级与较高级对比。

在有序多分类Logistic回归中,假设几个二元Logistic回归中,自变量的系数相等,仅常数项不等,结果也只输出一组自变量的系数。因此,有序多分类的Logistic回归模型,必须对自变量系数相等的假设(即“比例优势”假设)进行检验(又称平行线检验)。如果不满足该假设,则考虑使用无序多分类Logistic回归。三、前期数据处理

对假设进行验证前,我们需要将分类变量设置成哑变量。

1. 为什么要设计哑变量

若直接将分类变量纳入Logistic回归方程,则软件会将分类变量按连续变量处理。例如,如果把性别按“1”——男、“2”——女进行编码,然后直接把性别纳入方程,方程会认为“女”是“男”的2倍。为了解决这个问题,需要用一系列的二分类变量“是”或“否”来表示原始的分类变量,这些新的二分类变量被称为“哑变量”。

在SPSS软件的二项Logistic回归模型中,将分类变量选入categorical,软件会自动设置一系列的哑变量。由于验证假设3(自变量之间无多重共线性)需要通过线性回归实现,而在线性回归中,就需要手动设置哑变量。因此,这里需要先手动设置哑变量。

2. 设置哑变量的思路

哑变量的数目是分类变量类别数减一。本例中,党派1、党派2和党派3的原始编码为1、2和3。设置哑变量时,需要对党派1和党派2进行重新编码。

建立新变量Lib(党派1),若调查对象选了党派1,则Lib编为“1”,代表是;若未选党派1,则Lib编为“0”,代表否。同样,建立新变量Con(党派2),将是否选党派2编为“1”或“0”。此时,若既未选党派1,又未选党派2,则两个新变量Lib和Con的编码都为“0”,代表党派3。此时,党派3在模型中是参考类别(Reference)。

3. 在SPSS中设置哑变量

(1)首先,先创建新变量“Con”,在主菜单下选择Transform→Recode into Different Variables... ,如下图:

(2)在Recode into Different Variables对话框中,将politics选入右侧Numeric Variable-->Output Variable下,在右侧Output Variable中填写“Con”。点击Change→Old and New Values。

一、模型简介 有序 多分类 logistic回归 用于因变量为 有序 多分类 的情况,如患者对药物的反应y共有三种情况:疗效差、一般和好。定义y=1(疗效差)、y=2(疗效一般)、y=3(疗效好)。对于 有序 多分类 logistic回归 ,模型将因变量的多个分类依次分割为多个二元 logistic回归 。如3种不同疗效的患者, 分析 时拆分为2个二元 logistic回归 ,分别为 (1vs 2 3) 、(1 2 vs... 点击上方蓝字,轻松关注我们以下内容转载自“医咖会”微信公众号(medieco-ykh),作者张耀文。上一期我们讨论了 有序 多分类 Logistic回归 SPSS 简单操作,本期“科研加油站”栏目,我们一起来探讨 有序 多分类 Logistic回归 SPSS 详细 操作。问题与数据研究者想调查人们对“本国税收过高”的赞同程度:Strongly Disagree——非常不同意,用“0”表示;Disagree... 多元 有序 逻辑回归基于概率模型,它假设因变量的每个类别与一个潜在的连续变量(或称为对数优势)相关联。这个潜在变量的大小决定了观察到的 有序 分类结果。模型的目标是估计自变量对潜在变量的影响,以及它们如何影响因变量在不同 有序 类别之间的概率。多元 有序 逻辑回归用于 分析 有序 分类因变量与一个或多个自变量之间的关系。 有序 逻辑回归适用于因变量具有自然排序但没有固定间距的类别,例如疾病严重程度(轻度、中度、重度)或调查问卷中的满意度评分(非常不满意、不满意、一般、满意、非常满意)。 一、适用范围 logistic回归 是一种广义的线性回归 分析 模型,常用于疾病诊断、经济预测等领域,主要用途为寻找危险因素(寻找某一疾病的危险因素)、预测(不同自变量情况下,某病或某种情况的发生概率)和判别(判断某人属于某病或某种情况的概率有多大),在疾控项目中较多涉及寻找危险因素,因此,本文主要以寻找危险因素进行举例说明。二、数据结构 logistic回归 适用的因变量为二分类... 如果研究X对于Y的影响,Y为定量数据则可以使用线性回归 分析 。如果Y是定类数据,此时则需要使用 logistic回归 分析 。Logit回归共分为三种,分别是二元 Logistic回归 多分类 Logistic回归 有序 Logistic回归 (也称Oridinal回归),此三个方法的区别在于因变量Y的数据类型。如下表:Logistics回归分类哑变量问题 有序 logistics回归中,X可以为定量数据,也可以是定... 转自个人微信公众号【Memo_Cleon】的统计学习笔记:因变量无序 多分类 资料的 logistic回归 。因变量为无序 多分类 资料,或者因变量虽为 有序 多分类 但不满足比例优势假定(平行性检验P>0.05),可采用无序 多分类 logistic回归 进行 分析 。当然当结局变量无序,自变量只有一个且为分类变量时,可以直接采用卡方检验;结局变量 有序 ,自变量只有一个且为分类变量时,可以直接采用非参数检验。无序多分... 首先多元 有序 logistic回归 是针对因变量水平数大于2并且为 有序 变量10的一个情况。做了一个多因素 Logistic回归 分析 得到的结果呢就是一个独立影响因素。π2π3呢就是水平数2和3发生的概率然后这个π一比上π二加π三。 SPSS 关于有 有序 logistic这些回归 分析 的一些模块。说明这个模型是显著的也就是说至少有一个变量的 系数 是显著的。看到左侧是放置我们变量的因变量就放置我们的这个 有序 变量。说明是满足平 有序 logistic这个回归 分析 的一个条件。你看他这说明的是将表一中有差异的变量作为4变量。 Logistic回归 分析 用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据,也可以为定量数据,但要求Y必须为定类数据,并且根据Y的选项数,使用相应的数据 分析 方法。 首先,多元回归是干什么用的?在回归 分析 中,如果有两个或两个以上的自变量,就称为多元回归。实际应用中,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。总的来说,回归 分析 就是用来做预测的,多元回归要比一元回归更加高效实用。如果线性回归方程存在,那么我们要求出每一项 X 前的 系数 和常数项 。若要使求得的回归方程效果比... 有序 Logistic回归 ——因变量是 有序 分类变量的回归 分析 【例】研究BMI相关的危险因素。资料如下:表1 BMI相关危险因素原始资料  将BMI分成三类并赋值——正常(BMI=18-23)=1、偏高(BMI=24-27)=2、肥胖(BMI≥28)=3;性别赋值——1=男,0=女;年龄分组并赋值——20-29岁组=1、30-39岁组=2、40-49岁组=3;糖尿病状态赋值——有=1、无...