一、问题与数据
研究者想调查人们对“本国税收过高”的赞同程度:Strongly Disagree——非常不同意,用“0”表示;Disagree——不同意,用“1”表示;Agree--同意,用“2”表示;Strongly Agree--非常同意,用“3”表示。
另外,研究者也调查了一些其它情况,包括:是否是“雇主”(biz_owner:Yes——是,用“0”表示;No——否,用“1”表示)、年龄(age)和党派(politics:Lib——党派1,用“1”表示;Con——党派2,用“2”表示;Lab——党派3,用“3”表示)。部分数据如下图:
二、对问题的分析
使用有序Logistic进行回归分析时,需要考虑4个假设。
-
假设1
:因变量唯一,且为有序多分类变量,如城市综合竞争力等级可以分为高、中、低;某病的治疗效果分为痊愈、有效、无效等。
-
假设2
:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。
-
假设3
:自变量之间无多重共线性。
-
假设4
:模型满足“比例优势”假设。意思是无论因变量的分割点在什么位置,模型中各个自变量对因变量的影响不变,也就是自变量对因变量的回归系数与分割点无关。
有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归,例如本例中因变量“本国的税收过高”的赞同程度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs 2+3)、(0+1+2 vs 3),均是较低级与较高级对比。
在有序多分类Logistic回归中,假设几个二元Logistic回归中,自变量的系数相等,仅常数项不等,结果也只输出一组自变量的系数。因此,有序多分类的Logistic回归模型,必须对自变量系数相等的假设(即“比例优势”假设)进行检验(又称平行线检验)。如果不满足该假设,则考虑使用无序多分类Logistic回归。
三、前期数据处理
对假设进行验证前,我们需要
将分类变量设置成哑变量。
1. 为什么要设计哑变量
若直接将分类变量纳入Logistic回归方程,则软件会将分类变量按连续变量处理。例如,如果把性别按“1”——男、“2”——女进行编码,然后直接把性别纳入方程,方程会认为“女”是“男”的2倍。为了解决这个问题,需要用一系列的二分类变量“是”或“否”来表示原始的分类变量,这些新的二分类变量被称为“哑变量”。
在SPSS软件的二项Logistic回归模型中,将分类变量选入categorical,软件会自动设置一系列的哑变量。
由于验证假设3(自变量之间无多重共线性)需要通过线性回归实现,而在线性回归中,就需要手动设置哑变量。因此,这里需要先手动设置哑变量。
2. 设置哑变量的思路
哑变量的数目是分类变量类别数减一。本例中,党派1、党派2和党派3的原始编码为1、2和3。设置哑变量时,需要对党派1和党派2进行重新编码。
建立新变量Lib(党派1),若调查对象选了党派1,则Lib编为“1”,代表是;若未选党派1,则Lib编为“0”,代表否。同样,建立新变量Con(党派2),将是否选党派2编为“1”或“0”。此时,若既未选党派1,又未选党派2,则两个新变量Lib和Con的编码都为“0”,代表党派3。此时,党派3在模型中是参考类别(Reference)。
3. 在SPSS中设置哑变量
(1)
首先,先创建新变量“Con”,在主菜单下选择Transform→Recode into Different Variables... ,如下图:
本例中,容忍度均远大于0.1,方差膨胀因子均小于10,所以不存在多重共线性。如果数据存在多重共线性,则需要用复杂的方法进行处理,其中最简单的方法是剔除引起共线性的因素之一,剔除哪一个因素可以基于理论依据。
2. 检验假设4:模型满足“比例优势”假设
“比例优势”假设可以在后面结果部分的“平行线检验”中看到。
五、SPSS操作
SPSS中,
可以通过两个过程实现有序Logistic回归
。分别是Analyze → Regression → Ordinal...和Analyze → Generalized Linear Models → Generalized Linear Models...。
其中,Analyze → Regression → Ordinal模块,可以检验 “比例优势”假设,但无法给出OR值和95%CI。而Analyze → Generalized Linear Models → Generalized Linear Models模块可以给出OR值和95%CI,但无法检验“比例优势”假设。
这里,我们主要介绍Analyze → Regression → Ordinal过程。
(1)
在主菜单点击Analyze→Regression→Ordinal...
二分类(Binary Classification)
多分类
(Multinomial Classification)。
其中二分类是最常见且使用最多的分类场景,解决二分类的算法有很多,比如:
基本的KNN、贝叶斯、SVM
Online Ranking中用来做二分类的包括FM、FFM、GBDT、LR、XGBoost等
多分类
中比如:
改进版...
logistic回归
虽然名为回归,但实际用于分类问题。
本文将会介绍
logistic回归
、梯度上升算法以及
logistic回归
的二分类及
多分类
问题。 接收输入后能够输出类别。
在二分类中,输出的为0或1。在
多分类
中,输出的类别就为1,…,n。(
多分类
可以看作是多个二分类的结合,后文中会介绍) 简要流程如下:
1.回归;
2.求和;
3.Sigmoid。 具体流程为:首先对输入的数据进行回归(即在输入数据的每个特征上都乘一个回归系数),然后将结果相加,将
今天做数学建模2017B的时候用到了
logistic
s分析来估计任务是否完成,给大家分享一下
二元
logistic
s回归分析适用于因变量的结果只有两个的情况,例如任务的完成与否(0或1),通过对任务是否完成的影响因素可以估计出任务为完成或未完成的预测概率。
例如2017B中对任务是否完成的因素有任务所在地的用户密度和到城市中心的距离以及订单定价,我们通过SPPS二元逻辑分析来得出预测概率
http://blog.sina.com.cn/s/blog_7147f6870102vxwj.html
http://chen.yi.bo.blog.163.com/blog/static/150621109201010301321654/
http://beader.me/2014/05/03/
logistic
-regression/
好的,我会尽力回答你的问题。关于多元
有序
logistic回归
分析,这是一种常见的统计分析方法,用于研究一个
有序
分类变量和一组自变量之间的关系。
SPSS
是一种常用的统计分析
软件
,可以进行多元
有序
logistic回归
分析。
下面给出一个简单的实例
教程
,供参考:
假设我们想研究一个人的教育程度(
有序
分类变量,例如小学、初中、高中、大学)和他们的年龄、性别、职业等自变量之间的关系。我们可以使用
SPSS
进行多元
有序
logistic回归
分析。
1. 准备数据
首先,我们需要准备数据。我们可以使用样本数据,或者自己进行数据收集。数据应该包含
有序
分类变量(教育程度)和一组自变量(例如年龄、性别、职业等)。
2. 打开
SPSS
并导入数据
打开
SPSS
软件
,选择File -> Open -> Data,选择数据文件并导入数据。
3. 进行多元
有序
logistic回归
分析
选择Analyze -> Regression -> Ordinal Regression,进入多元
有序
logistic回归
分析界面。将
有序
分类变量(例如教育程度)拖入Dependent Variable框中,将自变量(例如年龄、性别、职业等)拖入Covariates框中。点击Model按钮,选择Enter,将所有自变量都加入模型。
4. 分析结果
分析结果将包括回归系数、标准误、z值、p值等。我们可以根据p值来判断自变量是否显著影响
有序
分类变量。此外,我们还可以使用
SPSS
的图表工具来可视化回归结果,帮助我们更好地理解分析结果。
以上就是一个简单的多元
有序
logistic回归
分析的实例
教程
。希望能对你有所帮助!
环境配置_解决win10安装office 出现“the setup controller has encountered a......”而且找不见Office Setup Controller文件
31271
ChatGPT报错:“Unable to load site,Please try again later. If you are using a VPN…”什么原因?如何解决?
26183