科研中,管理学者们常常需要面临庞大且高维的数据和信息,如何能够简单高效地处理数据,从中提取想要的信息,
机器学习
或许能够帮忙。
在学术研究中,如何能让建模更加真实可靠,并且能够使其主动适应各类变量,此时机器学习或许能够帮忙。
本质上,机器学习是“一个数学优化问题与实现该优化问题的计算机算法问题”,而对于管理学研究而言,机器学习正在一步一步地深刻改变其范式与方法。
如何将“商学”与“科技”结合,如何运用机器学习更好地赋能管理学研究已经成为学术界关注的前沿热点议题。然而,浙江大学管理学院刘景江老师注意到机器学习在中国管理学研究中的应用仍处于初级阶段并有极大的发展空间。
日前,
浙江大学管理学院刘景江
老师与博士生郑畅然以及合作者中国科学院大学经济与管理学院洪永淼教授于国家顶级期刊之一《管理世界》2023年第9期发表研究成果《机器学习如何赋能管理学研究?——国内外前沿综述和未来展望》,进一步探究了机器学习对于管理学研究的重要意义以及未来发展前景。
文章刊发于《管理世界》2023年第9期,
第191-215页
本期【科研】专题,看刘景江团队如何利用“商学+科技”的力量,推动管理学研究方法理论的进步、为管理学研究提供新的模板。
刘景江,
浙江大学管理学院创新创业与战略学系副教授
他们因何关注到“机器学习”
对管理学研究的重要性?
如今,机器学习催生的以数据、算法和算力为基本要素的计算社会科学这一新型研究范式和新兴交叉学科,正在极大地改变社会科学的传统研究范式和方法。
当管理学者面对实时发生、数量体量大、类型多、信息密度低的大数据时,运用机器学习的方法可以对复杂高维的大数据进行有效的降维处理,从而实现更加精准的预测、更好地帮助识别因果关系和构建新的理论。
通过对以往文献综述的研究以及对传统管理学研究方法的刨析,刘景江团队发现,一直以来,传统的管理学研究都存在着一些短板,而这些短板恰恰可以通过机器学习进行弥补。
在传统的管理学研究中,从海量的、高维的、非结构化的、多模态数据中提取有用信息;克服社会经济系统的非实验性、不可逆性和时变性,以及社会经济数据的种种缺陷,一直是长期存在的难点。
管理学定性研究常常采用少数甚至单个案例分析来构建理论,而没有使用大样本数据。受制于有限样本和人工经验,这些研究很难从数据中识别新颖、稳健、具有预测性和相对可解释性的模式,泛化能力较弱。
短板3:
数据观测方法存在局限
基于观测数据的管理学定量研究通常采用传统计量经济学方法,而这一方法存在诸多明显的局限性。这种计量方法是基于模型驱动的,通常事先假定一系列苛刻的假设条件和一个小的线性低维参数模型,容易导致偏差。
此外,这种方法以统计显著性和样本内拟合优度为模型优劣主要评估标准,模型的样本外预测能力较弱;它只能刻画主要因素的影响,无法做出可靠的因果推断。
机器学习技术、方法与工具所具有得独特优势有效地弥补了上述管理学研究所存在的短板,从而提升管理学研究的质量。
机器学习技术、方法与工具可以从复杂高维数据环境中提取有价值的信息以更好地帮助变量测量;直接基于数据灵活选择函数形式和构建算法以更好地帮助样本外的事件预测;改进传统计量经济学方法以更好地帮助因果推断;发现稳健且具有可解释性的模式以更好地帮助理论构建等。
通过对以往资料的分析,刘景江团队发现传统管理学研究,机器学习在我国管理学研究中的应用仍处于初级阶段。
此外,目前学术界极少有文献对实质性使用机器学习方法研究管理问题的最新成果进行系统综述并由此提出未来研究机会。特别是,现有文献缺乏从变量测量、事件预测(包括事件分类)、因果推断和理论构建等4个方面系统而具体地阐述采用机器学习方法赋能管理学研究的途径和策略。
基于上述背景,刘景江团队聚焦中国情境、中国问题和中国数据,创新提出这项有助于我国学者采用的最新机器学习的技术、方法与工具,将机器学习催生的以数据、算法和算力为基本要素的新型研究范式融入到管理学研究中。
如今,如何运用机器学习对管理学研究方法进行赋能已经成为学术界关注焦点问题之一。刘景江团队的研究成果,正是对这一问题的重要创新。
在这项研究中,研究团队都做出了哪些努力?他们的研究又涵盖了哪些内容?
梳理了借助机器学习开展管理学
实证研究的4种核心途径
在管理学研究中,工商管理和会计财务是其中的两大核心研究领域,包含大量来自个人、企业和政府的文本、图像、音频、视频等极具信息价值的非结构化数据。传统方法无法对这些非结构化数据进行量化分析,只能进行定性分析。
此时,借助机器学习方法,学者们可以从这些非结构化数据中挖掘、提取和构建更多有意义的变量,运用灵活的函数形式和降维技术来实现更精准的预测,从而更好地开展这两大领域中关键问题的实证研究。
因此,刘景江团队以这两大研究领域为例,以机器学习赋能管理学研究的4种核心用途(即变量测量、事件预测、因果推断和理论构建)为主线,全面回顾和系统梳理UTD-24期刊和国内顶级管理学期刊于1999-2021年正式发表的文章。
两大研究领域国内顶级管理学期刊上实质性
运用机器学习方法的文章发表趋势
对文章进行梳理后,研究团队总结归纳了代表性文献的研究主题、研究问题、数据集、机器学习算法和研究结论。
通过对机器学习赋能管理学实证研究的4种核心途径的具体探究,刘景江团队发现,每种途径中都包含不同的策略。他们认为,将机器学习与传统计量经济学相结合有助于做出更加精准的因果推断;机器学习能够在模式发现这一理论构建的关键步骤中发挥重要作用;将机器学习与多案例分析相结合有助于富有成效地开展理论构建。
此外,科研团队还做出了有效推断。在未来,变量测量、事件预测、因果推断、理论构建等4种核心途径的融合将日益紧密。这种紧密的融合将为机器学习赋能管理学研究提供了更加具有深度和广度的未来机会。
中国独特的政治、经济、文化和社会制度,蕴含明显异于西方世界的特性。特别是,我国改革开放以来建立的将“看不见的手”与“看得见的手”结合的中国特色社会主义市场经济体制驱动中国经济取得了惊人的发展。这些情境、事实和数据给构建中国特色管理理论提供了肥沃的土壤。中国管理故事需要构建和使用中国本土化理论才能进行有效阐释。
在这样的中国情境下,中国学者需要积极、大胆地运用国际前沿机器学习技术、方法与工具,对不同类型数据进行深入挖掘,构造独特的变量及其测量,进而做出具有中国特色的高质量研究。
以机器学习的方法推动中国管理学研究的范式变革和方法创新,从而构建原创性的中国特色管理理论,持续为我国经济建设、社会发展和文化繁荣提供精准指导,并提升中国管理学的国际学术影响力,更好地为世界贡献中国管理智慧。
刘景江团队发现,中国学者在运用机器学习方法进行管理学研究时,需要尽可能构建多来源的非结构化和结构化数据集;权变地联合使用多种互补的机器学习算法,将机器学习方法与传统计量经济学方法有机结合进行因果推断。
同时,要想将机器学习赋能于中国管理学研究,首先要遵循基于机器学习构建理论的基本流程,综合运用机器学习、人的判断和专业知识、基于个人、团队和组织的多案例分析等高度互补的方法进行理论构建。
对于大数据特别是庞大数据,需要更加关注模型选择而不是解释变量的统计显著性,这样更有助于改进对数据的拟合或预测效果。
刘景江团队的研究创新地探究了机器学习对于管理学研究的重要方法以及未来前景。
研究为如何采用机器学习提升管理学的研究质量、推进管理学研究范式变革和构建中国特色管理理论提供了方法论指引和方向性启示。
此外,这项研究成果也为管理学研究的老师们、同学们、企业家们提供了一种创新的学习方法,帮助管理学者们更好地做出研究、更好地发挥技术优势,补足了传统管理学研的短板,推动了中国管理学界应用机器学习的进程。
首先,研究团队以国际上得到广泛认可的UTD-24期刊和“2021中国最具国际影响力学术期刊(人文社会科学)”前20名中的管理学期刊于1999~2021年正式发表的文献为数据,采用编码方法,识别了工商管理和会计财务两大研究领域的国内外学者应用机器学习进行管理学实证研究的4种核心途径:变量测量、事件预测、因果推断和理论构建。
其次,刘景江团队从研究主题、研究问题、数据集、机器学习算法和研究结论等多个方面系统总结了这些途径的代表性文献,从而描绘了一幅机器学习赋能管理学研究的图景。
在分析以往研究方法不足的基础上,研究成果深入阐述了一系列采用机器学习开展管理学研究的主要策略和未来机会。特别是,从平均处理效应、异质性处理效应和多种方法融合等3个方面,阐述了应用机器学习实施因果推断的策略。
未来,机器学习在管理学研究中还有着广大前景,以及扩展方向。
一方面管理学者们可以尝试将文献综述的范围拓展到管理科学、营销和信息系统等多个领域。
另一方面,学者应植根中国情境,将机器学习与传统计量经济学相结合以做出更加精准的因果推断;将机器学习与多案例分析相结合以富有成效地开展理论构建。
学者·说
浙江大学管理学院副教授 刘景江
“近几年来,我们团队致力于交叉融合机器学习、计量经济学建模、随机控制实验等方法来研究管理学问题。2020年12月,我们确定了本文研究问题,着手开展研究设计和数据收集,并于2022年5月投至《管理世界》。
两位外审专家以及终审专家从研究贡献、文献引用、数据收集、未来展望等多个方面提出了非常中肯、专业、严谨的意见,为我们完善文章提供了很大帮助。
在论文终审和刊发前,《管理世界》编辑部的老师对本文进行了多轮优质高效、严谨细致的校对工作,大大提升了论文的可读性和流畅度。在此向审稿专家及编辑老师表示诚挚的谢意。”
论文摘要
机器学习正在深刻改变管理学的研究范式与方法。如何运用机器学习更好地赋能管理学研究已经成为学术界关注的前沿热点议题。然而,机器学习在中国管理学研究中的应用仍处于初级阶段。本文基于1999~2021年发表在工商管理和会计财务两大研究领域的国内外顶级期刊的学术文献,识别了学术界借助机器学习开展管理学实证研究的4种核心途径:变量测量、事件预测(包括事件分类)、因果推断和理论构建;梳理了每个途径的代表性文献的研究主题、研究问题、数据集、机器学习算法和研究结论;提出了使用机器学习赋能管理学研究的主要策略,并讨论了中国学者运用机器学习开展中国特色管理理论研究的未来机会。