“倾斜性”政策对各区域形成优势互补、共同发展的新格局发挥了重要作用。借助于这些区域政策,地方政府会更积极地介入经济活动,其对生产部门结构变迁的冲击具有时空异质性,这为讨论南北发展分化提供了一种新的线索。因此,文章构建了“倾斜性”政策、两部门结构与区域发展的均衡模型,采用机器学习方法对2003—2018年277座城市高维特征分阶段开展实证分析,并使用因果森林估计了“倾斜性”政策的异质性处理效果,经由省份聚类解决算法的“过拟合”问题以及用岭回归和社会网络分析等进行了稳健性检验。结果发现:(1)旨在协调区域平衡发展的政策在南方地区的效果优于北方,尤其在2012年以后,效果更明显。(2)“倾斜性”政策会提高欠发达地区不可贸易部门的份额,引致长期生产率提升速度比可贸易部门更缓慢,尽管这种现象在我国普遍存在,但北方城市相对更严重,这是南北区域发展差距扩大的重要原因。因此,考虑到传统区域政策的异质性和不可持续特征,未来区域政策的重心应侧重于如何提升欠发达地区人力资本积累以及企业的贸易参与度。
关键词
:
机器学习
因果森林
区域政策
生产部门结构
“Biased” Policy, Changes of Production Sectors and Development Gap between the North and the South in China: Causal Inference from Machine Learning
Hu Zunguo
1
,
Gu Jinxin
1
,
Chen Ying
2
Summary
:
Over the past decade, China’s regional policies have significantly narrowed the per capita output gap between inland and coastal areas, but the latest development differentiation between the North and the South has attracted much attention from different fields. Starting from judging the heterogeneous effect of “biased” policy, this paper deeply analyzes the impact of “biased” policy on the structural change of production sectors, and then explains the differences found in the North and the South, which further enriches the economic growth and China’s regional development theory under the parallel background of “effective market” and “active government”.
The “biased” policy covers non-productive regional policies, as well as productive regional policies based on balanced development, such as project priority. With the help of “biased” policy, many regions have the trend of the rapid expansion of industrial scale and accelerated urbanization in the short term, but more active involvement in economic activities is easy to lead to the expansion of the share of non-tradable production sectors. Subject to the low degree of the marketization of non-tradable sectors, the disadvantage of relatively slow productivity improvement in regions with expanding share of the sector will be exposed. In other words, the “biased” policy can have an asymmetric shock on the structure of local production sectors, and the behavior of local governments often aggravates the spatial heterogeneity of this shock, which forms another new source of regional development differentiation in China.
The results show that: (1) The effect of policies aimed at balanced development in the South is better than that in the North, especially after 2012. (2) The “biased” policy will increase the share of non-tradable sectors in underdeveloped areas, resulting in a relatively slow increase in long-term productivity compared with tradable sectors. Although this phenomenon is common in China, it is relatively more serious in the North, which is an important reason for the widening development gap between the North and the South.
This paper has the following contributions: (1) It firstly discusses urban productivity through the channel between “biased” policy and production sector structure, and then explores the reasons for regional development gap. (2) It constructs an equilibrium model of “biased” policy, two sector structure and regional development for the first time. (3) Using machine learning to carry out empirical analysis on the high-dimensional characteristics of 277 cities from 2003 to 2018, the heterogeneity treatment effect of “biased” policy is estimated by causal forest for the first time.
一、引 言
区域协调政策对区域高质量发展具有极其重要的作用,而实践结果也证实,政府积极的推动显著缩小了内陆与沿海地区人均产出差距。2003年东部与西部地区间人均产出相对差距系数达到63.0%,2016年已下降至45%,区域协调性进一步增强(孙久文等,2017;魏后凯等,2020),然而在2012—2018年期间,南方地区城市人均
GDP
年均发展速度108.69%,而北方城市仅为103.49%,
①
这与近些年来各界热议的南北地区发展分化现象吻合(刘秉镰等,2019;李兰冰和刘秉镰,2020)。区域发展的议题由内陆与沿海转移到南北地区关系,始终绕不开一个关键的问题,即一系列“倾斜性”区域政策效果的判断。这些“倾斜性”政策包括以下两方面:其一是非生产性区域政策,它对生产端直接影响不大,却能增加地方收入并引致不可贸易部门一定程度地膨胀,如转移支付等;其二是基于国土均衡发展导向的生产性区域政策,他们短期内一定程度上促进了生产能力提升,但其源自项目审批优先权等非市场化因素,促进生产能力提升的长期效果并不明显。譬如,自2003年以来,国家对中西部地区的工业园区或开发区等有关项目审批给予充分的“倾斜”,相关研究却发现中西部县市大部分园区出现了土地浪费严重,持续产出能力显著不足的现象(陆铭等,2011;陆铭,2017)。与此同时,该地区城镇化却迎来较大幅度的增长,其新增人口的家庭收入很大比例来源于本地服务业或外出务工,间接推动了当地教育、房地产和商贸等不可贸易部门的发展(胡尊国等,2016)。在“有效市场”和“有为政府”双重运行机制下,很多欠发达地区部分产出来源于区域政策租。获得“倾斜性”政策的地方政府往往会更活跃地介入经济活动,差异化的政府行为对生产结构的影响具有空间不对称性,即有些地区扩大了可贸易生产部门份额,
②
有些扩大了不可贸易部门份额。一般而言,不可贸易部门份额扩大的地区,长期发展处于相对劣势,这是因为该部门市场化效率相对更低,产品(服务)可贸易程度也较低,以致长期生产率提升相对缓慢(Gollin等,2016;胡尊国等,2016)。也就是说,一些地方政府借助“倾斜性”政策积极参与经济活动,短期内能实现就业扩张和城镇化率提高,但是不可贸易生产部门相对份额扩展的态势为后期经济增长乏力埋下了“隐患”,结果形成了区域发展分化的新来源。既然城市生产效率、生产部门结构调整与区域发展政策存在很强的关联性,那么过去几十年来我国实施“倾斜性”政策效果存在南北地域差异吗?“倾斜性”政策对地区生产部门结构冲击的空间异质性是一个诱发区域发展分化的新原因吗?
大量研究表明,相对于不可贸易部门,可贸易生产部门生产效率提升更快(Samuelson,1964),比较过去几十年内不同经济体发展结果,经济增长速度与可贸易生产部门份额及其效率存在较强的正相关性(Gollin等,2016),实际上区域发展过程也同样存在上述规律。首先,分工深化和数字经济兴起加剧了不同地区可贸易与不可贸易部门非对称性变化;其次,欠发达地区不可贸易产品价格通常决定于本地市场,但是很多不可贸易部门生产率提高会导致其产品价格下降(李兵等,2019),不同于规模经济效应,这种产品价格的下降往往以低工资增长为代价换取,结果引起高技能人才进一步外流,让区域协调政策效果大打折扣。赵进文和苏明政(2014)曾引入巴拉萨—萨缪尔森效应假说,解释了可贸易品和不可贸易品的相对价格波动对区域收敛的重要作用。贸易自由化能使可贸易部门产品价格传导到不可贸易部门(Dix-Carneiro和Kovak,2019;亢宇君和刘晓辉,2019),邵朝对等(2018)使用国内价值链贸易原理解释不同地区经济发展的空间差异。此外,唐保庆等(2018)使用服务业占比等指标分析了我国服务业发展呈现“东强西弱”的原因,实际上他们论述了不同地区可贸易服务业发展差距不断扩大的现象。
独特的城镇化背景和区域协调发展政策影响了城市生产部门形态。目前正深入推进的城镇化存在明显的行政偏向(魏后凯,2014;魏守华等,2020)。欠发达地区引入一些城镇化见效快、市场化程度不高的产业,结果是不可贸易部门就业比重呈现扩大态势(胡尊国等,2016)。即便剩余劳动力继续外出务工,其务工盈余收入形成恩格尔消费周期现象,增加对户籍地房产和其他服务等不可贸易品需求,也会扩大不可贸易部门份额;而发达城市正积极发展高端制造业和生产性服务业等可贸易产业。为了破解区域经济发展不均衡难题,国家实施了西部大开发、东北振兴和中部崛起等区域平衡发展战略,但是陆铭等(2011,2019)一系列研究发现,很多区域政策的具体实施可能引发了资源错配。
对“倾斜性”政策效果产生争议性判断另一个来源是统计技术因素,即实证过程高度依赖观测数据并缺乏反事实案例。基于观测性数据所开展的实证分析很难甄别变量之间存在相关关系,还是因果关系。例如,对政策干预效果开展评估最有效的手段是构建Neyman-Rubin因果模型分析,将政策干预的地区(处理组)与无政策干预的地区(控制组)进行实验比较,获得平均因果效应的无偏估计。然而,由于无法随机选择样本组及协变量分布不平衡,倾向值匹配方法(
PSM
)估计区域政策平均处理效应(
ATE
)可信度很难得到保证。此外,如果评估模型中协变量特征(如地区的运输条件、信贷规模和固定资产投资等)以及影响地区经济发展的其他未观测的因素(如营商环境)随时间变化,那么采用双重差分法(
DID
)估计政策效果也是值得质疑。综上,尽管有众多现有研究探讨了可贸易部门相对份额与地区生产率之间的紧密联系,也有大量文献分析了区域政策利弊,然而迄今鲜有研究通过“倾斜性”区域政策与生产部门结构之间连接渠道讨论城市生产率变化,进而探寻区域发展分化问题。
本文的实证过程分两个阶段评估了我国“倾斜性”政策效果、生产结构变迁和南北城市发展分化现象。异质性处理效应估计得到如下结果:其一,“倾斜性”政策在南方的效果优于北方,近年来更为突出。以省级聚类的结果为例,2004—2018年区域政策干预对南方地区人均
GDP
发展速度提升年均贡献了3.6%,而北方地区年均贡献不到0.8%。值得注意的是,2012年以来,“倾斜性”政策在南北地区的效果差别进一步拉大。其二,“倾斜性”政策对地区生产部门结构的非对称性冲击被统计结果所证实。在“种植”因果树过程中,2004—2011年北方城市可贸易与可不贸易两部门结构比的重要性相对更高,而在2012年以后南方城市的两部门结构比的重要性却要大于北方。其三,尽管“倾斜性”政策会提高惠及地区不可贸易部门份额,但是南方欠发达的城市不可贸易份额与“倾斜性”政策的
CATE
的相关性更强。为了检验因果森林结果的稳健性,我们将整个城市样本分成两个随机子样本,其中一个样本被用来“种植”因果森林,随后将因果森林省份聚类的
ATE
与非省份聚类的
ATE
预测进行比较,有关结果通过岭回归展开了进一步讨论。此外,在277个样本中选取了39座代表性城市进行城市网络流量(
flow
)测试,基于引力流量的社会网络分析(
SNA
)更有利于精准度量区域发展的态势。之前Taylor等(2010)和Fagiolo(2010)等对国际贸易和金融网络的拓扑推断给本实证带来很多启示,尤其是对系数估计和关系网络参数推断。
本文的主要贡献在于:第一,本文构建了由政府因素、两部门结构和两地区的均衡理论模型讨论地区生产率和区域分化问题。第二,使用机器学习算法对2003—2018年277座地级及以上城市数据开展统计分析,尤其采用因果森林(
causal forest
)算法对“倾斜性”政策的阶段性效果进行了有效估计,并有效地解释了南北发展分化新原因。与传统政策评估模型需要进行参数化设置不同,机器学习分析非参数模型有巨大优势。作为有监督机器学习(如随机森林)往经济可解释性方向突破的最新进展,因果森林可大幅提高政策评估的可信度(Athey等2019;Knittel和Stolper,2019)。这种以数据驱动方式获得因果推断结果,其可信度来源于两方面:一方面,因果森林通过大量的子样本产生平均处理效应(
ATE
)的平滑估计,其预测值以真实条件平均处理效应(
CATE
)为中心;另一方面,Athey和Imbens(2016)、Athey等(2019)证明了因果森林算法估计结果满足渐近正态性。
接下来本文内容安排为:第二部分构建有政府因果的理论模型并提出待检验的假说;第三部分是统计指标的选择说明;第四部分是因果森林估计过程;第五部门稳健性检验;第六部分有关结论和政策建议。
二、理论模型
本理论模型借鉴了Gollin等(2016)有关农业、可贸易和不可贸易三部门均衡思想,其研究核心是分析资源出口型国家城市化过程中所呈现的“荷兰病”问题。与之不同的是,本文所构建的均衡模型聚焦于城市可贸易和不可贸易两部门结构调整及其区域增长问题,而考虑到我国独特的城镇化和区域协调发展背景,我们在生产均衡模型中引入了区域政策租(
$ R $
),很多欠发达地区政策租来源于国家层面的政策倾斜,譬如财政转移支付和建设用地审批优先权等,显然这些区域政策直接与地方政府行为紧密相连,并影响城市生产部门调整及其产出水平。模型的基本假设如下:(1)整个经济体存在两个地区,发达地区
$ M $
和欠发达地区
$ N $
,每个地区存在两个生产部门:不可贸易品生产部门
$ u $
和可贸易品生产部门
$ k $
。(2) 不可贸易产品,如私人服务等不能在整个经济市场交易,其价格
$ {p_u} $
由本地市场内生性决定。由于产品具有市场化程度低的特性,该部门生产率增速相对慢于可贸易部门。(3) 可贸易产品,如工业品和可贸易服务能在全国市场交易并形成竞争性价格
$ p_k^{*} $
假设居民对数线性效用
$ u $
源于两类产品消费:不可贸易产品
$ {c_u} $
和可贸易产品
$ c{}_k $
,结合
Stone-Geary
函数思想,那么居民效用为:
$ {\lambda _k} + {\lambda _u} = 1 $
。假设效用函数是位似的,且不同地区的居民效用函数的权重相同。不同于其他产业结构变迁模型,这里所构建的城市两部门结构调整模型不用假设需求非位似性,但其结论最后与非位似性是一致的。
不同地区生产部门就业结构存在差异,两地区可贸易部门就业结构相对比值
$ {\delta _k} $
与不可贸易部门结构相对比值
$ {\delta _u} $
$ {Y}_{k}={Y}_{Mk}+{Y}_{Nk}={A}_{Mk}{L}_{Mk}^{1-\alpha }+{A}_{Nk}{L}_{Nk}^{1-\alpha }=({\tau }_{k}+{\delta }_{k}{}^{1\text-\alpha }){\psi }_{N}{\zeta }_{N}^{1-\alpha }{A}_{Nu}{L}_{Nu}^{1-a} $
$ i $
地区不可贸易部门产出函数表示为:
$ {Y_{iu}} = {A_{iu}}L_{iu}^{1 - \alpha } \text{,} i = M,N $
整个经济体不可贸易部门产出函数是:
$ {Y}_{u}={Y}_{Mu}+{Y}_{Nu}={A}_{Mu}{L}_{Mu}^{1-\alpha }+{A}_{Nu}{L}_{Nu}^{1-\alpha }=({\tau }_{u}+{\delta }_{u}^{1\text-\alpha }){A}_{Nu}{L}_{Nu}^{1-a} $
$ M $
总产出函数是:
$ {Y_M} = {Y_{Mk}} + {Y_{Mu}} = {A_{Mu}}L_{Mu}^{1 - \alpha } + {A_{Mk}}L_{Mk}^{1 - \alpha } = {\tau _u}\delta _u^{1 - \alpha }({\psi _M}\zeta _M^{1 - \alpha } + 1){A_{Nu}}L_{Nu}^{1 - \alpha } $
欠发达地区
$ N $
总产出函数是:
$ {Y_N} = {Y_{Nk}} + {Y_{Nu}} = {A_{Nu}}L_{Nu}^{1 - \alpha } + {A_{Nk}}L_{Nk}^{1 - \alpha } = (1 + {\psi _N}\zeta _N^{1 - \alpha }){A_{Nu}}L_{Nu}^{1 - \alpha } $
不同部门生产函数中
$ \alpha $
是相同的,生产过程中劳动力边际产出递减。某地区居民收入
$ {q_i} $
满足的支出关系是:
$ {\lambda _{ik}}{q_i} = (1 - {\theta _i}){R_i} + p_{ik}^*{Y_{ik}} \text{,} i = M,N $
可贸易部门产品价格取决于整个经济的市场竞争,
$ p_{ik}^* = p_k^* $
,不可贸易部门产品价格却由本地市场决定。若劳动人口可以在跨区域、跨部门之间自由流动,那么均衡状态时各地区以及生产部门之间工资率相等。因此,劳动力跨区域流动时工资率满足:
$ {w_{Mj}} = {w_{Nj}} , j = k,u $
同理,劳动力跨部门流动时:
$ {w_{ik}} = {w_{iu}} \text{,} i = M,N $
由于工资率分别等于产出函数的劳动力边际产出,结合式(12)、式(13)和式(14)可以得到:
$ {L_{iu}} = {\left\{ \frac{{[(1 - {\theta _i}){\lambda _{iu}} + {\theta _i}{\lambda _{ik}}] \cdot {R_i}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){P_{iu}}{A_{iu}}}}\right\} ^{ {{\raise0.3ex\hbox{$1$} \mathord{\left/ {\vphantom {1 {1 - \alpha }}}\right.\kern-\nulldelimiterspace} \lower0.3ex\hbox{${1 - \alpha }$}}}}} , i = M,N $
$ {Y_{iu}} = \frac{{[(1 - {\theta _i}){\lambda _{iu}} + {\theta _i}{\lambda _{ik}}] \cdot {R_i}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){P_{iu}}}} , i = M,N $
$ {L_{ik}} = {\left\{ \frac{{[(1 - {\theta _i}){\lambda _{iu}} - {\theta _i}{\lambda _{ik}}] \cdot {\zeta _i}{R_i}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){\psi _i}P_k^*{A_{iu}}}}\right\} ^{ {{\raise0.7ex\hbox{$1$} \mathord{\left/ {\vphantom {1 {1 - \alpha }}}\right.\kern-\nulldelimiterspace} \lower0.7ex\hbox{${1 - \alpha }$}}}}} , i = M,N $
$ {Y_{ik}} = \frac{{[(1 - {\theta _i}){\lambda _{iu}} - {\theta _i}{\lambda _{ik}}] \cdot {\zeta _i}{R_i}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){\psi _i}P_k^*}} , i = M,N $
均衡状态下,整个经济体不可贸易部门和不可贸易部门工资率也相等,那么:
$ (1+{\tau }_{k}{\delta }_{k}^{1-\alpha }){P}_{k}^{*}{A}_{Nk}{L}_{Nk}^{-\alpha }=(1+{\tau }_{u}{\delta }_{u}^{1-\alpha }){P}_{u}{A}_{Nu}{L}_{Nu}^{-\alpha } $
$ M $
总产出与地区
$ N $
总产出之比
$ \gamma $
$ \gamma = \frac{{{Y_M}}}{{{Y_N}}} = \frac{{{Y_{Mk}} + {Y_{Mu}}}}{{{Y_{Nk}} + {Y_{Nu}}}} = \frac{{{\tau _u}\delta _u^{1 - \alpha }({\psi _M}\zeta _M^{1 - \alpha } + 1)}}{{{\psi _N}\zeta _N^{1 - \alpha } + 1}} $
利用式(15)—式(21),将式(22)
$ \gamma $
$ \gamma = \frac{{{{\left[ {{\lambda _u}{R_N}{P_{Nu}}({\theta _N}{A_{Nu}} - {A_{Nk}})} \right]}^{1 - \alpha }} + {\theta _M}{{({\psi _M}\zeta _M^{ - \alpha } + {R_M}{\lambda _k}P_k^{*})}^{1 - \alpha }}}}{{{\psi _N}\zeta _N^{1 - \alpha } + {\delta _u}(\tau _k/{\tau _u})}} $
全国居民效用权重一样,即:
$ \frac{{\partial {L_{iu}}}}{{\partial {R_i}}} = {(1 - \alpha )^{ - 1}}{R_i}^{\alpha/1-\alpha}{\left[\frac{{(1 - {\theta _i}){\lambda _{iu}} + {\theta _i}{\lambda _{ik}}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){P_{iu}}{A_{iu}}}}\right]^{1/1-\alpha}} $
$ \frac{\partial {L}_{iu}}{\partial {\theta }_{i}}={(1-\alpha )}^{-1}\left(\frac{{R}_{i}}{{P}_{iu}{A}_{iu}}\right)^{1/1-\alpha}\left(\frac{{\lambda }_{ik}-{\lambda }_{iu}}{{\lambda }_{ik}-{\lambda }_{iu}{\zeta }_{i}}\right){\left[\frac{(1-{\theta }_{i}){\lambda }_{iu}+{\theta }_{i}{\lambda }_{ik}}{({\lambda }_{ik}-{\lambda }_{iu}{\zeta }_{i})}\right]}^{\alpha/1-\alpha} $
$ \frac{{\partial {L_{ik}}}}{{\partial {R_i}}} = {(1 - \alpha )^{ - 1}}{R_i}^{\alpha/1}{\left[\frac{{[(1 - {\theta _i}){\lambda _{iu}} - {\theta _i}{\lambda _{ik}}]{\zeta _i}}}{{({\lambda _{ik}} - {\lambda _{iu}}{\zeta _i}){\psi _i}P_k^*{A_{iu}}}}\right]^{1/1-\alpha}} $
$ \frac{\partial {L}_{ik}}{\partial {\theta }_{i}}={(1-\alpha )}^{-1}\left(\frac{{\zeta }_{i}{R}_{i}}{{\psi }_{i}{P}_{k}^{*}{A}_{iu}}\right)^{1/1-\alpha}\left(\frac{-{\lambda }_{ik}-{\lambda }_{iu}}{{\lambda }_{ik}-{\lambda }_{iu}{\zeta }_{i}}\right){\left[\frac{(1-{\theta }_{i}){\lambda }_{iu}-{\theta }_{i}{\lambda }_{ik}}{({\lambda }_{ik}-{\lambda }_{iu}{\zeta }_{i}){\psi }_{i}}\right]}^{\alpha/1-\alpha} $
$ \frac{{\partial \gamma }}{{\partial {R_N}}} = \frac{{(1 - \alpha ){R_N}^{ - \alpha }{{\left[ {{\lambda _u}{P_{Nu}}({\theta _N}{A_{Nu}} - {A_{Nk}})} \right]}^{1 - \alpha }}}}{{{\psi _N}\zeta _N^{1 - \alpha } + {\delta _u}(\tau _k/{\tau _u})}} $
通过式(24)—式(29)可以得到以下结果:
$\dfrac{{\partial {L_{Nu}}}}{{\partial {R_N}}} > 0$
$\dfrac{{\partial {L_{Nu}}}}{{\partial {\theta _N}}} > 0$
$\dfrac{{\partial {L_{Nk}}}}{{\partial {R_N}}}$
$\dfrac{{\partial {L_{Nk}}}}{{\partial {\theta _N}}}$
符号是不确定的。
(ii)当
${\theta _N} > \dfrac{{{A_{Nk}}}}{{{A_{Nu}}}}$
$ {\theta _N}{A_{Nu}} - {A_{Nk}} > 0 $
$\dfrac{{\partial \gamma }}{{\partial {R_N}}} > 0$
${\theta _N} < \dfrac{{{A_{Nk}}}}{{{A_{Nu}}}}$
$ {\theta _N}{A_{Nu}} - {A_{Nk}} < 0 $
$\dfrac{{\partial \gamma }}{{\partial {R_N}}} < 0$
,两地区发展差距
$ \gamma $
与区域政策租存在非线性关系,该非线性关系取决于地方政府将政策租分配到不可贸易部门的比例为
$ {\theta _N} $
和各部门的生产率(
$ {A}_{k}或{A}_{u} $
)。因此,本文提出待检验的假说如下:
假说1:地方政府介入经济活动以及“倾斜性”政策的力度加大均会提高当地不可贸易部门份额。
假说2:“倾斜性”政策对生产部门结构造成非对称冲击,该冲击的空间异质性结果是区域发展分化的一个重要来源。一些地区将资源过度投入不可贸易部门,但市场化程度低、生产率提升缓慢的现象会随之而来,相对于其他可贸易部门迅速扩张的地区,他们长期发展差距呈现扩大的现象。
三、变量说明
实证样本选自2003—2018年277座地级及以上的城市,具体数据来源于《中国城市统计年鉴》,
Wind
数据库和国泰安数据库。为衡量地方政府对经济发展的干预程度,使用主成分法构建了由城市建设用地面积增速、建设用地面积变异系数和城市财政收支三因素的政府行为指数。为了对两部门结构、“倾斜性”政策及区域发展态势估计结果开展进一步稳健性检验,文中增加引力模型对39座代表城市
③
的引力流量(
flow
)的分析。国家对区域资源配置的干预影响了城市间错综的贸易、资本以及人口流动网络,所以城市网络引力流量(
flow
)有助于分析这种空间关联结构演变趋势,同时也能避免内生性困境。借鉴Sen和Smith(1995)、Kolaczy和Csárdi(2014)和刘华军等(2015)的引力模型的处理方式,城市网络中
$ i $
$ j $
城市的引力流量
$ {f_{ij}} $
$ {f_{ij}} = {\sigma _{ij}}\frac{{\sqrt {{q_i}{q_j}} }}{{{d_{ij}}^2}} \text{,} {\sigma _{ij}} = \frac{{{q_j}}}{{{q_i} + {q_j}}} $
$ {d_{ij}} $
$ i $
$ j $
之间的地理距离,用城市之间高速公路距离衡量,
$ i $
城市人均
GDP
表示为
$ {q_i} $
$ j $
城市人均
GDP
表示
$ {q_j} $
,其他有关地区特征变量的选取见
表1
。
④
⑤
表 1
指标体系构建说明
为讨论“倾斜性”政策时空异质性效果,我们使用了Athey等(2019)条件平均处理效应(
CATE
),即
$ \tau (x) = E\left[ {{Y_i}(1) - {Y_i}(0)\left| {{X_i} = x} \right.} \right] $
$ {Y_i}(1) $
$ {Y_i}(0) $
分别表示对城市样本
$ i $
进行处理和控制后的观测结果。按照50%比例将全部城市数据随机分为两个样本子集,即训练样本集和估计样本集,训练样本集用于生成回归树结构,并构建了1000棵因果树。为避免随着因果树生长越来越“茂盛”时,出现高估拟合优度现象,文中使用了Athey和Imbens(2016)“诚实估计(
honest estimation
)”方法,并通过递归二叉分裂法将12个协变量特征空间分成不同的子空间。最后,基于Tibshirani等(2018)广义随机森林过程进行了相应的参数调试。实际上,2003年发展水平较低的城市更容易得到区域政策的倾斜,这意味着潜结果模型研究最初存在对象选择偏差(
selection bias
)问题(如
图1
)。但是,根据Athey和Imbens(2016)以及Athey等(2019)所创造的异质性处理效应估计方法−因果森林,能够给出观测性研究处理效应(
Treatment Effects
)的预测,并建立有效的置信区间。
$ \hat{\tau }=\frac{{\displaystyle {\sum }_{i=1}^{n}{\alpha }_{i}(x)\left[{Y}_{i}-{\hat{m}}^{(-i)}({X}_{i})\right]\left[{Z}_{i}-{\hat{e}}^{(-i)}({X}_{i})\right]}}{{\displaystyle {\sum }_{i=1}^{n}{\alpha }_{i}(x){\left[{Z}_{i}-{\hat{e}}^{(-i)}({X}_{i})\right]}^{2}}} $
因果森林以通过式(31)的形式估计预测结果。
$ {\alpha _i}(x) $
是由机器学习驱动形成的核(
kernel
),
$ {Z_i} $
为处理变量。用
$ e(x) = P\left[ {{Z_i}\left| {{X_i} = x} \right.} \right] $
表示倾向值得分,
$ m(x) = E\left[ {{Y_i}\left| {{X_i} = x} \right.} \right] $
表示“照顾性”政策效果期望值。符号
$ -i $
表示“袋外(
out-of-bag
)”预测,即
$ {Y_i} $
不用于计算
$ {\hat m^{( - i)}}({X_i}) $
$ e(x) $
是倾向值得分,满足0~1均匀分布。
$ \hat m( \cdot ) $
$ \hat e( \cdot ) $
是广义随机森林的估计值,并在两个森林中进行“袋外”预测。
接下来将省级层面聚类特征融入因果森林算法模型中。之所以考虑以省份为聚类单元,是因为省级政府是国家治理结构非常重要的行政节点,同一省份内各地级市往往有着类似的公共政策、区位特征和文化特征,甚至投资环境也具有某种共性。在机器学习算法中考虑这些相似特征并赋予同一省份相同或更合适的权重,一定程度上克服了机器学习算法依靠数据驱动的弊端,尤其是“过拟合”问题。若
$ J $
是省份的数量,那么考虑省份聚类的平均处理效应
$ \hat \tau $
估计如下:
$ {\hat \tau _j} = \frac{{\text{1}}}{{{n_j}}}\sum\limits_{\left\{ {i:{A_i} = j} \right\}} {{{\hat \Gamma }_i}} ,\hat \tau = \frac{1}{J}\sum\limits_{j = 1}^J {{{\hat \tau }_j}} ,{\hat \sigma ^2} = \frac{1}{{J(J - 1)}}{\sum\limits_{j = 1}^J {\left( {{{\hat \tau }_j} - \hat \tau } \right)} ^2} $
$ {\hat{\Gamma }}_{i}={\hat{\tau }}^{(\text-i)}({X}_{i})+\frac{{Z}_{i}-{\hat{e}}^{(-i)}({X}_{i})}{{\hat{e}}^{(-i)}({X}_{i})\left(1-{\hat{e}}^{(-i)}({X}_{i})\right)}\left\{{Y}_{i}-{\hat{m}}^{(-i)}({X}_{i})-\left[{Z}_{i}-{\hat{e}}^{(-i)}({X}_{i})\right]{\hat{\tau }}^{(-i)}({X}_{i})\right\} $
(二)基本估计结果
因果森林给出“倾斜性”区域政策不同地区平均处理效应(
ATE
),其中涉及到处理变量
$ Z $
、结果变量(人均
GDP
发展速度)以及12个协变量。
⑥
表2
汇报的
ATE
结果发现:首先,尽管“倾斜性”政策在各地区的效果均出现了下降,然而不论在哪个阶段,“倾斜性”政策在南方地区实施的效果显著优于北方地区,以省级聚类的因果森林算法分析结果为例,全阶段“倾斜性”政策干预对南方地区人均
GDP
发展速度提升年均贡献了3.6%(
ATE
=0.036),而北方地区年均贡献为0.8%(
ATE
=0.008)。其次,第二阶段“倾斜性”政策在南北地区效果进一步拉大,当考虑省份聚类后,南北地区
ATE
差距从第一阶段0.011扩大到第二阶段0.044。再次,在调整不同参数(即不考虑省份聚类或考虑省份聚类)后,他们的
ATE
符号趋势相同。这些统计结果验证了理论假说2,即“倾斜性”政策的异质性效果是南北区域分化的重要原因。
表 2
各地区不同阶段
ATE
如
图2
显示,不论哪个阶段,“倾斜性”政策干预对南方城市促进作用效果总体上好于北方城市,尤其在第二阶段,南方城市
CATE
相对更大,分布更为集中,而这阶段区域干预政策在北方城市效果分化更严重,且“倾斜性”政策对北方城市发展的促进效果已经不明显了(
CATE
为负),这些统计结果验证了理论假说2。
(四)生产部门结构变迁
为了讨论生产部门变迁与区域发展分化的关系,接下来通过因果森林算法获得条件平均处理效应:
$ \tau (两部门结构比)=E\left[{Y}_{i}(1)-{Y}_{i}(0)|{X}_{i}=两部门结构比\right] $
,以便深入探讨各阶段两部门结构比与“倾斜性”政策处理效果异质性。地方政府行为、不可贸易部门份额和“倾斜性”政策效果之间的相关性统计如
图3
和
图4
所示。
(1) “倾斜性”政策、地方政府行为与城市不可贸易部门份额存在紧密关系。这体现在以下两方面: 一方面,地方政府介入经济活动的力度越大,可贸易与不可贸易两部门就业结构比越小,即不可贸易部门份额更高,如
图(3
a
)
所示;另一方面,不可贸易部门份额更高的城市,“倾斜性”政策促进其人均
GDP
增长的效果越好,如
图(3
b
)
(2)有关2012—2018年数据统计显示,一方面,不可贸易部门份额与“倾斜性”政策效果的关系因南北区位产生很大差异,不可贸易部门份额更大的南方城市,
CATE
更大,如
图(4
b
)
,但北方地区该相关性不明显,如
图(4
a
)
。另一方面,尽管地方政府介入经济活动都会提高城市不可贸易部门份额,如
图(4
c
)
和
(4
d
)
,然而受区域政策倾斜的南方城市不可贸易部门份额与
CATE
的相关性更强,这意味着2012以来“倾斜性”政策对南方城市人均
GDP
增速仍有促进作用,而北方城市效果不明显。这进一步解释理论假说1和假说2。
五、稳健性检验
(一) 岭回归
下面运用了一种重要的机器学习方法−岭回归分析了城市生产效率与两部门结构关系,在使用岭回归对不同地区经济发展状况的估计中,被解释变量是城市人均
GDP
,解释变量包括虚拟变量
$ {Z_0} $
以及因果森林算法所使用的12个协变量,其中使用十折交叉验证法获得调节参数
$ \lambda $
值。岭回归系数的报告如
表3
和
表4
。
表 3
2004—2011年岭回归结果
表3
和
表4
分别汇报了2004—2011年和2012—2018年两个不同阶段的岭回归估计系数。岭回归通过
glmnet
函数将所有变量进行了标准化,以消除变量尺度上的差别。在将数据分割为训练集和测试集后,测试集的
MSE
都非常小,均没有超过0.4,而且2012—2018年岭回归下测试
MSE
尚不足0.06,即这些岭回归的估计结果是可信的。
首先,两部门结构比是解释人均
GDP
最重要的因素之一。例如,2004—2011年变量两部门结构比系数在基于南方、北方和全国样本的岭回归后,其系数分别为0.134、0.194和0.122,其他变量系数均“压缩”至0附近,而信贷发展速度除外。
其次,基于南北地区样本的岭回归中,两部门结构比系数在两个阶段发生了反转,在第一阶段南方地区样本估计系数0.134,小于北方0.194,而到了第二阶段情况发生逆转,南方城市两部门结构比系数0.051大于北方两部门结构比系数0.044。这在一定程度上验证了因果森林算法下的
ATE
规律,即2012—2018年南方城市的两部门结构比(可贸易部门与不可贸易部门比)在因果森林形成过程中的重要性要大于北方,该情况恰与第一阶段发生了反转,因为2004—2011年北方城市两部门结构比重要性相对更高。这也再次证明了2012年以来,南北城市不可贸易部门份额的变动以及该生产效率提升的差异是地区发展差距扩大的重要原因。
表 4
2012—2018年岭回归结果
(二)基于社会网络分析法(
SNA
)的检验
⑦
为了避免岭回归可能存在内生性问题,接下来使用有向关系数据城市网络引力流量(
flow
)分析不同城市发展态势。采用引力模型分析城市网络总流量克服了单维无方向数据统计的局限,某种程度优于传统空间计量“邻近”思想。城市引力流量模型探讨39座样本城市发展态势时,使用了
Newton
-
Raphson
方法以及衍生的迭代加权最小二乘法(Kolaczy和Csárdi,2014)。与逻辑回归类似,将城市网络引力流
$ {f_{ij}} $
设定为计数形式。
根据实证结果,两部门结构比是解释城市引力流量极其重要的解释变量,在加入变量政府行为指数后,基于2004—2011年和2012—2018年样本数据的广义线性模型的回归系数分别是0.400和0.610,且非常显著。由于这里的城市引力流量的度量是以两地人均
GDP
作为核心因素,这间接说明了可贸易与不可贸易部门的份额变动是影响城市生产效率和地区人均产出差距的重要因素。从39座样本城市看,并没有发现地方政府干预行为从根本上改变引力的流向,政府行为指数在两阶段系数分布是−0.330和−0.220。此外,城市引力流也存在显著的南北方差异。
六、结论与政策建议
区域协调发展政策在资源空间配置及区域高质量发展方面发挥了积极作用。很多“倾斜性”政策与生产部门结构调整紧密相关,并一定程度上改变了空间发展格局,形成了独特的人流、物流和资本流之间的网络形态,尤其是近几年来,南北地区城市发展态势发生了比较明显的差异。鉴此,本文深入研究了“倾斜性”政策、生产部门结构调整和区域发展差异的关系,利用277座城市2003—2018年样本数据,结合因果森林等机器学习方法对“倾斜性”政策效果进行了有效评估,并深入探讨了南北区域发展差异成因,结果发现:
(1)“倾斜性”政策一定程度能改变落后地区发展态势,但是在促进经济快速发展过程中,“倾斜性”政策在南方城市效果总体上优于北方,2012年以来该现象更为明显。对不同阶段的因果森林异质性处理效应分析均得到类似的结果,尤其采用省级聚类的因果森林异质性处理效应的稳健性检验结果显示,2004—2018年,“倾斜性”政策干预对南方地区人均
GDP
发展速度提升年均贡献了3.6%,而北方地区年均贡献约为0.8%。而且,自从2012年以来,“倾斜性”政策在南北地区的效果差别进一步拉大,考虑省份聚类后,南北地区
ATE
差额从第一阶段0.011扩大到第二阶段0.044。同时,南方城市
CATE
分布更为集中,受照顾政策城市的生产效率发展规律更趋同,而北方城市的效果出现比较严重的分化;从平均角度看,“倾斜性”政策对北方城市发展的促进效果已逐渐变弱。
(2)生产部门变迁与“倾斜性”政策效果紧密相关。在因果森林形成过程中,2004—2011年北方城市两部门结构比重要性相对更高,而在2012以后该情况发生了逆转。岭回归的结果也显示,两部门结构比是解释人均
GDP
增长重要因素之一。以2004—2011年南方、北方和全国城市样本的岭回归为例,两部门结构比系数分别为0.134、0.194和0.122,其他变量系数均“压缩”至0附近(信贷增速等极少数变量除外)。而最后的实证围绕39座典型城市人均
GDP
构建了引力模型,形成了城市有向引力流量数据,其中广义线性模型采用
Newton
-
Raphson
衍生出的迭代加权最小二乘法处理,以克服内生性和多重共线性问题,最后估计系数非常显著,不管何种时期,两部门结构比是解释城市引力流量极其重要的解释变量。加入变量政府行为指数后,基于2004—2011年和2012—2018年样本数据的广义线性模型的回归系数分别是0.400和0.610,且非常显著。这是间接证实了可贸易与不可贸易部门的份额变动影响城市生产效率及引发地区人均产出的差距。此外,城市引力流也存在显著的南北方差异。
(3)借助于“倾斜性”政策支持,有的地区政府热衷于提高产业规模和城镇化率,结果不成比例地扩大了不可贸易部门相对份额。长期以来,相较可贸易部门份额扩大的地区,生产效率提升处于劣势。尽管这种现象在我国普遍存在,以北方地区更为严重。“倾斜性”政策引致地区生产部门结构非对称变化,地方政府的介入加剧了这种变化的空间异质性,形成了区域发展差距的重要来源。不论南方或北方城市,在第一阶段“倾斜性”政策效果几乎没有差别,在第二阶段,就两部门结构比与“倾斜性”政策效果看,南方地区相对更有优势,经济发展速度更快。另一方面,尽管“倾斜性”政策会提高所有欠发达地区的不可贸易部门份额,但是欠发达的南方城市不可贸易份额与区域政策
CATE
的相关性更强。相对于北方城市,2012以来南方城市不可贸易部门生产效率提升更快,这便是近年来南北方发展差距拉大的另一重要原因。统计结果表明,不同地区不可贸易部门份额与“倾斜性”政策效果的关系有明显差异,不可贸易份额更大的南方城市,
CATE
更大,但北方地区该相关性不明显。
针对“倾斜性”政策效果的时空异质性和区域发展新分化特征,本文建议如下:(1)重新梳理财政转移、基础建设与土地审批等区域政策的长短期利弊关系,意识到这些政策的区域异质性效果以及不可持续特征。避免出现因政府干预行为而产生区域发展分化的新来源。之前政策扶持下很多工业园区(尤其是欠发达地区)出现了效率低下,资源浪费的现象,这些巨大投入却对区域收敛作用并没有预期明显。(2)未来区域政策重心应当向如何提升欠发达地区人力资本积累方面倾斜。加大对中西部的教育、科研、医疗服务和住房市场投入和建设力度,营造有利于人才成长的氛围,形成高效的创新创业新机制,这样利于地区长期发展收敛。(3)区域政策更加精细化、专业化,从国家层面为欠发达地区的中小企业发展提供支持,目的是提高其市场化程度和贸易参与度,重点是帮助这些企业完善和强化产业链供应链。
① 人均
GDP
数据来自
Wind
,南北城市划分以淮河—秦岭为界。
② 将城市生产部门分可贸易和不可贸易两个部门。
③ 根据有向数据的图论思路选取四大区域中不同
GDP
级别城市样本,篇幅限制,名单备索。
④ 277座地级及以上城市包括北方城市130座,南方城市147座;由于篇幅限制,详细列表省略。
⑤ 依据《中国城市统计年鉴》将可贸易部门以下九类:制造业、批发零售贸易业、交通仓储邮电业、信息传输计算机服务和软件业、金融保险业、租赁和商业服务业、科研综合技术服务业、文化体育和娱乐业。不可贸易部门分为十类:卫生社会保险和社会福利业、公共管理和社会组织、农林牧渔业、电力煤气及水生产供应业、建筑业、住宿餐饮业从业、房地产业、水利环境和公共设施管理业、居民服务和其他服务业、教育文广播影视化业。
⑥ 将北京、天津、河北、上海、江苏、浙江、福建、山东、广东、海南除外,其他省份所管辖的地级市及以上城市均接受区域倾斜政策干预,处理变量设为1。样本城市有277座,以传统的秦岭—淮河为界,北方城市为130座,南方城市为147座。
⑦ 限于篇幅,分析表格省略,若有需要,可向作者索取。
主要参考文献
胡尊国, 王耀中, 尹国君. 落后地区的城镇化与工业化——基于劳动力匹配视角[J].
经济评论, 2016(2): 98–111.
Athey S, Imbens G. Recursive partitioning for heterogeneous causal effects[J].
Proceedings of the National Academy of Sciences of the United States of America, 2016, 113(27): 7353–7360.
DOI:10.1073/pnas.1510489113
Dix-Carneiro R, Kovak B K. Margins of labor market adjustment to trade[J].
Journal of International Economics, 2019, 117: 125–142.
DOI:10.1016/j.jinteco.2019.01.005
Fagiolo G. The international-trade network: Gravity equations and topological properties[J].
Journal of Economic Interaction and Coordination, 2010, 5(1): 1–25.
DOI:10.1007/s11403-010-0061-y
Gollin D, Jedwab R, Vollrath D. Urbanization with and without industrialization[J].
Journal of Economic Growth, 2016, 21(1): 35–70.
DOI:10.1007/s10887-015-9121-4
Knittel C R, Stolper S. Using machine learning to target treatment: The case of household energy use[R]. NBER Working Paper No.26531, 2019.
Samuelson P A. Theoretical notes on trade problems[J].
The Review of Economics and Statistics, 1964, 46(2): 145–154.
DOI:10.2307/1928178
Sen A, Smith T E. Gravity models of spatial interaction behavior[M]. Berlin, Heidelberg: Springer, 1995.
Taylor P J, Hoyler M, Verbruggen R. External urban relational process: Introducing central flow theory to complement central place theory[J].
Urban Studies, 2010, 47(13): 2803–2818.
DOI:10.1177/0042098010377367