地级市2010-2019网络基础设施包容性绿色增长与地区差距基于双重机器学习的因果推断
地级市2010-2019网络基础设施包容性绿色增长与地区差距基于双重机器学习的因果推断
含原始数据及计算结果、计算代码、参考文献
数据来源:基于上市公司年报、公告数据,中国统计年鉴、及各地区统计年鉴数据的整理计算
数据期间:2010-2019
数据范围:全国各地级市
参考文献:
网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断
主要指标:




(一)研究设计部分
附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。
附表1 主要变量定义及描述性统计
|
变量 |
计算方法及符号表示 |
均值 |
标准差 |
最小值 |
最大值 |
|
|
被解释变量 |
包容性绿色增长 (IGG) |
2.991 |
0.797 |
0.954 |
7.199 |
|
|
处置变量 |
“宽带中国”政策虚拟变量 (Broadband) |
0.188 |
0.391 |
0.000 |
1.000 |
|
|
控制变量 |
教育投入 |
教育支出与地区GDP之比 (Edu) |
0.035 |
0.019 |
0.008 |
0.185 |
|
科技投入 |
科学技术支出与地区GDP之比 (Sci) |
0.003 |
0.003 |
0.000 |
0.063 |
|
|
城市化水平 |
每平方公里人口数的自然对数 (Urban) |
5.738 |
0.922 |
1.620 |
7.882 |
|
|
固定资产投资 |
固定资产投资总额与地区GDP之比 (Inv) |
0.779 |
0.288 |
0.087 |
2.243 |
|
|
互联网普及率 |
国际互联网用户数与年末总人口之比 (Inter) |
0.212 |
0.184 |
0.003 |
3.664 |
|
|
居民消费 |
社会消费品零售总额与地区GDP之比 (Consump) |
0.383 |
0.110 |
0.000 |
1.013 |
|
|
产业结构 |
第三产业增加值与第二产业增加值之比 (Constru) |
0.964 |
0.537 |
0.176 |
5.154 |
|
|
政府干预 |
地方财政一般预算内支出与地区GDP之比 (Fis) |
0.202 |
0.135 |
0.044 |
2.527 |
|
|
失业水平 |
年末城镇登记失业人员数与年末总人口之比 (Unemp) |
0.009 |
0.123 |
0.000 |
6.509 |
|
|
金融规模 |
年末金融机构各项存贷款余额与地区GDP之比(Size) |
2.381 |
1.248 |
0.588 |
21.301 |
|
|
人力资本 |
每万人小学、普通中学、普通高等学校 在校学生数的自然对数 (Cap) |
7.191 |
0.287 |
6.133 |
8.657 |
|
|
交通运输水平 |
公路客运量的自然对数 (Pass) |
8.435 |
1.004 |
2.197 |
12.566 |
|
|
公路货运量的自然对数 (Fre) |
9.004 |
0.869 |
5.361 |
13.225 |
||
|
机制变量 |
技术创新 |
专利申请量的自然对数 (Patent) |
7.529 |
1.630 |
2.996 |
12.226 |
|
绿色技术创新 |
绿色专利申请量的自然对数 (GPatent) |
5.028 |
1.716 |
0.000 |
10.454 |
|
|
农业创业 |
农、林、牧、渔业企业注册数目的自然对数 (ABusiness) |
7.239 |
0.921 |
3.091 |
10.683 |
|
|
非农创业 |
其他行业企业注册数目的自然对数 (NABusiness) |
10.331 |
0.851 |
7.834 |
13.709 |
|
|
就业规模 |
在岗职工平均人数的自然对数 (Scale) |
3.512 |
0.827 |
1.099 |
6.649 |
|
|
从业质量 |
在岗职工人均工资的自然对数 (Income) |
10.687 |
0.298 |
8.357 |
11.829 |
|
|
数字普惠金融 |
数字普惠金融总指数的自然对数 (DFII) |
5.001 |
0.513 |
2.834 |
5.773 |
|
|
覆盖广度 |
覆盖广度分项指数的自然对数 (Breadth) |
4.926 |
0.565 |
0.631 |
5.738 |
|
|
应用深度 |
应用深度分项指数的自然对数 (Depth) |
4.984 |
0.518 |
1.456 |
5.805 |
|
|
数字化程度 |
数字化程度分项指数的自然对数 (Digitization) |
5.168 |
0.625 |
0.993 |
6.365 |
|
(二)稳健性检验部分
本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。
附表2 稳健性检验
|
变量 |
(1) |
(2) |
(3) 考虑省份-时间交互固定效应 |
(4) 剔除并行政策干扰 |
||||
|
调整研究样本 |
缩尾处理 |
|||||||
|
剔除部分 城市 |
调整研究 区间 |
1%缩尾 |
5%缩尾 |
|||||
|
Broadband |
0.106*** (0.024) |
0.070*** (0.025) |
0.122*** (0.025) |
0.098*** (0.023) |
0.105*** (0.023) |
0.100*** (0.024) |
0.121*** (0.025) |
0.098*** (0.024) |
|
Smartcity |
是 |
是 |
||||||
|
Bigdata |
是 |
是 |
||||||
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
省份-时间 固定效应 |
否 |
否 |
否 |
否 |
是 |
否 |
否 |
否 |
|
样本量 |
2470 |
1974 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。
附表3 双重机器学习稳健性检验
|
变量 |
(1) 改变样本分割比例 |
(2) 更换机器学习模型 |
(3) 交互式模型 |
(4) 工具变量 |
|||
|
Kfolds=3 |
Kfolds=8 |
Lassocv |
Gradboost |
Nnet |
|||
|
Broadband |
0.109*** (0.026) |
0.098*** (0.025) |
0.263** (0.132) |
0.077*** (0.021) |
0.226*** (0.065) |
0.232*** (0.019) |
0.651** (0.289) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
(三)机制检验部分
本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。
与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:
θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。
附表4 “宽带中国”对机制变量的回归结果
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
(9) |
(10) |
|
Patent |
GPatent |
ABusiness |
NABusiness |
Scale |
Income |
DFII |
Breadth |
Depth |
Digitization |
|
|
Broadband |
0.204*** (0.038) |
0.266*** (0.044) |
0.074** (0.036) |
0.126*** (0.026) |
0.057** (0.024) |
0.038*** (0.011) |
0.029*** (0.008) |
0.031*** (0.008) |
0.073*** (0.015) |
0.140*** (0.029) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2538 |
2538 |
2538 |
2538 |
(四)重抽样检验
附表5 基准回归估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
IGG |
EG |
ID |
WB |
PR |
|
|
Broadband |
0.108*** (0.025) |
0.074** (0.037) |
0.350*** (0.045) |
-0.007 (0.019) |
0.051 (0.054) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
附表6 异质性分析估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
|
资源型 |
非资源型 |
老工业基地 |
非工业基地 |
发达城市 |
较发达城市 |
欠发达城市 |
交通基础设施 |
|
|
Broadband |
0.078* (0.041) |
0.114*** (0.030) |
0.121*** (0.035) |
0.114*** (0.035) |
0.264*** (0.065) |
0.017 (0.036) |
0.112*** (0.035) |
0.040** (0.018) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
1130 |
1690 |
940 |
1880 |
480 |
700 |
1640 |
2820 |
附表7 进一步讨论估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
城市相对差距 |
南北相对差距 |
胡焕庸线相对差距 |
沿海内陆相对差距 |
中心外围相对差距 |
|
|
Broadband |
-0.033* (0.017) |
-0.026* (0.014) |
-0.033** (0.015) |
-0.030* (0.017) |
-0.027** (0.011) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。
(一)研究设计部分
附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。
附表1 主要变量定义及描述性统计
|
变量 |
计算方法及符号表示 |
均值 |
标准差 |
最小值 |
最大值 |
|
|
被解释变量 |
包容性绿色增长 (IGG) |
2.991 |
0.797 |
0.954 |
7.199 |
|
|
处置变量 |
“宽带中国”政策虚拟变量 (Broadband) |
0.188 |
0.391 |
0.000 |
1.000 |
|
|
控制变量 |
教育投入 |
教育支出与地区GDP之比 (Edu) |
0.035 |
0.019 |
0.008 |
0.185 |
|
科技投入 |
科学技术支出与地区GDP之比 (Sci) |
0.003 |
0.003 |
0.000 |
0.063 |
|
|
城市化水平 |
每平方公里人口数的自然对数 (Urban) |
5.738 |
0.922 |
1.620 |
7.882 |
|
|
固定资产投资 |
固定资产投资总额与地区GDP之比 (Inv) |
0.779 |
0.288 |
0.087 |
2.243 |
|
|
互联网普及率 |
国际互联网用户数与年末总人口之比 (Inter) |
0.212 |
0.184 |
0.003 |
3.664 |
|
|
居民消费 |
社会消费品零售总额与地区GDP之比 (Consump) |
0.383 |
0.110 |
0.000 |
1.013 |
|
|
产业结构 |
第三产业增加值与第二产业增加值之比 (Constru) |
0.964 |
0.537 |
0.176 |
5.154 |
|
|
政府干预 |
地方财政一般预算内支出与地区GDP之比 (Fis) |
0.202 |
0.135 |
0.044 |
2.527 |
|
|
失业水平 |
年末城镇登记失业人员数与年末总人口之比 (Unemp) |
0.009 |
0.123 |
0.000 |
6.509 |
|
|
金融规模 |
年末金融机构各项存贷款余额与地区GDP之比(Size) |
2.381 |
1.248 |
0.588 |
21.301 |
|
|
人力资本 |
每万人小学、普通中学、普通高等学校 在校学生数的自然对数 (Cap) |
7.191 |
0.287 |
6.133 |
8.657 |
|
|
交通运输水平 |
公路客运量的自然对数 (Pass) |
8.435 |
1.004 |
2.197 |
12.566 |
|
|
公路货运量的自然对数 (Fre) |
9.004 |
0.869 |
5.361 |
13.225 |
||
|
机制变量 |
技术创新 |
专利申请量的自然对数 (Patent) |
7.529 |
1.630 |
2.996 |
12.226 |
|
绿色技术创新 |
绿色专利申请量的自然对数 (GPatent) |
5.028 |
1.716 |
0.000 |
10.454 |
|
|
农业创业 |
农、林、牧、渔业企业注册数目的自然对数 (ABusiness) |
7.239 |
0.921 |
3.091 |
10.683 |
|
|
非农创业 |
其他行业企业注册数目的自然对数 (NABusiness) |
10.331 |
0.851 |
7.834 |
13.709 |
|
|
就业规模 |
在岗职工平均人数的自然对数 (Scale) |
3.512 |
0.827 |
1.099 |
6.649 |
|
|
从业质量 |
在岗职工人均工资的自然对数 (Income) |
10.687 |
0.298 |
8.357 |
11.829 |
|
|
数字普惠金融 |
数字普惠金融总指数的自然对数 (DFII) |
5.001 |
0.513 |
2.834 |
5.773 |
|
|
覆盖广度 |
覆盖广度分项指数的自然对数 (Breadth) |
4.926 |
0.565 |
0.631 |
5.738 |
|
|
应用深度 |
应用深度分项指数的自然对数 (Depth) |
4.984 |
0.518 |
1.456 |
5.805 |
|
|
数字化程度 |
数字化程度分项指数的自然对数 (Digitization) |
5.168 |
0.625 |
0.993 |
6.365 |
|
(二)稳健性检验部分
本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。
附表2 稳健性检验
|
变量 |
(1) |
(2) |
(3) 考虑省份-时间交互固定效应 |
(4) 剔除并行政策干扰 |
||||
|
调整研究样本 |
缩尾处理 |
|||||||
|
剔除部分 城市 |
调整研究 区间 |
1%缩尾 |
5%缩尾 |
|||||
|
Broadband |
0.106*** (0.024) |
0.070*** (0.025) |
0.122*** (0.025) |
0.098*** (0.023) |
0.105*** (0.023) |
0.100*** (0.024) |
0.121*** (0.025) |
0.098*** (0.024) |
|
Smartcity |
是 |
是 |
||||||
|
Bigdata |
是 |
是 |
||||||
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
省份-时间 固定效应 |
否 |
否 |
否 |
否 |
是 |
否 |
否 |
否 |
|
样本量 |
2470 |
1974 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。
附表3 双重机器学习稳健性检验
|
变量 |
(1) 改变样本分割比例 |
(2) 更换机器学习模型 |
(3) 交互式模型 |
(4) 工具变量 |
|||
|
Kfolds=3 |
Kfolds=8 |
Lassocv |
Gradboost |
Nnet |
|||
|
Broadband |
0.109*** (0.026) |
0.098*** (0.025) |
0.263** (0.132) |
0.077*** (0.021) |
0.226*** (0.065) |
0.232*** (0.019) |
0.651** (0.289) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
(三)机制检验部分
本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。
与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:
θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。
附表4 “宽带中国”对机制变量的回归结果
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
(9) |
(10) |
|
Patent |
GPatent |
ABusiness |
NABusiness |
Scale |
Income |
DFII |
Breadth |
Depth |
Digitization |
|
|
Broadband |
0.204*** (0.038) |
0.266*** (0.044) |
0.074** (0.036) |
0.126*** (0.026) |
0.057** (0.024) |
0.038*** (0.011) |
0.029*** (0.008) |
0.031*** (0.008) |
0.073*** (0.015) |
0.140*** (0.029) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2538 |
2538 |
2538 |
2538 |
(四)重抽样检验
附表5 基准回归估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
IGG |
EG |
ID |
WB |
PR |
|
|
Broadband |
0.108*** (0.025) |
0.074** (0.037) |
0.350*** (0.045) |
-0.007 (0.019) |
0.051 (0.054) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
附表6 异质性分析估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
|
资源型 |
非资源型 |
老工业基地 |
非工业基地 |
发达城市 |
较发达城市 |
欠发达城市 |
交通基础设施 |
|
|
Broadband |
0.078* (0.041) |
0.114*** (0.030) |
0.121*** (0.035) |
0.114*** (0.035) |
0.264*** (0.065) |
0.017 (0.036) |
0.112*** (0.035) |
0.040** (0.018) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
1130 |
1690 |
940 |
1880 |
480 |
700 |
1640 |
2820 |
附表7 进一步讨论估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
城市相对差距 |
南北相对差距 |
胡焕庸线相对差距 |
沿海内陆相对差距 |
中心外围相对差距 |
|
|
Broadband |
-0.033* (0.017) |
-0.026* (0.014) |
-0.033** (0.015) |
-0.030* (0.017) |
-0.027** (0.011) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。
(一)研究设计部分
附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。
附表1 主要变量定义及描述性统计
|
变量 |
计算方法及符号表示 |
均值 |
标准差 |
最小值 |
最大值 |
|
|
被解释变量 |
包容性绿色增长 (IGG) |
2.991 |
0.797 |
0.954 |
7.199 |
|
|
处置变量 |
“宽带中国”政策虚拟变量 (Broadband) |
0.188 |
0.391 |
0.000 |
1.000 |
|
|
控制变量 |
教育投入 |
教育支出与地区GDP之比 (Edu) |
0.035 |
0.019 |
0.008 |
0.185 |
|
科技投入 |
科学技术支出与地区GDP之比 (Sci) |
0.003 |
0.003 |
0.000 |
0.063 |
|
|
城市化水平 |
每平方公里人口数的自然对数 (Urban) |
5.738 |
0.922 |
1.620 |
7.882 |
|
|
固定资产投资 |
固定资产投资总额与地区GDP之比 (Inv) |
0.779 |
0.288 |
0.087 |
2.243 |
|
|
互联网普及率 |
国际互联网用户数与年末总人口之比 (Inter) |
0.212 |
0.184 |
0.003 |
3.664 |
|
|
居民消费 |
社会消费品零售总额与地区GDP之比 (Consump) |
0.383 |
0.110 |
0.000 |
1.013 |
|
|
产业结构 |
第三产业增加值与第二产业增加值之比 (Constru) |
0.964 |
0.537 |
0.176 |
5.154 |
|
|
政府干预 |
地方财政一般预算内支出与地区GDP之比 (Fis) |
0.202 |
0.135 |
0.044 |
2.527 |
|
|
失业水平 |
年末城镇登记失业人员数与年末总人口之比 (Unemp) |
0.009 |
0.123 |
0.000 |
6.509 |
|
|
金融规模 |
年末金融机构各项存贷款余额与地区GDP之比(Size) |
2.381 |
1.248 |
0.588 |
21.301 |
|
|
人力资本 |
每万人小学、普通中学、普通高等学校 在校学生数的自然对数 (Cap) |
7.191 |
0.287 |
6.133 |
8.657 |
|
|
交通运输水平 |
公路客运量的自然对数 (Pass) |
8.435 |
1.004 |
2.197 |
12.566 |
|
|
公路货运量的自然对数 (Fre) |
9.004 |
0.869 |
5.361 |
13.225 |
||
|
机制变量 |
技术创新 |
专利申请量的自然对数 (Patent) |
7.529 |
1.630 |
2.996 |
12.226 |
|
绿色技术创新 |
绿色专利申请量的自然对数 (GPatent) |
5.028 |
1.716 |
0.000 |
10.454 |
|
|
农业创业 |
农、林、牧、渔业企业注册数目的自然对数 (ABusiness) |
7.239 |
0.921 |
3.091 |
10.683 |
|
|
非农创业 |
其他行业企业注册数目的自然对数 (NABusiness) |
10.331 |
0.851 |
7.834 |
13.709 |
|
|
就业规模 |
在岗职工平均人数的自然对数 (Scale) |
3.512 |
0.827 |
1.099 |
6.649 |
|
|
从业质量 |
在岗职工人均工资的自然对数 (Income) |
10.687 |
0.298 |
8.357 |
11.829 |
|
|
数字普惠金融 |
数字普惠金融总指数的自然对数 (DFII) |
5.001 |
0.513 |
2.834 |
5.773 |
|
|
覆盖广度 |
覆盖广度分项指数的自然对数 (Breadth) |
4.926 |
0.565 |
0.631 |
5.738 |
|
|
应用深度 |
应用深度分项指数的自然对数 (Depth) |
4.984 |
0.518 |
1.456 |
5.805 |
|
|
数字化程度 |
数字化程度分项指数的自然对数 (Digitization) |
5.168 |
0.625 |
0.993 |
6.365 |
|
(二)稳健性检验部分
本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。
附表2 稳健性检验
|
变量 |
(1) |
(2) |
(3) 考虑省份-时间交互固定效应 |
(4) 剔除并行政策干扰 |
||||
|
调整研究样本 |
缩尾处理 |
|||||||
|
剔除部分 城市 |
调整研究 区间 |
1%缩尾 |
5%缩尾 |
|||||
|
Broadband |
0.106*** (0.024) |
0.070*** (0.025) |
0.122*** (0.025) |
0.098*** (0.023) |
0.105*** (0.023) |
0.100*** (0.024) |
0.121*** (0.025) |
0.098*** (0.024) |
|
Smartcity |
是 |
是 |
||||||
|
Bigdata |
是 |
是 |
||||||
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
省份-时间 固定效应 |
否 |
否 |
否 |
否 |
是 |
否 |
否 |
否 |
|
样本量 |
2470 |
1974 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。
附表3 双重机器学习稳健性检验
|
变量 |
(1) 改变样本分割比例 |
(2) 更换机器学习模型 |
(3) 交互式模型 |
(4) 工具变量 |
|||
|
Kfolds=3 |
Kfolds=8 |
Lassocv |
Gradboost |
Nnet |
|||
|
Broadband |
0.109*** (0.026) |
0.098*** (0.025) |
0.263** (0.132) |
0.077*** (0.021) |
0.226*** (0.065) |
0.232*** (0.019) |
0.651** (0.289) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
(三)机制检验部分
本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。
与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:
θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。
附表4 “宽带中国”对机制变量的回归结果
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
(9) |
(10) |
|
Patent |
GPatent |
ABusiness |
NABusiness |
Scale |
Income |
DFII |
Breadth |
Depth |
Digitization |
|
|
Broadband |
0.204*** (0.038) |
0.266*** (0.044) |
0.074** (0.036) |
0.126*** (0.026) |
0.057** (0.024) |
0.038*** (0.011) |
0.029*** (0.008) |
0.031*** (0.008) |
0.073*** (0.015) |
0.140*** (0.029) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
2820 |
2538 |
2538 |
2538 |
2538 |
(四)重抽样检验
附表5 基准回归估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
IGG |
EG |
ID |
WB |
PR |
|
|
Broadband |
0.108*** (0.025) |
0.074** (0.037) |
0.350*** (0.045) |
-0.007 (0.019) |
0.051 (0.054) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
附表6 异质性分析估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
|
资源型 |
非资源型 |
老工业基地 |
非工业基地 |
发达城市 |
较发达城市 |
欠发达城市 |
交通基础设施 |
|
|
Broadband |
0.078* (0.041) |
0.114*** (0.030) |
0.121*** (0.035) |
0.114*** (0.035) |
0.264*** (0.065) |
0.017 (0.036) |
0.112*** (0.035) |
0.040** (0.018) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
1130 |
1690 |
940 |
1880 |
480 |
700 |
1640 |
2820 |
附表7 进一步讨论估计量中位数调整结果(reps=10)
|
变量 |
(1) |
(2) |
(3) |
(4) |
(5) |
|
城市相对差距 |
南北相对差距 |
胡焕庸线相对差距 |
沿海内陆相对差距 |
中心外围相对差距 |
|
|
Broadband |
-0.033* (0.017) |
-0.026* (0.014) |
-0.033** (0.015) |
-0.030* (0.017) |
-0.027** (0.011) |
|
控制变量 一次项 |
是 |
是 |
是 |
是 |
是 |
|
控制变量 二次项 |
是 |
是 |
是 |
是 |
是 |
|
时间固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
城市固定 效应 |
是 |
是 |
是 |
是 |
是 |
|
样本量 |
2820 |
2820 |
2820 |
2820 |
2820 |
双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)