地级市2010-2019网络基础设施包容性绿色增长与地区差距基于双重机器学习的因果推断

含原始数据及计算结果、计算代码、参考文献

数据来源:基于上市公司年报、公告数据,中国统计年鉴、及各地区统计年鉴数据的整理计算
数据期间:2010-2019
数据范围:全国各地级市

参考文献:
网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断
主要指标:

 

95de761ac7935ef50ffe96d556cec48.png




 

e2c161e044d881aa50f666c190dee13.png



 

dea8d512f5e709cf722c970e9c0795d.png

 

f94706655931c2a98fd9e688b784398.png

(一)研究设计部分

附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。

     附表1                        主要变量定义及描述性统计

变量

计算方法及符号表示

均值

标准差

最小值

最大值

被解释变量

包容性绿色增长

IGG

2.991

0.797

0.954

7.199

处置变量

“宽带中国”政策虚拟变量

Broadband

0.188

0.391

0.000

1.000

控制变量

教育投入

教育支出与地区GDP之比

Edu

0.035

0.019

0.008

0.185

科技投入

科学技术支出与地区GDP之比

Sci

0.003

0.003

0.000

0.063

城市化水平

每平方公里人口数的自然对数

Urban

5.738

0.922

1.620

7.882

固定资产投资

固定资产投资总额与地区GDP之比

Inv

0.779

0.288

0.087

2.243

互联网普及率

国际互联网用户数与年末总人口之比

Inter

0.212

0.184

0.003

3.664

居民消费

社会消费品零售总额与地区GDP之比

Consump

0.383

0.110

0.000

1.013

产业结构

第三产业增加值与第二产业增加值之比

Constru

0.964

0.537

0.176

5.154

政府干预

地方财政一般预算内支出与地区GDP之比

Fis

0.202

0.135

0.044

2.527

失业水平

年末城镇登记失业人员数与年末总人口之比

Unemp

0.009

0.123

0.000

6.509

金融规模

年末金融机构各项存贷款余额与地区GDP之比(Size

2.381

1.248

0.588

21.301

人力资本

每万人小学、普通中学、普通高等学校

在校学生数的自然对数

Cap

7.191

0.287

6.133

8.657

交通运输水平

公路客运量的自然对数

Pass

8.435

1.004

2.197

12.566

公路货运量的自然对数

Fre

9.004

0.869

5.361

13.225

机制变量

技术创新

专利申请量的自然对数

Patent

7.529

1.630

2.996

12.226

绿色技术创新

绿色专利申请量的自然对数

GPatent

5.028

1.716

0.000

10.454

农业创业

农、林、牧、渔业企业注册数目的自然对数

ABusiness

7.239

0.921

3.091

10.683

非农创业

其他行业企业注册数目的自然对数

NABusiness

10.331

0.851

7.834

13.709

就业规模

在岗职工平均人数的自然对数

Scale

3.512

0.827

1.099

6.649

从业质量

在岗职工人均工资的自然对数

Income

10.687

0.298

8.357

11.829

数字普惠金融

数字普惠金融总指数的自然对数

DFII

5.001

0.513

2.834

5.773

覆盖广度

覆盖广度分项指数的自然对数

Breadth

4.926

0.565

0.631

5.738

应用深度

应用深度分项指数的自然对数

Depth

4.984

0.518

1.456

5.805

数字化程度

数字化程度分项指数的自然对数

Digitization

5.168

0.625

0.993

6.365

(二)稳健性检验部分

本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。

     附表2                               稳健性检验

变量

(1)

(2)

(3)

考虑省份-时间交互固定效应

(4)

剔除并行政策干扰

调整研究样本

缩尾处理

剔除部分

城市

调整研究

区间

1%缩尾

5%缩尾

Broadband

0.106***

(0.024)

0.070***

(0.025)

0.122***

(0.025)

0.098***

(0.023)

0.105***

(0.023)

0.100***

(0.024)

0.121***

(0.025)

0.098***

(0.024)

Smartcity

Bigdata

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

省份-时间

固定效应

样本量

2470

1974

2820

2820

2820

2820

2820

2820

注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。

     附表3                         双重机器学习稳健性检验

变量

(1)

改变样本分割比例

(2)

更换机器学习模型

(3)

交互式模型

(4)

工具变量

Kfolds=3

Kfolds=8

Lassocv

Gradboost

Nnet

Broadband

0.109***

(0.026)

0.098***

(0.025)

0.263**

(0.132)

0.077***

(0.021)

0.226***

(0.065)

0.232***

(0.019)

0.651**

(0.289)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2820

(三)机制检验部分

本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。

与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:

θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。

     附表4                    “宽带中国”对机制变量的回归结果

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

Patent

GPatent

ABusiness

NABusiness

Scale

Income

DFII

Breadth

Depth

Digitization

Broadband

0.204***

(0.038)

0.266***

(0.044)

0.074**

(0.036)

0.126***

(0.026)

0.057**

(0.024)

0.038***

(0.011)

0.029***

(0.008)

0.031***

(0.008)

0.073***

(0.015)

0.140***

(0.029)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2538

2538

2538

2538

(四)重抽样检验

     附表5                 基准回归估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

IGG

EG

ID

WB

PR

Broadband

0.108***

(0.025)

0.074**

(0.037)

0.350***

(0.045)

-0.007

(0.019)

0.051

(0.054)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

    

     附表6                异质性分析估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

资源型

非资源型

老工业基地

非工业基地

发达城市

较发达城市

欠发达城市

交通基础设施

Broadband

0.078*

(0.041)

0.114***

(0.030)

0.121***

(0.035)

0.114***

(0.035)

0.264***

(0.065)

0.017

(0.036)

0.112***

(0.035)

0.040**

(0.018)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

1130

1690

940

1880

480

700

1640

2820

    

     附表7                进一步讨论估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

城市相对差距

南北相对差距

胡焕庸线相对差距

沿海内陆相对差距

中心外围相对差距

Broadband

-0.033*

(0.017)

-0.026*

(0.014)

-0.033**

(0.015)

-0.030*

(0.017)

-0.027**

(0.011)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。

(一)研究设计部分

附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。

     附表1                        主要变量定义及描述性统计

变量

计算方法及符号表示

均值

标准差

最小值

最大值

被解释变量

包容性绿色增长

IGG

2.991

0.797

0.954

7.199

处置变量

“宽带中国”政策虚拟变量

Broadband

0.188

0.391

0.000

1.000

控制变量

教育投入

教育支出与地区GDP之比

Edu

0.035

0.019

0.008

0.185

科技投入

科学技术支出与地区GDP之比

Sci

0.003

0.003

0.000

0.063

城市化水平

每平方公里人口数的自然对数

Urban

5.738

0.922

1.620

7.882

固定资产投资

固定资产投资总额与地区GDP之比

Inv

0.779

0.288

0.087

2.243

互联网普及率

国际互联网用户数与年末总人口之比

Inter

0.212

0.184

0.003

3.664

居民消费

社会消费品零售总额与地区GDP之比

Consump

0.383

0.110

0.000

1.013

产业结构

第三产业增加值与第二产业增加值之比

Constru

0.964

0.537

0.176

5.154

政府干预

地方财政一般预算内支出与地区GDP之比

Fis

0.202

0.135

0.044

2.527

失业水平

年末城镇登记失业人员数与年末总人口之比

Unemp

0.009

0.123

0.000

6.509

金融规模

年末金融机构各项存贷款余额与地区GDP之比(Size

2.381

1.248

0.588

21.301

人力资本

每万人小学、普通中学、普通高等学校

在校学生数的自然对数

Cap

7.191

0.287

6.133

8.657

交通运输水平

公路客运量的自然对数

Pass

8.435

1.004

2.197

12.566

公路货运量的自然对数

Fre

9.004

0.869

5.361

13.225

机制变量

技术创新

专利申请量的自然对数

Patent

7.529

1.630

2.996

12.226

绿色技术创新

绿色专利申请量的自然对数

GPatent

5.028

1.716

0.000

10.454

农业创业

农、林、牧、渔业企业注册数目的自然对数

ABusiness

7.239

0.921

3.091

10.683

非农创业

其他行业企业注册数目的自然对数

NABusiness

10.331

0.851

7.834

13.709

就业规模

在岗职工平均人数的自然对数

Scale

3.512

0.827

1.099

6.649

从业质量

在岗职工人均工资的自然对数

Income

10.687

0.298

8.357

11.829

数字普惠金融

数字普惠金融总指数的自然对数

DFII

5.001

0.513

2.834

5.773

覆盖广度

覆盖广度分项指数的自然对数

Breadth

4.926

0.565

0.631

5.738

应用深度

应用深度分项指数的自然对数

Depth

4.984

0.518

1.456

5.805

数字化程度

数字化程度分项指数的自然对数

Digitization

5.168

0.625

0.993

6.365

(二)稳健性检验部分

本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。

     附表2                               稳健性检验

变量

(1)

(2)

(3)

考虑省份-时间交互固定效应

(4)

剔除并行政策干扰

调整研究样本

缩尾处理

剔除部分

城市

调整研究

区间

1%缩尾

5%缩尾

Broadband

0.106***

(0.024)

0.070***

(0.025)

0.122***

(0.025)

0.098***

(0.023)

0.105***

(0.023)

0.100***

(0.024)

0.121***

(0.025)

0.098***

(0.024)

Smartcity

Bigdata

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

省份-时间

固定效应

样本量

2470

1974

2820

2820

2820

2820

2820

2820

注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。

     附表3                         双重机器学习稳健性检验

变量

(1)

改变样本分割比例

(2)

更换机器学习模型

(3)

交互式模型

(4)

工具变量

Kfolds=3

Kfolds=8

Lassocv

Gradboost

Nnet

Broadband

0.109***

(0.026)

0.098***

(0.025)

0.263**

(0.132)

0.077***

(0.021)

0.226***

(0.065)

0.232***

(0.019)

0.651**

(0.289)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2820

(三)机制检验部分

本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。

与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:

θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。

     附表4                    “宽带中国”对机制变量的回归结果

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

Patent

GPatent

ABusiness

NABusiness

Scale

Income

DFII

Breadth

Depth

Digitization

Broadband

0.204***

(0.038)

0.266***

(0.044)

0.074**

(0.036)

0.126***

(0.026)

0.057**

(0.024)

0.038***

(0.011)

0.029***

(0.008)

0.031***

(0.008)

0.073***

(0.015)

0.140***

(0.029)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2538

2538

2538

2538

(四)重抽样检验

     附表5                 基准回归估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

IGG

EG

ID

WB

PR

Broadband

0.108***

(0.025)

0.074**

(0.037)

0.350***

(0.045)

-0.007

(0.019)

0.051

(0.054)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

    

     附表6                异质性分析估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

资源型

非资源型

老工业基地

非工业基地

发达城市

较发达城市

欠发达城市

交通基础设施

Broadband

0.078*

(0.041)

0.114***

(0.030)

0.121***

(0.035)

0.114***

(0.035)

0.264***

(0.065)

0.017

(0.036)

0.112***

(0.035)

0.040**

(0.018)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

1130

1690

940

1880

480

700

1640

2820

    

     附表7                进一步讨论估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

城市相对差距

南北相对差距

胡焕庸线相对差距

沿海内陆相对差距

中心外围相对差距

Broadband

-0.033*

(0.017)

-0.026*

(0.014)

-0.033**

(0.015)

-0.030*

(0.017)

-0.027**

(0.011)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。

(一)研究设计部分

附表1给出了本文所用变量的计算方法、符号表示及具体数据特征。

     附表1                        主要变量定义及描述性统计

变量

计算方法及符号表示

均值

标准差

最小值

最大值

被解释变量

包容性绿色增长

IGG

2.991

0.797

0.954

7.199

处置变量

“宽带中国”政策虚拟变量

Broadband

0.188

0.391

0.000

1.000

控制变量

教育投入

教育支出与地区GDP之比

Edu

0.035

0.019

0.008

0.185

科技投入

科学技术支出与地区GDP之比

Sci

0.003

0.003

0.000

0.063

城市化水平

每平方公里人口数的自然对数

Urban

5.738

0.922

1.620

7.882

固定资产投资

固定资产投资总额与地区GDP之比

Inv

0.779

0.288

0.087

2.243

互联网普及率

国际互联网用户数与年末总人口之比

Inter

0.212

0.184

0.003

3.664

居民消费

社会消费品零售总额与地区GDP之比

Consump

0.383

0.110

0.000

1.013

产业结构

第三产业增加值与第二产业增加值之比

Constru

0.964

0.537

0.176

5.154

政府干预

地方财政一般预算内支出与地区GDP之比

Fis

0.202

0.135

0.044

2.527

失业水平

年末城镇登记失业人员数与年末总人口之比

Unemp

0.009

0.123

0.000

6.509

金融规模

年末金融机构各项存贷款余额与地区GDP之比(Size

2.381

1.248

0.588

21.301

人力资本

每万人小学、普通中学、普通高等学校

在校学生数的自然对数

Cap

7.191

0.287

6.133

8.657

交通运输水平

公路客运量的自然对数

Pass

8.435

1.004

2.197

12.566

公路货运量的自然对数

Fre

9.004

0.869

5.361

13.225

机制变量

技术创新

专利申请量的自然对数

Patent

7.529

1.630

2.996

12.226

绿色技术创新

绿色专利申请量的自然对数

GPatent

5.028

1.716

0.000

10.454

农业创业

农、林、牧、渔业企业注册数目的自然对数

ABusiness

7.239

0.921

3.091

10.683

非农创业

其他行业企业注册数目的自然对数

NABusiness

10.331

0.851

7.834

13.709

就业规模

在岗职工平均人数的自然对数

Scale

3.512

0.827

1.099

6.649

从业质量

在岗职工人均工资的自然对数

Income

10.687

0.298

8.357

11.829

数字普惠金融

数字普惠金融总指数的自然对数

DFII

5.001

0.513

2.834

5.773

覆盖广度

覆盖广度分项指数的自然对数

Breadth

4.926

0.565

0.631

5.738

应用深度

应用深度分项指数的自然对数

Depth

4.984

0.518

1.456

5.805

数字化程度

数字化程度分项指数的自然对数

Digitization

5.168

0.625

0.993

6.365

(二)稳健性检验部分

本文从样本、数据、变量、模型等多个视角对研究结论进行稳健性检验。根据附表1和附表2中结果,“宽带中国”变量前的回归系数均显著为正,网络基础设施促进城市包容性绿色增长的结论具有相当的稳健性。

     附表2                               稳健性检验

变量

(1)

(2)

(3)

考虑省份-时间交互固定效应

(4)

剔除并行政策干扰

调整研究样本

缩尾处理

剔除部分

城市

调整研究

区间

1%缩尾

5%缩尾

Broadband

0.106***

(0.024)

0.070***

(0.025)

0.122***

(0.025)

0.098***

(0.023)

0.105***

(0.023)

0.100***

(0.024)

0.121***

(0.025)

0.098***

(0.024)

Smartcity

Bigdata

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

省份-时间

固定效应

样本量

2470

1974

2820

2820

2820

2820

2820

2820

注:*、**、***分别表示在10%、5%、1%的水平下显著,括号内为稳健标准误。下表均相同,不再赘述。

     附表3                         双重机器学习稳健性检验

变量

(1)

改变样本分割比例

(2)

更换机器学习模型

(3)

交互式模型

(4)

工具变量

Kfolds=3

Kfolds=8

Lassocv

Gradboost

Nnet

Broadband

0.109***

(0.026)

0.098***

(0.025)

0.263**

(0.132)

0.077***

(0.021)

0.226***

(0.065)

0.232***

(0.019)

0.651**

(0.289)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2820

(三)机制检验部分

本文基于双重机器学习模型,检验了“宽带中国”对机制变量的影响效应。根据附表4中结果,“宽带中国”系数显著为正,说明网络基础设施建设确有利于提高城市技术创新水平、鼓励大众创业、改善就业质量以及促进数字普惠金融发展。

与传统中介效应分析不同,因果中介效应分析认为中介因素M

取决于处置状态d

,而被解释变量Y

同时取决于中介因素M

和处置状态d

,因此,直接效应θ

在处置状态变更的基础上由个体中介因素状态Md

决定,间接效应δ

在中介因素状态变更的基础上由个体处置状态d

决定,一定程度上说明了中介因素M

与初始处置状态d

是相互“分离”的(反事实框架),二者可分别表示为:

θ1=EY1,M1-Y0,M1

θ0=EY1,M0-Y0,M0

δ1=EY1,M1-Y1,M0

δ0=EY0,M1-Y0,M0

因果中介效应分析除了直接效应与间接效应的表示形式与传统中介效应分析不同,解释上也存在差异。本文重点基于因果中介效应分析检验了中介因素的机制路径,因此,以间接效应为例进行特别说明。文中所谓的“处置组间接效应”和“控制组间接效应”并非仅针对“宽带中国”试点或非试点城市,可将其进一步解释为,初始时某一城市在接受处置或未接受处置情况下,中介因素由未处置时的状态变更至处置后的状态所带来的被解释变量的改变,而且由于不同个体初始处置状态不同,间接效应也应有所差异。因此,文中将其命名为“处置时间接效应”和“未处置时间接效应”或许更为恰当,当然,也有研究将其称为“总体间接效应”和“自然间接效应”。为避免读者对文中叙述产生疑惑,特此进行说明。

     附表4                    “宽带中国”对机制变量的回归结果

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

Patent

GPatent

ABusiness

NABusiness

Scale

Income

DFII

Breadth

Depth

Digitization

Broadband

0.204***

(0.038)

0.266***

(0.044)

0.074**

(0.036)

0.126***

(0.026)

0.057**

(0.024)

0.038***

(0.011)

0.029***

(0.008)

0.031***

(0.008)

0.073***

(0.015)

0.140***

(0.029)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

2820

2538

2538

2538

2538

(四)重抽样检验

     附表5                 基准回归估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

IGG

EG

ID

WB

PR

Broadband

0.108***

(0.025)

0.074**

(0.037)

0.350***

(0.045)

-0.007

(0.019)

0.051

(0.054)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

    

     附表6                异质性分析估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

资源型

非资源型

老工业基地

非工业基地

发达城市

较发达城市

欠发达城市

交通基础设施

Broadband

0.078*

(0.041)

0.114***

(0.030)

0.121***

(0.035)

0.114***

(0.035)

0.264***

(0.065)

0.017

(0.036)

0.112***

(0.035)

0.040**

(0.018)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

1130

1690

940

1880

480

700

1640

2820

    

     附表7                进一步讨论估计量中位数调整结果(reps=10)

变量

(1)

(2)

(3)

(4)

(5)

城市相对差距

南北相对差距

胡焕庸线相对差距

沿海内陆相对差距

中心外围相对差距

Broadband

-0.033*

(0.017)

-0.026*

(0.014)

-0.033**

(0.015)

-0.030*

(0.017)

-0.027**

(0.011)

控制变量

一次项

控制变量

二次项

时间固定

效应

城市固定

效应

样本量

2820

2820

2820

2820

2820

双重机器学习采用样本分割拟合的方法对处置系数进行估计,Chernozhukov等(2018)认为,虽然特定分割样本对渐进估计结果没有影响,但在有限样本中特定子样划分对结果估计可能是重要的。为保证分析结果的稳健性,本文进一步采用重抽样的方法(reps=10)对文中主要结论进行再检验,具体检验结果可见附表5、附表6以及附表7。可以看出,重抽样下,基准回归结论保持不变,网络基础设施对城市包容性绿色增长存在显著正向影响,且主要体现在促进经济增长和改善收入分配上(见附表5);异质性分析中,重抽样结果显示网络基础设施影响不同类型城市包容性绿色增长存在显著区别,对于非资源型、老工业基地以及发达城市的影响更甚,且相对于以高铁为代表的交通基础设施,网络基础设施在促进城市转型增长上体现出更大的效应(见附表6);进一步讨论中,网络基础设施分别能够在不同层面上显著降低区域发展差距(见附表7),也与原文结论相一致。综上,重抽样结果表明,特定子样划分并没有显著改变本文主要结论,研究结果体现出较强的稳健性。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐