面板数据熵权法的Stata程序
面板数据熵权法的Stata程序(以中国省级数字经济指数编制为例)注:以下内容选自我工作论文的一部分,且非最终结果,仅供交流学习,不可直接
面板数据熵权法的Stata程序(以中国省级数字经济指数编制为例)
注:以下内容选自我工作论文的一部分,且非最终结果,仅供交流学习,不可直接使用。
现有相关中国数字经济测度研究的分析角度包括国民经济核算方法(张美慧,2017;续继和唐琦,2019;关会娟等,2020)、数字经济增加值测算(Barefoot et al.,2018;Bureau of Economic Analysis,2019;许宪春和张美慧,2020;韩兆安等,2021)、卫星账户构建研究(杨仲山和张美慧,2019;向书坚和吴文君,2019;罗良清等,2021)和数字经济指数编制(Ojanperä et al.,2019;徐清源等,2019)。数字经济指数编制一般使用指标体系法,目前中国数字经济指数编制主要在省级层面(刘军等,2020;葛和平和吴福象,2021;杨慧梅和江璐,2021;王军等,2021;盛斌和刘宇英,2022)和地市级层面(赵涛等,2020;柏培文和张云,2021),但分析的框架与标准不相一致。主要区别在于以下三个方面,一是指标体系的差异,其特征表现为一级指标较为一致,但三级指标差异较大。一级指标以基础设施(或发展环境)、数字产业化、产业数字化居多,个别研究还考虑了数字治理。三级指标在数量上为14—54个不等,具体内容上也有所区别。二是赋权方法的差异,现有研究采用客观赋权法的较多,也有学者使用了主观赋权法或组合赋权法。客观赋权法主要包括熵权法、熵权TOPSIS方法、主成分分析法和CRITIC方法,主观赋权法包括层次分析法(AHP)和专家打分法,组合赋权法包括基于层次分析的变异系数法等。三是样本区间的差异,该因素主要受到指标数据可得性和研究目的的影响。现有研究的样本区间为3—25年不等,考虑到数字经济相关指标的起始统计时间,一般来说,选择的样本区间越长,可选指标数量越少,但也有研究的样本区间和指标数量都较大,这种情况下,缺失数据较多,对编制数字经济指数的可靠性会存在一定影响。本文根据数字经济的内涵,侧重均量,参考现有研究,综合考虑指标的全面性、科学性与数据可得性以及可测度周期,构建了2011—2019年中国30个省份(除西藏以外)的数字经济指数DEI。该指数测度的指标体系共涵盖3个一级指标下22个三级指标。
其中,互联网宽带接入端口、域名数、网站数、长途光缆线路数、移动电话普及率、信息传输、软件和信息技术服务业城镇单位就业人员、电信业务总量、电子商务采购额、电子商务销售额、农村宽带接入用户和工业企业每百人使用计算机数来源于国家统计局网站,2011年的电子商务采购额和电子商务销售额数据来源于《中国电子商务年鉴(2011)》,2012年的电子商务采购额和电子商务销售额数据来源于《中国第三产业统计年鉴》;IPv4地址数来源于《中国互联网络发展状况统计报告》;研究与试验发展(R&D)经费投入强度来源于《中国科技统计年鉴》;软件从业人员硕士及以上人员、软件业务收入、软件业务出口收入、软件和信息技术服务业利润总额来源于《中国电子信息产业统计年鉴(软件篇)》,规模以上电子信息产业制造业主营业务收入和利润总额来源于《中国电子信息产业统计年鉴(综合篇)》;“两化”融合发展指数来源于《中国信息化与工业化融合发展水平评估蓝皮书》和《中国信息化与工业化融合发展水平评估报告》;数字普惠金融指数数据来源于北京大学数字金融研究中心每年发布的《北京大学数字普惠金融指数》;淘宝村数量来源于阿里研究院。
1、熵权法的基本原理
综合数字经济指数构建及数据特征,本文采用客观赋权法中的熵权法对指标进行赋权(郭芸等,2020;王军等,2013)。由于指标量纲不同会导致指标计算产生较大误差,本文首先采用阈值法对数据进行无量纲化处理,对于正向、负向指标分别处理如下:
2、熵权法的Stata程序
capture program drop EWMnprogram define EWMnargs var D NT //D=±1分别表示正向指标和负向指标 NT表示N个横截面单元与T年的乘积nquietly{n*第一步:标准化 `var'_sdnsum `var'nscalar min=r(min)nscalar max=r(max)nng `var'_sd=100*(`var'-min)/(max-min)nif `D'==-1{nnoisily dis as error "负向指标"nreplace `var'_sd=100-`var'_sdn}nn*第二步:指标归一化 `var'_png `var'_sds=`var'_sd+0.00000001 //添加偏移量negen `var'_sds_sum=sum(`var'_sds)ng `var'_p=`var'_sds/`var'_sds_sumnn*第三步:计算信息熵 `var'_eng `var'_sij=-1/ln(`NT')*`var'_p*ln(`var'_p)negen `var'_e=sum(`var'_sij)nn*第四步:计算信息熵的冗余度 `var'_dng `var'_d=1-`var'_enn*第五步:清除多余变量 只保留`var'_sd `var'_dndrop `var'_sds `var'_sds_sum `var'_p `var'_sij `var'_en}nendnn*【1】求`var'_dn/*调用EWM程序,依次输入三个参数var D NTn注:负向指标会提示文字*/nn*正向指标nEWM var1 1 270nEWM var2 1 270nEWM var3 1 270nEWM var4 1 270nEWM var5 1 270nEWM var6 1 270nEWM var7 1 270nEWM var8 1 270nEWM var9 1 270nEWM var10 1 270nEWM var11 1 270nEWM var12 1 270nEWM var13 1 270nEWM var14 1 270nEWM var15 1 270nEWM var16 1 270nEWM var17 1 270nEWM var18 1 270nEWM var19 1 270nEWM var20 1 270nEWM var21 1 270nEWM var22 1 270nn*【2】求权重wng sum_d=var1_d+var2_d+var3_d+var4_d+var5_d+var6_d+var7_d+var8_d+var9_d+var10_d+var11_d+var12_d+var13_d+var14_d+var15_d+var16_d+var17_d+var18_d+var19_d+var20_d+var21_d+var22_dnnforvalues i=1/22{ng w`i'=var`i'_d/sum_dn}ndrop sum_dnlist w* in 1nn*【3】求数字经济指数DEIng DEI=var1_sd*w1+var2_sd*w2+var3_sd*w3+var4_sd*w4+var5_sd*w5+var6_sd*w6+var7_sd*w7+var8_sd*w8+var9_sd*w9+var10_sd*w10+var11_sd*w11+var12_sd*w12+var13_sd*w13+var14_sd*w14+var15_sd*w15+var16_sd*w16+var17_sd*w17+var18_sd*w18+var19_sd*w19+var20_sd*w20+var21_sd*w21+var22_sd*w22ndrop *_*
3、数字经济指数测算结果
根据上述计算,2011—2019年中国30个省份的数字经济指数测算结果如下:
年 份 地 区 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 | 2017年 | 2018年 | 2019年 | 均值 |
北 京 | 32.8719 | 36.3422 | 40.5947 | 44.1645 | 50.4627 | 53.4700 | 57.3986 | 59.7392 | 67.3001 | 49.1493 |
天 津 | 10.3933 | 9.4497 | 11.5356 | 12.7219 | 14.8138 | 15.0598 | 19.0953 | 21.0032 | 25.1175 | 15.4655 |
河 北 | 8.7160 | 10.2584 | 9.7272 | 10.7560 | 9.9786 | 11.0511 | 12.2237 | 13.7040 | 16.1336 | 11.3943 |
山 西 | 3.3748 | 4.5221 | 5.1670 | 5.7962 | 6.9623 | 7.1927 | 8.3692 | 10.6973 | 12.1564 | 7.1376 |
内蒙古 | 2.9373 | 3.9594 | 4.7124 | 5.1486 | 6.1847 | 6.7310 | 7.6352 | 9.6011 | 11.6871 | 6.5108 |
辽 宁 | 7.6717 | 8.5216 | 9.6638 | 10.3989 | 11.4708 | 13.3699 | 13.8211 | 15.4262 | 17.3447 | 11.9654 |
吉 林 | 3.4949 | 4.1980 | 4.9118 | 5.8586 | 6.5447 | 7.8490 | 8.5352 | 9.8711 | 12.9062 | 7.1299 |
黑龙江 | 2.8052 | 4.1156 | 5.0888 | 5.7194 | 6.1261 | 6.3454 | 7.6069 | 8.9883 | 11.0635 | 6.4288 |
上 海 | 17.4781 | 18.7715 | 20.3737 | 26.3522 | 28.7408 | 34.2779 | 36.1449 | 37.2622 | 42.2920 | 29.0770 |
江 苏 | 15.0046 | 17.2152 | 18.2688 | 17.3009 | 20.6820 | 21.2859 | 22.2986 | 24.6484 | 28.5898 | 20.5882 |
浙 江 | 18.8831 | 22.9468 | 23.9179 | 25.1435 | 30.7513 | 36.1636 | 36.3166 | 39.1985 | 43.9447 | 30.8073 |
安 徽 | 3.8492 | 4.6435 | 5.1227 | 6.2094 | 7.5942 | 8.8068 | 10.4082 | 12.3275 | 14.8325 | 8.1993 |
福 建 | 11.2733 | 10.8617 | 12.6997 | 14.5796 | 15.1617 | 17.3766 | 21.7189 | 22.2897 | 25.5733 | 16.8371 |
江 西 | 7.5062 | 6.6346 | 6.6694 | 5.6246 | 7.4185 | 7.7645 | 8.6219 | 10.5049 | 13.1565 | 8.2112 |
山 东 | 10.9038 | 12.9717 | 17.2760 | 12.0634 | 13.6670 | 14.9057 | 17.8201 | 18.8523 | 19.8663 | 15.3696 |
河 南 | 3.2673 | 3.9357 | 5.0199 | 6.1436 | 7.2290 | 8.6513 | 9.6686 | 11.8849 | 13.6494 | 7.7166 |
湖 北 | 4.3837 | 4.9854 | 5.7648 | 6.4932 | 7.7569 | 8.6058 | 9.2292 | 11.4632 | 14.3650 | 8.1164 |
湖 南 | 3.6466 | 4.4762 | 4.9077 | 5.6956 | 6.7728 | 7.4717 | 10.4712 | 10.7029 | 12.6390 | 7.4204 |
广 东 | 18.1810 | 19.9599 | 22.4931 | 29.3749 | 29.9769 | 34.6657 | 33.5873 | 35.9474 | 37.8574 | 29.1160 |
广 西 | 2.6669 | 3.4135 | 4.2955 | 4.9902 | 5.9750 | 6.2895 | 7.3987 | 9.8288 | 12.8294 | 6.4097 |
海 南 | 3.5932 | 5.1580 | 5.8736 | 6.7830 | 8.3098 | 8.3059 | 10.4741 | 12.7000 | 15.8434 | 8.5601 |
重 庆 | 4.6232 | 5.7782 | 6.5912 | 7.4938 | 8.6973 | 9.3701 | 10.6257 | 12.9937 | 15.4398 | 9.0681 |
四 川 | 6.2620 | 6.7410 | 7.7987 | 9.2144 | 9.8979 | 12.0233 | 11.9577 | 14.0752 | 16.8470 | 10.5352 |
贵 州 | 1.9499 | 2.4440 | 3.2865 | 4.5572 | 5.0983 | 6.0925 | 7.1624 | 8.5851 | 11.6814 | 5.6508 |
云 南 | 2.0920 | 2.7158 | 3.5039 | 3.7355 | 4.7418 | 5.0769 | 5.9680 | 8.2548 | 10.9516 | 5.2267 |
陕 西 | 5.3787 | 6.3186 | 7.1202 | 7.8573 | 8.7262 | 11.9281 | 13.6492 | 16.8233 | 18.3107 | 10.6791 |
甘 肃 | 1.8374 | 2.5015 | 3.0543 | 3.4612 | 4.7688 | 4.8037 | 6.3566 | 8.4575 | 10.9922 | 5.1370 |
青 海 | 2.1630 | 2.6258 | 3.2624 | 3.9307 | 5.5550 | 6.2824 | 6.3819 | 9.4229 | 11.7900 | 5.7127 |
宁 夏 | 2.9024 | 3.3990 | 3.7350 | 4.6915 | 5.5566 | 7.6658 | 8.5260 | 11.0159 | 13.0027 | 6.7217 |
新 疆 | 2.4015 | 3.2309 | 3.4189 | 5.7002 | 6.0602 | 5.6667 | 6.2498 | 8.2662 | 10.9423 | 5.7707 |
均值 | 7.4171 | 8.4365 | 9.5285 | 10.5987 | 12.0561 | 13.4850 | 14.8574 | 16.8179 | 19.6369 | / |
参考文献
﹝1﹞柏培文,张云.数字经济、人口红利下降与中低技能劳动者权益[J].经济研究,2021,56,(5):91–108.
﹝2﹞葛和平,吴福象.数字经济赋能经济高质量发展:理论机制与经验证据[J].南京社会科学,2021,(1):24–33.
﹝3﹞关会娟,许宪春,张美慧,郁霞.中国数字经济产业统计分类问题研究[J].统计研究,2020,(12): 3–16.
﹝4﹞郭芸,范柏乃,龙剑.我国区域高质量发展的实际测度与时空演变特征研究[J].数量经济技术经济研究,2020,(10):118–132.
﹝5﹞韩兆安,赵景峰,吴海珍.中国省际数字经济规模测算、非均衡性与地区差异研究[J].数量经济技术经济研究,2020,(10):118–132.
﹝6﹞续继,唐琦.数字经济与国民经济核算文献评述[J].经济学动态,2019,(10):117–131.
﹝7﹞刘军,杨渊鋆,张三峰.中国数字经济测度与驱动因素研究[J].上海经济研究,2020,(6):81–96.
﹝8﹞罗良清,平卫英,张雨露.基于融合视角的中国数字经济卫星账户编制研究[J].统计研究,2021,38(1):27–37.
﹝9﹞盛斌,刘宇英.中国数字经济发展指数的测度与空间分异特征研究[J].南京社会科学,2022,(1):43–54.
﹝10﹞王军,朱杰,罗茜.中国数字经济发展水平及演变测度[J].数量经济技术经济研究,2021,(7):26–42.
﹝11﹞王军,邹广平,石先进.制度变迁对中国经济增长的影响——基于VAR模型的实证研究[J].中国工业经济,2013,(6):70–82.
﹝12﹞向书坚,吴文君.中国数字经济卫星账户框架设计研究[J].统计研究,2019,(10):3–16.
﹝13﹞许宪春,张美慧.中国数字经济规模测算研究——基于国际比较的视角[J].中国工业经济,2020,(5):23–41.
﹝14﹞徐清源,单志广,马潮江.国内外数字经济测度指标体系研究综述[J].调研世界,2018,(11):52–58.
﹝15﹞徐翔,赵墨非.数据资本与经济增长路径[J].经济研究,2020,(10):38–54.
﹝16﹞杨慧梅,江璐.数字经济、空间效应与全要素生产率[J].统计研究,2021,(4):3–15.
﹝17﹞杨仲山,张美慧.数字经济卫星账户:国际经验及中国编制方案的设计[J].统计研究,2019,(5):16–30.
﹝18﹞赵涛,张智,梁上坤.数字经济、创业活跃度与高质量发展——来自中国城市的经验证据[J].管理世界,2020,(10):65–76.
﹝19﹞张美慧.国际新经济测度研究进展及对中国的借鉴[J].经济学家,2017,(11):47–55.
﹝20﹞Barefoot, B., D. Curtis, W. Jolliff, J. R. Nicholson, and R. Omohundro. Defining and Measuring the Digital Economy[R]. BEA Working Paper, 2018.
﹝21﹞Bureau of Economic Analysis. Measuring the Digital Economy: An Update Incorporating Data from the 2018 Comprehensive Update of the Industry Economic Accounts[EB/OL]. https://www.bea.gov/system/files/2019-04/digital-economy-report-update-April-2019_1.pdf, 2019.
﹝22﹞Ojanperä, S., M. Graham, and M. Zook. The Digital Knowledge Economy Index: Mapping Content Production[J]. The Journal of Development Studies, 2019, 55(12): 2626–2643.