作者

测量维度

计算方法

词典构建方法

数据来源

特点

戚聿东和蔡呈伟 [1]

数字技术、商业模式、数字化相关信息

用各公司年报中关键词词频与当年同一行业全部企业同类关键词出现总量的比值作为度量指标

通过手工整理和Python分词的确定年报中对数字化相关信息表达的基本方式;采用人工筛选和计算机联想结构算法扩展关键词;运用可视化软件Gephi对关键词矩阵进行图谱分析并绘制关键词关联度图谱,依据相关性对关键词进行分类

在制造企业中去掉样本中由国家认定的高新技术制造企业

考虑到了企业生存环境的动态性和竞争性

吴非等 [21]

对企业数字化转型进行结构化分层,界分了“底层技术运用”“技术实践应用”两个层面,前者划分为人工智能技术、大数据技术、云计算技术和区块链技术四个维度,后者则关注“数字技术应用”这一维度

根据各维度特征词进行搜索、匹配和词频计数,得到各维度的词频

参考以数字化转型为主题的经典文献,归纳数字化转型特征词;以《中小企业数字化赋能专项行动方案》、近年《政府工作报告》等政策文件为蓝本,扩充数字化转型的特征词库

选取2007~2018年沪深A股上市公司,剔除金融类企业、ST和期间退市的样本、在考察年限中进行IPO的企业

各维度词频加总

赵宸宇,王文春和李雪松 [19]

数字技术应用、互联网商业模式、智能制造、现代信息系统

对词频数据进行标准化处理,使用熵值法确定各指标权重,得到数字化转型指数DIGI_text

以人工方式抽取数字化转型较成功的企业样本,并进行词频统计,筛选出与数字化转型相关的高频词;从上市公司总样本中提取其前后文本,寻找出现频率较高的文本组合并在既有文献基础上对关键词进行补充

2008~2017年中国A股制造业上市公司

根据年报对数字化关键词的描述信息、披露次数和企业生产经营情况等相关内容,采用专家打分法判断每家公司的数字化转型程度,分为四个等级分别为0~3分,得到数字化转型指数DIGI_score

考虑到了数字化相关词汇使用语境等问题

对DIGI_text和DIGI_score分别进行标准化处理,按各占50%的权重合成总指数DIGI

对四个维度采用0~1变量构建数字化转型分指数,并将所有分指数加总得到数字化转型变量DIGI_type

能够从四个维度更全面地反映数字化转型程度

在DIGI基础上,找到每家企业DIGI指数在样本期里的最大值,将取得最大值之后年份的样本值全部设为此最大值,得到新的数字化转型总指数DIGI_new

考虑到了数字化转型完成后数字化相关词汇披露减少的问题

袁淳等 [20]

企业数字化相关词汇频数总和除以年报MD&A语段长度

对中央人民政府、工业和信息化部网站的国家层面政府文件进行人工筛选,得到197个频率大于等于5次的企业数字化相关词汇,以此构建企业数字化术语词典

2010~2018年A股上市公司,剔除金融行业样本和ST、PT以及资不抵债的样本

忽视了词频较小的数字化特征词的价值

马连福、宋婧楠和王博 [22]

基本数字化技术、区块链、信息与通信、数字化应用

数字化特征词词频求和取对数

根据国务院政策文件、数字化相关的搜狗细胞词库词语,整合吴非和赵宸宇的研究,构建包含四个词语细目的数字化转型词库

2006~2020年的A股上市公司,剔除金融行业