苑泽明 尹琪 于翔
摘 要:数据资产的资产属性和数据属性决定了其可以改善企业传统生产要素的配置状态,从而赋能企业高质量发展。根据企业年报,运用机器学习算法,通过“种子词筛选+AutoPhrase相似词扩充+SnowNLP情感极性分析”对企业的数据资产水平进行评估,以全要素生产率衡量企业高质量发展水平,进而采用沪深A股上市公司2007—2022年的数据进行分析,结果发现:数据资产增加显著促进了企业高质量发展,该作用主要由数据资产的处理和应用产生,数据资产获取对企业高质量发展的影响不显著;数据资产增加能够改善劳动力结构、提高技术水平、抑制非效率投资、降低管理成本,从而通过对传统生产要素的优化机制来赋能企业高质量发展;外部环境对数据资产赋能企业高质量发展具有调节作用,表现为环境不确定性、信息化水平、市场化水平和数字经济政策供给水平的提高会强化数据资产对企业高质量发展的促进作用。因此,企业应积极开发、积累和利用数据资产,政府应持续推进地区信息化、市场化和数字经济发展,以充分发挥数据资产的积极效应。
关键词:数据资产;高质量发展;传统生产要素;劳动力结构;资本配置效率;技术水平;管理效率
中图分类号:F27;F273.4 文献标志码:A 文章编号:1674-8131()0-0054-20
一、引言
在数智时代,随着数字技术和数字经济的快速发展,数据资源呈现出指数级增长态势,推动着社会生产方式、生活方式发生深刻变革。在数字经济形态下,数据驱动的新产品、新服务、新业态和新模式不断完善和发展,数据成为一种新型生产要素,并催生出企业经济效益的新增长点,已经具备在财务报告中被确认为资产的条件,即形成了数据资产(孙颖 等,2021)[1]。截至2023年,中国信息通信研究院云计算与大数据研究所发布的《数据资产管理实践白皮书》已更新至6.0版本,其指出数据资产是指由企业拥有或控制的,能够为企业带来未来经济利益的,以物理或电子方式记录的数据资源。在此背景下,如何有效利用数据资产、激活数据资产潜能、挖掘数据资产生产力,成为国家和企业培育发展新动能、构筑竞争新优势的重要命题。与此同时,党的二十大报告指出,高质量发展是全面建设社会主义现代化国家的首要任务。企业是国民经济发展的微观基础,经济高质量发展首先需要实现企业的高质量发展。企业高质量发展意味着其生产函数整体处于最优状态,即各类生产要素在限定条件下实现利益最大化的最优配置(阳镇,2023)[2]。数据成为新的生产要素,改变了企业的生产函数,此时,数据资产不仅本身会带来丰厚的经济利益,而且还会通过促进传统生产要素的迭代和流动来优化生产要素的整体配置,从而推动企业高质量发展。因此,深入研究数字资产对企业高质量发展的影响及其机制,有助于进一步充分发挥数据要素的积极作用,进而带动经济高质量发展。
关于企业高质量发展的影响因素,已有文献从企业特征及外部环境等方面进行了广泛研究,如营商环境(周泽将 等,2022)[3]、政府补贴(郑飞 等,2022)[4]、企业创新(陈丽姗 等,2019)[5]、高管特征(李雄飞,2022)[6]、杠杆率(宋清华 等,2021)[7]等。随着数字经济的发展,大量文献就数字经济(刘艳霞,2022;阳镇,2023)[8][2]、数字金融(张超 等,2022)[9]、数字技术(李朝鲜,2022;黄勃 等,2023;栗晓云 等,2023)[10-12]、数字政府(岳宇君 等,2023)[13]、数字化转型(吴浩强 等,2023;高跃 等,2023;王羲 等,2024)[14-16]等对企业高质量发展的影响进行了探讨,但少有研究考察数据要素或数据资产对企业高质量发展的影响。孙颖和陈思霞(2021)[1]研究发现,数据资产促进了科技服务企业的高质量发展;杨向阳和徐从才(2024)[17]分析表明,数据要素主要通过降本增效和提质增效两条路径促进了流通企业的高质量发展。可见,有必要进一步深入研究数字资产对企业高质量发展的影响及其机制。
近年来,数据资产受到学术界的高度关注,成为研究热点之一,然而,关于数据资产的经济效应研究相对较少。其中,在对企业发展及行为的影响方面,数据资产能够通过缓解融资约束和加强研发合作来提高企业创新意愿和拓展企业创新资源,从而增加企业创新投入(李健 等,2023)[18],并通过嵌入有价值的信息来提高企业运营效率(Hu et al.,2022)[19],作用于企业的成本管理、组织建设和风险管控(Kiron,2017;Sivarajah et al.,2020)[20-21],进而增加企业经济利润(Begenau et al.,2018)[22],提升企业价值(苑泽明 等,2022)[23],促进企业高质量发展(孙颖 等2021)[1]。此外,路征等(2023)[24]研究发现,数据资产通过降低信息不对称程度、降低交易成本和提高企业创新能力三条路径促进了企业发展;陆岷峰等(2023)[25]分析表明,数据资产通过提高产品市场份额、抑制管理层跟风投资、提升资源配置效率、助力企业转型升级等路径提高了企业的产能利用率。但这些研究均未从数据资产对传统生产要素的影响视角来探究这一新型生产要素对企业高质量发展“赋何能”的问题。
作为数字经济时代的新型生产要素,数据资产依托于数字产业化和产业数字化,嵌入实体经济的各个领域,与劳动力、资本、自然资源、技术、管理等传统生产要素在价值链和产业链中深度融合,产生“鲶鱼效应”,促进企业的人力资源和资本积累、技术进步以及管理提效,从而显著提高企业的全要素生产率,有效推动企业高质量发展。因此,数据资产的价值创造是建立在优化传统生产要素的基础之上的,对于数据资产赋能企业高质量发展的研究,有必要从改善生产要素配置的视角出发,探究数据资产对传统生产要素的优化机制。有鉴于此,本文在已有研究的基础上,探讨数据资产通过优化传统生产要素来促进企业高质量发展的机制,并采用沪深A股上市公司2007—2022年的数据进行实证检验。
与已有文献相比,本文的边际贡献主要在于:第一,考察了数据资产对企业高质量发展的影响,并从对劳动力、资本、技术、管理4种传统生产要素的优化角度展开机制分析(劳动力结构改善机制、资本配置效率提升机制、技术创新积累机制、管理提质增效机制),拓展和深化了数据资产的经济效应研究,并为数据资产对传统生产要素的改善效应和对企业高质量发展的促进作用提供了新的经验证据,有助于深入认识和理解数字经济形态下数据资产的积极功效。第二,基于数据资产“获取—处理—应用”的底层逻辑,采用“种子词筛选+AutoPhrase相似词扩充+SnowNLP情感极性分析”的方法对企业数据资产水平进行测算,并构建了包括“数据资产获取”“数据资产处理”“数据资产应用”3个层面的数据资产特征词谱,为客观评估企业的数据资产水平提供了一种有效方法。第三,进一步分析了环境不确定性、城市信息化水平、地区市场化水平以及数字经济政策等外部环境对数据资产影响企业高质量发展的调节作用,为充分发挥数据资产的积极效应提供了经验借鉴和策略启示。
二、理论分析与研究假说
1.数据资产与企业高质量发展
近年来,作为数字经济时代的新型战略性资源,数据资产引起学界的高度关注。现有研究从数据资产的概念框架出发,一方面通过对数据资产的数据属性解读探求其产生经济收益的可能性及途径,另一方面基于数据资产的资产或财产属性探讨其权属问题(韩秀兰 等,2023)[26]。基于此,本文主要从数据资产的资产属性和数据属性两个方面,阐述其对企业高质量发展的影响。
从数据资产的资产属性来看:数据成为资产,首先表现为企业拥有的一种稀缺性资源。根据资源基础理论,稀有、不可替代和难以模仿的异质性资源是企业竞争优势的核心来源,对于促进企业业绩提升、推动企业高质量发展具有重要作用。企业对数据资源进行清洗和标准化处理,匹配数据源并删除冗余数据,使得数据资源成为产权明晰的资产并进入财务报表。由此,数据资产具有了可阅读、可理解和可增值的特征,企业可以利用其内含的有效信息进行商机洞察、风险管控和辅助决策等,从而降低信息搜索成本、传递成本和验证成本等;同时,企业还可利用数据资产开发新技术新产品新服务,形成新的收益增长点,促进企业价值提升。此外,资产化的数据资源具有可控制、可计量、可使用的特征,会在流通中进一步权益化,进而可以作为权益工具进行股权投资或融资,比如进入资本市场开展抵押、托管、信托及保险等金融业务,有效拓宽企业的融资渠道,降低企业的融资成本,有利于化解企业高质量发展的融资困境。因此,数据资产基于数据价值链,历经从资源化到资产化再到资本化的价值形态演进,为企业追求更高水平、高层次、高效率的价值创造提供了更好的条件和优势,进而赋能企业高质量发展。
从数据资产的数据属性来看:数据资产在本质上是一种信息知识资产,具有促进技术进步、提高生产效率、改善经营管理的能效。企业可以利用数据资产所蕴含的知识和信息开发新技术新产品、改进业务流程、提高经营管理效率,从而增强竞争优势;还可以通过数据资产来缓解企业与外部信息使用者的信息不对称,构建纵向贯通、横向互联的数据共享体系,在数据资产的流通与应用过程中与其他经济主体更好地实现优势互补。相比其他生产要素,数据资产具有虚拟替代性、无消耗性和共享性等特点,能够源源不断地产生和循环使用,并促进传统生产要素的流动配置和优化组合,产生价值倍增效应和投入替代效应(罗玫 等,2023)[27]。一方面,数据资产与传统生产要素深度融合,比如金融科技(资本要素)、智能机器人(劳动力要素)、人工智能(技术要素)、数字孪生(自然资源)等,可以显著提升传统生产要素的生产效率,产生价值倍增效应;另一方面,数据资产可以对人力和管理等传统生产要素产生虚拟替代效应,用更少的物质资源创造出更多的物质财富。例如,利用大数据智能技术来模拟人脑思维进行分析与决策,从而实现对部分人力的替代。与此同时,数据商品也可与传统生产要素相结合,对企业的资产结构、劳动力结构、技术结构以及管理决策等进行优化,从而改善企业的生产要素配置,促进企业高质量发展。
基于上述分析,本文提出假说H1:数据资产增加能够显著促进企业高质量发展。
2.数据资产对传统生产要素的优化作用
不同于传统生产要素,数据资产具有无实物形态的特点,其更多的是以信息和知识来驱动企业发展。数据资产除了可以直接改善企业的生产经营状态外,还能够通过技术流、资金流、人才流等突破传统生产要素的稀缺性和排他性限制,改善企业的劳动力、资本、技术和管理等传统生产要素的配置状态,产生基础性资源优化效应,并带来全要素生产率的提升。因此,本文认为数据资产能够通过对传统生产要素的优化机制来赋能企业高质量发展,并主要基于劳动力、资本、技术和管理四种传统生产要素展开分析。
(1)劳动力结构改善机制
第一,数据资产具有劳动力筛选效应。数据本身具有复制成本较低、确权模糊和收益难以转化等特点,这使得数据资产的整合难度大,因而企业沉淀数据资产需要招揽高素质和高技能的人才来进行数据汇聚、处理、管理、应用及流通。同时,企业在利用数据资产进行生产运营模式的平台化、智能化、生态化转变过程中,高重复性、低技能的就业岗位会被知识技能型岗位替代,导致技术型员工比例提高。第二,数据资产具有劳动力素质提升效应。数据资产是企业通过数据清理、数据标准化、数据搜索匹配等形成的有价值的高质量数据,可以有效地转化为具有新的广度、深度和高度的内外部信息,有利于企业员工通过“干中学”及“再教育”等方式来提升自身的知识与技能,从而促使企业的人力资本水平整体提升。第三,数据资产具有人才吸引效应。数据资产是不可替代和难以复制的竞争性资源,企业拥有的数据资产越多,越能够向外界传递其具有独特优势和巨大发展潜力的正面信号,从而吸引具有丰富经验和专业知识的高素质人才进入。企业的高质量发展与其劳动力结构紧密相关,高层次和高质量的人才越多,学习能力、吸收能力、转化能力和扩散能力越强,越能够实现技术突破、转型升级和新旧动能转化。因此,数据资产可以通过劳动力结构改善机制提升企业的人力资本水平,进而促进企业高质量发展。
基于上述分析,本文提出假说H2a:数据资产增加可以通过改善劳动力结构的路径来赋能企业高质量发展。
(2)资本配置效率提升机制
第一,数据资产具有投资决策优化效应。数据资产的增加有助于企业投资决策的可视化,可以通过直观的方式呈现相关信息,便于管理者从海量的数据中快速获取有效的信息和知识,为投资决策提供更全面准确的数据支持,还能够通过“数据+算法”的科学决策模式对资本配置组合进行智能评估、模拟择优,从而提高资本配置的有效性。第二,数据资产具有投资效率提升效应。企业可以利用数据资产进行动态持续的数据收集、反馈和分析,实时监控资本配置过程中的资本流向、使用与回收等情况,并通过风险和收益评估制定最优处置方案,及时调整资金流向,以最大化投资收益。第三,数据资产具有后期投资优化效应。企业能够利用数据资产所包含的本期资本配置信息进行事后评价,将资本配置实际表现与原有预期相比较,深入分析投资经验及问题所在,并据此调整后期的投资方向和结构,以进一步提高资本配置效率。资本错配会导致企业的投资和生产行为偏离最优决策,是造成企业全要素生产率损失的主要原因之一(Song et al.,2015;陈诗一 等,2017;才国伟 等,2019)[28-30],而数据资产对资本配置的优化作用可以显著改善企业的投资结构、提高企业的投资效率,从而有效缓解资本错配对企业全要素生产率提升的制约作用。因此,数据资产能够通过资本配置效率提升机制提高企业的投资效率,进而促进企业高质量发展。
基于上述分析,本文提出假说H2b:数据资产增加可以通过提升资本配置效率的路径来赋能企业高质量发展。
(3)技术创新积累机制
第一,数据资产具有知识溢出和积累效应。数据资产将复杂多样的信息和知识进行标准化的数据诠释,有助于各种显性和隐性知识资源在企业各部门、各环节共享和传输,催生出网络化的协同创新,这不仅使得企业能够通过学习效应和积累效应获得更多异质性技术资源和技术创新思维,提升技术创新认知,还有助于企业与相关知识主体之间的技术交流和合作,从而打破原有的技术组合,重塑并赋能企业的技术资源生成和积累。第二,数据资产具有技术创新促进效应。基于与产品研发、技术革新相关的数据资产,企业可以通过数据分析和挖掘对目标市场进行画像,准确掌握市场需求,从而有针对性地开展技术研发活动,提高技术创新的产出和绩效。第三,数据资产具有创新成本节约效应。在技术创新过程中,企业可以利用数据资产进行创新模拟,以数据试错替代实物试错,不但节约了技术创新成本,也提高了技术创新质量。技术进步是经济发展的内生动力,新技术的使用会推动企业转型升级,加快生产经营方式转变,建立市场竞争优势,进而促进企业高质量发展。因此,数据资产能够通过技术创新积累机制提高企业的技术水平,进而促进企业高质量发展。
基于上述分析,本文提出假说H2c:数据资产增加可以通过促进技术创新和积累的路径来赋能企业高质量发展。
(4)管理提质增效机制
第一,数据资产具有管理改善效应。资产化的数据提高了信息的有序性、确定性和清晰度,有助于企业利用数据信息平台实现数据信息的实时共享,使得生产经营的各环节由串联转向并联,推动信息结构从层次式转向网络式,进而打破各环节、各部门之间的信息屏障(陈冬梅 等,2020)[31],减少不同部门和团队之间的信息失真和沟通阻滞,不仅可以提高生产效率,也能够优化管理流程和机制,提高企业管理的质量。第二,数据资产具有监管强化效应。数据资产以各类信息系统为载体,留存了企业日常生产经营的全过程信息,实现了事前、事中和事后监督全链条的信息穿透,并依托数据中台等放大和扩散监管范围,使得各行为主体的履责情况能够得到及时客观的反映,这将增大管理层藏匿信息的难度,从而有效缓解委托代理冲突,抑制高管自利行为,提高企业监管的有效性和内部管理的效率。企业管理质量和效率的提升,为企业更好地配置各种生产要素和改善生产经营提供了必要的内部治理保障,有利于企业的高质量发展。因此,数据资产能够通过管理提质增效机制提高企业的经营管理水平和效率,进而促进企业高质量发展。
基于上述分析,本文提出假说H2d:数据资产增加可以通过提高经营管理效率的路径来赋能企业高质量发展。
三、企业数据资产评估与分析
1.企业数据资产评估方法
已有文献对企业数据资产的评估,通常采用“企业当年是否具备共享平台、数据中台或信息系统”或“数据资产关键词是否出现在年度报告中”来体现企业数据资产的“有或无”(孙颖 等,2021;Hu et al.,2022)[1][19]。近期,部分学者基于企业财务报表指标对数据资产的“多与少”进行了测度(李健 等,2023;路征 等,2023)[18][24]。但由于数据资产目前还未被纳入资产负债表中进行披露,基于财务报表对企业数据资产的评估难免存在遗漏。数据资产是企业利用大数据、人工智能等信息技术进行数智化转型形成的重要经济资源,此类特征信息会体现在具有总结和指引性质的企业年报中,因此,本文基于机器学习算法,采用“种子词筛选+AutoPhrase相似词扩充+SnowNLP情感极性分析”的文本分析方法对企业的数据资产水平进行评估。具体步骤如下:
第一,构建底层逻辑并选取种子词。数据从非结构化的低价值零散形态向结构化的可被应用的高价值资产形态转化,形成“数据价值链”(许宪春 等,2022)[32]。基于此,本文以“数据资产获取—数据资产处理—数据资产应用”价值链为底层逻辑,结合数据资产相关文件和研究报告,从企业年报中手工筛选出分别代表“数据资产获取”“数据资产处理”“数据资产应用”三个层面的种子词,然后通过访谈及调查问卷的形式向学术界、大数据行业协会以及相关企业人员征询意见,对种子词进行调整和完善。
第二,扩展种子词形成数据资产词典。刘景江等(2023)[33]指出,机器学习算法拥有强大的数据处理和挖掘能力,能够从复杂高维的非结构化数据环境中提取有价值的信息。因此,本文借鉴相关文献对机器学习算法的应用(胡楠 等,2021;孙昌玲 等,2021)[34-35],采用AutoPhrase方法对种子词进行扩展,以挖掘企业年报中能够体现数据资产的高质量特征词。同时,进一步对特征词谱进行检验与补充:首先,2023年中国信息通信研究院发布的《数据资产管理实践白皮书(6.0版本)》指出,数据资产是以电子或其他方式(如文本、图像、语音、视频、网页、数据库、传感信号等)记录的结构化或非结构化数据。基于此,对与各数据记录方式相关的关键词是否纳入本文特征词谱进行检验与补充。其次,根据国务院印发的《“十四五”数字经济发展规划》、工业和信息化部与国家互联网信息办公室等十六部门联合印发的《关于促进数据安全产业发展的指导意见》、工业和信息化部发布的《“十四五”大数据产业发展规划》等官方文件,将其中提到的数据资产关键词与本文的特征词谱进行对比和扩展,以确保词谱的全面性。最终,本文构建了如图1所示的数据资产特征词谱。
第三,计算词频和情感极性分析。考虑到中文语言在财经语料下的表达较为复杂,根据数据资产词典,采用Python技术计算企业年报中各特征词的词频,并且利用SnowNLP技术对每个出现的词汇进行情感极性分析,最终得到经情感极性(正向、中立、负向)调整后的各特征词词频。
第四,估算企业数据资产水平。将经情感极性调整后的正向及中立的各特征词词频进行加总,除以
年报总词频再乘以100,得到反映企业数据资产水平的指标。计算公式为:
DAi,t=∑Dwordsi,t,n/Twordi,t×100。
其中,DAit为i企业t年的数据资产水平,Dwordsi,t,n为词典中第n个特征词在i企业t年年度报告中的词频,Twordi,tt为i企业t年年度报告的总词频(排除英文和数字)。DA值越大,则企业的数据资产水平越高。
2.数据资产评估指标的有效性检验
本文采用上述方法对样本企业(沪深A股的上市公司,详见后文)2007—2022年的数据资产水平进行了评估,为了确保评估结果能够客观反映企业的数据资产水平,进行如下指标有效性检验。
(1)指标对比检验
本文基于企业、行业和地区层面的相关资料和数据对企业数据资产水平评估结果进行对比分析。
一是企业层面的对比。由于数据资产具有非实体性和依附性(需依附于实物载体或介质而存在),是否拥有数据中台和信息管理系统等对于企业的数据资产化进程具有重要意义(孙颖 等,2021)[1],因此可认为,企业的数据中台发展状况能够在一定程度上体现其数据资产水平。借鉴胡楠等(2021)[34]的检验思路,将《互联网周刊》、德本咨询、eNet研究院联合发布《2022数据中台TOP50》榜单企业与本文的样本企业进行匹配,得到5家企业(用友软件、浪潮软件、星环科技、恒生电子、普元信息);然后根据各样本企业2007—2022年数据资产水平的均值将其分为最高、较高、较低和最低四组,结果发现这5家企业中有4家位于最高组,另1家位于较高组,表明本文测算的数据资产水平是有效的。此外,抽取数据资产特征词词频占比前五的企业(高鸿股份、威星智能、机器人、科大智能、东方国信),仔细研读其年报和投资者关系活动记录表等相关资料,发现相较于大部分企业,其确实拥有较多的各类(运营类、市场和客户类、工业类及知识产权类等)数据资产,这也在一定程度上表明本文评估得到的数据资产水平较高的企业确实拥有较多的数据资产。
二是行业层面的对比。计算出2007—2022年各行业企业数据资产水平的均值(见表1),结果显示“信息传输、软件和信息技术服务业”“文化、体育和娱乐业”“综合类”等行业的企业数据资产水平较高,而“农、林、 牧、渔业”和“采矿业”等行业的企业数据资产水平较低,这一数据资产的行业分布状态与已有相关研究结果一致(李健 等,2023)[18]。
三是地区层面的对比。计算出2007—2022年31个省份(不包括港澳台地区)企业数据资产水平的均值(见表2)。贵州省的企业数据资产水平最高,这得益于2015年贵州大数据交易所的建立,贵州省的企业率先探索数据流动体系,并通过数据交易沉淀了较多数据资产。企业数据资产水平较高的省份还有北京、广东、上海和湖北,这也与《中国数字经济发展白皮书》中数字经济规模突破万亿元的省份相契合。可见,本文测算的企业数据资产水平在区域分布上也与实际情况基本一致。
(2)指标相关性检验
根据财政部发布的《企业数据资源相关会计处理暂行规定》,企业使用的数据资源,符合规定的应确认为无形资产。在此之前,已有研究也认为数据资产应纳入企业无形资产的范畴。基于此,本文根据样本企业的财务报表,将附注中含有与数据资产化过程相关词汇的无形资产占总资产的比例,作为衡量企业“数据类无形资产”的代理变量。例如无形资产附注中出现大数据、数字平台、数据中心和数据共享等词汇,即将其视为数据类无形资产。借鉴胡楠等(2021)[34]的验证思路,以样本企业的“数据类无形资产”(DA_IAi,t)为被解释变量,以“数据资产水平”(DAi,t)为核心解释变量,并纳入一系列控制变量(Controls,控制变量与后文的基准模型一致)以及个体(Company)、行业(Ind)、年份(Year)固定效应,构建如下相关性检验模型:
DA_IAi,t=α0+α1DAi,t+∑αkControlsi,t +∑Company+∑Ind+∑Year+εi,t。
回归结果显示,“数据资产水平”的系数在1%的水平上显著为正(0.078 1),表明本文测算的企业数据资产水平与企业数据类无形资产水平显著正相关,因此可以认为该指标是有效的。
四、实证研究设计
1.基准模型构建与变量选择
为检验数据资产对企业高质量发展的影响,构建如下基准模型:
TFP_LPi,t=α0+α1DAi,t+∑αkControlsi,t +∑Company+∑Year+εi,t
其中,下标i和t为分别代表企业和年份,被解释变量(TFP_LPi,t)“高质量发展”为企业i在t年的高质量发展水平,核心解释变量(DAi,t)“数据资产”为企业i在t年的数据资产水平;Controlsi,t表示一系列控制变量,Year和Company分别表示年份和个体固定效应,εi,t为随机误差项。
被解释变量“高质量发展”采用基于LP法测算的全要素生产率来衡量。全要素生产率能体现企业各生产要素的使用状况和配置效率,是企业发展质量和发展数量的综合反映,具有信息丰富和综合性强等优点,能够反映企业高质量发展水平,且与本文探究数据资产驱动传统生产要素改善的研究重点相契合。因此,本文选用全要素生产率作为企业高质量发展的代理变量,并借鉴鲁晓东和连玉君(2012)[36]的做法,采用LP法测算样本企业的全要素生产率。核心解释变量“数据资产”采用前文构建的企业数据资产评估方法进行测算。
参考黄勃等(2023)[11]和黄先海(2023)[37]的研究,从企业层面选取以下控制变量:一是“资产规模”,采用总资产的自然对数值来衡量;二是“企业年龄”,采用当年年份减企业成立年份加1的自然对数值来衡量;三是“成长性”,采用营业收入的增长率来衡量;四是“资产负债率”,采用期末总负债与期末总资产之比来衡量;五是“现金流比率”,采用经营活动产生的现金流量净额与营业收入之比来衡量;六是“市场价值”,采用总市值与总资产之比来衡量;七是“研发能力”,采用专利申请数量加1的自然对数值来衡量;八是“第一大股东持股比例”,采用年末第一大股东持股比例来衡量;九是“董事会规模”,采用董事会人数的自然对数值来衡量;十是“产权性质”,为是否国有企业的虚拟变量,国有企业赋值为1,否则赋值为0。
2.样本选择与数据处理
本文以沪深A股的上市公司为研究样本,考虑到在2006年以后数字化工具开始广泛使用(李琦 等,2021)[38],样本期间选定为2007—2022年,剔除金融类行业样本、ST和*ST类样本、数据缺失样本,最终获得36 589个观测值,并对连续型变量进行前后1%的缩尾处理。企业数据资产的相关数据来自深圳证券交易所和上海证券交易所官方网站披露的上市公司年报,其他数据源自CSMAR数据库。表3为主要变量的描述性统计结果。从整体样本来看,“高质量发展”的标准差为1.043,最大值为11.11,最小值为6.032,表明不同企业间的发展质量存在较大差异;“数据资产”均值为0.134,最大值为1.227,最小值为0,说明样本企业的数据资产水平总体较低,有待提高。
五、实证检验结果分析
1.基准模型回归
基准模型检验结果见表4,“数据资产”的回归系数在1%的水平上显著为正,表明企业数据资产的增加对其高质量发展具有显著的正向影响,假说H1得到验证。考虑到本文从数据资产获取、数据资产处理和数据资产应用3个层面确定企业的数据资产的特征词词谱,进一步分别统计该3个层面的特征词词频数,得到相应的指标(“数据资产获取”“数据资产处理”“数据资产应用”),用以反映不同层面的数据资产水平,并分别以其为核心解释变量进行模型检验,回归结果见表5。“数据资产获取”的回归系数为正但不显著,“数据资产处理”和“数据资产应用”的回归系数在1%的水平上显著为正,表明在企业的数据价值链中,数据资产的处理和应用显著促进了企业高质量发展,而数据资产的获取对企业高质量发展的影响不显著。其原因在于,处于获取阶段的数据往往是单一、零散的,这种尚未聚合的数据价值有限,往往需要经过处理后才具有应用价值;而在进入数据价值链的处理阶段后,大量无序的原始数据经过汇集、规整和分析,呈现出可阅读、可理解和可增值的状态,可以从中提炼出有效的信息与知识,并应用于企业的生产经营全过程中,进而为企业带来多元化的效益,助力企业高质量发展。
2.内生性处理
为了缓解模型可能存在的样本自选择偏误、逆向因果关系以及遗漏变量等内生性问题对回归结果的干扰,本文进行如下内生性处理:
(1)倾向得分匹配法
数据资产水平较高的企业可能本身的发展质量就较高,并非一定是由于数据资产的增加促进了其高质量发展。因此,根据企业数据资产水平的中位数将样本划分为“高水平”(实验组)与“低水平”(对照组)两组,选取“资产规模”“企业年龄”“成长性”“资产负债率”作为协变量,进行logit回归得到倾向得分值,并借助协变量进行1∶1最近邻匹配。样本匹配后,变量的标准化偏差都小于2%,且实验组与对照组无系统差异,通过了平衡性检验(见表6),ATT值为9.2,与前文分析结果一致。删除没有匹配上的样本后重新进行模型检验,回归结果见表7的Panel A,“数据资产”的回归系数依然在1%的水平上显著为正。
(2)工具变量法
企业的发展质量也可能会影响其数据资产水平,产生反向因果关系。对此,本文将剔除样本企业自身后的分年度、行业的数据资产水平均值作为“数据资产”的工具变量,进行2SLS检验。由于数据资产在企业间存在同群效应,样本企业的数据资产水平与同行业其他企业的数据资产水平具有相关性,同时行业内其他企业的平均数据资产水平不会对样本企业的高质量发展产生直接作用,因而该工具变量满足工具变量有效的相关性和外生性要求。工具变量法检验结果见表7的Panel B,工具变量通过了不可识别检验(Kleibergen-Paap rk LM统计量显著)与弱工具变量检验(Kleibergen-Paap Wald rk F统计量显著)。第一阶段回归结果显示,工具变量与“数据资产”显著正相关;第二阶段回归结果显示,工具变量拟合的“数据资产”的回归系数仍然在1%的水平上显著为正。
(3)更换固定效应
尽管基准模型已经控制了个体固定效应和年份固定效应,但仍可能遗漏不同年份发生在特定地区或特定行业的冲击,因此进一步增加省份固定效应和行业固定效应重新进行模型检验。此外,为了缓解大量干扰性因素的影响,将基准模型的固定效应更换为“省份—行业”“年份—行业”“年份—省份”三种高维交互固定效应中的两种,分别进行模型检验。更换固定效应的回归结果见表7的Panel C,“数据资产”的回归系数均在1%的水平上显著为正。
上述内生性处理结果表明,在缓解模型内生性问题后,本文的基本结论依然成立,即企业数据资产的增加促进了企业高质量发展。
3.稳健性检验
为进一步验证基准模型分析结果的可靠性,进行以下稳健性检验:
(1)变量替换
一是替换核心解释变量。在数据资产词典中,与中立情感词汇相比,正向情感词汇更能体现企业对数据资产的认可及取得的成就,因此,仅加总经情感分析调整后的正向数据资产特征词词频,从而得到“数据资产1”,将其作为核心解释变量重新进行模型检验。此外,将数据类无形资产占比(“数据资产2”)作为核心解释变量,重新进行模型检验。二是替换被解释变量。分别采用OP法、OLS法和FE法测算样本企业的全要素生产率,将其作为被解释变量重新进行模型检验。上述检验结果见表8,核心解释变量的回归系数均在1%的水平上显著为正,表明本文的分析结果是稳健的。
[12]栗晓云,夏传信,施建军.数字技术驱动制造企业高质量发展战略研究——基于三一重工、特斯拉和酷特智能的多案例研究[J].技术经济,2023,42(5):149-161.
[13]岳宇君,洪长威.数字政府建设与企业高质量发展:内在机理与实证分析[J].学术交流,2023(7):88-103.
[14]吴浩强,胡苏敏.数字化转型、技术创新与企业高质量发展[J].中南财经政法大学学报,2023(1):136-145.
[15]高跃,王跃堂,冀云阳.数字化转型赋能企业高质量发展——基于城市异质性视角的分析[J].城市问题,2023(6):95-103.
[16]王羲,陈雪姣,曹晶,等.数字化转型对企业高质量发展的影响——企业创新与风险承担视角[J].科技进步与对策,2024,41(7):1-10.
[17]杨向阳,徐从才.数据要素与流通企业高质量发展[J].商业经济与管理,2024(3):5-17.
[18]李健,董小凡,张金林,等.数据资产对企业创新投入的影响研究[J].外国经济与管理,2023,45(12):18-33.
[19]HU C,LI Y,ZHENG X. Data assets,information uses,and operational efficiency[J]. Applied Economics,2022,54(60): 6887-6900.
[20]KIRON D. Lessons from becoming a data-driven organization[J]. MIT Sloan Management Review,2017,58(2).
[21]SIVARAJAH U,IRANI Z,GUPTA S,et al. Role of big data and social media analytics for business to business sustainability:a participatory web context[J]. Industrial Marketing Management,2020,86:163-179.
[22]BEGENAU J,FARBOODI M,VELDKAMP L. Big data in Finance and the growth of large firms[J]. Journal of Monetary Economics,2018,97:71-87.
[23]苑泽明,于翔,李萌.数据资产信息披露、机构投资者异质性与企业价值[J].现代财经(天津财经大学学报),2022,42(11):32-47.
[24]路征,周婷,王理,等.数据资产与企业发展——来自中国上市公司的经验证据[J].产业经济研究,2023(4):128-142.
[25]陆岷峰,王稳华,朱震.数据资产如何赋能企业高质量发展——基于产能利用率视角的经验证据[J].上海商学院学报,2023,24(4):22-41.
[26]韩秀兰,王思贤.数据资产的属性、识别和估价方法[J].统计与信息论坛,2023,38(8):3-13.
[27]罗玫,李金璞,汤珂.企业数据资产化:会计确认与价值评估[J].清华大学学报(哲学社会科学版),2023,38(5):195-209+226.
[28]SONG Z,WU G L. Identifying capital misallocation[R]. Chicago:Univ. Chicago,Work Pap,2015.
[29]陈诗一,陈登科.中国资源配置效率动态演化——纳入能源要素的新视角[J].中国社会科学,2017(4):67-83+206-207.
[30]才国伟,杨豪.外商直接投资能否改善中国要素市场扭曲[J].中国工业经济,2019(10):42-60.
[31]陈冬梅,王俐珍,陈安霓.数字化与战略管理理论——回顾、挑战与展望[J].管理世界,2020,36(5):220-236+20.
[32]许宪春,张钟文,胡亚茹.数据资产统计与核算问题研究[J].管理世界,2022,38(2):16-30+2.
[33]刘景江,郑畅然,洪永淼.机器学习如何赋能管理学研究?——国内外前沿综述和未来展望[J].管理世界,2023,39(9):191-216.
[34]胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(5):139-156+11+19-21.
[35]孙昌玲,王化成,王芃芃.企业核心竞争力对供应链融资的影响:资金支持还是占用?[J].中国软科学,2021(6):120-134.
[36]鲁晓东,连玉君.中国工业企业全要素生产率估计:1999—2007[J].经济学(季刊),2012,11(2):541-558.
[37]黄先海,高亚兴.数实产业技术融合与企业全要素生产率——基于中国企业专利信息的研究[J].中国工业经济,2023(11):118-136.
[38]李琦,刘力钢,邵剑兵.数字化转型、供应链集成与企业绩效——企业家精神的调节效应[J].经济管理,2021,43(10):5-23.
[39]卜令通,张嘉伟.基于PMC指数模型的数字经济政策量化评价[J].统计与决策,2023,39(7):22-27.
[40]袁淳,肖土盛,耿春晓,等.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021(9):137-155.
[41]戴翔,马皓巍.数字化转型、出口增长与低加成率陷阱[J].中国工业经济,2023(5):61-79.
[42]江艇.因果推断经验研究中的中介效应与调节效应[J].中国工业经济,2022(5):100-120.
[43]刘姝雯,刘建秋,阳旸.企业金融化与生产效率:“催化剂”还是“绊脚石”[J].南开管理评论,2023,26(1):55-68.
[44]GHOSH D,OLSEN L. Environmental uncertainty and managers use of discretionary accruals[J]. Accounting Organizations and Society,2009,34(2):188-205.
[45]申慧慧,于鹏,吴联生.国有股权、环境不确定性与投资效率[J].经济研究,2012,47(7):113-126.
[46]张桅,胡艳.长三角地区创新型人力资本对绿色全要素生产率的影响——基于空间杜宾模型的实证分析[J].中国人口·资源与环境,2020,30(9):106-120.
[47]王小鲁,樊纲,胡李鹏.中国分省份市场化指数报告(2018)[M]. 北京:社会科学文献出版社,2019.
[48]金灿阳,徐蔼婷,邱可阳.中国省域数字经济发展水平测度及其空间关联研究[J].统计与信息论坛,2022,37(6):11-21.
[49]陶长琪,丁煜.数字经济政策如何影响制造业企业创新——基于适宜性供给的视角[J].当代财经,2022(3):16-27.
Empowering High-quality Development of Enterprises with
Data Assets: Optimization Mechanism of
Traditional Production Factors
Abstract:
In the era of the digital economy, accelerating the construction of Digital China and promoting high-quality development of the real economy are important engines for advancing Chinese modernization. Against this background, data is experiencing exponential growth, driving profound changes in social production and lifestyles. Enterprise data assets have also become a focal topic in academia. As a new factor of production in the digital economy era, data assets are embedded in various fields of the real economy, relying on data industrialization and industrial data-oriented businesses, serving as a key factor in talent upgrading, technological innovation, optimal capital allocation, and management efficiency improvement, thereby promoting high-quality development of enterprises.
Based on the data of A-share listed companies in Shanghai and Shenzhen Stock Markets from 2007 to 2022, this paper describes the data assets using text analysis, tests its influence on the high-quality development of enterprises and its mechanism of action, and identifies the regulatory effects in different external environments. It is found that data assets are the effective driving force of high-quality development. This conclusion is still valid after the robustness test and the endogeneity test. The mechanism test shows that the application of data assets can improve the development quality of enterprises through four channels: human resource optimization mechanism, capital allocation improvement mechanism, technology resource accumulation mechanism, and management resource efficiency mechanism. Further analysis shows that, for the areas with high environmental uncertainty, information level, marketization degree, and governments concern about the digital economy, data assets have a more significant role in promoting the high-quality development of enterprises. The conclusion of this paper provides a micro-theoretical basis and policy enlightenment for enterprises to use data assets to promote the optimization and upgrading of traditional production factors and achieve high-quality development.
The marginal contributions of this paper are as follows: firstly, in terms of research content, this paper examines the impact of data assets on the high-quality development of enterprises, not only providing a “new perspective” for high-quality development but also expanding the economic consequences of data assets from the dual attributes of “data” and “assets”. Secondly, in terms of variable measurement, this paper selects seed words based on the underlying logic of data asset “acquisition-processing-application”, uses the Autophrase method to construct a “data asset” text dictionary, and then mines textual information from annual reports through sentiment analysis to measure the level of enterprise data assets. Furthermore, the validity of this indicator is verified through feature word spectrum tests and comparative tests, providing useful references for innovating the measurement of enterprise data asset levels. Thirdly, in terms of analysis perspective and mechanism testing, this paper takes data assets as a new factor of digital economic development and the basic fact that they can substitute inputs and optimize resources for traditional production factors as a research starting point, providing evidence for the impact of enterprise data asset mechanisms on high-quality development through four channels: human resources optimization mechanism, capital allocation improvement mechanism, technological resource accumulation mechanism, and management resource efficiency enhancement mechanism, and further discusses the regulatory effects of regional and industry environments, providing theoretical support and empirical evidence for differentiated strategies for high-quality development of enterprises.
Key words:
data assets; high-quality development; traditional production factors; labor structure; capital allocation efficiency; technical level; management efficiency