袁 蓓,夏 昊
(1.哈尔滨银行 博士后工作站,哈尔滨 150000;2.哈尔滨工业大学 经济与管理学院,哈尔滨 150001)
当前智力资本的影响力正在从知识型企业向外逐步扩大和蔓延,逐步成为企业获得持续竞争力的重要来源,帮助企业占领行业领先地位。而在大数据时代,有关智力资本的信息披露也已从单一的年报向微博、网站等多渠道拓展。为了能够展现自身智力资本优势来获取投资者的信任,相比于传统媒体,上市公司如今会选取多渠道进行智力资本信息披露,这样有利于将公司预期信息及时有效地传播给所有利益相关者,上市公司也可在监管允许的范围里获取更大信息发布自由度,促进智力资本信息披露质量的提升。与此同时,作为投资者,往往渴望掌握更多智力资本相关信息用以分析判断出更佳的投资对象。大数据下的智力资本信息披露为投资者节省了大量搜集信息的时间成本,类似于微博等新媒体具有信息交互的功能,可以促使单向的信息流动向双向互动转换。因此,智力资本信息披露不仅有助于企业对外塑造形象,而且有利于投资者获取有效信息,研究涵盖微博、官网等多渠道披露的智力资本信息是如何影响企业价值就十分有必要。然而,当面临企业披露的大量智力资本信息时,如何挖掘并进行指标选取,如何准确、客观、科学地衡量智力资本信息促进企业价值的转化作用,又成为急需解决的难题。鉴于此,本文拟根据现有智力资本信息指标分类,利用机器学习的分类算法,重新分析智力资本的构成维度和测量指标,试图搭建智力资本信息披露指标体系,并以我国A股上市公司为对象,实证检验智力资本信息披露体系的科学性,验证机构投资者异质性这一外部因素是否能够在二者之间发挥一定的调节效用。
新近的文献中,有关智力资本评价体系大部分是依据指标法,局限于理论高度导致指标法在实际应用中存在数据难以获取的问题,缺乏成熟的智力资本评估体系严重影响了智力资本向价值的顺利转化。国外有关智力资本披露评价体系多为模型化,Dumay等(2016)[1]通过整合区域智力资本信息,构建模型来实证研究智力资本对世界各国的竞争力,研究结果显示,智力资本可以转化为财富生产力和经济价值。Gianluca等(2018)[2]为了对欧盟各国进行实证研究,从宏观、战略及微观三个方面构建了智力资本模型。而从国内研究来看,起初部分学者参照国外学者做法,如陈钰芬(2006)[3]为构建智力资本披露体系采用了Skandia导航器模型,并利用我国31个省份的数据进行实证分析。李卫兵等(2019)[4]参照国外做法,利用模型对我国区域智力资本及空间溢出效应进行测量计算。但随着研究的日益推进,有关智力资本信息披露体系开始向内容分析法转变,即通过分析年报披露的信息后进行归类及量化。刘晓宁(2006)[5]根据内容分析法利用年报披露的数据,从人力资本、过程资本、关系资本和创新资本角度构建了智力资本评价体系。冉秋红等(2010)[6]选择223家上市公司,对其在年报公开披露的智力资本信息进行评价估算,研究结果表明,智力资本对组织经营绩效产生了积极的、正向的影响。但由于内容分析法分析得出的年报信息数据多为绝对值,不利于直接比较,有关智力资本信息披露的指标分类和选取也存在一定争议。
但随着机器学习的出现,基于机器学习的智力资本分类算法可以用于评判指标的合理性,进而有助于建立一个科学的智力资本评估体系,从而客观地评判企业拥有智力资本水平的高低,协助企业预测面临的风险,最大化提升企业价值。目前为止,对于智力资本信息披露的指标分类仍未有统一的界定标准,基于机器学习分类算法构建智力资本信息披露指标体系的研究文献还暂未发现,鲜有将机器学习与智力资本信息披露相结合的研究成果,且有关智力资本信息的来源仅为年报,由此可以看出,利用机器学习的方法来研究多种渠道披露的智力资本信息能够在理论和实践方面实现突破。与此同时,机构投资者异质性作为外部影响的因素,很有可能会在二者关系中起到关键作用。目前已有研究证明,智力资本信息能够引起机构投资者和分析师重点关注,这是因为机构投资者的异质性决定机构投资者行为必须从理性出发,积极获取信息并准确判断出市场行情,根据其自身特点作出能够干预企业的决策。因此,关注机构投资者异质性,可能会因不同机构投资者持股比例而对二者之间的关系产生影响。需要将该种异质性纳入智力资本信息披露与企业价值的关系研究框架,才能更准确地刻画具体的影响过程。
本文指标构建的整体思路,是在已有文献基础上生成初始测量指标,并利用机器学习中分类算法进行筛选,随后将利用Delphi法通过专家问卷调查进行校验,确定最终的指标体系。如图1所示。
基于已有的理论和文献分析,Dumay等(2016)[1]提出的有关智力资本信息披露分类体系认可度较高,融合蒋艳辉等(2014)[7]、何贤杰等(2016)[8]、傅传锐等(2018)[9]对智力资本构成的认识,并考虑到我国上市公司智力资本信息披露的实际情况,本文拟从智力资本的人力资本、结构资本和关系资本三个维度展开,对于三个维度的计量指标参考现有的文献中的计量方法,并根据上市公司的实际情况及特征进行适度调整,初步确定了3大类29个指标作为初始测量的指标集合。具体指标设定如表1所示。
图1 指标构建思路图
表1 初轮筛选智力资本信息披露指标
表1(续)
基于初始指标体系,本文将从上市公司年报、官网以及微博等多渠道获取智力资本信息的相关数据。选取微博和网站等渠道,是由于大数据环境下,微博和官网等新媒体的广泛应用,逐步成为发行公司经营信息的载体。由于智力资本信息量巨大,本文将通过网络爬虫技术进行收集,设定“公司名+关键词”开始数据抓取工作,随后分析去重,初步形成数据源,对每家上市公司搜集到的信息总量依据标题重新排序,去掉重复性信息后,进行数据信息分类,利用“智力资本”及表1中的关键词对信息采集的方向进行控制,把搜集到智力资本主题互联网信息进行汇总,同时按照上述的分类标准,将年报信息进行整理分类,形成年报数据集,最后,得到共计8850个样本数据的智力资本数据合集。
为了保证数据的准确性和完整性,我们首先对这8850个样本数据的智力资本信息进行数据预处理。本文使用的数据共有8850个,提供了29个输入变量。由于有关智力资本信息的原始数据不是为了统计分析而设计的,自动抓取的部分变量文本的具体分类可能缺乏合理性。因此,对于某些变量本文从统计分析的角度进行了重新归类和适当合并调整。首先,在数据清理方面,利用sklearn-preprocessing中的Imputer类来处理缺失值,利用nan代替缺失值并把其调整为浮点型,为了补充Z的缺失值,使用X的均值填,我们共对470个缺失数据进行了预测和填充;其次,在数据转换过程中,我们将非0与非1变量的输入变量都执行了Normalizer类数据正则化操作,数据正则化是对每个样本的范数缩放到单位范数1,使本文数据质量有效提高。
本文将利用随机森林模型和SVM算法分别进行测算。随机森林模型的主要思想是采取自助法重采样技术,有放回的从原始训练集M里进行重复性的随机抽取,抽取n个样本组成新的训练样本集,再生成k个分类树,每次未被抽取到的样本组成了n个袋外数据,组成随机森林,判别时采用随机森林分类器,分类结果根据分类器的投票多少来决定。本次实证拟定表1中的29个底层指标为初始自变量,企业智力资本水平为因变量(对智力资本信息披露水平“有影响”设定类别为“1”,智力资本信息披露水平“无影响”设定类别为“0”)建立模型。我们从 8850个样本中随机抽取5310个(总量的60%)作为训练集训练我们所需模型,随后用另外3540个(总量的40%)样本作为测试集进行精确度检验,正确分类在总体中的占比即为精确度,本文的分类精确度公式为:
(1)
经过计算,在测试集上的准确率为0.699,各指标在随机森林模型中的重要性如表2所示。
表2 智力资本评价体系指标重要性
从建模结果来看,上述指标的预测准确度达到69.9%,结果较为理想。我们注意到,体系中各个指标的重要性都为正,且专业员工比例、技术创新及客户关系的指标重要性相对较高,即这些指标与评估体系的相关性更强,而员工男女比例、年龄结构、商业伙伴战略同盟数、品牌威望及商标知名度、环境保护与体系之间的相关性相对较弱。
但由于随机森林算法易存在过拟合问题,对于不平衡数据问题无法解决,此时,支持向量机(SVM)算法的优势就更为突出,它能够解决小样本、非线性、高维模式识别等问题。在本次实证中,我们重新将8850个样本按比例随机分为训练集和预测集,其中训练集样本量为6195个(70%),预测集样本量为2655个(30%)。实证过程中依旧按照表1提出的底层指标作为自变量,以智力资本水平为因变量进行分类预测。最终预测正确率为92%。该模型准确率高于随机森林模型(92%>69.9%),这不仅说明SVM构建的分类器可以很好地适用于智力资本评价指标分类,也再一次证明了上述指标体系的可用性。
为了验证是否应将员工男女比例、年龄结构、商业伙伴战略同盟数、品牌威望及商标知名度、环境保护等与体系之间的相关性相对较弱的指标剔除,文中采用Delphi法进行专业访谈,对指标进行归类整理。通过建立多级层次体系,基于多元渠道确定研究框架。按照Delphi法的应用要求,共邀请10名教授及副教授、5名上市公司高管进行三轮问卷调查。每轮调查均向专家进行适切度询问,并在调查结果的基础上过滤掉明显劣势的指标,对下轮指标进行优化,进而得出最终评估指标。专家问卷调查结果见表3,对于选取人力资本、结构资本、关系资本三个大类指标方面,“非常恰当”“比较恰当”占比总和100%,说明专家对此种分类表示认可。但对于具体指标,运用Delphi法进行三轮测试以后,表4所示共有5个指标不能达到一致。
表3 专家问卷结果分析表
表4 不能达到一致的指标适切度结果分析表
综上分析,得到多源化智力资本信息披露最终筛选的指标体系,如表5所示。
表5 多源智力资本信息披露内容框架
基于信号传递理论,对于本文中智力资本信息披露的影响结果分析,可以以信息披露对企业价值的作用机制为突破口。在影响机制解析中,首先,企业是信息的源头,利益相关者能够识别信息并加以分析,即信息融通阶段;其次,利益相关者会根据自身获得的相关知识进行方案设计,而管理者对未来发展方向的选择会影响企业的市场价值,即信息使用影响效果实施;最后,基于以上分析,能够找到智力资本信息披露对企业价值的作用机制[10]。智力资本信息传递过程总体也表现出一致性。可以分解为智力资本信息的创造、投资者对其解析并应用。值得注意的是,此传递过程中利益相关者的行为都会以各种形式发挥效应,并将影响企业估值。本文研究对象为上市公司披露的智力资本信息。资本吸纳过程中,利益相关者和管理者掌握的信息有所不同[11]。资本内部使用过程中,利益相关者和管理者掌握的信息亦会有所差异。考虑到上述情况,智力资本信息并非完全透明,而投资者仅能运用不充分信息决策,易产生消极情绪和厌恶心理进而影响方案抉择,其发挥的效用将最先作用于公司绩效,然后反映到价值水平[12]。研究发现,如果投资者获得智力资本信息较全面,能够知道公司的基本情况,包括管理者、员工、绩效等,投资意愿便会随之增加。反之,如果掌握的信息,如管理混乱、市场表现不佳、员工消极懈怠等消极信息,投资情绪将表现为负面;伴随着投资者心理的调整,外在表现也存在差异,若分析智力资本信息后符合投资者预期判断,便会增加购买力度,该上市公司在资本市场的受欢迎程度增加,股票的市场需求增大,企业价值随之提升。基于此,本文提出研究假设H1。
H1:智力资本信息披露水平对企业价值有正向影响。
与此同时,在研究机构投资者对智力资本信息披露影响企业价值的调节效应时,机构投资者的异质性作用不容忽视。若机构投资者能够拥有相对比例的股份,为了保证自身效益不被损害,便会选择增加信息面,掌握更多智力资本信息,并通过识别有效信息作出决策[13]。此外,投资者进行决策时往往会甄别自己收获的相关信息,出于提升价值角度考量,选择利己的行为,当资本市场中的散户由于缺少信息而不知如何决策时,便会参考机构投资者的行为选择跟风,这在一定程度上助长了股票增值,对于增加企业价值具有积极作用。
如果机构投资者能够在公司具有一定话语权,便可有效减少代理成本,对公司管理者的行为进行制约,促使公司定期进行内控检查,减少股东利益被侵害的可能性[14]。文献梳理发现,压力抵制型机构投资者对于内部治理有较大作用,能够有效对管理者行为进行内部审阅,提升公司总体绩效和业务能力。压力敏感型的机构投资者却能够与公司保持良好的内在联系,利益趋同,此外,敏感型机构投资者更为看重其投资范围,高效利用资源从事相关业务。鉴于此,本文提出如下假设:
H2:机构投资者对智力资本信息披露和企业价值的调节效应正向显著。即随着机构投资者持股比例上升,智力资本信息披露对企业价值的作用更强。
H3:与压力敏感型机构投资者相比,在分析智力资本信息披露对企业价值的作用时,压力抵制型机构投资者能够发挥更大的调节效应。
本文样本区间为2016—2019年,研究对象为我国A股上市公司中连续上市3年的公司,对金融类和数据缺失的样本予以剔除。样本相关数据来源于巨潮资讯网、CSMAR数据库、深交所网站、锐思数据库等,并利用stata16.0计量分析。最终共得到1887个公司/年度观察值,为保证结果准确,已对连续型变量逐年进行缩尾(Winsorize)处理。
被解释变量:企业价值。企业价值作为因变量,用Tobin’s Q指数表示,这样可以减少财务指标内联型,所需的数据源于国泰安数据库,计算时需剔除异常数据。
解释变量:智力资本信息披露。基于上述利用机器学习构建的智力资本信息披露体系,融合多种渠道获得的数据。由于采用内容分析法不能准确地计量和比较,此外,对于信息披露的分类没有统一的标准[15],为了研究方便,在梳理相关文献基础上,参考傅传锐等(2018)[9]学者衡量智力资本信息披露方式,对细节加以修正,划分成四个维度。本文采用问卷调查法对权重的设置进行问询,保证了指标设置的合理性。评分权重如表6所示。
表6 多渠道披露评分规则
智力资本多源化信息披露指数(ICDI)可以用信息披露得分占满分的比重表示,公式(2)如下:
(2)
其中,ICDIi为第i个公司的智力资本信息披露指数,Xi代表报告中显示的第i个指标,Yi代表第i个指标的权重比例。出于指标的客观性和有效性考虑,Yi等于1,表示平均划分。然而,从应用角度看,公司具有异质性,指标也有所不同。从总体分析,智力资本信息对公司发展其作用极为有效。
调节变量:机构投资者持股比例。此文中,机构投资者持股比例为机构投资者持有股票票面金额与企业所有股票票面金额的比值。基于机构投资者视角,参考相关文献,将社保等基金、外商投资等划分成压力抵制型,其余划分为压力敏感型。INR用来衡量压力抵制型机构投资者持股比例,INS用来衡量压力敏感型机构投资者持股比例。
控制变量:本文依据相关文献,共归纳了6个控制变量。
主要变量说明如表7所示。
表7 主要变量说明
为验证H1,依据Neha等(2018)[16]、Leena等(2018)[17]、Marta等(2018)[18]、张丹(2008)[19]的分析,控制变量包括公司规模、盈利能力、成长性、债务水平、现金净流量、股权集中度,运用Hausman检验判断选用固定效应模型或是随机效应模型,全面考量影响指标,建立回归方程(3)为:
TQ=α0+α1ICDIt+α2Roa+α3Lev+α4Size+α5Growth+α6Cash+α7Con+∑YEAR+ε
(3)
基于上述分析,运用方程(4)对假设2验证,探究交互项对智力资本信息披露和企业价值关系的作用。运用方程(5)分别验证压力抵制型和压力敏感型机构投资者对智力资本信息披露和企业价值的作用,对假设3验证。
TQ=α0+α1ICDIt+α2IBN+α3IBN×ICDIt+α4Roe+α5Lev+α6Size+α7Growth+α8Cash+α9Con+∑YEAR+ε
(4)
TQ=α0+α1ICDIt+α2IBN+α3Roe+α4Lev+α5Size+α6Growth+α7Cash+α8Con+∑YEAR+ε
(5)
表8为各指标的描述性统计结果。样本企业价值的平均值为2.453,标准差为7.819,极差较大,表明不同公司的企业价值有明显不同。智力资本信息披露指数的平均值为0.186,最小值为0.063,最大值为0.684,说明智力资本信息披露情况没有达到优化,自愿披露水平不高。INB的平均值为0.207,说明A股上市公司中机构投资者平均持股比例可达到20.7%。净资产收益率平均值是5.00%,资产负债率平均值是28.80%,公司面临的风险不高不低。资产规模的平均值是20.309,股权集中度平均为0.550,主营业务增长率28.90%,现金净流量系数0.149,说明公司有良好的发展前景,但资金周转情况可能有所不同。排名前三的高管薪酬平均值为5.635,最小值为0,最大值为9.734,说明不同公司高管薪酬差距较大,公司治理水平参差不齐。
表8 描述性统计分析
Pearson相关分析法被用以分析各变量内在关系。如表9所示,各个主要变量之间的相关系数都不超过0.5。这说明变量设置相对规范,不存在多重共线性。智力资本信息披露与企业价值的相关系数是0.013,正向作用较为明显。此外,净资产收益率、现金流量、高管薪酬成长性对企业价值均有积极作用。公司规模、资产负债率与企业价值负相关关系明显。
表9 相关系数分析
基于F检验和Hausman检验,均发现固定效应模型比混合效应模型更为适宜。表10第2、3列体现了智力资本信息披露和企业价值的关系。智力资本信息披露系数为0.869,即智力资本信息披露指数对公司价值具有促进作用,假设H1得到验证。从控制变量来看,盈利能力、现金流量与智力资本信息披露之间呈正相关关系,说明当企业经营状况良好时,为了企业经营的外部合法性,实现持续经营,会更加注重智力资本信息的披露。企业规模与智力资本信息披露在1%的水平上显著正相关,说明企业资产越多,越倾向于向外界披露智力资本信息,从而传递积极信号。企业成长能力与智力资本信息披露显著正相关,说明当企业处于成长阶段时,为了占据市场有利地位,会更加重视智力资本信息披露。在公司治理层面,高管薪酬比例与智力资本信息披露质量正相关,说明良好的公司治理环境有利于企业作出提高智力资本信息披露的决策。
表10 回归分析结果(1)
表10(续)
如表11所示,将机构投资者持股和智力资本信息披露交互项(INB×ICDI)融入模型后,导致相关性变为反向。这体现了机构投资者对于智力资本信息披露和企业价值的关系起消极作用。假设H2得到反向验证。这是因为机构投资者更为重视自己用专业渠道攫取的内幕消息,但对公开的信息却重视不足,故其反而起到消极作用。具体分析不同类型的投资者对智力资本信息披露和企业价值过程中的作用。压力抵制型智力资本信息披露指数和企业价值的回归系数为0.847,而压力敏感型为0.732,系数显著,说明通过假设。上述两种类型机构投资者持股比例的各自单独项与企业价值的回归系数分别为0.239和-0.023,表示压力抵制型机构投资者持股比例(INR)可以促进企业价值提升,故企业智力资本信息披露应该予以重视;压力敏感型机构投资者的持股比例(INS)和企业价值呈反向联系,出现该种现象的原因可能是由于压力敏感型机构投资者过于重视渠道建立,而忽略了智力资本信息作用。此外,交互项的系数和显著度都有所不同,压力抵制型投资者对资本信息披露和企业价值的作用效果更为有效。
表11 回归分析结果(2)
表11(续)
为保证结论的有效性,本文进行了稳健性测试,采用替代指标法。参照Scott和Lerner等学者的做法,以企业价值3年均值的对数作为托宾Q的替代,总体按照原模型设计;改变部分控制变量定义,如以销售收入自然对数衡量公司规模等,稳健性检验结果如表12所示,结果未因此类稳健性测试发生明显变化,说明本文所得结论具有一定的可靠性。
表12 稳健性检验回归分析结果
本文在回顾智力资本相关研究的基础上,证明了机器学习分类算法可以应用于智力资本信息披露指标的研究领域,随机森林模型和支持向量机(SVM)模型作为当前机器学习领域的分类算法,可以取得比传统指标分类更精确可靠的计算结果,这为以后智力资本信息披露领域的研究提供了新的思路。结合机器学习分类算法及其智力资本的特性,构建了多渠道化智力资本信息披露指标体系,并以A股上市公司2016—2019年的数据为样本,对智力资本信息披露和企业价值的作用进行解析。实证发现,本文设计的指标体系应用性较强,且资本信息披露能够提升企业价值。
经过分析,得到相关启示。第一,基于投资者视角,该类群体能够准确地攫取智力资本信息,制定有效投资方案。第二,通过相关部门的有效配合,对信息的来源渠道以及有效性进行监控。鼓励大众传媒传递正面且真实信息,方便投资者获取信息。第三,企业管理层应该加大培训,采取多样化的信息披露方式。设立相对独立的部门,专门负责网络信息发布与关注,通过信息披露方式的改变,为企业创造额外价值。
本文主要是以构建智力资本的信息披露指标分类体系为主要目标,在分类时仅参考部分学者的做法将智力资本设为人力资本、关系资本、结构资本三大类,且在大类指标下的细分指标设置时仅考虑了部分影响企业价值的具体指标,未来的研究中可以适当细化指标,引入其他维度变量,并通过构建模型来进一步探究企业智力资本信息披露的作用机制。