基于文本挖掘方法的环境信息披露指标体系改进

2014-09-25 05:44张秀敏杨连星吴漪曹柳龙徐一方
软科学 2014年7期
关键词:环境信息披露文本挖掘财务绩效

张秀敏+杨连星+吴漪+曹柳龙+徐一方

摘要:对国内外文献中环境信息披露指标(EDI)的构建方式进行系统的梳理,阐释内容分析法在构建质与量相结合指标体系中存在的局限性,提出采用文本挖掘方法确定指标体系中三级指标的内容及权重。在介绍文本挖掘方法生成五种EDI指标体系基础上,结合国内外文献中典型的影响因素,分析EDI与财务绩效之间的关系,通过面板回归得出与既有文献较为一致的结论。

关键词:环境信息披露;指标;文本挖掘;财务绩效

中图分类号:F127;F275文献标识码:A文章编号:1001-8409(2014)07-0065-07

Improvement of Environmental Disclosure

Index Based on Text Mining

——The Empirical Analysis of Sichuan and Chongqing Listed Companies

ZHANG Xiumin1, YANG Lianxing2, WU Yi1, CAO Liulong1, XU Yifang1

(1. School of Business, East China Normal University, Shanghai 200062;

2.School of Economics, Renmin University of China,Beijin 100872)

Abstract: Based on the systematic review of the construction method of Environmental Disclosure Index(EDI) from the present domestic and overseas literature, this paper finds the limits of content analysis method in constructing the EDI system based on quantitative and qualitative information, and proposes a complementary method of Text Mining to specify the thirdlevel indicators and their responding weights. After introducing five types of EDIs using this method, it selects some typical determinants from the present literature, and start a panel data analysis to analyze the relationship between EDI and financial performance.

Key words: environmental information disclosure; index system; text mining; financial performance

环境信息披露既是一种全新的环境管理手段,也是公众参与环境事务的前提,并且能够促进环保工作方式从“事后补救”向“事前警惕”的转换。对于上市企业,环境信息披露制度能够督促上市公司改进环境表现,保护投资者利益,促使社会筹集的资金投向绿色企业,将资本市场变为推动节能减排的经济杠杆。而所有关于环境信息披露的定量研究,都无法回避环境信息披露评价指标(EDI)的构建问题。

作为考量企业环境信息披露水平的核心指标,当前常规的EDI更多是定性与定量评价相结合的形式,也是国外研究发展的阶段性成果。然而目前我国多数研究直接照搬这种评分方式,若用于全行业、评分条目细分、考察时段较长的样本,则难以形成有效评分。本文在综述国内外环境披露指标的理论基础及构建方式基础上,对其归类和成因提出了自己的观点与看法。针对质与量相结合指标体系在实际操作中的局限性,提出采用文本挖掘方法改进内容分析法,避免原评分方式中存在的主观性。在构建多种EDI指标的基础上,探讨改进后指标体系的适用性,以期为环境信息披露指标体系的构建提供更为客观有效的方法与依据。

1既有环境信息披露指标体系文献回顾

国内外涉及环境信息披露指标体系的研究,迄今可以划分为单纯定量、单纯定性、定性与定量相结合三种类型的指标构建方式。单纯的定量指标是依据企业环境信息披露数量,如字数、句子数、篇幅数等构建指标进行评价。该方法在国外早期的定量研究中广为流行[1]。国内近期也少量穿插着基于单纯数量指标研究[2]。单一的质量指标是根据企业是否进行环境信息披露,通过构建0~1变量的指标体系单纯量化企业是否披露环境信息。这种纯粹的质量指标体系在国外文献并不多见[3]。上述两种指标在构建上的差异,某种程度上是由于中文与外文不同的语言特征造成的。外文的每个单词是独立的,阅读者能够依据空格区分单个的词汇,因而方便从数量上提取单个词语重复的次数,易于形成数量指标;而中文表述为连续的语句,且需要通过阅读者自身的理解去确认话语的内涵,因而通过0~1方式判别是否进行了环境信息披露更为便捷。

1982年,Wiseman率先对环境信息数量与质量的两个维度进行评价,指标形成过程如下:首先将企业披露环境信息分为大的类别;其次确定这些大类所包括的小类别,对小类别赋予分值;最后对不同类别的得分进行汇总[4]。Cormier和Magnan曾总结出这种EDI体系下各子条目的详细内容,认为一般企业披露的环境信息应该不会超出这个体系范围[5]。这种评价方法被Patten、Dennis (2002)等西方学者广泛使用[6]。国外近期研究成果通常认为,质与量相结合的指标评价方式最为准确有效[7,8]。因而当前国内外环境信息披露指标的内容基本上都由Wiseman的指标体系发展而来,所反映的信息也比较集中。

和国外相比,我国环境会计发展滞后二十余年,环境信息披露相关的研究几乎是由完全的定性研究直接跨越到定量分析,因而目前更多采用近似质与量相结合的方式构建企业环境信息指数[9,10]。除了在条目设计上十分详尽之外,还对企业环境活动的财务影响比较侧重。

而对于指标权重的确定,Wiseman依据披露信息详略的不同而赋予0~3分间的不同分数[4]。国内外研究通常采用直接加权的方法,以避免人为赋权的主观性。但等权重一定程度上影响到对企业环境信息披露衡量的客观性,也可能制约后续的实证分析。对此个别国内文献又在权重赋予方面有所创新[10,11]。

2改进当前环境信息披露指标体系的原因

21质与量相结合指标体系的局限性

依据上述国内外研究成果,课题组曾经完全沿用以前的文献,构建了一个基本上全面涵盖企业环境活动各个方面“大而全”的评价指标体系。对于指标的三级条目,按照披露的详尽程度评分给予0~4分,采用直接汇总的方法。从2009年10月至2010年5月,采用人工打分对全国所有上市企业2005~2008年年报和社会责任报告进行评分,但能够得出有效评分的企业少之又少,大量三级条目下企业得分为0,其余条目的评分又十分接近,样本差异性不显著。究其原因,除操作的主观性因素之外,亦有EDI指标体系内容设计和评分标准存在的问题,无法真实客观地呈现企业环境活动的差别。

内外部投资者保护机制的过度投资治理作用。实证结果显示,两权分离度与过度投资显著正相关,终极股东控制权与现金流权的分离引发过度投资问题。进一步的研究发现,现金流权抑制过度投资的“激励效应”与现金流权的大小密切相关,当终极股东持有的现金流权较少时,反而加剧了公司的过度投资行为;而仅当终极股东持有较多的现金流权时,现金流权的过度投资治理作用才得以发挥,两权分离度与过度投资间的正相关关系减弱。而且,投资者法律保护对于两权分离引致的过度投资具有抑制作用,投资者法律保护越好的地区,越可以减弱两权分离度与过度投资间的正相关关系,而这在国有上市公司中表现更为明显。本文在公司投资领域研究投资者保护机制对终极股东掠夺行为的影响,既丰富了有关公司控制权理论方面的研究成果,又指出了现实中上市公司过度投资背后的成因与治理机制;特别是从公司内部与外部两个层面考查投资者保护机制的过度投资治理效应,也使得关于投资者保护问题的研究更为深入。当然,本文通过研究仅指出公司内部终极股东的现金流权与公司外部的法制环境存在投资者利益保护作用,那么,公司内外部是否还存在其他的投资者保护机制来抑制终极股东的过度投资行为以及投资者保护机制应如何加以完善等则成为进一步研究的课题。参考文献:[1]俞红海,徐龙炳,陈百助.终极控股股东控制权与自由现金流过度投资[J].经济研究,2010,(8):103-114.[2]彭文伟,冉茂盛,周姝.最终控制权、现金流权与上市公司过度投资[J].软科学,2009,(12):126-129.[3]La Porta R,Lopez de Silanes F,Shleifer A,et al.Investor Protection and Corporate Valuation[J].Journal of Finance ,2002,57(6):1147-1170.[4]陈炜,孔翔,许年行.我国中小投资者法律保护与控制权私利关系实证检验[J].中国工业经济,2008,(1):24-31.[5]罗琦,王寅.投资者保护与控股股东资产偏好[J].会计研究,2010,(2):57-64.[6]唐蓓,潘爱玲,王英英.控股股东对过度投资影响的实证研究——来自中国上市公司的经验证据 [J].经济与管理研究,2011,(8):92-98.[7]La Porta R,Lopez de Silanes F,Shleifer A.Corporate Ownership around the Word [J] .Journal of Finance,1999,54 (2) :471-518.[8]Claessens S,Djankov S,Fan J,et al.Disentangling the Incentive and Entrenchment Effects of Large Shareholdings [J] .Journal of Finance,2002,57:2741-2771.[9]刘星,连军.终极控制、公司治理与地方国有公司过度投资[J].科研管理,2011,(8):105-112.[10]La Porta R,Lopez de Silanes F,Shleifer A,et al.Investor Protection and Corporate Governance[J].Journal of Financial Economics,2000,58(1-2):3-27.[11]王雪梅.终极控股权、控制层级与经济增加值——基于北京上市公司数据[J].软科学,2012,(2):113-118.[12]樊纲,王小鲁,朱恒鹏.中国市场化指数——各地区市场化相对进程2011年报告[M].北京:经济科学出版社,2011.[13]Richardson S.Over Investment of Free Cash Flow [J].Review of Accounting Studies,2006,126 (11):159-189.[14]辛清泉,林斌,王彦超.政府控制、经理薪酬与资本投资[J].经济研究,2007,(8):110-122.(责任编辑:王惠萍)endprint

2.1.1EDI指标条目内容设计上存在的问题

第一,部分指标在年报中基本没有或很少涉及。只有不足三分之一的上市企业在年报中披露环境信息,披露数量从一两句话到一两段话居多,内容也往往仅涉及环保政策、环保计划等定性信息,造成可归集的EDI得分项目相对集中。 “企业的或有环境负债”、“环保设施的折旧、摊销费用”、“环境机构及人员的常规费用、人员支出”、“ 环境审计”等项目,在实际披露中极少。第二,有少部分企业社会责任报告(可持续发展报告)和年报披露彼此完全独立,而社会责任报告中环境信息要集中丰富得多。如果仅从年报角度描述企业环境信息披露状况是不充分的。

2.1.2评分标准存在的问题

第一,定量描述内部的披露数量多少难于区分。一些企业在披露的相关项目中仅简单涉及定量信息,但无论这些披露项目详尽程度,其EDI评分必然高于定性披露。而另一些企业涉及的定量披露内容相对较多,但在现有评分标准下二者得分却完全相同。第二,定量指标的权重绝对高于定性指标未必合理。多数企业对于环境信息的披露目前仍以定性描述的形式呈现,且有些条目在形式上也只能够以定性的形式呈现。然而一旦缺乏定量描述,得分就会明显偏低,显失公允。第三,定量和定性内部之间的界限在某些情况下难以界定。例如,在定性描述中“一般描述”和“详细描述”的区分上就存在主观因素。又如在“企业受到环保部门及社会嘉奖情况”条目上,是按照获奖的个数作为定量评分,还是依据奖项的级别(地区、全国、世界)或类型(民间或官方)作为定性打分也存在争议。

因此,原有指标体系如果单单应用于个别的典型的重污染行业,如化工、采掘、造纸、印刷业等,时间跨度不长且披露内容充分的情况下,按原内容分析法的评分结果可能有效,且能够用于进一步实证分析[9,10]。而在国内自愿性环境信息披露普遍匮乏的情况下,若将这种评分方式直接用于长时期、全行业的样本,就难以形成整体的有效评分。

2.2基于文本挖掘方法改进当前环境信息披露指标体系

在长期手工评分实际操作过程中,发现评分者对于三级指标条目的认定大多还是基于个人在阅读中的判断,即在快速浏览中一旦发现关键字眼的出现,就认定该三级指标下存在内容,同时按照自认为的详细程度给予评分。然而,内容分析作为一种典型的信息分析方法,展示了客观、系统和定量等特点。但它也具有抽样过程的人为性、手工标引的低效率、人工作业的低信度问题。文本挖掘方法能够处理海量文献、处理非结构化数据,其研究品质远远高于手工信息分析方法[12]。

基于心理学的角度,很多情况下人们并不会仔细努力地加工信息,对信息的重复往往比信息的有效性更为有效。王静的阅读实验研究指出,信息出现的次数多少与信息接收者态度形成的强度大小呈正相关。阅读者态度的形成,是相关词语出现的频率越高,在该方面形成的态度越深刻[13]。由于一直以来我国企业自身环境披露的动力明显不足,内容上具有很高的同质性,导致纯粹从内容维度衡量企业环境信息披露水平的高低并不完全可行,可以考虑从数量维度着手加以完善。

据此,本文从Wiseman构建的初始指标体系出发,采用文本挖掘技术提取相应的关键字,作为对于三级指标是否出现的判定;以计算机统计关键词出现的次数直接作为权重。利用文本挖掘方法改进现有的评价指标体系,实质上是将目前手工打分改为计算机提取的一个量化过程:其中高频词提取过程本身已经与环境信息密切相关,而高频出现的次数一定程度上代表了披露者意向和对信息使用者的期望。改进后的指标体系兼顾了环境信息披露的质量与数量特征,与当前质与量相结合指标体系的基本思想一脉相承。只是通过文本挖掘对主观性赋值操作进行了修正与完善,将内容分析法的人工定性朝着计算机定量的方向迈出了一小步。

表2前10个高频词形成的共现矩阵

环境环保节能生产工作减排技术项目保护改造环境17913714713510480752530环保1851491231011251249292节能13216229015710182106生产101809764790工作1267965760减排96000技术710112项目077保护0改造3文本挖掘方法下的EDI 指标体系构建

3.1川渝上市企业环境信息的文本分析

目前国内的环境信息披露定量研究侧重重污染行业企业,考察时间短,很少有针对特定区域的研究。本文依托项目“川渝经济区上市企业环境信息披露实证研究”(SC09C034),在川渝经济区成立之初就探讨其环境治理问题,具有一定前瞻性。采用文本挖掘方法构建川渝地区上市企业EDI的具体步骤如下。

3.1.1环境信息的采集和提取

2005~2010年川渝地区有上市公司112家,将其年报和社会责任报告合并,共有披露的信息522份,其中与环境相关的内容253份。对这些样本进行筛选,提取与环境信息相关的内容。经过两轮复核整合在一个新的Access文档中,形成246条记录。

3.1.2形成环境信息的高频词

将上述文档导入ROST软件,对文档的内容进行分词和词频统计,形成相应的高频词。Access文档中的246条记录形成了173个高频词,出现频率从1020次到1次。出现频率最高的前41个高频词如表1所示。这些高频词从属于环境相关的披露原文内容,一定程度上体现了企业的环境信息披露的现状与重点。但从中也发现,一些词语与企业环境状况不存在直接关联。况且这些高频词都仅是单个词语,而体现词与词之间联系的特征词组能够更好地体现出企业环境信息披露要点,这需要对这些高频词加以进一步的共现分析。

表1出现频次最高的41个高频词

高频词出现次数出现频率高频词出现次数出现频率环境10200.0368提高2190.0079环保10000.0361治理2170.0078节能8420.0304能源2150.0078生产5200.0188设备2090.0076项目4800.0173积极2030.0073工作4720.0170循环1960.0071技术4710.0170废水1900.0069减排4610.0167实施1890.0068保护3880.0140降低1830.0066改造3190.0115社会1810.0065万元2900.0105经营1790.0065 产品2840.0103完成1780.0064 污染2730.0099体系1760.0064 建设2690.0097减少1690.0061 排放2460.0089工业1640.0059 资源2420.0088污水1630.0059 工程2410.0087加强1590.0057 生态2380.0086清洁1580.0057 处理2320.0084节约1510.0055 经济2270.0082经营1790.0065 资金2250.00813.1.3环境信息的共现分析

根据以上高频词结果,软件继续进行共现分析,形成了一个173×173共现矩阵。在此只选取了前10个高频词,如表2所示(排名靠后的词语两两之间共现次数较少,其共现关系能在后面的共现网络图中呈现。)

3.1.4环境信息的社会网络图

endprint

由于共现矩阵不易进行直观的描述和分析,借助ROST软件中的NetDraw工具绘制前41个高频词之间共现的社会网络关系图(173×173共现矩阵形成的社会网络关系图难以识别),实现了环境信息的可视化。 从图1可以发现,5个关键节点并不全是出现频率最高的前5个高频词,例如“减排”和“技术”,这就体现出了采用共现分析对直接分析高频词的一种完善和优化。这些词语作为连接其他词语的“桥梁”,在环境信息披露文本中起着至关重要的纽带作用。有些词语虽然出现的频次少,但他们却能反映企业环境信息披露的重要信息,如“可持续发展”反映出企业环境治理的最终目标,“加强”、“积极”披露出企业实施环境治理的态度等。因此,在通过文本挖掘得到词语重要性时,关注共现矩阵以及由此产生的社会网络关系图,可以挖掘出更加精确、更具有实际价值的信息,避免局限于文本中的高频词而导致结果不具备说服力。

3.2具体环境信息披露指标的生成

(1)基于心理学意义上对语言出现频率的解释,同时鉴于国内外文献中不少都是以纯数量指标(含单纯的单词数、句子数)刻画EDI的,首先将每个企业在2005~2010年每一年中相应的所有高频词出现的次数,等权重直接加总,记为EDI1。

(2) 采用特尔斐法,由环境领域相关专家剔除一些出现频率较高、但与环境信息披露关联意义较低的词这里选取的环境方面的专家是指长期参加过环境信息摘录,同时熟悉年报、社会责任报告披露环境信息内容的人员,一共选取9人。第四轮评分后收敛程度达到83%以上。 ,如“四川”、“万元”、“年度”等。将剔除后余下的环境信息披露特征词的次数直接加总,记为EDI2。

(3) 基于高频词进行共现分析这里直接用高频词进行共现,与用特尔斐法以后提炼的特征词进行共现的结果相比较,相似度极高。这是由于数据量不是足够大造成的,如果用全国的总体样本结果会有不同。 ,将共现次数较多的、在社会网络关系图中出现的41个词语提取出来,人为剔除了1个重复词语“降低”。然后对这些共现词组的词频进行加总,记为EDI3。

(4)如果两个词语之间共现次数只有一次,即认为他们之间的关联性不是很强,也不一定能够充分地反映企业的环境信息。对此剔除只共现一次的词语后直接加总,记为EDI4。

(5)同理,剔除共现一次和两次的词语,将剩下的词语依据出现频次直接打分,记为EDI5。

至此,对于同一企业在同一年份披露的环境信息,鉴于评价方法的不同得到五种不同的EDI评分。随着对高频词不断严格的处理,相应的EDI分值也越来越小,可以避免部分企业EDI分值虚高影响企业环境信息披露的真实性。同时,同一企业在不同年份披露的环境信息不尽相同,因而五种评分方式下各年的EDI分值也是有变化的。随机选取股票代码为000155的企业,其EDI汇总结果如表3所示。

表3股票代码为000155的企业2005~2010年

五种EDI得分情况

股票代码年份EDI1EDI2EDI3EDI4EDI50001552005年1601387356550001552006年1361176656490001552007年2902571541331110001552008年3853371751581410001552009年2962501361211050001552010年4013361751561374EDI指标的模型构建与有效性分析

对于环境指标本身,迄今为止尚未有一种能够进行客观评价和检验的有效方法。相关文献或是止于指标体系的构建,或是在形成指标之后随即进行各种实证分析。国外研究曾有将西方三十余年各种涉及环境信息指标的实证研究均纳入元分析框架内,通过回归分析得出了较为一致的结论[14]。进一步结合国内外研究中常规的影响因素与控制变量,对改进后的环境信息披露指标与各财务变量之间的关系进行回归分析。通过在相关理论和一致性的假设关系下,判定实证结果能否与国外多年综合结论保持一致,检验和支持本文构建的EDI指标的有效性。

4.1相关理论及变量选择

对于环境信息披露的研究中,利益相关者理论认为,股权集中度可以衡量股东对公司的约束力状况,股权较分散的公司一般在决策方面会采取积极的环保措施来吸引更多的投资者。同样Clarkson PM等认为市场投资者对公司股票估值中环境负债能力的评价主要依据公司环境一系列信息披露行为的评价,股权越分散,公司越有可能进行更大程度的环境信息披露[15]。

资产负债比可以用来表示公司的债务融资程度。Roberts R W认为公司债权人的权力取决于公司债务融资程度[16],而Cormier D等认为市场往往通过对公司环境责任的评估和债权人对公司的评价来衡量公司的环境绩效[5],同样Clarkson P M等实证分析表明公司债务融资程度越高,越有可能采取积极的环境决策[17]。

政府作为企业利益相关者的组成部分,主要通过其执法与立法机制来约束企业的相关行为,相应的企业也会采取环境责任保护的措施来降低政府规制对企业价值影响程度。若企业属于环境敏感性行业,必将受到更多的制度以及政策约束。Chan C、Kent P(2003)和Elijido-Ten E(2005)等实证分析显示环境敏感性行业的公司相比而言会披露更多的环境信息,降低与利益相关者之间的信息不对称性,减轻政府的规制程度对公司价值利润造成的风险[18,19]。另外,较大的公司较易受到公众的监督,因此大公司有较大的环境信息披露的倾向,同样大公司也相应具备进行环境保护的资源和能力。Cormier D等认为公司规模是决定环境信息披露的重要指标[17]。由此本文构建模型(1):

EDIit = β0 + β1SPi,t + β2CPi,t + β3GPi,t + β4TBQi,t + β5LnSizei,t +β6 (TBQ*CP)i,t +β7 (CP*LSize)i,t + εi,t(1)

模型中SPi,t 指前十位流通股股东的持股比例;CPi,t 指公司资产负债比;GPi,t 表示政府规制(权责),为虚拟变量:1为环境敏感性行业,0为环境非敏感性行业;TBQi,t 指市场价值或期末总资产;LnSizei,t为公司规模,是模型的控制变量。

4.2EDI3指标下的环境信息披露状况

将五种EDI均带入模型(1),由于篇幅所限只列出结果最为显著的EDI3的检验结果(原因分析见本部分最末)。通过表4的描述性统计结果表明,2005~2010年间川渝上市公司环境信息披露的企业数稳步上升,环境敏感性行业以及其他环境信息披露行业的EDI指标波动上升,说明川渝地区环境信息披露逐步规范加强,区域性环境绩

表4行业间环境信息披露状况(EDI3)

年度行业样本数企业披露数平均值标准差最小值最大值200520062007200820092010C711620.820.2177D863.53.779其他2500000C71143033.54137D861.22.416其他25233.115C712925.7321139D862.33.01137其他25554.2115C713258.3100.72419D8657.644.9895EF8215.515.53131其他1773.96.8115C713751.158.51271D8654.144.14100EF8420.130.41678其他17935.15115C715146.4591327D8751.851.73123EF8738.850.83115其他1708.520.9286注:C指代制造业;D电力、煤气以及水的生产和供应业;EF建筑业与交通运输业;其他(含采掘业、房地产业、农林牧副渔以及社会服务业等)效水平逐步优化。其中在2008年EDI指标达到阶段时间内最高值,这与该年规范性政策的出台是紧密相关和一致的2008年环保部和证监会分别出台了《上市公司环境保护监督管理工作的指导意见》(环发[2008]24号)和《重污染行业生产经营公司IPO申请申报文件的通知》(发行监管函[2008]6号),正式启动了“上市环保核查”制度,上交所也制定了《环境信息披露指引》。 。

endprint

4.3EDI模型的检验

本文面板数据集的截面纬度大于时间纬度,而GMM估计法对总体分布不做具体限定,只需要确定某些特征作为矩条件,估计值具有很好的大样本性质。虽然工具变量能够识别模型估计的内生性,修正估计的偏误,但依赖于变量的选取,会影响模型估计的稳健性;同时若变量包含滞后因变量,会进一步加强这种内生性。对此采用GMM估计法予以解决和完善,其中在动态面板数据模型中加入水平工具变量以及GMM型工具变量。

考虑到企业经济绩效对环境披露的影响和传导效应具有一定的滞后性,对模型自变量进行相应滞后处理。回归检验结果如表5所示。可以看出,模型不拒绝Sargan检验,同时也能通过Wald检验。各变量当期以及滞后期对环境信息披露指标的影响大都是显著的,与诸多文献的结论保持一致。表5EDI3的动态面板数据模型GMM估计检验结果

系数标准差T统计量PTBQ-6.1893.642-1.700.090TBQ(-1)1.9351.0501.840.066TBQ(-2)-1.9791.330-1.490.138GP13.8966.9691.990.047CP10.12542.71.950.053CP(-1)3.24510.770.3010.763CP(-2)-0.6597.500-0.08780.930SP3.088526.621.210.229SP(-1)-7.92535.50-2.000.047SP(-2)14.93456.202.630.009LnSize48.23723.862.020.044LnSize(-1)-25.46622.75-1.120.264LnSize(-2)20.63813.001.590.113TBQ*CP0.02940.02660.1110.912CP*LnSize-53.61426.70-2.010.045Constant-9.514360.8-2.500.013样本观察数 522模型使用具备鲁棒性的标准差水平工具变量DummiesGmm(TBQ,2,30)Gmm(CP,2,30)Gmm(GP,2,30) Gmm(SP,2,30)Wald (joint):Chi^2(15) = 54.27 [0.000] ** Wald (dummy): Chi^2(1) = 6.244 [0.012]*Sargan test: Chi^2(19) =12.98 [0.840]AR(1) test:N(0,1) = 3.250 [0.001] ** AR(2) test:N(0,1) =2.230 [0.126] 注: GMM工具变量中的第二滞后阶数30是指最多可以使用的滞后项;**表示在1%水平上拒绝原假设,*表示在5%水平上拒绝原假设

其中政府规制变量对EDI的影响系数较大为13.9,说明环保性政策的出台对企业的环境信息披露的影响很大,特别是受政策约束较大的环境敏感性行业;公司资产负债程度与EDI之间存在正相关关系,说明川渝地区融资环境以及公司债务融资程度对环境绩效影响极大,债务融资程度越高,公司越倾向于环保信息的披露;股权集中度与环境绩效存在正相关关系,与以往研究结论不一致,一定程度上说明我国股权集中度的提高可以通过少数大股东的压力,对公司环境信息披露程度产生正向效应;两交叉项对EDI影响中,股权集中度与公司规模二者共同作用于环境绩效的影响较为显著,但与EDI存在负相关关系;TBQ对EDI的影响具有一定程度上的不稳定性,公司规模较大会相应提升其环境绩效水平。

4.4指标的替换及分析

首先,分别采用ROA、ROE、ROTA替代TBQ作为财务绩效指标,对EDI与财务绩效关系进行回归分析,得出的各变量的显著性与前文类似。其次,在剔除2010年新上市的公司、ST、PT公司和金融保险企业后,回归所得的结果与前文也较一致。最后,2008年规范性政策出台作为模型的虚拟变量以及用所有均值进行检验,也基本支持原有模型的回归结果。上述面板分析及指标替换结果与Eva Horvathova、 MAli Fekrat等诸多研究结论基本一致[14,20]。

另外,对于五种EDI指标均进行了上述面板分析及其指标替换的检验,五种指标的结果也均保持一致,其中EDI3、EDI4 的实证结果更为显著,且二者差异性较小。就此回溯到五种EDI的生成方式,他们各具自身依据和特点。EDI1直接将高频词作为EDI的三级指标,出现次数作为权重,其优点在于方法简单,没有经过任何人工干预,缺点则在于高频词并非全部都与企业环境信息披露密切相关。EDI2采用特征词替代高频词,克服了EDI1的缺点,但提取特征词所采用的特尔斐法自身的局限也正是该指标的缺陷。特征词虽然能够确保主题与环境信息相关,但在实际披露文本中会出现几个特征词共同反映某个方面环境信息的状况,而共现步骤本身也能够剔除部分与主题无关的内容,共同展示同一语义的内容,因此用共现结果形成的EDI3应当更加具有代表性。EDI4对共现次数进行一次剔除,对共现结果进行了约束。EDI5剔除了两次共现的情况,进一步强化了对于共现结果的约束,但是否会导致在局部样本的过度剔除。那么这五种指标体系适用性到底如何,依据文本挖掘形成EDI的过程及其实证检验结果,初步认为EDI3、EDI4 应当具有更好的应用前景。当然最终结论还有待在全国总体样本中进一步检验。

5研究结论、启示与展望

目前,国内环境信息指标体系某种程度上是直接借鉴国外研究发展阶段上的最终成果。然而我国当前的环境信息,无论在披露的形式、内容、途径还是发展进程上都不完全相同,直接照搬国外既有成果,难免出现使用范围和效果上的局限。本文借鉴管理信息学科的文本挖掘技术,依靠计算机量化改进和延伸了目前EDI指标中“质与量相结合”的评分方式,构建以披露环境相关词、特征词词汇及其对应出现频率数量为评估依据的新环境信息披露指标体系,最终形成五种EDI指标。由于缺乏对EDI指标有效的评价方法,而国外元分析的综合研究结论认为,迄今三十余年与环境指标相关的实证研究具有相对一致的结论。对此本文将新生成的EDI指标结合国内外文献中常用的影响因素,通过面板回归得出了与既有文献较为一致的结论。在分析五种EDI形成方式和各自优缺点的基础上,认为第三和第四种EDI指标具备较好的应用前景。

本文的创新点在于针对当前质与量相结合的指标体系,沿袭内容分析法基本思路,运用文本挖掘方法提取三级指标下的关键词,并用这些词汇出现的次数作为权重,迈出了从人工定性到计算机定量改进的一小步。局限性则在于:目前生成的指标体系只是更多反映川渝经济区上市企业的环境披露状况,而整个上市企业环境信息披露指标的构建,还有待下一步依靠全国总样本进一步检验以及优化。基于全国上市企业披露的环境信息生成的特征词表以及重构的EDI指标体系,再进行样本的量化分析,对不同省市、不同经济发达地区、不同行业、不同板块各个时段的环境信息披露状况进行比较,以期得出更有普适性的研究结论。

参考文献:

[1]David Campell. A Longitudinal and Cross-Sectional Analysis of Environmental Disclosure in UK Companies a Research Note [J]. The British Accounting Review, 2003, 36: 107-117.

endprint

[2]孙贵丽,葛察忠,海热提. 从年报分析企业环境信息披露现状[J]. 环境保护,2010(11):34-37.

[3]唐久芳,李鹏飞. 环境信息披露的实证研究——来自中国证券市场化工行业的经验数据[J]. 中国人口、资源与环境, 2008(5): 112-117.

[4]Wiseman, Joanne. An Evaluation of Environmental Disclosures Made in Corporate Annual Reports [J]. Accounting, Organizations and Society, 1982,7(1): 53-63.

[5]Cormier D, MMagnan. Corporate Environmental Disclosure Strategies: Determinants, Costs and Benefits[J]. Journal of Accounting, Auditing and Finance, 1999,14(4): 429- 452.

[6]PattenDM . Intraindustry Environment at Disclosures in Response to the Alaskan Oil Spill: Anode on Legitimacy Theory [J].Accounting, Organizations and Society, 1992,17: 471-475.

[7]MAli Fekrat,Carla lnclan,David Petroni. Corporate Disclosures: Competitive Disclosure Hypothesis Using 1991 Annual Report Data [J]. The International Journal of Accounting, 1996, 31:175- 195.

[8]HaskinsME, Ferris KR, Selling TI. International Financial Reporting and Analysis:A Contextual Emphasis ( 2nd. ) [C]. Boston Irwin McGraw Hill, 2000.

[9]肖华,张国清. 公共眼里与公司环保信息披露——基于"松花江事件"的经验研究[J]. 会计研究,2008(5): 15-22.

[10]王建明. 环保信息披露、行业差距和外部制度压力相关性研究[J]. 会计研究, 2008(6): 54-62.

[11]李婉丽,张婧. 西部地区上市公司环境信息披露实证研究[J]. 青海社会科学,2008(4):50-55.

[12]范并思.社会科学信息分析中的文本挖掘[J].图书情报工作, 2012(8):7-10.

[13]王静. 信息合理化水平、数量、结构一致性对态度确定性的影响[C]. 河北师范大学硕士论文, 2010.

[14]Eva Horváthová. Does Environmental Performance Affect Financial Performance? A Meta-analysis [J]. Ecological Economics,2010(9): 52-59.

[15]ClarksonP, LiY, RichardsonG D. The Market Valuation of Environmental Capital Expenditures by Pulp and Paper Companies [J].The Accounting Review , 2004,79 (2): 329-354.

[16]CormierD,MMagnan,BVVelthoven. Enviromental Disclosure Quality in Large German Companies: Economic Incentives, Public Pressures or Institutional Conditions? [J]. European Accounting Research, 2005,14(1): 3-39.

[17]Roberts R W. Determinants of Corporate Social Responsibility Disclosure: An Application of Stakeholder Theory [J]. Account Org Soc,1992,6:595-12.

[18]Chan C, Kent P. Application of Stakeholder Theory to the Quantity and Quality of Australian Voluntary Corporate Environmental Disclosures[A]. Paper Presented to the Accounting and Finance Association of Australia and New Zealand (AFAANZ) [C]. Brisbane, 2003,7.

[19]Elijido Ten E. Determinants of Environmental Disclosure in a Developing Country: An Application of Stakeholder Theory [A]. Paper Presented to the Asia Pacific Interdisciplinary Research in Accounting[C]. Singapore, 2004,7.

[20]MAli Fekrat,Carla lnclan, David Petroni. Corporate Disclosures:Competitive Disclosure Hypothesis Using 1991 Annual Report Data [J]. The International Journal of Accounting, 1996,31: 175-195.

(责任编辑:王惠萍)

endprint

猜你喜欢
环境信息披露文本挖掘财务绩效
数据挖掘技术在电站设备故障分析中的应用
环境信息披露意识、环境绩效和环境信息披露行为
我国企业环境信息披露研究述评与展望
基于LDA模型的95598热点业务工单挖掘分析
上市公司债务融资期限结构与财务绩效关系的研究
从《远程教育》35年载文看远程教育研究趋势
苏宁云商轻资产盈利模式及其财务绩效研究
企业社会责任与财务绩效研究
慧眼识璞玉,妙手炼浑金
环境会计视角下中石油与荷兰壳牌石油可持续发展报告对比分析