基于企业年报的产业竞争情报分析方法研究

2021-08-06 20:52周磊方芳
现代情报 2021年8期
关键词:文本挖掘社会网络分析集成电路

周磊 方芳

摘 要:[目的/意义]上市公司年报是对企业财务绩效、战略动向的权威披露,可用于对产业竞争主体的经营管理行为进行监测。[方法/过程]融合数据挖掘、文本挖掘、社会网络分析等多技术,建立面向企业年报信息组织特征的产业竞争情报分析方法体系。以集成电路产业为例,通过分析创业板上市企业的年报信息来挖掘产业内业务合作与社会资源关联的潜在路径,从而为增强产业竞争合力提供情报支撑。[结果/结论]基于文本挖掘方法,发现集成电路上市公司可在制造、应用两个环节加强业务合作。同时,集成电路上市公司可借助机构股东的社会网络建立区别于业务合作关系的资源网络。最后,提出集成电路产业未来发展的对策建议。

关键词:上市公司年报;产业竞争情报;数据挖掘;文本挖掘;社会网络分析;集成电路

DOI:10.3969/j.issn.1008-0821.2021.08.013

〔中圖分类号〕G250.25 〔文献标识码〕A 〔文章编号〕1008-0821(2021)08-0129-07

Research on Industry Competitive Intelligence Analysis

Methodology By Company Annual Report

——A Case of Integrated Circuit Industry

Zhou Lei1 Fang Fang2

(1.Accounting College,Wuhan Textile University,Wuhan 430200,China;

2.School of Information Management,Wuhan University,Wuhan 430079,China)

Abstract:[Purpose/Significance]The annual report of listed companies is the authoritative disclosure of financial performance and strategic trends of enterprises,which provides a channel to monitor the operation and management behavior of industrial competitors.[Method/Process]Considering for information organization characteristics of company annual report,an industrial competitive intelligence analysis methodology system was established by integrating data mining,text mining,and social network analysis.An empirical study focused at integrated circuit(IC)industry was conducted in to explore the potential path of business cooperation and social network by analyzing company annual report from Chinas GEM,so as to provide intelligence support for enhancing the industrial competitiveness.[Result/Conclusion]It is found that IC listed companies can strengthen business cooperation in manufacturing and application by text mining.Depending on the social network of institutional shareholders,IC listed companies can establish a resource network which is different from business cooperation.Finally,suggestions for IC industry development are put forward.

Key words:listed company annual report;industry competitive intelligence;data mining;text mining;social network analysis;integrated circuit

区域竞争国际化、国际竞争本土化、竞争主体多元化的竞争格局使得商业竞争主体由单一企业层级向产业整体层次迁移,竞争思维由“零和博弈”向“竞合博弈”升级。这也使得产业竞争情报独立成为竞争情报的重要分支和新兴主题。2009年,郑彦宁等率先提出产业竞争情报概念,即以提升一个国家或地区某特定产业整体竞争优势为目的,关于产业竞争环境的动态性、应对性情报[1]。后续研究不断丰富产业竞争情报研究对象,将其由竞争环境监测扩展为综合性研究与实践。战略性新兴产业调查表明,产业竞争情报应提供本产业国内外发展状况、产业链构成、核心企业、关键技术、产业未来发展动向等综合信息[2]。创新密集型产业竞争情报应覆盖政策、市场、技术、舆论等多维度[3]。源于产业生态系统的竞争情报应包括竞争环境、竞争主体、产业链共生关系、产业链竞争关系4方面内容[4]。为了提升产业竞争情报服务的自动化和智能化,新兴研究还设计了产业竞争情报系统的概念框架,即综合应用专家预测、舆情监测、产业追踪路线图、灰色系统预测、神经网络预测等多种模型和工具,提供产业链分析、产业SWOT分析两大功能[5]。

综合来看,国内产业竞争情报研究已取得丰富成果,但分析对象以论文、专利等情报学传统数据源为主,研究功能多限于产业科技创新服务。虽有研究预见性地提出产业竞争情报服务应覆盖经济评价、融资模式、产业金融市场信息等功能[2,5],但并未展开定量化研究。然而,产业运行需要技术创新、资金运营等多要素的协同;产业创新链的绩效评价要综合考虑知识发现、技术发明、商品化等多环节。因而,产业竞争情报研究应在传统研究视域之外,加大对核心企业群经营性行为的监测与分析。

1 金融情报学初探性研究综述

2007年美国“次贷”危机全面爆发后,金融情报开始进入国内情报学研究视野。2013年,中国科学技术信息研究所率先提出了基于上市公司年报的产业竞争情报分析方法[6],开启了国内金融情报学的定量研究。该团队在2019年对我国上市公司年报信息质量进行了综合评价[7],建立了基于年报风险信息的企业风险条目抽取方法[8],并以美国上市企业年报产品为标杆,提出了我国上市企业年报信息组织的优化策略[9]。武汉大学马费成团队基于多重关联关系,建立了金融风险防范的知识关联模型及原型系统[10],提升了金融知识可视化程度[11]。唐晓波等综合财务指标、审计意见、管理层讨论与分析(MD&A)的情感极性提升企业破产预测系统准确率[12]。徐璐等利用多种机器学习模型对金融科技专利进行分类,发现随机森林在测试集上的表现明显优于其他方法[13]。国外研究亦将企业经营数据纳入以专利数据为主的技术创新研究框架,评估新兴产业发展潜力和商业化价值[14-15]。2020年,丁晓蔚等正式提出“金融情报学”概念,呼吁利用情报学的先进分析技术手段解决金融学领域的复杂研究问题[16],这也标志着金融情报学正式成为情报学的重要分支。

综上所述,上市公司信息披露机制产生了大量宝贵的金融信息,是分析企业经营管理行为、绩效与动向的理想数据源。情报学界从学科发展角度认可了金融情报学这一重要的交叉研究分支,但多集中于概念性、规范性研究,尚未形成集中化、系统化研究。因而,本文将针对企业年报的信息组织特征,综合数据挖掘、文本挖掘、社会网络分析等多种情报学分析技术,建立产业竞争情报分析方法体系,为相关研究的系统化发展提供分析框架。

2 基于企业年报的产业竞争情报分析框架

2.1 企业年报的组织结构特征分析

根据中国证券监督管理委员会的相关规定,我国上市企业年度报告共分12节。根据信息组织特征,可将企业年报内容分为两大类:财务信息、非财务信息。财务信息主要指基础财务数据和各类财务报表,是对企业经营情况的直接反映,也是财经类研究的核心分析对象;非财务信息指财务数据以外的其他内容。就篇幅而言,非财务信息占据企业年报的主体;就信息组织和处理方式而言,非财务信息属于非结构化数据,超出了经典统计学方法的适用范畴。综合来看,上市公司年报的组织结构特点如表1所示。

2.2 企业年报财务信息的数据挖掘方法

财经类研究围绕财务信息,建立了企業偿债能力、营运能力、盈利能力等经典财务指标分析体系;此后又提出了杜邦财务分析体系、Z-score指标、经济增加值(Economic Value Added,EVA)等综合研究框架。然而,经典财务指标体系间壁垒分明,常被作为并列的研究对象;综合研究框架存在行业限制、权重设置、功能单一等局限。因而,建议引入数据挖掘技术进一步发掘财务数据的潜藏信息,为评价产业整体经营绩效提供基础信息。

一是利用熵权法、熵权Topsis法为财务指标进行客观赋权,建立面向业绩评价的多指标融合性分析方法。首先,引入熵权法进行企业业绩纵向评价,即根据历年(季度)财务数据分布均衡性,确定各属性权重并计算企业综合财务价值评估。接下来,引入熵权Topsis法在熵权基础上计算各企业与最优解的距离,从财务绩效视角确定行业中的核心企业排序。

二是利用粗糙集、神经网络、支持向量机、决策树等模型处理计量经济学模型视域外的非线性关系,从而揭示产业运行中的复杂经济规律。以上市公司财务风险预测为例,其实质是监督式学习中的二分类问题。粗糙集既可以作为独立的分类器;也可以辅助神经网络建模,如减少神经元输入数量、探索预设规则、解释神经网络建模结果。支持向量机、决策树的分类效果优于许多机器学习算法,决策树的可视化展示还能够揭示财务风险预测机理。

2.3 企业年报非财务信息的文本挖掘方法

财会领域新兴研究尝试对非财务信息进行分析,但多出于企业战略风险管控目的,研究的自动化程度有限;同时,文本分析结果多作为回归模型的前置变量之一,未在文本间建立深层联系。针对这一局限,建议引入文本挖掘技术对非财务信息进行语义挖掘,为产业经营风险预警、合作机会发现等功能提供技术支撑。

产业经营风险预警可以年报第四节中的“风险分析”板块为数据源,根据文本的语义关联性,建立多层次的综合分析机制。底层为风险条目层,重点在于分词词典的建立、自更新、同义词和异形词的标准化;中层为风险语义图谱层,可利用RDF框架进行数据关联并指导领域本体建设;顶层为风险聚类层,即在语义关联的基础上增强LDA建模、SAO结构分析、社区识别等方法的分类精准度。产业合作可以年报中第三节、第四节的“公司未来发展的展望”模块为数据源,利用文本挖掘技术识别产业链上的各企业间的业务合作领域。具体包括3个步骤:首先,建立行业产品/业务词表,并建立企业特征向量;接下来,根据企业特征向量的相似性,发现企业间的横向合作机会;最后,借助关键企业的中介作用,发现企业间的纵向合作机会。

2.4 企业年报非财务信息的社会网络分析方法

非财务信息中还有一类介于财务数据、文本信息之间的实体,它们以文本形式存储于预定义属性中,是挖掘产业内广泛关联性的纽带。这类非财务信息集中于企业年报第二节、第六至八节,如“主营业务分析”模块、上市保荐机构、主要销售客户、供应商、股东、董监高人员等。财会类研究对这类实体的分析多限于高管教育背景或任职经历分析,且仅作为企业价值、财务绩效建模的前置变量之一。

进一步分析发现,这类实体构成了企业的核心利益相关人,代表着丰富的、异质性的社会资源。建议引入社会网络分析法剖析这类非财务信息,以揭示产业内的复杂资源网络。首先,应丰富社会资源的内涵,将保荐机构、主要客户、供应商、股东、董监高成员均纳入分析对象。其次,要完善社会网络分析指标和方法。一是财会领域多以0~1变量表征社会网络连接强度,建议采用余弦系数、Jaccard系数来全面展示社会关系的多元程度。二是财会领域仅采用中心性指标,建议增加矩阵可达性、凝聚子群、社区结构等指标充分挖掘社会网络结构特征。最后,根据研究背景或目的,借助企业间的社会资源纽带发掘潜在的合作发展机会。

最后,对上文提出的3类产业竞争情报分析方法进行对比,如表2所示。

3 实证研究:以创业板集成电路领域为例

集成电路(Integrated Circuit,IC)是信息通讯领域高端制造业高地,也是美国对华技术遏制的重点领域。2018年起,美国商务部将中国电子科技集团、烽火科技集团、华为、中兴、福建晋华等国内领军企业纳入实体清单的限制范围。

成长型企业是产业发展的后备军,蕴藏着巨大的合作潜力。本文以创业板上市归属于计算机、通信和其他电子设备制造业(《上市公司行业分类指引》(2012年修订)代码:C39)的企业为初步对象;从中筛选出68家拥有集成电路业务的企业,下载企业上市以来公布的历年年报。统计后发现,除300514曾为300139(2013年)第5大客户外,上述68家上市公司间无直接持股、供应链合作关系,也未合作申请专利。下文将利用文本挖掘、社会网络分析法对上述企业年报中的非财务信息进行分析,分别从业务合作、社会资源聚合两个角度为产业内合作提供参考建议。

3.1 基于文本挖掘的产业链合作机会发现

从企业年报第三节中抽取集成电路行业的产品概念,将其标准化为包含39个概念的产品词表,并进一步映射为原材料、制造、应用、封装4个环节。基于产品词表,建立企业产品特征向量Pi,通过共有产品比重来衡量企业间合作机会Sij,计算公式如下所示:

式(1)中PTj为企业j产品特征向量的转置;Pi为企业i的产品类型。计算各企业间的合作机会Sij,转换为对称矩阵后利用NetDraw生成合作机会图谱,如图1所示。节点大小由节点中介中心度决定,紫色、蓝色、绿色分别表示企业产品集中于原材料环节、制造环节、应用环节;黄色、红色分别表示企业产品分布于制造和应用环节、制造和封装环节;粉色节点(300053)的产品贯穿制造、应用和封装环节。

界型企业的中介作用,形成横贯制造、应用、封装3个环节的协同合作机遇。因而,可以将集成电路产业链的特征总结为两点:一是上游布局存在短板,投入与活力不足;二是产业链合作机会集中于制造、应用环节,企业制造群内部可继续分组,应用群合作力量集中。

3.2 基于机构股东的产业社会资源网络分析

证券市场中的机构投资者主要是指养老基金、保险基金、证券公司、各类投资基金等[17]。具有国资背景的机构股东因其注册資本金充足、具有良好的银企关系、容易享受到各类政策红利,在中国证券市场占据举足轻重的地位。下文将以机构股东为桥梁,在无直接投资关系的企业间搭建合作通道。

从企业年报第六节中下载企业十大股东信息,从中筛选出机构股东。接下来,在百度企业信用中查找并下载机构股东的股权穿透图,确保实际控制人追踪至各级地方政府、财政厅(局)、国资委。建立由68家上市企业、569家机构股东、银行、其他机构和政府等共同构成的关系网络。该网络为一个包括4类主体、2类关系的异构网络。底层是机构股东对上市公司的持股关系,这是上市企业建立紧密联系的关键;中层是银行与机构股东的业务托管关系,为上市公司拓展外部资源提供了便捷渠道;顶层是实际控制人对银行及其他各类投资者的持股关系。受篇幅限制,下文仅展示底层网络,如图2所示。

图2是机构股东与上市公司间的二模网络,蓝色节点为机构股东,红色为上市公司,节点规模由其度数中心性决定。较大的蓝色节点分别为全国社会保障基金理事会、中央汇金资产管理有限责任公司、易方达基金管理有限公司、国泰基金管理有限公司、南方基金管理有限公司,说明其直接持有多家集成电路创业板公司的股份。较大的红色节点有300373、300176、300046、200115、300327,说明这些企业更受机构股东青睐,可以通过银行对机构股东的托管关系、政府机构对银行的持股关系获得更广泛的社会关系。

进一步将该多主体网络转为无向图,生成上市企业间的可达矩阵。统计发现,删除孤立点后可达矩阵节点间的平均距离K为3.67。考虑到当节点间距离过大时,机构股东难以对上市公司产生实质性影响,特将节点距离K的最大阈值设为3,即节点间距离为2或3时,认为二者间可以借助机构股东的社会网络形成合作渠道,由此生成的上市公司潜在合作关系如图3所示。

能力强弱。红色、蓝色、橙色节点分别表示度数中心性大于20、10、0。关系强度=1k,K=2时,用黑线连接,表明存在某机构股东同时持股两企业,如全国社会保障基金理事会(2019年)是300046和300115的十大股东;K=3时,用灰线连接,表明企业i、j的机构股东间存在直接的持股关系,如2019年300134的机构股东广东粤财信托有限公司持有300136的机构股东易方达基金管理有限公司22.65%的股权。图3中,度数中心度最高的节点是300115,它可以凭借机构股东网络与29家上市企业建立联系。同时,该节点还是图1中的结构洞,连接着制造群和应用群。

为了探寻业务合作与社会资源聚合间的关系,进一步对比图1和图3发现,图3中高度数中心度的节点300346、300327、300735、300394在图1中均为单业务节点;节点300322、300373拥有制造、封装业务,但中介性偏低;300389无业务合作关系。由此可见,上市公司业务合作机会与社会资源网络间无严格对应关系。因而,综合文本挖掘、社会网络分析两种方法,能够为探索产业内合作路径提供异质性的答案。

4 结束语

国内产业竞争情报研究以论文、专利等情报学传统数据源为分析对象,围绕产业科技创新这一主题取得了丰硕成果;但对产业金融市场、核心竞争主体经营管理行为的关注有限。针对这一问题,本文以上市企业作为产业内的核心竞争主体,融合数据挖掘、文本挖掘、社会网络分析多种智能分析技术,建立基于企业年报的产业竞争情报分析方法体系。基于该分析框架,对创业板上市的集成电路领域企业展开实证研究。利用文本挖掘技术分析企业业务关联性,发现产业内的业务合作集中于制造、应用两个环节;利用上市公司机构股东的社会网络,可以在企业间建立区别于业务关联的合作渠道。

同时,本研究对我国集成电路领域产业的发展壮大亦有3点建议。一是就产业链布局而言,亟待补齐明显短板。研究发现创业板从事上游原材料供应的企业仅6家,难以突破制约我国半导体行业发展的高端原材料困局。针对这一卡脖子问题,一方面要引导企业加强对行业短板和关键核心技术的科技攻关;另一方面,继续推动国家“安可工程”,加强对国产化原材料的采购支持。二是就产业内的业务关联性而言,仍需提升产业链上下游配套生产能力。研究发现创业板上市的集成电路企业的业务合作机会以制造环节为主、行业应用环节为辅。目前,需要积极促成企业间实质性的合作开发,以降低经济成本和不确定性,提升技术迭代速度和市场占有率。三是就产业内社会资源聚合而言,应充分发挥机构股东的纽带作用。研究发现,机构股东社会网络是对业务关联性的有效补充,能够在企业间建立异质性的合作机遇。未来,应通过挖掘社会资源在企业间搭建更广泛的合作通道,增强产业内资金流转效率。

参考文献

[1]郑彦宁,赵筱媛,陈峰.产业竞争情报的解析[J].情报学报,2009,28(6):917-922.

[2]陈峰.战略性新兴产业竞争情报需求问题及其求解[J].图书情报工作,2011,55(14):5-9,58.

[3]侯元元,乔婧,黄裕荣,等.基于产业创新环境视角的产业竞争情报研究及实践[J].情报杂志,2016,35(7):126-131.

[4]鞠英杰,游雪雯.基于生态系统理论的产业竞争情报分析研究[J].情报杂志,2018,37(1):22-27.

[5]王晓慧,董雪季,郭琪.产业竞争情报系统构建研究[J].图书馆学研究,2018,37(9):2-6.

[6]刘志辉,赵筱媛.上市公司年报在产业竞争情报分析中的应用研究[J].图书情报工作,2013,57(3):65-68,119.

[7]崔笛,郑明,李岩,等.基于分类体系的上市公司年报信息披露质量研究——以我国A股上市公司为例[J].情报学报,2019,38(12):1250-1259.

[8]梁娜,姚长青,王峥.基于三重维度的企业风险信息抽取方法研究[J].情报学报,2019,38(12):1241-1249.

[9]浦墨,高影繁,苏娜,等.上市企业年报产品信息组织分析[J].情报学报,2019,38(12):1260-1267.

[10]唐旭丽,马费成,傅维刚,等.知识关联视角下的金融知识表示及风险识别[J].情报学报,2019,38(3):286-298.

[11]张瑞,唐旭丽,王定峰,等.基于知识关联的金融数据可视化分析[J].情报理论与实践,2018,41(10):135-140.

[12]唐晓波,谭明亮,李诗轩,等.企业破产预测系统模型构建及实现研究[J].情报学报,2019,38(10):1051-1065.

[13]徐璐,卢小宾,杨冠灿.金融科技专利识别与分类方法构建及应用[J].图书情报工作,2020,64 (11):89-97.

[14]Papazoglou M E,Spanos Y E.Bridging Distant Technological Domains:A Longitudinal Study of the Determinants of Breadth of Innovation Diffusion[J].Research Policy,2018,47(9):1713-1728.

[15]Wagner S,Wakeman S.What Do Patent-based Measures Tell us About Product Commercialization?Evidence from the Pharmaceutical Industry[J].Research Policy,2016,45(5):1091-1102.

[16]丁曉蔚,苏新宁.金融情报学:情报学的重要分支学科[J].情报学报,2020,39(2):158-170.

[17]邵颖红,陈爱军.机构股东积极主义发展中存在的主要争论[J].同济大学学报:社科科学版,2004,15(1):36-41.

(责任编辑:陈 媛)

猜你喜欢
文本挖掘社会网络分析集成电路
首个原子级量子集成电路诞生
人工智能与集成电路的关系探讨
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
新浪微博娱乐明星的社会网络分析
基于社会网络分析的我国微课研究探析
慧眼识璞玉,妙手炼浑金
基于CMOS集成电路闩锁效应理论的实践
超大规模集成电路用硅片产业化