业财融合领域多粒度知识热点分析

2020-03-30 13:22李承犁严承希徐思昊
财会月刊·上半月 2020年3期
关键词:财务转型财务共享业财融合

李承犁 严承希 徐思昊

【摘要】通过对CNKI 2012 ~ 2019年引文数据集的发表年、关键词和机构等元数据进行文本处理与分析,结合内容分析法、共词分析法及主题聚类建模等量化分析手段,从宏观与微观两个层面对我国业财融合策略在不同经济行业和领域机构所呈现的热点方向和主题分布特征进行深入挖掘和分析。研究发现:业财融合在不同领域行业的侧重点以及理论与实务研究方面既有一定的联系,也存在一定的差异。

【关键词】业财融合;财务管理;管理会计;财务共享;财务转型

【中图分类号】F275      【文献标识码】A      【文章编号】1004-0994(2020)05-0144-6

一、引言

随着企业管理要求的不断提升,会计职能已经由财务会计向管理会计转型。财务工作不再是对业务的事后监督和核算,而应具有前瞻性地参与全业务流程并计算业务活动的绩效,再将重要的信息反馈给具体业务部门,从而为业务活动提供决策支持。随着“互联网+”、大数据、云计算、人工智能等信息技术的不断演进,其在会计核算及财务管理中的应用越来越深入,这为业财融合带来了技术基础。

业财融合能为企业管理带来新的动力,但是要想把纷繁的业务数据、流程与标准化的财务会计融合在一起,需要研究和解决诸多难题。近年来,我国在业财融合领域的研究日益增多,相应的研究成果也不断涌现。本文旨在通过对我国业财融合领域的研究现状进行深入分析,从知识热点的角度,以可视化图谱为技术基础,分析展示我国业财融合领域的研究方向、特点和主要成果,为进一步开拓业财融合研究与应用的知识范围提供参考。

二、研究方法

(一)关键词共词分析

共词分析法是一种将文献中关键词之间的共现概率转化为相似矩阵或者网络,以支持更深度的社会网络分析或聚类分析的量化方法。Callon等[1] 认为,共词分析可以用于描述创新知识点在不同阶段之间的交互作用,以及辨别一项基础或应用研究是否是该领域发展的根本动力。本文将使用基于“业财融合”文献集的关键词共词网络进行相关主题知识领域分析。

除了术语的标准性问题,越来越多的研究发现共词分析的关键步骤是构建合理大小的高频词共现矩阵[2,3] ,如何对文献集合中的高频与低频词汇进行科学切分成为当前运用共词分析法的难点问题。常见的方法主要有经验值法[4] 、基于齐普夫第二定律的Donohue切分法[5] 以及基于H指数或G指数的高频词切分法[6,7] 等。本文结合定量阈值切分与专家定性判别的方法,综合确定最后的高频词切分界限。本文主要比较了三种常见的关键词切分方法,即Donohue切分法、H指数切分法和G指数切分法,这里分别简记为DhI、HI和GI。假设按照词频统计由大到小进行排序,排名第i的关键词词频为Freqi,I1为文献集合出现次数为1的关键词数量,则这三类关键词切分阈值k可以表示如下:

(二)内容分析法

美国著名社会学家Bernard[8] 认为,内容分析法是一种用于描述交流中具有明确特征的传播内容且具有一定客观性、系统性和定量性特点的研究方法。从本质上而言,该分析方法是通过对文献内容“量”的分析来找出反映文献“质”的更深刻、更精确的认识[9] 。因此,内容分析法应该是从属于定性与定量相结合的一种分析手段,其步骤一般包括抽样、编码和量化分析等,常常被用于基于文献资源的循证类研究[10] 。

为了展现业财融合在我国不同领域与行业中主题分布的特征,本文基于内容分析法对相关文献资源涉及的组织机构的领域类型与经济行业分类分別进行编码,并结合主题聚类分析、信息计量分析的结果进行综合比较。

本文对组织机构的划分采用两层分级,其中:第一层级包括政企行业和教研机构两种类型;第二层则将其进一步分为五类子领域,包括企业、高校与教育机构、医院与医疗机构、研究类院所,以及政府和军队机构。对于相关经济行业的分类方式,本文使用2017年国民经济行业分类标准(Industrial Classification for National Economic Activities,ICNEA)作为行业分类的基准参照。ICNEA是由国家质量监督检验检疫总局和标准化研究院发布的有关我国国民经济行业分类的国家标准,旨在统一与标准化国民经济中同性质的包含生产、运营和交易等各类经济活动的组织结构类目体系和相关术语集合的定义与范畴[11] 。该分类标准是我国目前最新的国家行业类标准,其标准制定程序严格准确,具有相当的可信度与权威性。

(三)主题建模聚类

Blei等[12] 在2003年首次提出了一种基于狄利克雷分布的文档主题生成算法,即LDA模型。该模型假定采样过程中的参数服从狄利克雷分布,利用贝叶斯模式下所抽取的隐主题后验概率所服从的多项式概率与先验狄利克雷分布之间所成的共轭关系进行两阶段的主题生成,结合Gibbs抽样方式进行“词—主题”与“文档—主题”矩阵的求解。尽管LDA模型可以快速有效地挖掘出文档集合中潜在隐主题的分布,形成概率性分布的聚类集合,具有一定的解释力度,但从本质上来说LDA属于完全无监督的学习模型,因而模型所生成的聚类质量仍然缺少一定语义化的质量控制,导致部分聚类可能存在难以解释的不受信任问题。

为了解决这类问题,斯坦福大学计算机学院的Ramage等[13] 提出了Labeld LDA聚类算法(LLDA)。该算法基于已有的LDA模型,引入先验标签(客观事实)的监督项分布,使得主题采样时只能够在指定的标签类别所对应的文档中进行,从而在一定程度上缓解了这种标签类信任分布的问题。其中,对于文档d第i个位置主题j的吉布斯抽样概率满足如下公式:

(2本文使用LLDA算法将ICNEA分类引入关键词的主题聚类模型中,从而获取我国经济行业类别下有关“业财融合”主题特征项的分布特征,以用于对不同行业的侧重点与热点知识分布进行微观比较与评估。此外,本文还使用两种定量测度指标——基于高频主题词汇的熵(ICNEA熵)与相关度(行业主题相关性)——对不同领域和行业内的主题宏观特征进行进一步的比较与探索,从而更全面地揭示出我国“业财融合”的主题分布规律与研究、应用热点。可以将ICNEA熵和行业主题相关性进行进一步的形式化表示,假设       表示高频词i在LLDA聚类空间里某一个ICNEA类别中的特征概率权重,k是该ICNEA类别特征向量的长度,那么ICNEA熵可以表示为:

与此同时,本文使用迷惑度(用Perplexity表示)[14] 对LLDA聚类模型进行评估。该方法假定某个词语所估计的句子生成概率越大,模型所对应的语言模型越贴近真实的句子,此时模型预测下一个词的平均选择类别越少,其迷惑度也就越小。在后文中,本文将讨论不同参数下的LLDA模型聚类的迷惑度情况,以求解最佳的LLDA模型,迷惑度计算公式如下:

三、实验数据分析

(一)数据来源与描述统计

本文选择我国最大型的文献资源数据库中国知网(CNKI)作为数据来源,将检索主题设定为“业财融合”,检索时间范围设为2000 ~ 2019年,共检索到1305篇文献。将该数据集进行文本结构化处理,并丢弃缺失重要信息的数据(如机构名和关键词),最终得到727篇文献作为本文的数据集。根据2000 ~ 2019年6月发文量统计情况,可以看到CNKI中最早有关业财融合的研究出现在2012年。随着时间的推移,有关业财融合的研究逐年递增,至2018年已经达到近五年最高发文水平370篇,如图1所示。

在领域与行业类目编码过程中,首先采用基于字符串规则匹配的方式对数据集进行处理,将每条记录中的组织机构分配到一层和二层的领域类型中,例如将含有“学校”“学院”字段的机构名归属于一级领域教研机构和二级领域高校与教育机构中。该方法对于10次随机抽样的1000个机构名分类识别的准确率可以达到100%。与此同时,本文邀请来自财会领域的三位学者与工作人员进行了独立的人工标注实验。每位标注人员在充分阅读与理解每篇文献和ICNEA类目的基础上,对ICNEA的19个门类进行类别标注,并使用最大标注概率的类别作为该条目所属的ICNEA类别。为了检验与评价该标注实验的客观性和准确性,通过计算标注结果的kappa值来测量不同的人工评价的一致性。该评价实验结果显示kappa值可以达到92.7%,说明ICNEA标注实验是客观和有效的。

通过比较不同行业与ICNEA中发文的规模,可以发现:从领域类型来看,政企行业比教研机构发文规模大,其中企业类型占比达到67.4%,高校与教育机构占比20.6%,是二级领域分类中发文最多的两个类别;在ICNEA方面,教育业,制造业,信息传输、软件和信息技术服务业是发文量排名前三的经济行业,分别占到了21.7%、11.6%和11.0%,而在住宿和餐飲业,国际组织,农、林、牧、渔业等行业中该主题被提及的次数非常少,相关文献数量之和占比仅为6.6%。由此可见,以企业为结构主体的非学术研究型机构比学界更加重视业财融合的发展,这主要表现在两类国民支柱产业的经验上,即信息传输、软件和信息技术服务业和制造业。而造成该现象可能的原因是业财融合从本质上来说更加偏重于财务与业务应用的实践层面。具体行业与领域的文献占比情况如图2所示。

(二)参数优化与讨论

在选择高频关键词时,本文采用了三种方法(DhI、HI、GI)对文献记录中的关键词进行高频阈值的测度与评估,分别得到三种方法的高频阈值:HI=14,GI=39,DhI=38.23。尽管这三类切分方式都可以较好地获取高频主题词汇集,但HI所得到的高频关键词最为丰富,且都是可以反映主题特征的热点词汇。

考虑到LLDA模型易受到不同参数组合的影响,本文对最优参数组合进行了实验分析与讨论,结果如图3所示。

当LLDA的迭代次数为100时,随着Alpha与Beta的成倍增大(10倍),模型迷惑度也相应增加,最小迷惑度所对应的Alpha与Beta参数区间应该在0.001 ~ 0.01的范围内。进一步比较该区间可以发现,在Alpha=0.005与Beta=0.006时,本模型可以达到最低的迷惑度71.21。同样,可以根据不同迭代次数下的模型迷惑度比较来确定最佳的迭代次数,在本实验中,LLDA模型的最佳迭代次数参数为100。

(三)实验结果分析与讨论

1. 宏观性高频研究与应用热点的识别。从高频词的统计来看:“业财融合”是具有最高词频的核心词汇;“财务管理”“管理会计”“财务转型”“企业管理”“财务部门”反映的是财会数据与资源管理方面的工作;“财务共享”“财务共享中心”“财务人员”主要强调财务机构的共享作用;“内部控制”“预算管理”“全面预算管理”则侧重于业财融合中资金预算与控制方面的策略与问题;“大数据”与“互联网+”主要是有关财务管理与信息化技术的交叉建设。可以发现,高频词汇所反映出来的主题知识都是一些比较宽泛的范畴,如“财务管理”“财务转型”这些热门方向,而这种基于高频词的热点跟踪属于宏观层次的总体形势分析,其表述较为抽象,需配合更为微观的主题特征予以解析。

2. 微观性行业主题模型分析。LLDA模型的聚类结果显示,在ICNEA的19个行业门类中,不同行业所关注的主题词汇存在一定的差异。为了更好地展现这些行业的相关特征属性,本文选择每个类别中权重最大的10个特征词作为主题特征进行阐述,并且按照行业特征与热点特征分别进行信息标注。其中:“集团公司”“财务共享”“财务转型”等热点词汇反映出业财融合的推进及研究情况;“全面预算管理”“企业内部控制”“企业成本”“业务决策”等热点词汇反映出业财融合在企业内部治理和管理中的应用场景;“作业成本法”“人工智能”“大数据思维”“信息系统”等热点词汇反映业财融合应用的技术基础。与此同时,在一些行业类别中有大量行业特征词汇,例如在“信息传输、软件和信息技术服务”一类中,“电信企业”“通信行业”“网络维修费”和“通信运营”都属于典型的通信运营商企业的语义化标识,说明我国通信运营商对于业财融合方面的经验与研究在信息传输、软件和信息技术服务行业中占有重要的地位。另外,从模型算法上来看,这些行业特征词汇也在一定程度上证实了LLDA模型的优势,即LLDA模型可以很好地捕捉到先验标签(ICNEA类别)条件下主题特征的分布情况,具有一定的主题可解释性。

3. 不同ICNEA行业的高频热点分布。为了更好地比较与评估业财融合在我国不同行业之间研究与应用现状的差异,本文将微观主题模型中的宏观性高频热点词汇单独列出,通过计算与排序熵值及其主题特征值(为了更加直观地显示和比较,这里的熵值和主题特征值是指经过10倍放缩以后的值,其中熵值是原始ICNEA熵除以10以后的值,而主题特征值则是原始主题特征概率乘以10以后的值),可以发现:从高频热点词汇分布的稳定性来看,“业财融合”“财务共享”“管理会计”“财务管理”等新一代财务核心流程的价值链管理熵值较高,显示出在业财融合研究中涉及财务核心流程的研究更具价值;像“大数据”“对策”“问题”“内部控制”等涉及具体领域新兴技术以及财会整合举措研究的熵值较低,说明单纯探讨技术的研究价值不大。这也反映出业财融合在应用信息技术方面比较统一,不是主要的研究难点,主要难点还是在于对财务核心流程管理问题的研究。这种相对稳定的热点词汇进一步反映出财务管理实践逐步由分工协作转向一体化融合的普遍发展趋势。图4中列举了这些高频热点在发文规模最大和最小的六类行业中的分布情况。

从图4中可以看到,发文量较少的行业,如住宿和餐饮业,国际组织,农、林、牧、渔业中基本很少提及这些高频热点词汇,除了住宿和餐饮业对于财务人员有相关要求外,其余行业高频词汇的特征基本没有差异。与之相反的是,发文量最高的教育业重点讨论了“财务共享”“管理会计”和“大数据”方面的内容,体现出业财融合的学术研究结合了财务管理制度与技术创新的趋势。制造业则更加强调“企业”与“财务共享”方面的内容。对于信息传输、软件和信息技术服务业而言,其最为关注“管理会计”和“财务转型”方面的内容。

从经济行业之间的主题相似度分析来看:住宿和餐饮业,信息传输、软件和信息技术服务业,公共管理、社会保障和社会组织,制造业,卫生和社会工作,国际组织,水利、环境和公共设施管理业,采矿业,金融业这些行业在业态上并没有很高的相似度,但在业财融合研究领域中的主题相似度较高,体现出财务管理与业务、信息技术的融合在这些行业中具有较高的内在需求和共通性;交通运输、仓储和邮政业,农、林、牧、渔业,教育业,科学研究和技术服务业这几个行业相对独立,特别是教育业、科学研究和技术服务业在业财融合方面的研究重点与其他行业有明显区别,这也与上述热点词汇分布的情况相符;建筑业、房地产业、租赁和商務服务业具有较高的主题相似度,这也与这些行业自身业务形态的高相似度相吻合。

4. 政企行业与教研机构的特征比较分析。除了行业特征,本文按照机构领域比较了“业财融合”相关主题特征在政企行业与教研机构中表现的异同点,并在下表中列举出这两个领域中高频热点特征和Top20的主题特征分布。

总的来说,政企行业与教研机构对业财融合的关注要素基本是相似的,都涉及财务管理、管理会计、财务转型等方面。相比之下,教研机构更加关注财务管理、财务共享和财务转型等核心话题,以及强调企业在财务管理活动中的增值问题等方面的理论讨论。而政企行业更加注重实践中如何解决业务与财务管理流程问题,以及如何通过引入更加智能化的信息决策服务和具有协同性的内部控制机制,以推进企业的财务转型与共享,即更多地在实践与应用层面制定一些具体实施方案,如针对具体行业实施全面预算管理(成本管理)策略、运用“互联网+”技术将业财融合嵌入企业内部控制、制定财务共享管理实现方案等。

四、总结与展望

为分析我国业财融合领域的知识现状特点,本文通过对我国大型电子文献资源数据库CNKI2012 ~ 2019年间相关论文的发表年、关键词以及发文机构等元数据进行文本处理和分析,结合内容分析法、共词分析法、主题聚类建模等量化分析手段,从宏观高频词分布和微观行业研究特性两个层面,对我国业财融合研究在不同经济行业及领域机构所呈现的热点方向和主题分布进行了深入挖掘和分析,得到了相关现状特点。

本文对相关文献的梳理为我国业财融合的下一步研究提供了探索的方向:①业财融合要解决的问题和难点是运用信息技术,将非标准化的业务经验与标准化的财务管理相融合。因此,如何充分运用日益发展的信息技术(如大数据、“互联网+”、人工智能等)从业务数据中规范化建模并在财务管理上实现创新,将是未来一段时间内业财融合的主流方向。②将教育科研机构与政府、企业的研究相结合。业财融合理论研究要与财务管理工作实务相结合,工作实务的案例经验可以为理论研究提供实证支撑,理论研究的成果要为管理实践工作提供新的思路和解决方案。③在行业间融汇贯通。从本文研究结果来看,目前业财融合在如信息传输、软件和信息技术服务业,制造业,住宿和餐饮业等领域的研究比较融通,但是仍有一些行业,如房地产业,交通运输、仓储和邮政业等相对独立,研究的共通性较少,未来在业财融合研究领域可以进一步探索,在这些行业之间找到通识。

【 主 要 参 考 文 献 】

[ 1 ]   Callon M., Courtial J. P., Laville F.. Co-word Snalysis as a Tool for Describing the Network of Interactions Between Basic and TechnologicalResearch:The Case of Polymer Chemsitry[ J].Scientometrics,1991(1):155 ~ 205.

[ 2 ]   李纲,巴志超.共词分析过程中的若干问题研究[ J].中国图书馆学报,2017(4):93 ~ 113.

[ 3 ]   张勤,马费成.国外知识管理研究范式——以共词分析为方法[ J].管理科学学报,2007(6):65 ~ 75.

[ 4 ]   肖明,杨楠,李国俊.基于共词分析的我国用户信息行为研究结构探讨[ J].情报杂志,2010(S2):12 ~ 15.

[ 5 ]   Donohue J. C.. Understanding Scientific Literature:A Bibliographic Approach[M].Cambridge:The MIT Press,1973:1 ~ 80.

[ 6 ]   張松等.基于词频g指数的共词聚类关键词选取研究——以教育技术学硕士学位论文为例[ J].现代教育技术,2013(10):53 ~ 57.

[ 7 ]   Zhao W., Mao J., Lu K.. Ranking Themes on Co-word Networks:Exploring the Relationships Among Different Metrics[ J].InformationProcessing & Management,2018(2):203 ~ 218.

[ 8 ]   Bernard B.. Content Analysis in Communication Research[M].New York:Free Press,1952:1 ~ 220.

[ 9 ]   邱均平,邹菲.关于内容分析法的研究[ J].中国图书馆学报,2004(2):12 ~ 17.

[10]   王立学,冷伏海,王海霞.技术成熟度及其识别方法研究[ J].现代图书情报技术,2010(3):58 ~ 63.

[11]   国家质量监督检验检疫总局,国家标准化管理委员会.国民经济行业分类标准(GB/T 4575-2017)[S].北京:中国标准出版社,2017.

[12]   Blei D. M., Ng A. Y., Jordan M. I.. Latent Dirichlet Allocation[ J].Journal of Machine Learning Research,2003(4~5):993 ~ 1022.

[13]   Ramage D., Hall D., Nallapati R., et al.. Labeled LDA:A Supervised Topic Model for Credit Attribution in Multi-labeled Corpora[A].Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing(EMNLP '09)[ C].Stroudsburg:Association for Computational Linguistics,2009:248 ~ 256.

[14]   Huang L., Ma J., Chen C.. Modeling Syntactic Structures of Topics with a Nested HMM-LDA[A].Proceedings of the 2009 Ninth IEEEInternational Conference on Data Mining(ICDM'09)[C].Washington:IEEE Computer Society,2009:824 ~ 829.

猜你喜欢
财务转型财务共享业财融合
招标企业“互联网+”财务转型浅析
打造产融结合平台推动企业财务转型
试析集团企业实施财务共享存在的风险及防控对策
平安集团财务共享服务中心组织结构框架研究
通信运营企业基于客户效益的业财融合研究及应用
业财融合助力企业发展探究
论实施业财融合推进精细化财务管理的措施
通信企业基于价值的业财融合分析浅谈