基于文本挖掘的PPP项目绩效付费行为识别*

2024-09-26 00:00:00梁秀峰吴兴欢柴莹刘毅
项目管理技术 2024年9期

摘要:全面识别PPP项目绩效付费行为,对于完善PPP项目制度有重要作用。通过设计PPP项目绩效付费行为文本挖掘流程,构建文本数据库,对文本进行分词及去停用词处理,挖掘行为关键词,对关键词聚类分析,识别出PPP项目绩效付费行为,即合作行为、机会主义行为和合谋行为。研究成果可为PPP项目绩效付费行为研究提供理论参考。

关键词:

PPP项目;绩效付费行为;文本挖掘

0引言

根据财政部政府和社会资本合作中心项目管理库的数据,我国超过90%的PPP项目基于绩效付费。PPP项目参与主体在内外环境影响下做出的能动反映,主要包括行为主体和行为手段。项目公司可能出于契约精神或社会责任,按照绩效标准积极完成绩效目标,也可能由于自身逐利本性不按照绩效标准完成绩效目标,而采取机会主义、行贿监督部门等行为,使未达到绩效标准的产品或服务得到超额支付。在绩效付费过程中,绩效监督机构和项目公司选择不同的付费行为,直接影响不同的绩效结果和最终支付额度,甚至影响项目效益。因此,要制定一套完善的PPP项目绩效付费制度,需要系统地识别出PPP项目绩效付费行为。

现有研究中PPP项目绩效付费行为有合作行为,如张云华等[1]通过计算实验方法研究PPP项目多主体协同合作行为;邹国良等[2]基于演化博弈理论分析乡村振兴战略下农村人居环境整治PPP模式中参与者的合作行为;孙谋轩等[3]研究公私制度逻辑冲突与社会资本在PPP项目中的合作行为作用关系。除了合作行为,PPP项目绩效付费行为还存在机会主义行为,如Liu等[4]通过演化博弈理论研究PPP项目运营期私人投资者机会主义行为演化;Sanda等[5]研究PPP项目中利益相关方的机会主义行为;王天日等[6]建构了基于Moran过程的博弈模型,探讨抑制PPP项目承包商机会主义行为策略的条件。从现有研究看,目前对PPP项目绩效付费行为进行系统识别的研究较少,而随着PPP项目的发展,网络上涌现出大量PPP项目绩效付费案例,较为全面地反馈了现有PPP项目绩效付费的实施过程和经验,这些案例中包含了对PPP项目绩效付费行为的描述。应用文本挖掘技术对这些案例进行挖掘,可全面系统地识别出PPP项目绩效付费行为。

文本挖掘技术是数据挖掘技术的一个分支,是从文本数据中抽取出有价值的信息和知识的计算机处理技术。目前,文本挖掘技术已被应用于因素和行为挖掘识别。例如,陈芳等[7]利用文本挖掘技术从空中危险接近事件中挖掘出导致接近事件的因素;田水承等[8]利用文本挖掘技术从国内大量建筑施工坍塌事故调查报告中挖掘出导致安全事故的影响因子;姜早龙等[9]通过文本挖掘技术对社交媒体上的老旧小区改造话题进行挖掘,识别出不同主题的热点话题;薛楠楠等[10]通过文本挖掘技术从大量建筑安全事故报告中挖掘出建筑工人不安全行为。因此,本研究基于文本挖掘技术设计PPP项目绩效付费行为文本挖掘流程,对大量PPP项目绩效付费案例进行挖掘,以全面识别PPP项目绩效付费行为。

1文本挖掘流程设计

文本挖掘与数据挖掘流程基本相似,二者关键区别在于数据挖掘的对象是结构化数据,文本挖掘的对象是非结构化的自然语言,而计算机无法直接理解非结构化的自然语言,需先通过自然语言处理技术将其转变为计算机可理解的结构化数据,再进一步挖掘分析。

文本挖掘的一般流程为:文本获取→形成待挖掘文本数据库→文本预处理→形成结构化数据→文本数据分析→结果可视化→发现规律。文本获取后,形成文本数据库,通过文本预处理将非结构化文本转换成用特征词表征的结构化数据,然后通过数据聚类、关联等,挖掘文本与文本之间的内在规律。

然而,本研究对PPP项目绩效付费行为的挖掘识别是先将隐藏在大量案例文字中的行为关键词挖掘出来,再对其聚类,以识别出PPP项目绩效付费行为。因此,本研究的文本挖掘流程分为三步:第一步,文本获取,构建文本数据库;第二步,数据处理,挖掘行为关键词;第三步,行为识别,进行行为关键词聚类,识别出PPP项目绩效付费行为。文本挖掘流程图如图1所示。

2文本获取

文本获取是指对网络上与研究主题相关的文本进行收集,形成文本数据库。本研究的案例来自各国PPP官方数据库、世界银行PPI数据库、专业机构报告、文献案例、网页案例、中国裁判文书网,最终筛选出三个渠道,即专业机构报告、网页案例及中国裁判文书网。PPP项目绩效付费行为文本数据库来源如图2所示。

21专业机构报告

北京明树数据科技有限公司发布的专题报告《可用性付费模式应用的国际经验总结与借鉴——以交通基础设施项目为例》列举了12个项目案例,均包含PPP项目绩效付费相关内容,因此,将这12个项目案例纳入本研究文本挖掘数据库。

22网页案例

通过百度、谷歌搜索引擎,以“PPP”“BOT”“成功”“失败”“案例”为关键词进行搜索,在搜索结果中尽量选择权威或较有公信力的网站发布的案例。搜索到13个成功案例(国家发展与改革委员会公布)、21个失败案例(搜狐网),其中有两个失败案例是项目前期问题导致的,将这两个案例剔除,共保留32个案例资料。

23中国裁判文书网

在中国裁判文书网主页搜索栏中以“PPP”“BOT”“工程”为关键字进行搜索,得到1354个文书。通过对这些文书进行阅读,发现其中较多的为建设期施工合同纠纷案件,不涉及绩效付费行为。最终筛选得到4份民事裁定书、1份民事判决书和1份行政裁定书,共6份案例资料。PPP项目绩效付费案例文本数据库资料来源及数量见表1。所收集的案例中,国内案例有34个,占比68%;国外案例有16个,占比32%。

3文本处理

对文本中淹没、隐藏的行为关键词进行挖掘,需要先将文本中的语句切分成单个词汇,然后清洗淘汰无用信息,最后保留PPP项目绩效付费行为相关词汇。具体流程分为两步:一是分词(Word Segmentation),二是去停用词(Remove Stopwords)。

31分词

分词是指将语句文本分割成词或词组并按照一定的规范重新组合词序列的过程。本研究文本资料包含大量专业术语,采用统计和理解的分词算法会造成专业词汇无法识别,因此采用基于词典的分词方法。该方法能有效准确地分词的关键是建立与文本资料专业相符的专业词库(或称“专业词典”)。

311PPP项目绩效付费行为文本分词词库构建

目前,有关专业词库构建方面的研究较少。王爱华[11]针对工程项目腐败行为构建领域词表,但该词表无法获取。搜狗词库收录了工程领域专业词表,但无PPP项目绩效付费行为专业词表。本研究对于搜狗词库中与本研究相关的城市信息大全、社会科学、工程与应用科学三大类词库进行下载,以作为基础词库,并在此基础上构建PPP项目绩效付费行为专业词库。

312分词程序设计

构建PPP项目绩效付费行为专业词库后,采用Python语言编写分词代码程序,以实现对文本分词。分词主要程序是读取文本数据库中文本的路径、标题及每个文本的内容,存储到数据库中,导入jieba工具加载上述建立的词库,读取数据库中的每个文字或单词,判断是否出现在词库中。如出现,则按专业词库分词;如未出现,则按单字分词。分词实现流程设计图如图3所示。

32去除停用词

对文本进行分词处理后,需要将不具有实际含义的词移除,以降低对文本挖掘的干扰。

321停用词表构建

本研究采取停用词表的方法去除停用词。第一步是构建停用词表。在全球最大开源代码网站Github中下载通用停用词表。该网站提供了百度、哈尔滨工业大学及四川大学的通用停用词表。本研究分词结果中包含了大量城市名称、项目名称、部分专业术语等,这些词汇对本研究毫无意义,需要去除。但这些词汇没有包含在停用词表中,不能满足本研究需求,因此需要在此基础上构建PPP项目绩效付费行为停用词表。停用词表构建与停用词去除相辅相成,首先用通用停用词表去除部分停用词,然后再将去除停用词后的结果与PPP项目绩效付费行为不相关词一起添加到停用词表。

322去除停用词程序设计

去除停用词思路为:首先加载停用词表,然后匹配分词结果与停用词表。当分词结果中包含停用表中的字符或词汇时,去除该词。去除停用词实现流程设计图如图4所示。本程序过程采用Python语言编写。

4行为识别

对文本清洗后的PPP项目绩效付费行为关键词进行词频统计,采用词云法展示词频较高的关键词。首先,基于Python采用groupby函数将相同关键词聚合;其次,采用numpysize函数对聚合的关键词进行个数统计;最后,采用wordcloud函数对关键词进行词云绘制。词云中词汇大小与其自身出现频率呈正相关。通过运行程序,PPP项目绩效付费行为文本关键词词频见表2,PPP项目绩效付费行为文本挖掘词云图如图5所示。

图5中关键词出现频率越大,字体越大。PPP项目绩效付费行为比较突出的关键词有:付费、扣费、违约行为、拖欠、合作、终止合作、运维不达标。这些词也是PPP项目绩效付费行为中的具体行为,从词云中可看出这些具体行为的出现概率。

41行为关键词聚类

从行为驱动力(即利益)的角度对以上具体付费行为词汇进行聚类:部分词汇表征了“为他”的PPP项目绩效付费行为,如“付费”“合作”“按约定时间”“良好的大修”等,这些行为可视为良好合作的行为;部分词汇代表了“为己”的PPP项目绩效付费行为,如“拖欠”“运维不达标”“违约行为”“擅自”等,这些行为往往破坏政府与社会资本的合作,或产生不良后果。因此,将这些具体付费行为词汇聚类为合作行为和不合作行为,PPP项目绩效付费行为初步聚类如图6所示。

42PPP项目绩效付费行为识别

在图6的合作行为中,贿赂、大肆收受、寻租正好符合“合谋行为”的定义。合谋行为是指工程利益相关方相互串通立场,通过正当或不正当的手段侵蚀项目利益或公共利益的行为[12]。因此,可将此类行为归为合谋行为。

在图6的不合作行为中,运维不达标、拖欠、违约行为、腐败、缺乏足够的监督、擅自、主体责任不落实、隐患排查治理不彻底、不能继续履行、违反合同均为单方的自顾行为,正好符合“机会主义行为”的定义。机会主义行为被认为是“狡猾的自利追逐”[13],是社会经济活动中一种常见行为。根据新制度经济学对人的假设,人是追求效用最大化的。人们在追求自身效用最大化时,往往会借助各种不正当手段谋取自身利益,不遵守约定和服从信用约束,损害他人利益,可将此类行为归为机会主义行为。

因此,进一步将PPP项目绩效付费行为聚类为合作行为、机会主义行为和合谋行为。PPP项目绩效付费行为聚类识别如图7所示。

5结语

本文通过收集PPP项目案例,采用文本挖掘技术识别出PPP项目绩效付费行为关键词,基于利益对行为的驱动力,聚类识别出合作行为、机会主义行为和合谋行为。

合作行为是PPP项目绩效付费行为中最基本、最常见行为,也是项目持续发展的基础。合作行为意味遵守项目约定,各自履行职责,社会资本按照约定时间运营维修,并进行良好的大修,持续履行自己职责;绩效监督机构定期检查,及时全面地评价社会资本绩效;政府依据评价结果按照规定对社会资本进行付费。另外,在项目运行过程中,参与主体在完成各自职责过程中还可能为其他参与者提供工作便利,互惠互利,促使合作更加紧密,项目发展更加健康。

机会主义行为是一种自私自利的行为,通常为了自身利益而做出损害他人利益的行为。PPP项目绩效付费中也经常存在这种行为,如社会资本违反合同约定,在运维过程中主体责任落实不明确,隐患排查治理不彻底,导致运维不达标,损害政府或公众利益;绩效监督机构不严格监督,对社会资本绩效无法准确评估;政府擅自挪用PPP项目应付款项,对社会资本拖欠付费或不合理扣费等。这种行为如果存在较多且持续时间较长,会使项目效益受损,严重的还可能使项目被迫终止。

合谋行为是PPP项目绩效付费中因委托代理关系的存在,作为代理方的绩效监督机构与作为委托方的政府之间存在信息不对称,绩效监督机构与社会资本合谋,以此追求自身利益最大化的行为。例如,绩效监督机构寻租,放松监管或修改绩效评价结果,使社会资本在不完成绩效目标的情况下获得足额支付。

针对PPP项目绩效付费中的机会主义行为和合谋行为,应采取一定的抑制措施,如提高项目透明度,让公众参与监督,阻断不良行为的发生;优化绩效付费系数,激励社会资本积极完成约定内容;提高合谋惩罚,震慑双方不敢采取合谋行为。

随着时间的推移,网络上还会出现更多的PPP项目案例,后续研究中可从更广阔的渠道收集案例,以更加全面地识别PPP项目绩效付费行为。

参考文献

[1]张云华,伊弘阳基于计算实验的PPP项目多主体协同合作行为激励仿真研究[J]技术与创新管理,2022,43(4):441452

[2]邹国良,刘娜娜,梁雁茹乡村振兴战略下农村人居环境整治PPP模式合作行为演化博弈分析[J]运筹与管理,2022,31(4):6168

[3]孙谋轩,朱方伟公私制度逻辑冲突与社会资本在PPP项目中的合作行为研究[J]南开管理评论,2023,26(3):233245,256

[4]LIU J,GAO R,CHEAH C Y J,et alEvolutionary game of investorsopportunistic behaviour during the operational period in PPP projects[J]Construction Management & Economics,2017,35(13):137153

[5]SANDA Y N,ANIGBOGU N A,IZAM Y D,et alManaging stakeholder opportunism in PublicPrivate Partnership(PPP)housing projects[J]Journal of Construction in Developing Countries,2022,27(1):213228

[6]王天日,郭靖云,王海涛,等基于Moran过程的PPP项目承包商机会主义行为演化动态[J]技术经济,2020,39(8):168173

[7]陈芳,沈芮宇基于文本挖掘的空中危险接近事件致因研究[J]安全与环境学报,2022,22(6):32803287

[8]田水承,王雪晨,范彬彬基于文本挖掘的建筑施工坍塌事故致因研究[J]西安科技大学学报,2022,42(5):849855

[9]姜早龙,李荷老旧小区改造的公众关注热点及推进策略研究——基于文本挖掘技术[J]建筑经济,2023,44(1):2936

[10]薛楠楠,张建荣,张伟,等基于文本挖掘的建筑工人不安全行为及其影响因素研究[J]安全与环境工程,2021,28(2):5965,85

[11]王爱华工程项目腐败行为的领域词表构建[D]北京:清华大学,2013

[12]乐云,单明建设工程领域工程合谋现象研究综述[J]工业技术经济,2013,32(1):14551

[13]WILLIAMSON O EThe economic institutions of capitalism:firms,markets,relational contracting[M]New York:Free Press,1985

收稿日期:20230607

作者简介:

梁秀峰(通信作者)(1989—),男,博士,讲师,研究方向:项目管理与工程经济。

吴兴欢(1989—),女,研究方向:项目管理。

柴莹(1994—),女,研究方向:PPP项目管理。

刘毅(1994—),女,研究方向:项目管理。

*基金项目:河北省教育厅科学研究项目“乡村振兴背景下河北省城乡融合发展模式及路径研究”(BJS2024086)。