任刚 车黎刚
摘 要:建设工程专业技术资格电子化评审对于全面推进专业技术资格评审管理科学化、规范化,提高专业技术资格评审的工作效率和管理水平,实现评审的公开、公平、公正,以及节省人力、物力、财力等方面具有重要作用和深远意义。江苏省在建设工程专业资格评审全流程中,通过网上申报、电子化评审、电子票决、相似性警示等功能的应用,实现了电子化、自动化、智能化。
关键词:建设工程 池化技术 相似性比对 PDF切片技术
1 项目背景
专业人员专业技术资格申报、评审涉及广大专业技术人员的切身利益,也是各级住房城乡建设主管部门实施人才培养战略的重要手段。经过多年的实践,江苏省建设工程系列专业人员专业技术资格管理已经形成申报、审核、分类、汇总、评审、票决、公示等一整套较为规范完整的工作体系,但每个环节均采用传统的人工处理模式,存在工作量大、易出错、分析能力弱等较多问题。建立一套符合建设工程专业技术资格申报、评审和管理要求的信息系统已是专业技术资格业务管理工作的当务之急,将对促进公平正义、方便申报人、减少成本、提高效率有着积极的意义。
2 总体架构
采用J2EE技术,基于Windows2003/2008 Server操作系统,Oracle 11g数据库、Weblogic应用服务器进行开发,集成了MyBatis、Spring、Ajax、Pentaho、Mondrain等开源框架,具有优秀的稳定性和强大的扩展能力,满足业务不断扩充和灵活变化。
3 核心功能
建设工程专业技术资格电子化评审平台建设的目标是利用先进的网络通信技术、计算机技术、安全保障技术、构建全省专业技术资格评审服务系统,实现专业人员专业技术资格管理的信息化、数字化、阳光化、自动化等,使专业技术资格评审更为高效、经济、安全、方便、快捷。通过制定统一的评审工作流程与操作规程,使专业技术资格评审工作更加科学、规范、协调和统一,减少评审工作自由裁量权,避免人为因素干扰,提高评审工作的科学性,构建更加公平、公正的评审环境。
3.1 申报电子化。申报人员可以通过互联网,在平台上随时随地进行专业技术资格申报、提交和修改,不再需要拿着纸质材料来回奔波于专业技术资格管理部门,大大方便了申报人,提升了申报效率。
3.2 评审网络化。通過电子化评审平台,小组评委和执委会专家一律在平台上完成资格条件审查、现场答辩、小组讨论投票、大组会讨论、大组投票等全部评审工作,实现纸质材料评审向网上评审的转化,同时对评审工作进行全程自动记录。
3.3 票决自动化。小组投票和大组投票均通过平台的自动票决功能进行统一投票,在组织人员的全程控制下,由系统自动生成票单供专家进行投票,自动对票单进行实时统计,并同步将投票结果公布,完全排除人工处理环节。
3.4 抽查随机化。评委评审结束后,通过平台可以按照需要对评审材料进行随机抽查,并对发现的评审质量问题进行进一步核查处理和过程追溯。
3.5 分析智能化。平台可以对申报和评审过程的每个环节和评审结果进行自动数据统计,形成多级分析汇总数据,通过报表、KPI、OLAP等多种方式,对申报评审工作、专业技术资格人才库等进行决策分析。
3.6管理协同化。通过省、市两级平台,实现了全省专业技术资格管理机构在预审、终审等不同环节的工作统一协同,实现了初级、中级和高级专业技术资格评审属地化管理下的申报材料,评审结果等专业技术资格数据的充分共享。
4 项目创新
4.1 多源异构数据关联应用
为了建立全省完整的专业技术人才库,加强不同领域专业技术人员信息的互联互通和整合应用,省住建厅对建设工程专业技术资格申报信息库进行了充分共享,提供了多种开放信息共享接口,与其他专业技术人才信息库形成充分对接,同时与权力阳光运行系统、优质工程评审系统、建设工法评审系统、执业资格注册系统、建设领域信用平台等上下环节的信息系统进行关联应用,为提升建设领域的整体信息质量和业务处理效率提供支撑。
4.2 PDF文件切割传输显示技术
申报人的申报材料繁多,在系统中产生的PDF申报材料文件也比较大,在审核和评审过程时,容易造成网络传输显示时等待时间很长。针对此问题,系统研发了PDF文件动态切割引擎,当超过指定页数或大小的PDF文件需要传输显示时,系统在后台自动判断,根据需要使用PDF文件动态切割引擎将其切割成若干个较小页码的PDF文件流,或者转化为更小格式的图片文件流,然后再进行网络传输和显示,这样可以在不影响查看效果的前提下,大幅提升文件显示速度。
4.3 PDF相似性比对显示技术
申报人在填写申报材料时,会尽量多的填写业绩材料,以往专家在评审申报材料时,需要人工去比对、剔除部分雷同的业绩材料,来保证评审的正确性,这个对于纸质材料来说,工作量巨大,而且比对覆盖面非常有限。
对此,系统采用针对申报材料PDF文件的相似性自动比对技术,判断可疑的相似业绩材料,在PDF文件上动态高亮显示,对专家进行提醒,并可以一目了然的调看相关业绩材料,大大减少了比对工作量。
系统在相似性比对时,首先会自动识别出材料中对应的项目信息、获奖信息、论文著作信息等,然后进行分类相似性比对。对于项目信息和论文著作信息,自动与其他人的相关信息和历史申报信息进行比对;对于获奖信息,首先平台中存储的历史主要奖项库进行信息比对,比对奖项名称、获奖人和时间,然后再与其他人的获奖信息和历史申报的获奖信息进行比对。
进行相似性比对时,系统采用条件随机域CRFs模型来建立比对算法。首先根据历史信息建立项目名称、奖项名称等这些内容的特征词库,然后根据特征词库对文本进行快速识别和分段分词,然后与其他人的相关信息和历史申报信息进行分段匹配,自动计算文本的相似度,最后根据匹配的相似度以及时间、单位等辅助信息来综合判断,当某个业绩与另一个业绩的相似度达到指定阈值时,则认为其属于雷同业绩材料,在专家查看时给予高亮警示。