贾娟娣 潘玲玲
关键词:科研原始数据;流程化管理;监管模型;仿真实验
在经济发展由高速度发展向高质量发展过程中,推动企业转型、实现创新发展成为各行业“制胜法宝”,科研領域也是如此。在越来越多先进智能化技术支持下,科研深度不断推进,复杂性和难度与日俱增。与此同时,科研原始记录数据数量也在日益攀升,且原始记录数据的完整性、真实性和精确性对科研活动最终结果影响远大,一旦劣质数据混入其中,很容易导致科研结论存在误差,甚至导致研究活动之前的努力毁于一旦。因此,保证科研原始记录数据如实记录、科学管理、精确筛选劣质数据极为重要,尤其是在当前“创新就是生产力”背景下,科研活动数量持续化增加,关于科研原始记录数据监管的重要性进一步凸显。基于此,本文结合现代化技术,构建科研原始记录数据监管模型并分析其应用可行性具有极其重要的实际意义。
一、科研领域中的原始数据具体内涵阐述
(一)原始数据内涵
结合现有资料和文献分析,对数据内涵总结如下:在科学研究活动或者技术涉及活动中,计算、分析、统计等所依仗的数值信息。数据形式没有统一标准,在不同应用场景下表现形式存在差异,例如实验室中获取,收录在数据记录本中的手写、打印的测量数据、观察数据及计算解释、结论记录信息及报告等“无形数据”,也被称为“文本数据”。还存在实验过程中直接测量的数据经过分析从而编写出来的图形及图表信息等,这些数据可以相较文本数据可以更为全面、直观地展示描述具体内容,其被称为“有形数据”。
科学研究领域中提到的原始数据主要是指未经过技术手段处理、分析、整合等操作,直接是通过实验观察、实验测量或者调研等获取的纸质记录数据或者是依托计算机信息技术形成的文字、图像及声音等数据。
(二)原始数据的记录和保存
当前科研领域中原始数据记录方式多样,一般情况下,纸质数据记录本、电子记录和数据库保存三种形式是最常见方法。三种数据记录保存形式各有优缺点,在实际应用时,需要结合实际场景,科学进行选择。接下来对三种记录保存方式进行全面阐述:
第一,数据记录本。此种方式在科学研究实验活动中应用最为常见,数据记录本是科学编制、连续编码专门用来记录科研过程、数据信息的装订本,其形式不存在统一标准,可以基于实际需求进行调整。该记录本在应用时,可以对研究人员实验获得数据、观察获得数据、解释、思考思路及行动计划等进行记录,通过纸质版信息保存方式,可以实现原始数据真实、全面记录保存目标。同时该方式具备操作简便、及时高效等优点,尽管在数据处理及分析时面临更大挑战,但整体来看,仍是利大于弊,是实验室中最常用的记录方法。
第二,电子记录方法。随着现代化技术发展,计算机、互联网得到普及,依托现代技术形成的电子数据记录本面世,充分发挥软件系统优势,实现数据智能化记录,其较纸质数据记录本在文字处理、信息处理及数据整合等方面具有高效、便捷的优势,电子数据记录本可以通过与其他智能程序耦合实现,数据精确筛选、智能化分析及图表自动生成、图像自动转化等优势。基于此,该种记录方式得到大面积推广,且逐渐取代传统的纸质数据记录表信息保存方式[1]。
第三,数据库保存。随着信息技术、大数据技术、云平台等先进技术发展,科研领域逐渐构建起专业信息共享数据库,将相关信息数据存储其中,从而便于其他研究人员查阅,例如GENBANK、DDBJ 等,具备收录期刊文章信息数据及保存数据的功能,此种方式对于科研发展有推动作用,通过实现数据共享可以为科研水平提升夯实基础,但由于多种因素限制,数据库可以保存的数据类型有限,此方面有待进一步研发。
二、用户需求分析
本文旨在构建科研原始记录数据监管模型,通过发挥智能化、现代化技术优势,实现科研数据全方位管理及系统性监控,从而有效提升数据来源可靠性和真实性,为我国乃至世界科研发展提供支持。从用户需求角度来看,需要满足如下需求:
(一)提升工作效率
打造智能化数据监管模型,可以有效提升数据记录、保存效率,降低数据出错的可能性,再加上设置定人定岗管理机制,可以有效避免出现数据重复记录、混乱记录等,且智能化模型可以发挥技术优势,实现数据录入保存全过程监督及智能提醒,这不仅可以提升数据安全性还能有效保证工作效率。
(二)提升数据质量
智能化数据监管模型的构建,可以有效对数据来源、记录等进行管控,且为数据营造高等级防护体系,可有效避免人工失误或者信息泄密等问题出现。因此构建数据监管模型时保证科学管控数据质量是一项重点关注内容。
(三)提高分析数据可靠性
数据监管模型的构建科研通过日志审核及审计体系构建完整的数据溯源机制,有效保证数据信息的可靠度和真实性。对于后续利用原始数据进行的分析、图表制作及结论总结等真实可信夯实基础。
(四)降低人员工作压力
数据监管模型构建之后,可以实现原始数据智能化记录,进而将人从烦琐、复杂的数据整理、记录工作中解放出来,降低人员工作量,也可以有效避免数据混杂、数据重复记录等问题,只需按照提示,自动化录入信息内容即可,可节省更多的时间做更有价值的工作[2]。
三、科研原始记录数据监管模型构建
结合上文的用户需求分析,本文参考博弈论理论、数据监管生命周期模型及改进病毒传播SIR 模型等为基础,总结科研原始数据的特点以及当前现有技术,提出如图1 所示的实现全覆盖、无缝式监管的科研原始数据收集、整理、分析及保存流程思路。
(一)监管模型构建过程中的重点任务
结合上文的数据监管思路分析,科研原始数据监管模型在构建之前,需要先明确理清监管流程。基于现有研究资料分析,本文构建的原始数据监管模型只要从前期准备、中期建设及后期完善三部分进行思考。
第一,前期监管。此过程中相关人员需要明确科研原始数据的内涵及数据常见类型,然后咨询相关领域专家,针对设计思路提出建议,指出其中不足,然后组织模型构建队伍,通过科研原始数据系统性分析,总结监管模型的要点,形成模型框架。在此过程中,对数据进行粗糙式整理,为后续监管提供助力。
第二,中期监管。此过程中,完整的数据库、数据库管理模型构建完成,此时依托智能化技术可以实现数据全方位管控,且依托模型对数据进行上传、修改及搜索等操作,且在构建模型时或基于不同数据类型针对性进行架构。
第三,后期监管。此过程是从数据传播、数据利用、数据融合及评估等角度完成数据监管任务的。以数据传播为例,在对外传播数据过程中,更多的科研人员可以了解科研数据,在利用参考数据过程中,可以多次验证数据可靠性,且保持数据持续更新增补。因此,通过不断更新优化模型,总结模型实际应用经验,对模型存在的不足进行更新优化,这对于提升数据监管目标有积极作用[3]。
(二)数据监管模型构建时应用的方法和技术
基于上文提出的数据监管模型流程和需求,在构建模型时,采用如表1 所示的方法和技术,支持模型发挥效用,真正实现数据监管目标。
(三)科研原始记录数据监管的要素分析
科研原始记录数据在进行监管过程中,设计要素曝光,其中监管环境、数据资源、数据监管服务、监管工具等是重点内容。具体来看,监管环境包括数据基础来源、国家监管环境、科技发展环境等;数据资源包括现有的科研数据类型,几乎所有科研活动中获得或者由计算机获取的信息数据均包含在内;监管服务随着技术发展,基础服务日益优化,在进行模型架构时大数据技术、云平台及信息技术等均可以发挥效用;监管工具是实现功能的重要支撑,监管模型的数据收集、数据存储、数据组织及数据共享等均需要监管工具发挥作用[4]。
(四)科研原始记录数据监管模型分析
结合上文分析,本文基于前人已有研究成果,构建如下管控模型。该管控模型遵循科研数据生命周期为主,结合博弈理论等进行架构[5]。主要分为三阶段进行思考,第一阶段以数据源头博弈为基础,从数据生产者方向和科研数据监管者方向为主,旨在生产优质数据,避免劣质数据出现。在进行模型架构着重思考实用价值和利益价值。第二阶段,从劣质数据传播阻断方向入手进行思考,通过现代化技术在科研数据传播途径中设置栅栏,实现阻隔劣质数据传播的目的。第三阶段实现科研数据修复与淘汰,大量的科研数据中,势必会存在数据缺少及不完整信息数据,同时在数据整合过程中,高校、科研机构等场所会对数据进行验证,此时数据会得到进一步修复,但部分数据由于缺失严重难以修复则需要被淘汰,无法再将其留存,不然会对后续的科研活动产生阻碍作用[6]。结合上述三阶段工作重点,构建如下模型如图2 所示。
四、科研原始记录数据监控模型应用分析
经过系统性分析,最终对构建的控制模型进行仿真实验。按照上述三阶段划分系统性进行验证,确保模型具有实际应用价值。从灵敏度方向进行分析,该模型的构建可以有效降低数据失误的可能性,依托博弈模型等优势,有效平衡数据生产者和数据服务人员之间的关系,通过提升劣质科研数据生产成本、降低监管难度方面进行思考,且从提升科研数据造假惩處力度等方面完成监管机制[7]。
例如设立科研补助、科研奖励、科研惩罚等,这对于进一步提升监管效果极为有利。从此方面来看,构建的模型从实际出发,构建框架基于现实角度进行设置,具有较高的灵敏度。从传播角度来看,构建的模型在数据传播途中设置甄别机制,可以对数据进行筛选,对于其中的劣质数据,可以通过构建隔离空间单元,缩短数据修复时间,在短时间内实现数据修复阻隔其传播路径。虽然劣质数据具有一定的潜伏期,但通过延长隔离观察时间、降低该数据的应用次数,不仅可以降低数据造成的负面影响,也可以在先进技术支持下缩短劣质数据确认时间降低数据感染可能。在修复与淘汰阶段,模型发挥优势,从科学角度对劣质数据进行区分并修复,然后发挥优选机制作用,将修复后的数据与初始数据进行比较,从而确定修复的价值[8]。本次模型的构建,充分发挥科研数据生命周期理论价值和博弈模型等理论优势,结合现今智能化技术,实现科研数据智能筛选和优劣数据区分,并组建数据修复模型实现数据再修复。综上,本文构建的科研数据监管模型具有实用价值,可以实现对劣质数据科学管控的目的。
五、结束语
综上所述,本文结合现有理论,在前人研究成果支持下,尝试提出一种符合实际的科研原始数据记录监管模型构建思路。通过系统性梳理数据监管要素及各要素之间的关系,在生命周期理论和博弈理论等支持下,按照三个阶段进行讨论,在保证涵盖原始数据来源、服务对象等基础上,完成监管模型架构。希望通过本文的研究,可以为诚信科研目标实现、提升科研数据的可信度和实用价值提供更多借鉴。