张开智 柳平增 姜红花 刘鹏
[摘 要] 根据平台评价的原则,结合蔬菜产业大数据平台的特点并借鉴软件工程质量管理理论,参考当下大数据与平台建设方面的标准,提出了针对蔬菜产业的以数据质量与管理为核心的大数据平台评价指标体系,以期利用该指标体系提升平台服务质量及管理能力,并推进蔬菜产业的健康发展。
[关键词] 大数据平台;指标体系;数据质量;数据管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 07. 067
[中图分类号] F307.1;TP311 [文献标识码] A [文章编号] 1673 - 0194(2020)07- 0162- 04
0 前 言
农业部研究编制的《“十三五”全国农业农村信息化发展规划》已经将农业农村大数据的建设作为重中之重。为了实现农业信息要素数据的会聚利用、国内国际农业数据资源统筹,以相关数据挖掘、传递、共享的基础设施建设为基础,健全农业数据标准体系,建立农村农业数据采集、分析、应用服务体系,为农业数据信息支撑宏观管理、引导市场、指导生产能力的发挥夯实基础[1]。
国家和各地农业主管部门也高度重视农业农村信息化的发展,当前由两者带头,并联合科研机构、高校、各领域大型企业以及农户,建立了很多全国范围内的农业大数据平台。随着农业的发展及农业信息化的进步, 大数据和农业相结合成为炙手可热的研究方向, 山东农业大学早在2013年成立了国内第一个农业大数据产业技术创新战略联盟, 建成了“农业大数据应用云平台”, 同时研建了“渤海粮仓科技示范工程”、“奶牛数字化精准养殖系统”、“山东省小麦、玉米主要虫害特征数据采集与预警平台”等一系列利用大数据技术指导实际农业生产的应用项目,取得了显著成果[2-3]。在农业农村大数据建设中,相关研究人员对蔬菜产业大数据平台建设的关注程度也日益提升,涌现出大量蔬菜产业相关的大数据平台。但在平台建设以及数据质量、数据管理等方面也存在一些不容忽视的问题,例如平台本身的可靠性差,操作难,数据的时效性、完备性不强,数据管理能力欠缺等,导致大数据平台的应用效果不理想,对蔬菜产业发展起到的价值作用也差强人意。提高相关平台的利用率,推动农业农村大数据建设,促进蔬菜产业的健康发展,迫切需要加强蔬菜产业大数据平台的评价理论的研究。
1 建立评价指标的原则
指标在评价体系中肩负着作为基本构成单元的责任,只有恪守指标选取的相应原则,才能准确及时全面地衡量蔬菜产业大数据平台建设的具体状况,选择合适准确的指标,关系到评价结果的客观、公正,是有效评价系统的保证。本文根据平台评价指标设计的原则,结合数据质量与数据管理评价的特点,对蔬菜产业大数据平台的评价指标体系设计采取系统性、科学性、可操作性、层次性原则。
1.1 系统性
蔬菜产业大数据平台评价本质上是一个系统工程,内部拥有许多个子系统,这些子系统之间不仅相互影响,而且与其外部的系统也是相互联系的。指标体系应能全面地反映被评价对象的综合情况,有层次性,从宏观到微观,形成一个不可分割的評价体系[4]。
1.2 科学性
科学性原则是指标概念包括定性指标和定量指标都要有明确含义和目标导向,都能直接或间接地映射出平台本身的特点。在设计蔬菜产业大数据平台评价指标体系的过程中,要考虑到产业特点和发展规律,所构建的指标含义要明确[5]。
1.3 可操作性
整个指标体系的构建都是可以实现的,这就是所谓的可操作性原则。选取指标、确定指标主体、调研数据集成平台等指标体系构建的主要过程,可操作性原则在实际操作过程中包括评价方法和获取相关数据[6]。
1.4 层次性
蔬菜产业大数据平台作为一个系统概念,有它的评价目标,其内部的很多子系统也都有各自的评价目标。不同层次方面体现不同的评价目的,提高衡量系统方案的效果和确定评价指标权重的准确性和效率。
2 评价指标体系的构建
平台评价是对平台进行全面的检测评估,用实际指标与计划指标进行比较,以评定平台目标的实现程度,同时对平台建成后产生的效果进行全面评估。总结查阅的文献资料后发现,目前大多数评价指标主要是平台的性能、技术水平、使用成本、系统效益等几个方面。而大数据平台是侧重于“数据”层次的数据采集管理分析平台,大数据平台与传统平台的区别在于数据是整个平台价值的核心。本文在总结国内外研究的基础上,结合蔬菜产业大数据的特点,借鉴软件工程质量管理理论,并征询专家学者的意见,建立了以数据质量与数据管理为核心的蔬菜产业大数据平台评价指标体系。
评价指标体系第一层目标层为蔬菜产业大数据平台总体质量;第二层为准则层,包括性能、数据质量、数据管理、技术水平、价值5个一级指标;第三层为指标层,包括可靠性、可维护性、准确性等32个二级指标,如图1所示。
2.1 平台功能性
在GB/T 16260-2006、ISO/IEC 25010-2011中对功能性的定义为当在指定条件下使用时,软件产品提供满足明确和隐含要求的功能的能力[7-8]。在研究了国内外相关文献以及相关标准后,选取了平台功能性测评较重要的可靠性、可维护性、可扩展性、易用性、适应性5项指标。可靠性表示在使用时,系统平台维持规定的性能级别的能力,不会产生损耗或老化而影响使用。可维护性指的是平台可以被修改的能力,修改可能包括纠正、改进或系统对环境、需求和功能规格说明变化的适应。通过可扩展性来说明该平台适应变化的能力,当需要为平台添加新的功能时,对其他模块的影响和添加的代价。易用性来表示平台被理解、学习、使用和吸引用户的能力。操作方便、容易熟悉掌握的信息系统可以使用户更好地运用系统工作。适应性是在不同的应用环境中,不需要额外的消耗或者技术手段就可以使用平台的能力。
2.2 数据质量
根据GB/T 25000.12-2017中描述数据质量是指在指定的条件下,数据的特性可以满足无论明确的还是隐含的要求的程度[9]。数据质量是决定数据是否适合预期用途的基础,数据质量相关指标目前来说还没有统一的规范,研究目标、方向不同,数据质量评价的指标也不相同。结合数据质量标准以及国内外学者的研究,进行数据质量相关指标的比较分析,得出数据质量中依赖数据平台的11项指标,即准确性、完备性、精度、时效性、可理解性、可用性、可恢复性、保密性、可追溯性、权威性、开放共享性[10]。准确性表示数据能正确的去表示某个概念或事件的相关属性真实值的属性的程度。完备性是指与一个实体相关联的主题数据具有所有预期属性的值和相关的实例值的程度。精度具有表示数据精确或提供区分度的属性的程度。时效性是数据具有表征其正确寿命的属性的程度,超过时限的信息不仅降低价值,而且有可能是完全错误的。在特定的使用周境中,数据具有表征能被用户阅读和解释,可以用适当的语言、符号和单位来表达的属性的程度称之为可理解性。可用性是数据的一种重要特征,能被授权用户和应用程序检索的属性的程度。数据可以保持指定操作等级和质量等级的属性的能力即为可恢复性,由提交点、回滚等功能提供。在平台中,数据应该是只能被授权用户访问和解释的,并且在平台中用户被授予不同的访问权限,不会被非法入侵访问数据,这一功能靠数据的保密性来保障。数据来源权威性,数据采集具有长时间数据积累,具有数据规范的政府、各权威公司(如布瑞克)、高校等,增加数据可信度,提升平台价值。数据的可追溯性是数据采集到最终显示过程一整个数据链的逆向查询过程,在数据出现差错时及时找到问题所在。
2.3 数据管理
大数据时代的到来令数据管理的方式面临挑战与变革,数据的合理高效管理和科学应用是数据质量的前提与有效保障。在一个大数据平台中,数据管理水平的基本评价指标应该有以下几项:安全性、可运维性、可并行性、开放共享性、异构性、可视化水平[11]。首先从安全性上来说,指保护平台所用数据免收无授权操作而故意或偶然的共享、破坏、修改、泄露的能力。可以通过对访问数据的用户进行授权,分等级控制、监控数据被访问的情况等来进行数据安全的管理,保障数据管理的安全性,才能顺利安全地进行数据的开放共享。可运维性是平臺数据管理方面可以进行日常的运行及维护工作,为平台提供可靠持续的数据内容。可并行性是平台所管理数据可以被多用户同时共享并且不会产生任何紊乱,不影响数据质量的性能,可并行性是数据管理能力一个很重要的指标。开放共享性,按照统一的管理方式对平台数据进行有选择的开放共享,是实现数据跨组织、跨行业流转的重要前提,也是数据价值最大化的基础,有助于提升平台竞争力。随着大数据的高速发展,数据集成时要具有异构性,考虑到不同的数据格式、爆炸式增长的数据量,以便加强数据的安全性、完备性控制。数据最简短有效呈现给用户靠的是数据的可视化,旨在把数据资料以视觉化的方式表现出来。
2.4 平台技术水平
平台设计的技术水平的高低直接影响着平台的运行和维护,决定着运行和应用的持续时间,也是平台功能性的根本保障,将技术与产业实际结合起来才能发挥平台最大作用。平台的技术水平的评判选取了目标规划实现度、响应时间、资源利用率、规范性、先进性、开发效率及稳定性7个指标。目标规划实现度用于判断平台现状真实值是否达到或超过平台现状的期望值。响应时间是指从用户发出指令到网页被显示所用的时间,页面载入时间越短, 越受用户的欢迎。资源利用率是指平台对计算机、各种软硬件以及其他资源的利用程度。平台建设要规范,遵循相应的国际标准、国家标准以及运用数据库标准格式等。平台总体上的先进性,搭建平台时能应用目前先进的技术方法,包括体系结构,数据库,软硬件设备等。平台效率表示在规定条件下,相对于所用资源的数量,平台可提供适当性能的能力,其中资源包括其他系统平台、软硬件、以及物质材料等。并发性要求大数据平台应该能够进行高性能并发操作,可同时并行处理请求的能力尽量高,以满足尽量多的用户同时访问的需求。稳定性是保证用户随时访问利用平台资源的关键指标,系统升级、数据更新等不会影响平台的使用。
2.5 平台价值
整个平台价值的体现选取了四个指标:用户满意度、平台的可推广性、管理的科学性和经济效益(包括直接经济效益与间接经济效益)。用户满意度是指大数据平台建设成功之后使用者的感觉。用户满意的平台除了功能齐全、满足业务要求外,还应该具有对用户友好的人机交互界面,易学易用,视觉效果好以及平台提供的决策支持能力等。可推广性是大数据平台在农业中的应用是农业信息化进程一个关键的环节,成功的蔬菜产业大数据平台具有典型示范作用,可以引导其他企业、产业进行农业信息化有益的探索[12]。管理科学性指平台建设时是否融进了先进的科学管理方法和相应的管理保证机制,即组织保证、人员保证与制度保证。平台价值最重要的指标就是经济效益,社会经济活动中平台为使用企业、用户获得的经济收益和利益以及具有的社会效益就是平台的经济效益,通过平台的应用直接影响产业链各环节成本的降低和收益的提高。
3 总结与展望
蔬菜产业大数据平台评价体系框架研究是一项复杂而困难的工作,它所面临的问题涉及平台应用的方方面面,使蔬菜产业大数据平台评价体系更加完善,还需要长期的实践经验,需要丰富的科学理论做指导。本文在分析国内外大数据方面的包括网站、系统、平台等指标体系研究现状的基础上,结合了平台评价的原则,提出了以数据质量为核心的蔬菜产业大数据平台评价指标体系。为蔬菜产业大数据平台评价体系的理论研究与实践开展能提供一些理论上的建议与启迪,为其建设和发展贡献微薄之力。
通过对各行业中网站、系统、平台的评价研究中发现:要注意与将评价与具体项目联系在一起,理论与实践相统一;建立独立于平台使用者和开发者之外的第三方评价,将评价活动市场化,来增加评价的客观性;加强大数据平台对数据与平台技术的评价;将来可以开发出一套平台评价软件,专门对各种数据平台进行评价,实现平台评价研究作用于实践的最终目标。
通讯作者:柳平增
主要参考文献
[1][作者不详]农村农业信息化大飞跃 细读“十三五”全国农业农村信息化发展规划[J].农业工程技术,2018,38(3):14-15.
[2]柳平增.农业大数据平台在智慧农业中的应用——以渤海粮仓科技示范工程大数据平台为例[J].高科技与产业化, 2015 (5):68-71.
[3]李瑾,顾戈琦.基于“互联网+”的农业大数据平台构建[J].湖北农业科学,2017,56(10):1947-1952.
[4]闵文杰,陈建明,张仲义.信息系统评价指标体系及方法的研究[J].铁道学报,2000(5):37-41.
[5]肖敏. 我国政府数据开放平台评价指标体系构建及实证研究[D].郑州:郑州航空工业管理学院,2019.
[6]国家质量监督检验检疫总局.GB/T 16260.1-2006 軟件工程 产品质量第1部分:质量模型[S].2006.
[7]ISO.ISO/IEC25010:2011 Systems and Softaare Engineering-Systems and Software Quality Reguirements and Evaluation(SQuaRE)-System and Softaare Quality Models[S].2011.
[8]国家质量监督检验检疫总局.GB∕T 25000.12-2017 系统与软件工程 系统与软件质量要求和评价(SQuaRE)第12部分:数据质量模型[S].2017.
[9]孙俐丽,袁勤俭.数据质量研究述评:比较视角[J/OL].农业图书情报,2019(7):4-13.
[10]Abdullah N, Ismail S A, Sophiayati S, et al.Data Quality in Big Data:A Review[J].International Journal of Advances in Soft Com puting and its Applications, 2015:17-27.
[11]国家质量监督检验检疫总局.GB/T 36073-2018 数据管理能力成熟度评估模型[S].2018.
[12]范林强,柳平增.蔬菜产业信息系统评价指标体系探究[J].南方农业,2017,11(5):61-63.