2015年8月,国务院印发《促进大数据发展行动纲要》,2016年8月中国大数据产业生态联盟宣告成立。中国软件评测中心作为第三方测评机构,在联盟内作为其中的一个工作组。为了推动联盟的发展,我们积极地开展了第三批优秀大数据产品与解决方案测评。
截至2017年5月19日,大数据产品与方案质量保障工作组共征集到32家单位报送的20个大数据产品、14个解决方案以及12个案例。我们在产品方面重点关注的是这些产品是否有大数据的业务属性,首先是分布式存储或者分布式计算、大数据分析和挖掘的能力,另外是有安全性、兼容性、可扩展性等。对于解决方案,我们重点是关注这些解决方案是否是针对某些行业的特定业务需求做一些定制化开发,同时,他可能会去解决一些大规模数据的处理问题。我们也会从系统的架构去评判解决方案是否有一定的可扩展性和伸缩性,安全上是否有一定的防护能力。对于案例,我们会重点考量这个系统是否真正运行起来,是否取得了一定好的经济效果。
谈谈我们评审的一些关键要点。对于产品,首先该产品是一个市场上流通的产品,同时要有一定的大数据属性、有自己的著作权。我们国内很多产品可能是基于开源产品集成创新,或者某些方面做了更多的改进。对于解决方案,它至少包括两个以上的大数据产品或组件,有两个或者两个以上的自主知识产权,或者有自己的算法,有能力去解决行业的一些痛点,具有行业或领域特征。对于案例,要有具体的行业落地大数据系统,有应用规模,而且能很好地开展工作。
截止到第三批,我们累计认定了34个产品、22个解决方案和24个案例。第三批我们会发布9个产品、6个解决方案、10个案例。我们对过去三批产品做了简单总结,这三批产品主要来自国内很多大的集成企业。这些企业更多关注基础平台设施,它们基于国外的开源架构做一些平台整合,进而在平台上做开发和应用;有一些企业,围绕大数据全景图做一些数据收取、挖掘、转化的工具,以及内存的分布式数据库产品;还有一些企业,基于一些特定的行业应用需求,在大数据平台下做行业应用解决产品、通用的计算平台、分析平台等。
过去三批的解决方案,大部分都集中在政务领域或关系民生的领域。同时,在工业制造领域,以及电力行业也会有一些大数据解决方案。也有一些通用型的解决方案平台,比如一些算法的综合平台,以及一些基于安全特性的解决方案。
过去三批的案例,集中在政务、金融、旅游、教育、公安等领域。在一些传统信息化能力比较强的行业,大数据逐渐落地生根。接下来,大数据更多的是对应行业应用需求做落地。比如在公安领域,很多厂商围绕数据会有很多模型或算法,解决公安领域的刑事侦查需求。
通过总结,我们可以看到,我们的产品主要集中在开源平台基础上,大量产品是基于开源框架做的开发,基于开源技术做的创新。同时,还有一些行业的集成创新,比如电力反欺诈、切电行为分析,以及安全集中管控。此外,行業解决方案也在随着行业不断落地生根,比如税务行业和政务行业。目前,随着我们国家工业的转型升级,大量工业领域的案例在不断往前推进。
对于一些通用平台的评测,我们会按照软件的质量特性,分成功能、效率、信息安全、兼容性、可扩展性、可移植性等方面,对平台做深度的测评。对平台的功能、日志处理能力、图片流或数据流处理能力,以及分析的核心功能做验证。对平台支撑TBC标准的支持能力,以及跨数据库查询能力做兼容性的测试。这也是我们进一步对一些核心产品做深入测试的工作之一。
我们也会看到一些不足之处。第一方面,技术创新与支撑能力仍需加强。在基础设施平台上还主要以集成开源的产品为主,数据分析方面也主要依赖开源的算法库,期待更多的自主大数据产品。
第二方面,大数据产品的成熟度有待提高。有些产品在功能完备性、易用性、可靠性等指标以及用户使用规模和普及性等方面还需要进一步完善。我们看到一些产品的应用性和成熟度不是很高,系统使用过程中可能有不稳定的情况。
第三方面,系统效率未得到足够的重视。在性能效率方面,很多产品缺乏测评结果数据,还有很多的优化空间。对于大数据分析处理平台,效率逐渐成为大家关注的焦点,现在很多企业逐渐去关注,并能很好地使用这个平台,很多企业逐渐在效益方面做更好的优化和升级。
第四方面,大数据安全还未引起重视。系统的安全运维管理以及技术保障手段还有待进一步增强。大家可能共同关注安全,比如在政务领域,国家推进政务资源的共享,在技术管理上可能会有新的挑战。
我们评测中心近期会发布大数据生态共享平台,我们会把所有评测或者评选过的产品解决方案和案例,统一监管到这个平台上。希望通过这个平台能够对产业生态起到促进作用。endprint