薛双
摘 要:信息技术的持续创新和广泛应用,推动科学研究进入大数据时代,既给高校科学研究管理带来了新机遇,也提出了新挑战。新技术理念的出现需要新的管理思维,通过分析科研数据管理出现了哪些新的特征,在充分了解大数据管理的基础上探讨在当前环境下高校科研管理模式革新的新思路,对未来科研数据管理的研究方向做进一步思考。
关键词:大数据; 互联网; 科研数据管理
引言
科研数据作为对自然,社会现象和科学实验等活动的定量记录,是科学技术发展的重要基础。科学研究和商业在内的各个领域已被推向前所未有的“大数据”时代,能够可视化日益庞大和复杂的数据,是科学研究必须适应的一个新事实。高校作为科研前沿,积累了大量的科研数据。如何在如此大量的信息中有效管理科研数据是科研管理的重中之重。
1大数据时代科研数据管理新特征
1.1 形式多样化
大数据时代,科研数据的来源不再是单一的文本数据,而是变成了视频等各种形式的多媒体数据。随着信息化程度的不断提高,各种非标准化数据的比例会越来越高,传统的关系数据库对数据结构的一致性要求越来越高,无法处理如此庞大的混合数据集。大数据技术将使用更先进的信息技术对元数据进行打包、分类和过滤,以获得过去未被注意到的细节和新发现。例如,新兴的分析工具Spark是一个在大数据时代快速处理数据分析的框架。它易于操作,不需要用户的任何编码知识。一些大型软件供应商(如Microsoft和Salesforce)引入了新的分析工具:Microsoft R Server和Lightning CRM平台,非编码器也可以创建应用程序来查看数据。
1.2 重视关联性
在传统数据时代,我们获得的数据少、结构单一。使用传统的数学方法,便可以计算出数据之间的因果关系。然而,在大数据时代,数据体量大,结构复杂。研究人员可以从多个方面,视角和领域分析实验数据,并探索研究对象之间的相关性,而不只是对设计实验的痴迷和验证假设。当然,关注关联性并不意味着放弃传统的因果关系研究,大数据技术主要处理具有相关性的过程数据。
1.3 预见新趋势
传统的科研小数据因果关系的研究资料非常简单,实验结果因缺乏多元化的数据来补充的限制,因此实验结果缺乏扩展性和可持续性。在大数据时代,未来形势的预测是科研数据的最重要的研究。只有不断补充数据和不断丰富模型,才可以预测地更准确,为高校科学研究管理做决策判断、出台文件政策提供科学合理的依据。大学如何使用这些数据来产生有价值、有意义的科研成果;如何利用这些数据来预测未来科研发展方向是一个亟待解决的问题。数据挖掘是近十年来信息科学领域备受重视的交叉学科,这门学科兴起的因素之一就是能分析过去、指导现在、为未来作决策分析。
2大数据情境下科研管理模式革新
2.1完善高校科研管理数据库
高校应该主动迎接大数据时代的到来,准确和真实的研究数据库是一个重要的基础和前提,为实现科研管理的变化。高校和科研院所可整合科研管理系统,以方便内部科研管理,但仍有待提高许多领域。在不同的高校采用不同制造商的系统将导致不同的科研情况和系统使用情况,以及不同的数据准确性之间的数据兼容性。今后各科研系统要尽量实现数据的标准化,维护人员更新及时、保证数据准确性才能推动大数据时代建设科研管理的基础变革。
2.2构建科研数据交流与分析平台
目前,高校科研管理的数据库作为科研数据的第一手资料,但考虑到数据安全与数据所有权益等原因,机构内的共享平台,基本未实现开放共享,从而限制了科研数据获取利用。
2.3 可视化应用
可视化通过提供统计或交互式视觉表现的软件系统来帮助人们探索和解释复杂的数据,它能有效简化提炼数据流,帮助使用者交互筛选有用数据。大数据时代的可视化不同于以往,现今主要是基于并行算法设计技术,高效地处理和分析特定数据集的特性,直观的可视环境也方便了科研管理人员可从纷杂无序的数据中解脱出来,寻找新的研究切入点。多屏显示可视化环境通过高速网络连接的图形服务器驱动显示器墙阵列,实现大运算量的并行计算和超高分辨率的显示的功能,它能从多方面增进研究人员探索的工作效率,促进更好地进行空间思维、促进科研人员之间的沟通。例如:高分辨率的地理航拍图像是其中一个优势应用,基于SAGE环境下的JuxtaView软件以及其并行环境,可快速显示由多块高分辨率图像组成的地理航拍数据显示,目前得到了广泛应用。
2.4 个性化、专业化服务
数据不仅可以通过被收集,存储,组织和分析等手段让研究人员找到研究学科发展的规律,捕捉自己的研究方向;也可通过个人终端的研究项目和研究团队的信息,了解各研究时间和项目的进度;甚至每个研究者的思维态度,能力和方法都因此而有迹可循。科研数据管理者可由此及时、准确地为研究者提供所需要的各种资源、指导和帮助,使高校科研管理真正实现精准服务。
3科研数据管理面临的挑战
3.1 数据计算方法需优化
从系统角度看待科研数据处理,未来计算的研究方向主要包括以下几个方面:批量计算主要考虑的是针对典型应用进行定制化的性能优化,解决数据计算中的存储瓶颈问题;流式计算后续的研究要设计并优化流式计算中的资源调度策略,同时实现数据流速高时处理速度快和数据流速低时能耗低两个目标。这些计算模式并不是相互独立的,也可以相互配合,满足同一应用范式在不同阶段对数据计算结果的要求。
3.2 专业人才缺乏
高校科研管理部门利用好现在和未来的海量数据、海量技术,需要专业性的数据人才,这些专业人才对科研数据资源的成功管理和利用起关键性作用。他们需要具备利用快速变化的网络技术和数据技术的能力,参加相关的教育和培训活动,以便使用和管理这些科研数据。高校可通过开设数据科学相关的专业和课程对科研管理人员进行专业培养,促进数据科学理论的发展,加快人才队伍的建设。
3.3 数据的安全和隐私问题
信息技术中,数据的安全和隐私一直是重中之重。随着数据量的增大,数据面临更严峻的安全风险和威胁,科研管理部门需要制定相应的安全访问策略,确保数据访问的授权和安全。数据的隐私问题包括两个方面:一是个人隐私的保护,随着数据采集技术的发展,在用户无法察觉的情况下,个人隐私信息可以被更容易地獲取;另一方面,即使得到用户的许可,个人隐私数据在存放、传输和使用的过程中,也有被泄露的风险。因此,大数据时代的隐私保护或将成为新的命题。
结论
大数据时代的到来,给高校科研数据管理工作带来了挑战,为顺应时代发展,高校科研数据管理工作必须不断进行完善。高校需要优化数据计算方法、加强科研人员队伍的建设、提升高校科研发展水平、对高校科研数据的安全和隐私问题加强重视并提高相应的监控手段,更好地促进高校科研数据管理工作的发展。
参考文献
[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维大变革[M].盛杨燕,周涛译.杭州:浙江人民大学出版社,2013.
[2]CODATA中国全国委员会.大数据时代的科研活动[M].北京:科学出版社,2014.
[3]邢文明,吴方枝,司莉等.高校图书馆开展科研数据管理与共享服务调查分析[J].图书馆论坛,2013(6):19-25,61.
[4]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014(3):11-16.
[5]杨鹤林.从数据监护看美国高校图书馆的机构库建设新思路——来自 DataStaR 的启示[J].大学图书馆学报,2012(2):23-28.
[6]李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报,2011(5):46-52.
[7]唐燕花.高校科研数据管理服务实践研究及建议[J].图书情报工作,2016(24):130-138.
[8]胡绍君.面向科研数据管理的高校学科馆员能力建设研究[J].图书情报工作,2016(22):74-81.