赵兴刚,邓志龙,庄绪强
(陕西青年职业学院 陕西西安 710068)
【法律与社会】
大数据环境下西安社科信息平台建设探析
赵兴刚,邓志龙,庄绪强
(陕西青年职业学院 陕西西安 710068)
本文从大数据背景下社科信息平台建设的现状出发,结合当前信息平台研究基础,提出西安市建设社科数据平台的原则、路径与目标及其具体建设方案,以实现社科数据信息资源共享,促进西安社科研究发展与繁荣。
大数据;社科信息平台;共享
当前,大数据的应用和发展已经影响到当前社会的每一个角落,但是由于社科信息大数据大部分掌握在政府、科研机构以及部分高校中,信息共享程度低。加之由于社科数据信息量大、各种类型数据混杂,仅靠单一的社科研究机构或个人都比较难以完成。同时因为政府、科研机构和部分高校的技术应用水平参差不齐,从而导致了数据处理水平不同,信息应用水平还较为低下,根据研究显示,社科信息在此方面更为突出。要解决社科信息在共享和应用方面存在的这些问题,就需要社科类信息的高度共享、信息处理工具技术的深度整合以及信息处理研究人员的跨界合作,因此,当前大数据环境下就非常有必要构建社科信息资源平台。
社科信息资源共享平台的构建,不仅可以满足当前大数据环境下民众对社科信息的需求,也可以更好地为政府、科研机构以及高校对社科信息的查询和处理,同时也会为社科信息大数据应用和相关产业的发展奠定坚实基础。社科信息平台的建设,也为社科信息的收集、整理和分析更加有效、及时和准确,从而更好的为政府、高校和科研机构服务。结合传统互联网、移动互联网、社交网络以及当前快速发展的物联网采集到的各类社科动态数据,社会的“数据画像”将更加准确,社会行为分析和预测也将更具有洞察力。
当前,国内一大批社科信息网已经成功投入运营,如中国高校人文社会科学信息网,简称社科网(www.sinoss.com),主要致力于服务人文社会科学研究、服务社科研究管理、服务人文社科资源及成果推广应用。中国社会科学网(www.cssn.cn)以“中国哲学社会科学优秀成果的观点发布平台、全球学术资讯的权威集散地、中国学术走向世界的重要桥梁”为发展定位,致力于打造全球最大的学术门户网站。这些社科信息平台的建设,使得当前的社科文献资源得到了有效的保护和利用,意义重大,但是也必须清醒的看到,当前大数据环境下社科信息资源平台建设还不够完善,主要存在下述问题:
1.法律制度不完善,体系标准不统一
(1)法律制度不完善。在信息资源平台建设方面,目前法律法规尚不健全,甚至很少涉及该领域,从而导致政府、高校、科研机构以及企业在数据资源共享方面缺乏依据。
(2)体系标准不统一。在信息平台的建设过程中,各地方政府、研究机构、高校联盟等各自为营,以自身实际情况为基础,满足自身需要为目标,建立大量形态各异的社科信息资源平台,缺乏数据开放共享标准,并且造成了严重的资源浪费。
2.缺乏共享意识,倒挂现象频现
(1)共享意识淡薄。受传统意识的影响,各级政府、科研机构、高校以及企业等部门数据共享意识淡薄,各自为政,甚至认为数据共享对自身而言是一种损失。因此,无论从思想上还是行动上都无法适应当前大数据时代的要求,信息平台能够发挥的价值也就微乎其微。
(2)倒挂现象普遍。各级政府及科研院所内部支持数据资源的行程,但是因为共享意识淡薄,大量的数据资源无法实现共享,平台数据量不断增加,从而导致倒挂现象频繁出现。
3.重复建设现象严重,系统数据兼容性差
(1)重复建设现象严重。因为各单位信息化水平参差不齐,不同行业单位因为信息化水平的不同,信息平台建设水平也不相同,基础设施建设混乱,分散建设、重复建设现象比较严重,不同机构之间存在较多壁垒。
(2)系统数据兼容性差。当前,各类信息平台种类繁多,不同的机构因自身条件不同,采用不用的信息化平台来满足自身的需要,这些平台因为没有统一的开发标准,系统数据库无法兼容,具有较强的独立性,从而制约了信息平台的融合,社科信息平台的建设更是如此。
1.可行性分析
随着互联网技术的不断发展,大数据的不断融合,信息平台的作用不断凸显,完善的社科信息平台的建立,有利于整合整个西安乃至陕西地区的社科研究力量,同时社科信息平台开发信息资源共享程度和对社科信息的利用水平,直接影响着西安地区社科研究水平,合理有效地利用这些社科信息,将有利于促进区域经济社会发展。
(1)技术可行性。在建设社科信息平台前,要结合当前大数据环境,从技术角度考虑平台建设可行性,要对实际情况进行详细分析,在此基础上制定详细建设方案,并运用相关体系对建设方案进行评估。近年来,互联网技术发展迅猛,已经影响到社会各个领域,互联网科技的迅猛发展,不断提高了人们生产生活的效率,大大节省了成本,这些都有效的推动了社会的不断向前发展,社科信息平台的构建,就是将传统社科信息进行数字化,通过数字化的管理,加上科学系统的辅助,一个完整的社科信息平台就得以建立,通过网络平台的传播,就可以实现社科信息资源的共享。由此可见,计算机技术和网络技术的不断成熟发展,都为社科信息平台的建立奠定了良好的技术基础。
计算机硬件技术的不断提升,为社科信息平台奠定了技术基础。首先,计算机中央处理器运行速度的不断提高,不仅可以满足传统数据的信息共享,还可以满足大型数据库的处理要求,从而实现对多媒体内容实现共享,从而进一步提高社科信息平台的利用水平,满足社会各阶层的需要。其次,伴随着存储容量的不断提升,可以满足社科信息平台资源库的需要,NAS(Network Attached Storage)和云技术的出现,可以更好的保障社科信息平台数据存储的需求。第三,伴随着网络带宽技术的不断提升,已经完全实现光纤到桌面,这不仅可以满足社科信息平台用户对多媒体信息的需求,也可以满足普通用户上网带宽的需求,这都为社科信息平台的建设奠定了良好的基础。
社科信息平台建设完成后,信息安全是不可忽视的问题。当前,信息安全技术已经得到了广泛的发展,数字认证、入侵检测和防火墙技术都是目前应用广泛的信息安全防范技术。如通过内外网隔离技术可以保证信息共享平台内部网络的安全;通过身份认证技术可以保证数据交换过程中的信息安全,通过防火墙技术可以防止外部网络对内部网络的非法访问,从而降低内部网络受到外部网络攻击的可能性,保证信息共享平台的安全运行。
(2)经济可行性。社科信息平台的建设是以大数据为基础构建的信息资源共享平台,信息服务过程是一个漫长的不断变化的过程,需要大量的建设和维护经费,因此建设初期就应该对经济可行性进行具体分析,从而保证平台的长期运行。
社科信息平台的建设成本主要是建设初期软硬件资源的成本、人力成本、传统社科信息数字化的成本以及平台应用培训成本等,建设完成后主要是平台运营成本。平台建设完成后可以通过社科信息资源共享来为政府、高校、研究机构以及普通民众提供“一站式”服务,方便每一位平台使用者高效、快度、便捷的获得社科信息资源,减少使用者的成本消耗,提高工作效率,同时也实现了对资源的有效利用,并且服务品质也得到了大幅提升,因而可以为相关使用单位带来明显的经济和社会收益。由此不难看出,在大数据的基础上构建社科信息资源共享的平台,在经济效益上具有可行性。
2.必要性分析
(1)有利于提高数据共享意识及数据利用率。社科信息平台的构建,可以促进社科信息的有效整合,实现高度集中和共享,从而方便适数据使用者更加便捷高效的获得相应的信息,从而消除时间、空间以及人群之间的差异。社科信息平台的构建,还有效突破了传统模式下信息封闭的状态,避免了不同机构重复建设信息平台的成本,提高了资金的利用率,实现了不同机构间信息的互联互通。通过社科信息平台的信息共享,实现社科数据信息的快速准确查询,可以为政府提供决策大数据支持,有效提高政府工作效率。社科信息平台的建立,还不断提高了信息的附加值,使得社科信息资源得到充分广泛的整合和应用,从而在很大程度上促进数据增值产品的产生。
(2)有利于社科机构开放资源信息的共享。根据相关研究显示,我国现阶段八成以上的社科信息资源都在相关研究机构的掌握之下,大量的信息资源得不到合理的应用,长期处于闲置状态,诸如大量的信息是以文档或者网页的形式分散存放在相关社科机构的电脑或者局域网中,缺乏与互联网的联络,无法将庞大的数据提供给使用者。同时,因为社科机构的独立性,不同社科机构拥有独立的网、络系统,导致了社科信息资源各自处于封闭状态,分散的社科信息资源亦缺少有效的整合、共享,所以社科信息资源的共享、同步、利用都比较困难。
通过社科信息平台的建立,可以将不同机构分散的社科信息有效的进行整合,从而实现大量社科信息的标准化传输,扩大社科信息的共享程度,降低管理成本。
(3)有利于满足社会各阶层的需求。社会各阶层是社科信息平台服务的对象,主要包括政府、企事业单位、科研机构、高校以及普通民众等,社科信息资源共享平台的建设可以较好的满足社会各个阶层对社科信息的需求,提高数据的利用率。
1.建设原则
(1)可持续性原则。在当前大数据环境下,社科信息平台的建设必须满足开放性和扩展性的原则,平台建设维护过程中要不断更新技术手段从而实现平台的可持续性发展,同时也要不断采纳广大用户的意见建议,不断提高平台的可用性和易用性。平台在使用过程中,用户也可以根据自身意愿实现对优质资源的上传,同时对已存在的资源进行评价,从而实现良好的互动。
(2)跨平台应用原则。社科信息平台的构建,必须要满足不同操作系统、不同终端、不同文件格式的应用,实现良好的兼容性,从而更好的实现不同机构、人群间社科信息的同步、共享、更新,从而实现对社科信息的最大化利用。
(3)安全稳定性原则。社科信息平台的建设主要是实现信息资源的高效共享,进而实现对外的提供良好的信息服务,因此必须保证信息平台的高效、安全、稳定运行,伴随着当前网络安全技术的不断发展,一定要制定详细、合理的技术方案来保证系统的运行,同时,也要不断采用新的技术和高可靠性的软硬件来提高系统的可靠性。
2.建设目标
大数据环境下社科信息平台的建设主要是以海量互联社科信息的共享为目的,并以平台为基础,将传统的社科信息资源结构进行重新调整,从而具统一的、便于检索和使用的资源访问点,使社科信息资源的应用更加便捷、高效。为了实现不同类型的社科信息的工作,满足大数据环境下社科信息的流通需要,实现信息资源共享,从而更好地解决不同机构间的信息孤立的局面。通过建设一个便捷、独立的社科信息共享平台,需要使用统一的技术环境来支撑,从而实现服务的信息化、网络化,保证信息资源的安全。为了实现这些具体目标,社科信息系统需要满足一下要求:
首先,要不断提高服务效率,改变传统的、落后的人工操作、手动检索的模式,从而不断提高服务质量。基于大数据社科信息平台建立完成后,信息需求方可以通过任何终端在任何时间不受地理位置限制方便的使用社科信息平台,从而大幅度降低成本。
其次,要不断整合现有的资源,由于我国信息资源开放平台建设起步较晚,社科类信息平台起步更晚,从而导致了各社科信息研究存储机构资源建设封闭、分散,通过基于大数据的社科信息资源平台的建设,可以更好的整合这些资源,增加资源的开放性,提高信息资源服务性。
最后,要实现信息服务的延展性,传统的社科信息平台虽然也能提供信息相应服务,但是相比大数据下的社科信息平台可以提供海量存储、多用户并发访问等特点,其服务受到了很大的限制,管理和使用都不够便捷,无法提供“一站式”服务,通过建设基于大数据的社科信息平台,可以较好的延展社科信息的服务。
3.架构设计
社科信息平台的建设,应该以政府管理、调配为主,通过联合各部门、各区域的业务,来实现西安市内的社科信息资源的调整和重构,同时利用现有网络设备和共享数据存储设备,将分散在各单位、部门的数据整合在一起,遵循相同的技术标准和规范,从而满足西安市用户需要的社科信息平台。
基于大数据的西安社科信息数据平台从系统结构上可以分为服务层、协议层、数据层和硬件层,硬件层是整个数据平台的基础,为其它三个层次提供服务,其它三个层次之间互不干涉,下层为上层提供服务,上层使用下层提供的服务,各层之间修改不影响其它层次,各个不同的子系统组成了统一的信息服务平台。
(1)硬件层。社科信息平台的硬件层主要包括服务器、存储设备、网络设备等,为信息平台提供硬件基础。
(2)数据层。数据层主要包括图书馆社科信息资源、社科研究机构研究数据、社科研究者上传研究信息数据等建立的资源库,通过统一认证的中心数据库来建立索引或者存储,来统一实现社科信息资源的存储和共享。
(3)协议层。协议层的主要作用是社科信息平台提供方便的接入标准,通过标准为用户提供统一的服务窗口,这是社科信息平台数据共享中最为重要的一个层次。通过统一的协议,将系统资源服务、系统信息集成以及现有的、孤立的信息平台联合起来,形成一个大数据状态下的社科信息平台,从而满足用户对社科信息和社科文献资料的使用需求,同时,该层次还为不同的用户提供统一的访问权限设置。
(4)服务层。服务层使用下三层提供的服务,直接面向用户,通过对不同类型的社科信息的加工、处理、编排目录以及权限设置等,调配下三层资源对用户提供服务,从而实现对分散数据的统一整合,满足用户对数据的访问、查找、筛选等操作,实现高效的社科信息服务。
4.功能设计
(1)信息管理功能。该功能主要实现信息标准化管理和多数据源管理等功能,前者指不同的社科信息存放在不同的信息资源库中,可以实现相互自由转换,实现数据信息的统一,实现数据集成。后者主要实现在不同的服务器间连接数据源,通过不同的权限控制来进行数据流的控制,从而实现数据类型之间的转换。
(2)数据采集和审批。数据采集部分主要包括数据采样和数据填报两部分组成,前者通过专业换的抽取工具,通过数据库管理接口实现对数据源的链接,从而实现对不同类型数据的自动采集,同时可以实现数据的自动导入和手工录入,从而实现数据对数据的大规模采集功能。
数据审查主要是保证数据的质量,从而实现对数据的准确分析和统计,并使用多种防护技术,如数字签名来实现数据采集的合法化。
(3)数据查询和分析。大数据下的西安社科信息平台通过采用智能化的平台信息综合查询系统,根据不同的数据报表、数据多重分析、数据预测调差等多种方式,实现对数据综合查询和分析功能,并且进一步实现对数据的增值利用。同时,该子系统还包含数据信息公开发布功能、数据信息综合查询功能、数据信息导入导出功能、信息打印功能等。
(4)数据交换。大数据下西安社科信息平台可以实现不同数据之间的交换和资源的整合,支持多种数据录入方式,既可以自动完成也可以手动录入,从而解决不同社科研究部门对数据的采集,同时也满足不同数据标准、不同数据存储之间统一实现一体化的信息服务。使得数据的统一和运用更加方便,同时在开放信息的前提下,拓展和补充各部门的个性化设置,来适应业务的需要。
(5)任务管理。从操作方面来看,调配任务引擎所必须的执行工作包含:第一开启抽取工作流,第二点击一个服务连接,第三在开启另一个审查工作流再调动一部分程序内容。所以若需要调配任务引擎就要有大量的接口相辅助,从而适应各行业的应用需求。从工作层面看,系统中存在大量的需要定时执行的操作。从应用层面看,调配任务的内容包含任务安排、执行时间控制、调配执行和工作监控等功能。
(6)信息安全控制。信息安全系统的发展对使系统更加平稳,使数据更加完整和安全有大的影响。整体主要的数据查找和系统处理的安全性管理主要包括进入权力的管理、使用体验者的管理等内容,相对分开,与数据资源交流平台其他系统整合,实现整体化。主要包括数据安全、服务器安全、网络环境安全、桌面安全和安全控制等。
大数据下的西安市社科信息平台的建立是一个非常现实的问题,随着各地区和部门信息化水平的不断提高,信息基础也日臻完善,各社科部门和组织都拥有越累越多的社科数据资源,如何实现不同部门和组织之间的数据共享交流和提高数据的利用价值是本平台研究的主要目的。本文通过探讨研究现状、平台建设分析以及平台建设设计,给出了一套完成的大数据下西安社科信息平台建设思路,希望能为西安市社科信息平台建设提供支持。
[1] 张瑾.科技信息资源共建共享平台构建研究[J].图书馆学研究,2012,13:41-46.
[2] 龙健.政府基础信息资源跨部门共享机制研究[D].北京大学,2013.
[3] 丁玉成.大数据时代县区统计部门间信息资源共享策略研究[J].企业改革与管理,2015,06:192.
[4] 徐晓日,李思聪.大数据背景下政府信息资源共享问题研究[J].长白学刊,2015,06:57-61.
[5] 王书伟.大数据时代政府部门间信息资源共享策略研究[D].吉林大学,2013.
[6] 张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013,S2:216-233.
Analysis of social science information platform construction inXi’an under large data environment
ZHAO Xing-gang,DENG Zhi-long,ZHUANG xu-qiang
(Shaanxi youth,Career Academy,Shaanxi,Xi’an 710068)
the present situation of the construction of social science from the background of big data information platform,combined with the current information platform based on the proposed construction of Xi’an social science data platform principle,path and objectives and specific construction plan,in order to achieve the social science data sharing of information resources,promoting the development and prosperity of Xi’an Academy of social sciences.
big data;social science information platform;sharing
2017-6-20
西安市2017年度社会科学规划基金项目
赵兴刚,(1963-),男,陕西合阳人,陕西青年职业学院教授,主要从事高职教育教学与研究。 邓志龙,(1976-),男,陕西岐山人,陕西青年职业学院数字信息技术系讲师,主要从事计算机科学教学与研究。 庄绪强,(1979-),男,山东莒南人,陕西青年职业学院数字信息技术系讲师,主要从事网络技术与网络安全教学与研究
17X13
A
1674-2885(2017)02-81-05