文/中国科学院信息化工作领导小组办公室
中国科学院北京100864
中国科学院科研信息化回顾与展望*
文/中国科学院信息化工作领导小组办公室*
中国科学院北京100864
编者按进入21世纪以来,与信息化在全球的迅猛发展同步,科研信息化正在引发科学与工程的变革。中科院近年来与政府、高校以及其他研究机构合作开展联合攻关在该领域取得了诸多进展。为进一步探讨科研信息化支撑科技创新的模式,本刊特设“科研信息化”专栏,从科研信息化的宏观发展战略、国内外发展态势、对科技创新的重要意义和作用以及科研信息化如何支撑科技发展等方面进行深入探讨,并提出科研信息化未来发展战略及应对措施。
文章阐述了科研信息化的内涵、战略意义,分析了国外科研信息化态势,回顾了中科院科研信息化发展历程中的标志性事件,分析了目前的科研信息化发展态势,重点介绍了“十二五”期间的科研信息化发展战略及主要措施,系统总结了科研信息化实践经验,对中国科研信息化提出了一些建议。
信息化,科研信息化,云计算,大数据
DOI 10.3969/j.issn.1000-3045.2013.04.006
1.1 科研信息化的内涵
人类社会的不断进步对科学研究提出了越来越高的要求。今天,科学研究的前沿正在从微观和宏观两个方向上向着未知的领域大踏步地前进,进入一个更加复杂深奥的世界,对科研方法和手段也提出了新的挑战。科学研究的对象已大大超越了简单的孤立系统,正向着大范围、多领域的复杂系统工程进军。在这个信息爆炸的时代,科研活动之间的交流、科研信息的获取和处理都在发生着许多新的情况和新的问题。随着信息技术的发展,传统的科学研究方法已经不能满足需要,必须革新[1]。
科研信息化(e-Science)的概念最早是在1999年由英国约翰·泰勒(John Taylor)博士提出,“e-Science就是在重要科学领域中的全球性合作,以及使这种合作成为可能的下一代基础设施”。我们认为,科研信息化究其实质是科学研究活动本身的信息化,其特征是充分利用网络信息基础设施与技术、促进科技资源交流、汇集与共享、变革科研组织与活动模式、推动科技发展转型的历史进程[1,2]。
1.2 科研信息化的战略意义
近年来,各国为提升国家实力,增加科技创新动力,纷纷提出了信息化发展战略。大量数据中心的建成、高速传输网络的互通、超级计算机性能的不断提升、云计算技术带来的变革等对各行各业的影响与日俱增。
党的“十八大”明确提出当代中国坚持走中国特色新型工业化、信息化、城镇化、农业现代化道路,并明确到2020年全面建成小康社会时,要达到工业化基本实现、信息化水平大幅提升的目标。近年来,我国信息化发展速度远超预期,成绩斐然。在工业、农业和服务业信息化,社会领域(如电子政务、传媒、交通等)信息化,科研信息化,教育信息化,国家信息安全保障体系建设以及提高国民信息技术应用能力等方面都取得了一系列突破性发展。
中科院党组高度重视科研信息化工作。中科院院长白春礼认为:“要进一步认识信息化对科技创新活动、科研范式转变的深刻影响”[3]。
科研信息化是提高科研水平和创新效能的必由之路,是迈向新一轮科技革命的必经之途。
“科研信息化”的概念自提出后,在世界范围得到了高度重视。综合21世纪以来的国际科研信息化发展,当前国际科研信息化发展呈现以下态势:
(1)科研信息化已经成为发达国家持续推进科技竞争力的关键手段。世界各国纷纷制定国家层面的科研信息化发展战略,持续投入大量资金提升科研信息化基础设施能力,促进科研模式的变革,实现科技创新跨越。美国国家科学基金会(NSF)推出一系列规划,予以持续推进。2011年4月,NSF正式发布《面向21世纪科学与工程的网络基础设施框架》(简称CIF21)规划报告,其实质是美国版的“十二五”国家科研信息化发展规划。欧盟在科技发展计划第五、第六和第七框架(FP7)的持续支持下,科研信息化基础设施得到不断发展,逐步形成了明晰的e-Infrastructure架构[4]。2012年2月21日,FP7支持的“信息化基础设施标准和互操作性实施计划”(SIENA)发布了《欧洲e-Science分布式计算基础设施路线图》,确定了为采纳基于开放标准的可互操作的网格与云计算基础设施所需解决的问题。
(2)科研信息化基础设施的发展不断加速,发达国家投入巨资以保持领先地位。高速科研网络向着更高的带宽、高可靠性与个性化的服务方向发展。美国能源部科学办公室支持的高速科研网络能源科学网(ESnet),是一个为数千名科学家和全世界的合作者服务的高速网络。ESnet率先提供高带宽可靠连接,使国家实验室、大学和其他研究机构的研究人员彼此进行联系,利用所需要的合作能力,致力于重大的科学挑战。2011—2012年ESnet已将带宽升级至160G—400Gbps。
高性能计算的峰值计算能力突飞猛进,P级计算屡见不鲜,即将进入百亿亿次计算时代。欧洲先进计算合作伙伴(PRACE)计划部署了一个泛欧peta-scale生态系统,并计划至2020年达到exa-scale的运算性能。国际Top 500组织2013年6月17日公布的最新全球超级计算机500强排行榜,中国国防科学技术大学研制的“天河二号”以每秒33.86千万次浮点运算速度,成为全球最快的超级计算机。
目前全球范围内的科技数据共享蓬勃发展,存储能力快速增长。美国国家高性能计算应用中心(NCSA)的海量数据归档能力在2011年达到500PB。
(3)当前科技创新呈现交叉、开放、协作的新特点,科学研究的复杂性、多学科、国际协作特征显著,越来越离不开科研信息化的融合性发展。以基础学科高能物理领域研究为例。大型强子对撞机(Large Hadron Collider,LHC)横跨瑞士和法国,是全球最大的科学设施。2010年3月30日LHC正式运行之后,全世界成千上万的科学家都希望能访问并分析其实验数据,于是欧洲核子中心(CERN)与相关各方共同打造了一个分布式计算和数据存储的基础设施——LHC计算网格(LCG),这是当今世界上最大的网格计算环境。由LHC实验产生的数据经过原始处理后,在计算网格全天候运行的支持下分布式存储到欧洲、北美和亚洲11个顶尖研究中心,再从那里分散到世界各地上百所研究中心,由全世界多位物理学家合作处理由LHC产生的实验数据。LCG针对高能物理计算需求而建立,同时扩展应用于生物、大气等其他科学研究领域,已成为一个科学研究的通用计算平台。目前,LCG已连接起36个国家的170多个计算中心,可为全球8 000多位物理学家提供对每年产生的25 PB的LHC实验数据的实时访问及相应的数据处理能力[5]。
(4)信息技术在科研中得到越来越广泛的应用,科研信息化已进入了以云计算和大数据为特征的新阶段。以大数据、云计算为代表信息技术的深入应用有力地推动了科研信息化的纵深发展和横向融合,同时不断涌现新的科学技术问题,更有力地推动了信息技术本身的创新。
2009年,IT界提出的云计算兴起后,引起了科研界的极大关注,国内外许多科研机构尝试用不同方式来利用云计算从事科研工作,包括利用亚马逊等提供商的商业云服务或自建“科技云”等。欧盟在2011年8月提出《欧洲科学云计算基础设施战略规划》,提出了2020年欧洲科学云基础设施的发展愿景。届时欧洲所有学科的科学家将优先选择这一基础设施进行数据存储、访问、处理和分析,它将拥有海量数据、开源工具以及可从任何计算机、智能电话或平板终端访问和使用的无限计算能力。2012年3月29日,美国政府推出“大数据研究与开发计划”,旨在提高从海量数字数据中提取知识和观点的能力,从而加快科学与工程发现的步伐,加强美国的安全,实现教育与学习的转变。由此,大数据进一步吸引了全球科技、经济界的关注。
3.1 中国科学院科研信息化的发展
1986年,中科院高能所与欧洲核子中心开始了计算机远程互联的实验,并于1987年实现了电子邮件通信。1994年5月,中科院开始了基于x.25的“百所联网”工作。1996年,中科院负责的“中关村教育与科研示范网”项目发展成为中国科技网。1996年5月中科院成立“信息化工作领导小组”,时任中科院副院长路甬祥任组长,信息化专家顾问组同期成立。1996年,开始制定全院层面的信息化规划,规划中提出了建设数字化中科院的目标。1997年6月,在国务院信息化领导小组和主管部门的支持下,网络中心建立了承担全国互联网域名管理的机构“中国互联网络信息中心”。
2007年9月,中科院提出构建中科院超算三层架构体系。2009年4月24日,中科院超级计算中心新型百万亿次高效能计算机系统“深腾7000”投入实际使用。同年7月13日,时任中共中央政治局委员、国务委员刘延东视察中科院计算机网络信息中心,指出“要把科研信息化作为科技现代化的必由之路”。12月,中科院数据资源中心建成2.3PB存储环境。2011年6月3日,中科院院党组通过了“十二五”信息化发展规划[6],明确提出要引领中国科研信息化发展,逐步建成信息化中科院。
3.2 中国科学院科研信息化发展态势
为引导中科院院属各单位信息化工作,不断提升应用水平,有力支撑科研与管理创新,中科院信息化工作领导小组办公室自2008年起每年组织开展全院范围内的信息化评估,评估范围包括信息化管理、信息化基础设施、科研信息化应用、管理信息化应用、教育信息化应用和网络信息安全等主要方面。
根据2008—2012年的信息化评估数据[7],院属各单位的信息化建设和应用水平得到有效提升。其中,科研信息化的平均分数自2009年开始呈逐年递增态势。与2008年相比,2012年科研信息化平均分数上升幅度为56%,涨势明显。科研信息化2012年的发展态势是:院属各单位在科研信息化应用建设方面发展迅速,进步明显;信息化基础设施建设不断完善,维护和使用效率达到了较高的水平。
具体来看,2012年中科院在科研信息化方面得分在30(含)分(满分40分)以上的研究所数量大大增加,从2011年的4家上升到2012年的14家;得分在20分以下的研究所数量显著减少,由2011年的37家下降到21家,降幅达43.24%(图1)。
在数字文献资源方面,各研究所普遍达到了很高的水平。数字文献资源使用方式多样化,普及程度进一步提高。图书馆管理系统建设日趋完善,功能服务逐渐增加。九成以上的研究所已启动知识库管理系统,超过50%的研究所建立了本学科领域的知识环境。
大多数研究所已建立科研协同平台,平台建设来源和方式呈现多样化和复合性特点。其应用平台还可连接与使用更为丰富的各类科研资源。团队协同工作平台、会议网站平台和学术主页平台得到迅速发展。
研究所自建科学数据库数量和普及率进一步提高,科学数据资源的运行管理模式呈现多层次特点,多数研究所注重数据资源的统一管理和运行维护。
高性能计算应用软件来源和开发方式愈加多样化和均衡化,应用范围更加广泛。高性能计算环境CPU平均利用率较高(图2)。使用GPU技术的研究所数量增加。
上述情况表明,中科院科研信息化应用的使用频率和效率日益提升,科研信息化建设工作不断突破和改善。
3.3 中国科学院科研信息化发展战略与举措
为服务“创新2020”发展战略,中科院“十二五”期间信息化应用的重点是科研信息化。明确提出:要建设开放共享、功效一流、安全可靠的信息化环境,促进信息化与科技和管理创新活动的深度融合,引领中国科研信息化发展,逐步建成信息化中科院,为创新跨越提供有力支撑[6]。
图1 中科院各研究所科研信息化得分分布年度对比图(满分40分)
科研信息化是中科院“十二五”信息化发展规划确定的发展主线,其战略目标是以科技创新活动和科技工作者的需求为核心,构建一批跨机构、跨地域和跨领域的科研信息化应用平台,强化中科院信息化基础设施之间的互操作性,并能够通过各种网络与各学科领域的数字化设备进行连接,实现数据资源、文献资源和软件资源等的分享与共用,形成可共享、无障碍、无缝链接的“科技云”环境,实现信息化环境与重大科研项目(工程)的有机融合,促进科技人员学术思想的交叉和碰撞,有力支撑各学科领域“一三五”规划的实施。“科技云”是中科院科研信息化的基础设施和公共服务环境,其总体目标将通过“科研信息化应用推进”、“科技数据资源整合与共享”两大工程任务进行部署并实现。
此外,为更好服务于各学科和领域的重大科技项目(工程),正在构建面向学科和领域的“科技领域云”,实现信息化基础设施及资源与科技活动的直接融合,利用云计算,建立面向共性需求的基础平台,并结合学科特点,支持部分面向学科领域的科研信息化应用,从而成为“科技云”的有机组成部分。“科技领域云”的具体目标是在中科院信息化公共基础设施、资源及服务的支撑下,集成院内外该领域各种科研资源和服务,为从事该领域研究的科研人员提供信息化的方法与手段,并支持多个科研团队、多个研究所进行跨地域、跨学科的资源共享与协作研究,有力支撑各学科和领域的“一三五”规划的实施。
为推动国内科研信息化发展,2009年12月中科院联合国家科技部、国家自然科学基金委等部门举办了国内首次“第一届中国科研信息化发展研讨会”。该研讨会每两年举办一次,是目前国内科研信息化规模最大、层次最高、影响力最大的会议。2011年,中科院联合国家科技部、国家自然科学基金委员会等部门首次发布了《中国科研信息化蓝皮书(2011)》。2013年,中科院还将承办IEEE e-Science International Conference,这是国际科研信息化会议首次在中国召开。
图2 中科院各研究所高性能计算环境CPU平均利用率情况
回顾中科院自“知识创新工程”以来的科研信息化历程和实践,我们认为:
(1)顶层设计持续推进是发展科研信息化的引导力。“十一五”期间,中科院在此前信息化建设基础上,开始系统提出中科院信息化的整体建设目标,坚持以应用需求为出发点,重点围绕科研信息化的全周期和关键要素,提出要发展网络、超算、数据等科研信息化基础设施整体环境的理念,明确了科研信息化的整体体系架构和实现路径,部署了服务全院的e-Science虚拟科研平台建设项目和e-Science应用示范项目。研究所层面根据整体目标并结合自身需求部署开展了科研信息化工作,强有力地支撑了科学研究和科技创新。从而实现了科研信息化的系统谋划和推动落实,中科院科研信息化进入了体系化发展的新阶段。“十二五”期间,中科院继续坚持对科研信息化的整体设计,提出科技云的战略目标,计划建设中科院科技云门户,基于科研信息化集成服务平台,实现多种科研信息化基础设施以及基础资源的服务集成,为广大科研团队提供一站式的协同科研环境服务,并开展科技领域云建设,进一步深化各领域科研信息化应用。中科院科研信息化进入了整合发展阶段。
(2)机制措施和专业队伍是实施科研信息化的保障力。通过信息化评估,召开信息化工作会议,发布《中国科研信息化蓝皮书》、《中国科学院科研信息化实践与探索》等措施和方式推动了全院信息化的发展。成立专业了信息化服务支撑机构——中科院计算机网络信息中心,负责运行覆盖全院的信息化基础设施,为各学科领域科研信息化应用提供好用、易用的信息化公共服务,带动科研信息化整体水平的提升。此外,中科院高能物理所、微生物所、地理科学与资源所等单位在科研信息化方面的实践有效带动了所在学科领域科研信息化的发展,具备了较好的国内外影响力。
(3)内在应用需求和复合型人才是深化科研信息化的推动力。各领域科研信息化的需求和应用情况差异化比较大,如高能物理领域已经无法离开信息技术,学科本身发展对科研信息化有内在强烈需求,实现了良性循环发展。与此形成鲜明对比的是,某些领域,如基础数学研究领域,则对信息技术的需求还不是很突出。因此必须根据各领域的科研特点,因需发展科研信息化。此外,科研信息化的应用离不开既精通学科专业同时掌握信息技术的复合型人才,如在天文领域,必须培养大量的复合型人才,才能适应学科本身的发展。
党的“十八大”报告中明确指出“科技创新是提高社会生产力和综合国力的战略支撑,必须摆在国家发展全局的核心位置”。提出了“创新驱动发展”和“‘新四化’同步发展”的新战略、新要求。
目前国内外科技界普遍认为,当前的科技发展正处于重大变革性突破的前夜,或者说是“第六次科技革命”的前夕,新技术革命和产业革命初现端倪。一些重要科技领域显现发生革命性突破的先兆。
中科院院长白春礼在“以科技自信助力实现中国梦”一文中指出,我国的在创新驱动发展战略中,科技居于龙头地位,可以说是撬动中国梦实现的“杠杆”[8]。
因此,我国未来科技发展一方面面临难得的战略发展及赶超期,另一方面也再次落后处于科技发展“代差”的危机期。我们必须抓住机遇,迎难而上,加快发展科研信息化。展望未来,对中科院科研信息化乃至中国的科研信息化,我们有更多期望[9]:
(1)科研信息化是伴随第六次科技革命必然发生的变革,是科技发展、信息化发展、社会发展的必然趋势。面对这一科技模式变革的时代潮流,我们别无选择,唯有加快发展科研信息化,实现科研模式的转型,服务国家战略的同时,推动科研创新能力的提升。为此,中科院必须在科研信息化方面先行一步,在当前科技云、科技领域云的基础上,面向“创新2020”,全力推进科研信息化。
(2)科研信息化必将贯穿科技模式变革的全周期,必须围绕科研信息化关键要素开展持续工作。科研信息化本身的要素要求我们需要围绕先进科研基础设施与资源集成能力、先进大数据研究与知识发现能力、先进数字协同与开放合作能力、先进科研活动创新链条整合能力、先进科学传播与人才培育能力等核心能力长期开展工作,促进科研模式的不断优化完善。
(3)社会各方面需要共同努力协同构建适于科研信息化发展的良好生态环境。发展科研信息化必须要发挥政府、企业、科研院所、社会组织、科研人员等各层面各方面的积极作用,营造良好的科研信息化环境。比如,我国当前比较突出的科研信息化基础设施及信息资源共享问题。近10余年来,科技部、基金委、中科院等部级单位在科研信息化方面做了大量的工作,积累了相当丰富的技术和数据资源,但资源共享相关的政策法规体系不完善,支持力度有待进一步提高。我们应抓紧促成《科学数据资源共享条例》及相关配套政策的出台发布,建立科技数据共享平台,向公众开放科技信息资源,促进科研创新成果不断向企业转移转化,带动国家和地方产业发展。
(4)推动国家层面的顶层设计,协同推进中国的科研信息化。中国科学家在香山科学会议上研讨认为,科研信息化(e-Science)是建设创新型国家和美丽中国的重要科技支撑条件,是现代科学技术发展的必然趋势。密集型数据的获取、传输、处理、分析、可视化、共享和利用是数据密集时代科研信息化的重要内容,数据科学应运而生。开展数据密集时代科研信息化的研究和战略部署意义重大。综观国际国内大势,中国科技发展正处于可以大有作为的重要战略机遇期。但目前在国家层面对科研信息化重视不够,国家的信息化规划中尚无关于科研信息化的阐述,缺乏对科研信息化的整体战略和规划。我们有理由期待国家强化对科研信息化的顶层设计与整体规划,以实施国家科研信息化工程为抓手,推动中国的科研信息化发展。
(5)以全球视野,推进我国科研信息化进程,推动科研要素的全球配置和优化,提升科技创新能力。应进一步利用我国在人才、技术、资金、设备、创新环境方面的比较优势,与发达国家、发展中国家广泛建立互利共赢的协同创新网络、平台和机制,尤其是培养利用各领域高端复合性科研信息化人才方面,可以充分利用国际资源,以提升自身科技创新能力和国际化水平,共同应对区域性和全球性挑战,服务国家发展战略与科技创新发展的战略需求。
致谢感谢中科院国科图成都分馆提供了有关材料。
1江绵恒.科学研究的信息化:e-Science,上海第三届亚太城市信息化论坛大会特邀报告.2002年6月,上海.
2桂文庄.什么是e-Science.科研信息化技术与应用. 2009,V1(1):1-7.
3白春礼.序言.中国科学院信息化发展报告2013,2013.
4中国科学院信息化工作领导小组办公室.中国科学院信息化发展报告2013,2013.
5中国科学院信息化工作领导小组办公室.中国科学院科研信息化实践与探索,2011.
6中国科学院信息化工作领导小组办公室.中国科学院“十二五”信息化发展规划,2011.
7中国科学院信息化工作领导小组办公室.中国科学院信息化评估报告2012,2013.
8白春礼.以科技自信助力实现中国梦.紫光阁,2013年6月.
9谭铁牛.加快科研信息化进程迎接新一轮科技革命.2011年12月,北京.
(相关图片请见封二)
Review and Perspective on Chinese Academy of Sciences’e-Science
(The Cyber Infrastructure Office,ChineseAcademy of Sciences,Beijing 100864,China)
This paper discussed the connotation and strategic significance of e-Science.The international e-Science developments were analyzed.Milestones and current developments of the e-Science development in Chinese Academy of Sciences(CAS)were reviewed.Then the strategy and key measures for e-Science in CAS during the 12thFive-Year Plan were elaborated.A systematic summary of e-Science practices was presented and a few suggestions on Chinese e-Science development were proposed in the end.
informatization,e-Science,cloud computing,big data
*修改稿收到日期:2013年6月18日
**执笔人:陈明奇(E-mail:mqchen@cashq.ac.cn)、吴丽辉