张黎伟, 周勇义, 黄 凯, 刘克新
(北京大学 实验室与设备管理部,北京 100871)
公共平台建设是大型仪器开放共享体系建设的重要举措之一。大型科学仪器公共平台是以提供公共服务和开展高水平科学研究为目的、通过集中投资建设或有效的资源整合而形成的大型科学仪器群,配合以科学的建设发展规划和完善的运行管理机制,最终成为支撑科技创新工作的重要载体。经过多年建设,国内高校尤其是“985工程”“211工程”高校和部分科研院所的大型仪器公共平台已初具规模,部分高校已建成至少1个校级公共平台,在为教学科研提供公共支撑和推动大型仪器开放共享、提高使用效益方面的作用也日益显现[1-4]。
我校在公共平台体系建设上取得了较好成果,且对公共平台建设机制、校级平台考评等方面进行尝试和实践[5-7]。本文重点介绍了北京大学公共平台的三级管理体系、以及校级平台的两种准入模式和退出机制,以期与兄弟高校共同开展研究和探索。
我校是最早推动大型仪器开放共享体系建设的高校之一,主要通过硬件、软件和保障体系的构建,推动大型仪器设备共享,从提高大型仪器设备使用效益,达到人才培养,科研支撑和社会服务的目的。作为大型仪器开放共享体系建设的重要举措之一,我校公共平台建设实行校级-院系级-开放机组三级管理体系(见图1)。
图1 校、院、系三级公共平台管理体系
校级公共平台是国家和学校投入大规模资金建设的大型科学装置、设施或仪器群,是学校为支撑创新型人才培养,关键领域科学研究和多学科发展而进行的重要部署,是面向全校多个学科提供最广泛支撑的公共服务体系。
我校校级公共平台的建设始于1964年电镜实验室,经过半个多世纪的建设与发展,目前已建成7个校级公共平台,是全校各相关学科的教学科研工作的重要载体,在交流合作与社会服务中发挥了重要作用(见表1)。
表1 7个校级公共平台
与校级平台的多学科广泛支撑的属性不同,院系级公共平台主要立足本学科的发展,由学院针对自身发展和科研需求,有选择性的进行资源配置,具有专业性强的特点。院系平台由院系自主建设和管理,主要为本学科或本院系提供公共支撑服务。目前我校的院系级公共平台也已呈现遍地开花之势,包括已建成的生命学院公共仪器中心、高通量测序平台、环境工程计量认证实验室等,以及正在建设中的工学院仪器公共平台、地空学院仪器公共平台等。
开放机组是独立于校级平台和院系平台以外,由相关实验室建设和运行,为校内外提供开放共享服务的基本单元,由单台或若干台仪器设备资源和相关仪器操作、管理人员构成,可满足用户某特定方向的测试和研发需求。我校大型仪器设备实行“专管共用、开放共享”的管理体制,按照优先满足校内教学科研需求、积极开展校外服务的原则实施开放共享工作。除涉密仪器设备外,我校单价在40万元(含)以上的具有一定共性需求和共享价值且运行状态良好的大型仪器设备,原则上均需开放共享。目前可提供对外测试服务的机组已达300余个,开放仪器设备上千台,有效支持了全校相关学科和校外单位的教学科研工作。
校级平台的成立主要由以下两种准入建设模式:
在校级平台建设中,为了避免校级平台发展成为某一个学科或学院的独享的专属平台,失去其对全校所有相关学科的公共支撑作用,从建设之初,就明确其校级平台的定位。由学校根据全校相关学科的发展需要进行顶层设计,调动和整合相关政策和经费资源,从公共的角度和学校层面投入平台建设经费,从而凸显和保持平台的公共属性。与此同时,在设备选型和配置上,应充分考虑各学科要求,兼顾平台主体设备的公用性与先进性,通过对需求开展深入和广泛调研,并组织科学论证,实现资源配置的科学统筹规划。
以高性能计算校级公共平台的建设过程为例,高性能计算是计算机科学的一个重要分支,主要是指从体系结构、并行算法和软件开发等方面研究开发高性能计算机的学科[8]。随着计算机软硬件技术飞速发展,不断提高的计算能力为科技工作者提供大规模数据处理分析和复杂理论模型研究的有效支持,成为发现新现象、认识科学规律、进行工程设计不可替代的方法和手段[9-11]。
数学学院、物理学院、化学学院、生命学院等多个学院对高性能计算均有迫切需求,据不完全统计,校内相关学科的计算需求总量约为1 000 TB。但是由于多年来,我校尚未建成一个校级的高性能计算平台为全校提供公共服务,各学院或课题组为了解决学科建设需要和科研项目中的计算需求,分散建设了几十个中小规模的计算集群,由院系或实验室独立运行管理和使用。扣除日常维护成本不计,这些零散建设的计算集群仅硬件设备的购置经费已高达近6 000万元。此种方式存在诸多弊端:①经费投入多,统筹规划不足。分散建设的集群处于单打独斗状态,经费总投入不少,但并未形成集约优势,缺乏统筹规划,资金使用效益较低,仅可用于完成较小体量的计算任务,对于大规模数据计算力不从心。②运行维护能力低。大部分课题组缺乏专业的实验技术人员进行设备运行维护,管理人员通常由学生或者兼职老师担任,缺乏专业技能,维护经验不足。当设备出现故障时,修复期相对较长,不利于科研工作的正常开展。③运行维护成本高。受实验室空间限制,高性能计算设备购置后,通常需要将普通办公场所或实验室进行二次改造,电力改造和装修成本较高,机房建设和设备电力消耗较大,运行成本高。④投入产出比相对较低。由于缺乏专业人员进行运维和调试,许多软件移植和编码工作无法开展,设备深度开发和资源调度受限,难以充分发挥其应有的效益。⑤不具备可持续发展潜力。设备的购置经费通常来源于某科研项目,设备购置后也通常用于服务本科研项目的开展。在项目结题后,若无新的课题和计算任务,设备通常处于暂闲置的状态,一定程度上形成了资源浪费。并且缺乏新的课题经费用于设备的升级和更新,不具备可持续发展潜力。
因此,鉴于上述分散建设的诸多弊端,从统筹规划、提高资金使用效益、充分整合我校高性能计算资源的角度出发,为了满足我校相关学科在大规模数据处理和计算方面日益突出的需求,学校于2015年正式启动高性能计算校级公共平台的论证与建设工作。
鉴于高性能计算设备更新速度较快(18个月),生命周期较短(5年左右),本着高效、经济、节能、环保原则,校高性能平台建设比照当前世界公认的在建设与管理均处于领先地位的劳伦斯伯克利美国能源部国家实验室计算平台方式,采用滚动式发展的建设模式,即在平台建设的5年中采取分步投入方式,按照300 TB(第1年),200 TB(第3年)的退役(第5年),每2年退役1个主计算平台(第6年起)的建设规模持续投入,从而确保设备的先进性和计算服务能力的长期可持续性。首期项目建设中设备经费投入为1 600万元。
为了充分体现高性能计算校级公共平台的公共性,规范平台的使用和管理,确保平台资源的合理分配,科学、高效利用计算资源,平台拟定了“高性能计算校级公共平台资源分配和使用规范”和“高性能计算校级公共平台收费管理办法”等管理规定,对收费标准、计费方式、排队规则、资源分配方式、优惠和奖励措施等进行约定。此外,为了确保校级平台高性能设备计算效能充分发挥,引导科研需求向校级平台聚集,避免院系分散采购和重复配置,以2015年平台论证启动为时间节点,原则上不允许院系自行购置200万元以上的计算集群。与此同时,为了鼓励将非校拨经费用于参与高性能平台建设的课题组,平台建立了合理的鼓励政策和补偿机制,从机时和资源使用优先级上给予一定的优惠政策。
经过2年建设,2017年9月,高性能计算校级公共平台建成并向全校师生提供试运行和开放共享服务。平台采用常温直接水冷技术解决CPU和内存散热问题,是国内首套采用该技术的高性能集群,系统性能良好,节能效果显著,LINPACK效率达到92.6%,PUE值达到1.1,居于国内领先水平。试运行的3个月中,系统运行平稳,任务饱满,性能优良,节点平均利用率高达95.87%,用户数量达354人(其中教师132人,学生222人),分布于我校18个院系,支撑科研项目100项,支持发表了高水平研究论文4篇,成绩喜人,用户反映良好。
近年来,院系级平台建设亦日益成熟,其资源体量不断扩大,设备种类丰富,测试服务能力增强。并且随着学科交叉融合的不断深入,院系级平台所支撑和服务的学科也逐渐增多,已成为校级平台的补充和后备。此外,由于校级平台由学校投资建设,并有持续性的经费支持和政策倾斜,因此,为了争取学校的支持,部分院系级平台有意愿申请成为校级公共平台。为了把好“入口”,避免校级资源被滥用,建立严格、有效和完备的准入和退出机制,将有助于引导平台规范健康发展,确保学校公共资金的合理分配和投入。学校进行了有益的尝试,针对各项准入指标制定了相应的定量和定性考核标准,并对准入程序进行了严格约定。
2.2.1 准入因素
申请成为校级公共平台的院系级平台须在资源体量、公共性、运行机制、管理团队等方面同时满足各项要求。
(1) 资源体量。平台所拥有的各类资源是其开展各项工作的物质基础,也是体现平台工作量和支撑能力的重要指标。平台应同时满足以下条件:①平台仪器设备选型应经过科学论证,高中低档次搭配科学合理,维护到位,运转正常,能够满足学校多个相关学科的需求。②仪器设备总量不应少于2 000万元,其中必须配置至少1台(套)单价400万元以上的大型设备或设施。③实验室面积原则上不应少于500 m2,专职管理人员不应少于6人。
(2) 公共性。平台的建设有别于单纯的、满足个别学科发展或课题组需要的仪器购置,带有明显的公共服务特征,其建设目的是支撑和带动一批相关学科的发展。在公共性方面,平台应同时满足以下条件:①平台所提供服务的用户不应仅局限于平台所挂靠院系,而应扩展至全校所有的相关学科。提供服务的学科领域应不少于5个一级学科或10个二级学科(其中二级学科不应属于相同院系,应至少涵盖3个院系)。②平台核心仪器设备的年平均开放共享机时应不少于2 000 h/年,且校内服务机时比例应不少于总机时的80%,校内服务中非本院系的服务机时占比应不少于25%。③在平台提供服务的课题组中,年服务总机时达到100 h或总测试样品数300个以上的应不少于30个。④平台中处于正常工作状态的大型仪器设备,原则上均需纳入开放测试基金系统。
(3) 运行机制。高效管理,机制先行。在运行机制方面,平台应根据资源及服务特点,建立健全各项操作管理制度、操作规范及工作流程,完善内部管理与绩效考核机制、共享监管机制和人才评价机制,形成科学的组织管理模式和有效的运行机制。
此外,为了平台资源的开放和透明,提高平台运行效率,平台必须建设信息化管理平台,全面展示平台总概况、仪器设备资源、开放信息、收费标准、机时预约及预约情况、管理人员、服务指南、通知公告等。
(4) 管理团队。以专业研究人才、技术人才、管理人才为主要构成部分的专业化人才队伍支撑体系是仪器设备和科研设施发挥作用的关键因素,也是平台能够正常运行的重要保障[12-15]。平台应成立专家委员会或学术领导团队,并实行专家委员会监督下的主任负责制,并搭建技术支撑团队,保证队伍结构梯次合理,符合平台的工作需要和未来的发展。①学术领导团队应尽量覆盖平台所提供服务的学科领域,并熟悉本领域国内外学术和技术的发展动向,在本学科科研领域内具备一定的影响力,在平台科研方向、资源配置、人员引进等方面提供指导和引领作用。②技术支撑团队应立足于平台的专业特色和对相关学科的支撑,具有系统、坚实的专业基础理论知识和专业技术能力,熟悉本专业国内外的实验技术现状和发展趋势,具备丰富的实验操作经验,并具备维修设备、排除常见故障的能力,具备解决关键性实验技术问题和提供深度研发实验服务的能力。③管理团队应立足服务,做好对外沟通联络和内部组织协调,及时维护信息平台相关信息,保证平台的高效运转。
2.2.2 准入程序
申请单位根据上述准入考核因素提交申请报告和支撑资料,申请报告需由申请单位联合另外2个二级单位共同签字盖章,从而体现多学科支撑的必要性。
作为校级平台建设的主管部门,实验室与设备管理部对申报材料进行严格审查,并组织专家组进行联合审议。若审议通过,则试运行至少1年。试运行期间申请单位应参照校级平台模式进行管理。
试运行结束后,实验室与设备管理部再次组织专家组对平台在试运行期间的建设成效和公共服务支撑情况进行审议,并将审议情况报学校审批,由学校确定是否设立为正式的校级公共平台。
作为学校重点投资建设领域,从启动建设到日常运行,学校给予了校级平台大量的经费支持和政策倾斜。然而,校级平台不应为“终身制”。为了与学校投入相匹配,应严格规定退出标准,对于无法达到要求的校级平台,应及时退出,避免其长期占用学校公共资源。
退出机制是促进校级平台保持内生动力的有效约束机制之一,是保障平台可持续发展的重要环节。作为平台主管部门应加强日常动态监管,对平台进行严格约束和规范管理,及时清理达不到要求的平台,确保校级平台始终具备较高的教学科研支撑能力,保障平台的可持续发展。
学校对校级平台退出机制面进行了约束和规范,凡存在下列情况之一的校级平台,经专家组审定,由设备部作为校级平台主管单位对其进行提醒,并要求进行限期整改。若整改效果不明显或整改后仍达不到要求的,将上报学校审核后取消其校级公共平台资格。① 不满足上述准入要求的;② 无正当理由拒绝为校内其他单位用户提供开放共享服务;③ 用户投诉较集中,管理问题较严重;④ 弄虚作假,虚报开放共享服务情况;⑤ 违反财务管理规定;⑥ 无正当理由拒绝参加年度校级平台绩效考评;⑦ 在绩效考评工作中连续两年考核不合格。
校级平台也可自愿申请退出。平台及所挂靠院系提交退出申请,经设备部审核后报学校审批。
校级公共平台、院系级公共平台和开放机组的三层级管理架构是大型仪器开放共享体系建设的重要布局。对于平台建设主管部门而言,最重要的是要调动和整合相关的政策和经费资源,强调顶层设计,把好校级平台建设的“入口”和“出口”,确保学校投资效益的充分发挥。并且,在强化校级公共平台的支撑能力以外,也需要加强与院系的沟通和协调,充分认识到院系级公共平台和开放机组对于大型仪器开放共享体系建设和服务学科发展的重要作用,与院系共同探讨和筹划院系级平台的建设发展,使得校级平台、院系平台和开放机组形成更为有益的互补,从而合力推动平台建设的深入发展。