施振佺,郭 畅
(1.南通大学科学技术处,江苏南通 226019;2.南通大学理学院,江苏南通 226019)
一直以来,科技创新在经济发展和社会进步中起了巨大的推动作用,因此,引导企事业单位努力突破传统技术、开展技术创新,发挥科技创新的推动作用具有非常关键的作用。然而如何激活科研人员为科技创新,怎么开展科技创新以及在哪些方面开展科技创新,是一直以来国家政府、企事业单位的科技管理人员所面临和要研究的内容。面对这些问题,如何进行科学高效的决策是科技管理中至关重要的内容,也是很多科技管理人员和学者研究的重要内容之一。当前随着科技创新的政策环境和技术的发展,在高校以科技管理大数据为基础,利用大数据分析技术来推动科技管理决策是今后发展的趋势,因此,研究大数据驱动的科技管理决策对于高校的科技发展具有非常重要的意义。
科技管理决策根据它决策范围的大小可以分为宏观、中观和微观3 个层次。宏观的科技管理决策一般是指一个系统的整体科技发展状况方面的决策,着眼于系统科技发展的整体和长远目标来进行决策。微观科技管理决策是指对系统科技发展中的微观元素的决策,主要是指一些科技项目、科技人员和科技成果等管理和发展的决策。而中观决策主要是指介于宏观和微观之间的科技管理决策。本文研究的高校科技管理的中观决策,研究高校内部二级学院或者学科的发展进行科技管理决策。
当前,已有很多学者在研究科技管理决策问题。贾晓峰等[1]通过构建科技决策立法与监督体系,确保在决策过程中充分体现各类参与主体的科技诉求,实现最高决策主体的民主决策,优化决策体系中各环节反馈与协同等方面。赵志耘等[2]利用知识图谱的研究工具根据创新城市科技监测与评估数据,分析预测发展趋势与规律,研究城市科技创新的管理与决策。陈美华等[3]研究了运用地平线扫描法对科技管理进行前瞻性的预测和决策。智强等[4]通过对比中美两国政府科技部门的决策体系,发现美国是典型的“自下而上”式决策结构,中国则为“自上而下”式决策结构。陈玲玲等[5]运用决策论的数学原理,针对共性技术立项决策的现实情况构建决策模型来对科技管理进行决策。这些学者分别从决策的理论、方法和制度等角度对科技决策展开了研究。
在大数据应用到决策方面也存在大量研究。温桂珍提到应用大数据技术挖掘海量数据的关联性关系,并进行预测,能够更准确地反映事物全貌并提高预测精度和准确度[6]。顾肃[7]研究了利用大数据分析技术,可以使政府及社会各方面的治理快速获得有价值的信息,及时发现问题,纠正运作中出现的偏差,提高社会决策和治理的能力。周芳检[8]提出了一种融合数据驱动和模型驱动的“数据-智慧”决策范式,研究了具有自动决策和人机协同决策功能的“数据-智慧”模型。这些学者从大数据对决策的作用、大数据决策的范式以及如何利用大数据技术进行决策等方面开展了研究。
还有学者开展了利用大数据进行科技管理的研究。尹丽英等[9]研究了科技管理的数据服务模式,彭茂祥等[10]基于专利数据研究了国防科技大数据构建和管理。然而利用大数据进行科技管理决策的研究相对较少。因此,本文拟通过深入分析基于大数据的科技管理决策模式、结构、关键步骤和特点等来研究大数据驱动的科技管理决策。
(1)基于经验的科技管理决策模式。科技管理是调动科研人员发挥科技创新的主观能动性和创新性,从而提高和改进科技水平的有效方法。在科技管理的初期,科技人员数量较少,导致科技管理人员数量更少[11]。国家在本科院校也没有设置相应的专业进行培养,因此很多单位在配置科技管理部门人员时,往往由科技人员承担。单位通过选拔科研工作开展较好,又有余力的科研人员来从事科研工作,同时兼顾科技管理工作。该阶段的科技管理人员往往凭借着他们个人科研工作中获得的经验或与生俱来的管理经验和专家经验,进行科研管理和科技管理的决策工作。这些方法和案例虽然最后能产生较好的结果,但是在管理工作和决策方面通常存在不够全面和科学的问题。
(2)计算机技术辅助的科技管理决策模式。进入计算机和互联网信息时代,科技管理开始使用管理信息系统,由此产生了大量的科技管理数据,同时由于科技创新在各个单位的发展中占据的地位越来越高,使得重视科技创新的人员日益增多,因此单纯的凭借经验来进行科技管理和决策无法满足工作的需求。于是开始出现了计算机技术辅助的科技管理决策模式。这种模式下,科技管理人员慢慢开始采用计算机对科技数据和管理数据进行统计分析,从而实现对科技管理的辅助决策。计算机技术辅助科技管理决策通过运用数据挖掘技术,对科技管理数据进行统计分析,挖掘出科技管理决策的有用条件,提供科技管理人员进行科技管理决策判断的依据,具有简单、便捷、快速和高效等特点。
(3)大数据驱动的科技管理决策模式。随着信息技术的不断发展,科技数据出现高速增长,数据规模呈现海量特征,同时也出现了数据的多样性和异构性的特征。在这个时候,科技管理信息系统已经不仅仅是单一的系统,发展为多源异构的科技管理大平台。首先,科技管理部门在不断的扩大,导致科技管理的信息系统也在增加;其次,客户端从原来的互联网端增加了移动端等;再者,科技数据从原来的结构化数据,发展为包含文本、图片和视频等多种形式的数据。这种多源异构的科技管理平台产生了大量多源异构的科技管理数据,随着数据量的不断增长,大数据驱动的科技管理决策模式也应运而生。大数据驱动的科技管理决策模式采用大数据技术对科技管理过程中产生的大数据进行分析,挖掘出潜在的决策条件,同时运用大数据分析技术,分析出潜在的决策方案,并选出最优方案,具有快速、全面、科学等特点[12]。
高校科技管理决策的精准、科学和全面与否取决于在高校科技管理中对涉及决策问题概念界定的是否清晰、问题分析的是否全面、决策方案选取的是否精准,而运用大数据技术,可以帮助高校科技管理部门在处理问题概念界定、问题分析和决策方案的选取时,能够更加清晰、全面和精准。
首先,大数据技术可以让高校科技管理决策变得更加有效和完整。数据的缺失和不完整是在信息化时代常见的问题,也是不可避免的问题[13]。在计算机辅助科技管理决策时,如果出现数据缺失问题就可能影响科技管理决策有效性和完整性。而运用大数据技术的模糊分析和模糊预测等技术可以帮助我们弥补高校科技管理中数据缺失问题所造成的无法全面分析问题和制定决策方案,从而形成有效科技管理的决策。
其次,大数据技术可以让高校科技管理决策变得更加科学和全面。当前高校科技管理决策时往往凭借经验或者计算机辅助技术来了解二级学院或者学科的前沿或者发展趋势,这就取决于个人的知识面或者现有的科技项目或者科技成果,可能会造成决策的片面或者不科学问题。但是如果借助大数据的挖掘技术和分析技术,通过分析一些科技指南政策,挖掘出二级学院和学科发展的国内外的研究热点[14]。因此,大数据技术可以在高校科技管理决策的问题分析、因素罗列和结果预测时变得更加全面和科学。
最后,大数据技术可以让高校科技管理决策变得更加精准和高效。当前高校科技管理决策时往往凭借经验进行最后的决策,这样的决策往往需要很多的经验积累。而在大数据技术下,通过概率分析影响因素的权重大小,同时运用矩阵模型等可以对问题、影响因素和建议方法进行精准的匹配,挖掘出有效的决策方案,预测出各个方案的可能结果和成功效果,这样可以让高校科技管理决策变得更加精准和高效[15]。
根据大数据科技管理及相关业务流程的特征,大数据驱动的高校科技管理决策模型由四个部分组成。它们分别是科技管理大数据处理平台、科技管理大数据分析平台、科技管理大数据可视化平台以及科技管理客户端。科技管理大数据处理平台是对多源异构的科技管理大数据进行收集、预处理和存储等[16]。它是为形成所需要的数据而准备的;科技管理大数据分析平台是根据科技管理决策的流程对科技管理大数据进行分析界定相关要求和影响因素,挖掘出备选方案,分析备选方案的风险和后果,进行方案的决策,执行决策方案,最后对执行的方案进行评价和反馈;科技管理大数据可视化平台是利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对挖掘数据、方案选择等加以可视化解释;而科技管理决策的客户端是科技管理部门和科技人员操作使用的平台,也是数据收集的平台。大数据驱动的科技管理决策的具体模型结构如图1 所示。
图1 大数据驱动的科技管理决策模型结构
(1)科技数据和管理数据。科技数据和科技管理数据是大数据驱动的科技管理决策的基础,也是决策好坏的基础。它就像人的血液对人的重要性一样。科技管理系统的所有流程都是基于数据来推动的,没有科技数据或者科技管理数据,流程无法往下进行,就不会形成科技管理。科技数据和科技管理数据推动着科技管理中的每个流程和环节往前推进。大量的科技数据和管理数据相互间因为业务关系,使得它们彼此间存在着关联关系,这种关联关系隐藏着潜在的价值。因此,科技数据和管理数据是科技管理决策的大数据基本要素。
(2)大数据业务流程。大数据的业务流程也是科技管理决策的大数据要素,它决定着科技数据的流转,产生哪些数据,在信息管理系统中发挥着什么作用等。它就像人体血管决定着血液往哪里流一样。大数据处理的业务流程由采集数据、预处理数据、分析数据和展现数据等组成[11]。在科技管理决策中,首先要对多源异构的科技数据和科技管理数据进行采集,对遗漏数据、噪声数据和不一致数据进行清洗处理并进行存储;然后采用大数据技术对所提出的问题、具体的要求和影响的因素进行分析,从中挖掘出关联属性,确定备选方案;同时,运用大数据分析技术分析出备选方案的风险情况,并由此做出决策,并展示相应的备选方案和决策方案;最后,执行决策,对执行情况进行评价、反馈评价等;最终将整个问题、影响因素、备选方案和执行方案以及评价存储到决策数据库,作为决策知识库。
(3)大数据技术。大数据技术是在上述业务流程和数据分析中采用的技术的总称。它是保障大数据业务流程得以推进,各种要求和影响因素得到全面分析,数据能够快速、高效处理,决策结果得以及时、科学和准确展示的基础。根据上面的业务流程,可以分成数据采集技术、数据清洗技术、数据存储和管理技术、数据分析和挖掘技术、数据可视化展示技术。
(1)数据的多源异构多模态形式。科技管理采取信息系统管理以后,为了科研人员能够更加方便、快捷的使用,数据的端口和形式不断增多。有的是来自各个主管部门的管理系统的数据,有的是来自科研人员用户端自行输入数据,还有的来自其它职能部门的业务数据,这些不同的数据来源造成了科技管理中的多源大数据的特征[11]。同时,不同来源的数据的结构也不相同,有的是结构化的数据,有的是pdf 或者word 文本格式,还有的是互联网上爬取的网页格式等,这些数据结构互不相同,因此它具有异构的特征。这些不同来源不同结构的数据也形成了科技管理大数据的多模态特征。因此,科技管理中的大数据具有多源异构多模态形式。
(2)数据的周期性。信息数据在业务流程中都具有各自的生命周期,科技管理大数据也是这样,它有各个业务系统数据的生命周期。在科技管理中,数据的周期始于业务流程的开始,终于业务流程的结束。比如在科技项目管理中,数据开始于项目申报,经过项目的立项、任务书的签订、建经费卡等过程,最后终止于项目的结题验收。每个科技项目的数据都是像这样周期性的流转,因此,科技项目数据具有周期性的规律。而在科技管理决策中,它的生命周期开始于科技管理决策的问题提出,经过相关要求的界定、方案的选取、方案的决策,最后执行方案、评价方案、反馈评价和方案入库。
(3)数据的关联性。信息数据本身是独立的,但是在某个系统内部,数据的属性或者数据所属的属性让各种数据之间存在着某种联系,这种联系被称为数据间的关联性。在科技管理系统中也一样,数据间存在着关联性。比如,科研经费是科研项目中非常重要的一项内容,科研经费和科研项目息息相关,科技经费保障着科研项目的开展,科研项目离不开科研经费的支持,因此科研经费和科研项目之间是密切相关联的。而在整个科研系统中,科研项目和科研成果、科研成果转让和科技开发服务等数据之间也都有着密切的关联性。这些数据间的关联有的是直接关联的,有的是间接关联的。无论是直接关联还是间接关联,都隐藏着数据的价值。
由于高校对科技管理的要求越来越高,高校的组织架构中设立的科技管理部门也越来越多,导致科技管理决策的主体也越来越多。在信息化的时代,这些科技管理部门往往会构建自己的信息系统,从而形成独立的数据库。这些数据库包括科技处的科技项目数据库和科技成果数据库、科技服务处的企业数据库和企业需求数据库、军工科技项目库和成果库等,还有分布在其它高校职能部门的科技资源库中科技经费、科技人员和科研仪器等科技数据。众多的科技数据还在各个信息系统里,如果没有形成充分有效共享,就不能对所有数据信息进行了解,更不可能形成有价值的科技数据挖掘,也不能形成基于大数据的科学决策。国外在数据共享推动科学决策方面做的非常好,美国的政府治理方面就出台了开放政府的法案,要求各级政府开放原始数据,以便能让多元主体充分利用数据资源,挖掘出有价值信息,为决策提供支持。因此,大数据驱动的科技管理决策首要的关键环节是各决策主体间的数据能够充分共享。
大数据分析也是大数据驱动的科技管理决策的关键环节,大数据分析是将大数据中涉及到所决策问题的影响因素进行关联分析,挖掘其中相关联的数据信息,为最终的决策提供数据支撑。在科技管理的决策中也是,它是将科技管理大数据转化为有决策价值信息的过程。
大数据的分析包括以下过程:
(1)科技管理大数据的预处理。现实世界中的数据通常是不完整的,含有噪声,格式也是不一致的。科技管理大数据也是如此,这就需要我们对它进行预处理。数据预处理是对不同数据源采集的数据进行清洗、识别,同时对来自不同数据源的数据进行合并集成、存储的过程。
(2)科技管理大数据的变换。科技管理大数据因为它的多源异构等特征,需要进一步通过数据变换,采取去噪声、聚集、概化和规范化等操作将科技管理大数据转换成适用于统计、分析和挖掘的数据形式。
(3)科技管理大数据的挖掘。科技管理大数据挖掘是对科技管理数据仓库中的信息数据,选择合适的统计、分析和挖掘工具,采用统计方法、事例推理、决策树、规则推理等方法进行科技数据处理,从中挖掘出可以有利于科技管理决策的数据信息。
(4)科技管理大数据的方案展示。科技管理大数据的决策方案展示是对科技管理数据中挖掘出来有价值的信息,在分析研究后形成的可选方案,以可视化的形式展现给决策主体,帮助他们进行科技管理决策分析。
图2 科技管理决策的大数据分析
决策方案的选择在大数据驱动的科技管理决策中也是关键一步。它是对前期经过大数据分析、挖掘出的可选方案,采用数据决策技术进行方案的选择。决策方案的选择直接决定了后面到底执行的哪种方案,执行的效果怎么样等。通常采用的决策技术主要有:乐观准则、悲观准则和后悔准则。乐观准则也称最大准则,它找出每种方案的最好结果,再从最好结果中找一个更好的作为选择。悲观准则也称最大最小准则,在每种备选方案中找出最坏的结果,然后在最坏的结果中找出一个最好的一种方案。
(1)高校科技管理大数据决策的动态特性。当前,数据信息瞬息万变,主要表现在大数据的动态性和增量性中。科技数据信息也是如此,大数据的动态变化为科技管理提供依据更加精准有效的决策。同时,科技管理决策行为又影响着科技大数据的动态变化。通过面向科技大数据的增量式学习实现科技管理方法和技术的动态演化与有效积累,进而对科技决策形成反馈,能够有效地提高科技决策的精度。科技管理大数据决策的动态性决定了该决策过程是一个完整的、闭环的、动态的体系结果。该决策模型是一种具备实时反馈的闭环模型,这让决策模式由传统的相对静态的模式或多步骤模式提升为对管理决策问题的动态的渐进式求解模式。
(2)高校科技管理大数据决策的全局特性。从当前的科技管理环节来看,如:项目指南发布、申报、评审、预算评估、结题验收、成果转化等,不同的环节涉及到多种类型的数据。同时,也存在多种多样的决策支持系统,但多数是面向单一环节或局部应用的决策系统,往往无法较好地从全局角度优化策划和多目标决策等。科技管理大数据决策在大数据环境下进行决策将会更加注重科技管理数据的全方位性、各个科技管理环节的交互性、多个管理目标的协同性。通过对多源异构科技数据进行融合分析,能够实现不同科技管理环节信息对全局科技管理决策问题求解的有效协同,并且对每个单一问题的科技管理决策,都能够以整体决策优化为前提,进而为整个科技管理大数据决策提供全局性指导。
(3)高校科技管理大数据决策的不确定性。受当前科学技术研究的限制,科技管理大数据决策具有不确定性,主要表现在三个方面:一是支撑决策的各环节数据的不完整、不确定。首先,即便是借助当前先进的数据收集技术和方法,尽可能的收集和整合各种信息数据,仍然难以保证数据的全面性和完整性。其次,科技管理大数据的动态特征决定着数据随着时间变化产生不确定性。另外,科技管理大数据中普遍存在的噪声和数据缺失现象决定了数据的不完备性和不确定性;其次,科技管理大数据决策的数据分析不确定性。科技管理大数据分析涉及多源异构数据融合分析、知识发现的分析、大数据关联分析等研究内容,这些数据来源、分析内容和影响因素都是不确定的;最后,科技管理决策问题的复杂性导致决策过程和结果的不确定性。当前对科技管理的大数据决策相关问题求解时,通常为保证科技管理决策的高效性,会采纳满意的近似解来代替精确解,而这从某种程度上反映了当前科技管理大数据决策的不确定性特征。
(4)从因果分析向关联分析的转变。在理论分析中,通常考虑的数据是准确的,可以进行反复试验,探索对象之间的因果关系。然而在实际的科技管理大数据环境下,难以保证数据的准确性。此时分析挖掘科技管理中的因果关系就显得非常困难。通常,变量之间的关系大致可以分为两种类型:函数关系和关联关系。一般情况下,大数据的非线性特征使得数据很难严格地满足函数关系,而关联关系的要求相对宽松,在科技管理大数据环境下更容易被接受,并且更容易满足科技管理的多决策需求。因此,在科技管理大数据决策中的影响因素更多的通过关联关系来展现出来。
(5)科技管理大数据决策向满足个性化需求转变。用户是科技管理大数据决策系统的服务对象,是检验系统是否有效的直接评价者。在科技管理的过程中,用户角色可能会发生转变,因此科技管理大数据决策系统根据各类主要的用户角色特点,挖掘并细化潜在的需求,逐步提供符合用户要求的个性化服务。主要用户及其需求如:科技管理部门主要负责统筹科技资源,需要利用大数据分析支撑科学决策,对科技活动进行指导和管理;科研人员和科研机构需要利用大数据服务工具提升科研效率,加强科研管理,关联项目、人员、成果等数据。
大数据驱动的高校科技管理决策是科技创新和信息化发展到一定阶段的必然产物,而基于大数据的科技管理决策能够带来很多优势。首先,它能够让科技管理决策告别模糊不清的决策,而是变成更加明确、科学的决策。其次,它能够让科技管理决策不再是粗放式的决策,而是更加精细化的决策。再者,它让科技管理决策不再是单一性的决策,而是多个主体部门的协同决策。最后,它可以让科技管理决策从被动式的决策变为主动性的决策。本文分析了科技管理大数据的特征、结构、意义等,研究了科技管理大数据对高效、科学的决策带来了非常大的作用。因此,我们需要努力推动基于大数据的高校科技管理决策。
(1)建立大数据驱动科技管理决策的意识。目前很多高校仍然只是建立了各科技管理部门的信息系统,按照信息系统的基本业务流程进行管理,在此基础上进行简单的统计分析,从而辅助科技管理部门进行科技管理决策。科技管理部门主体能够知道科技数据能够让科技管理决策更加精准、更加全面,但是大部分高校科技管理主体仍然是利用计算机进行辅助决策,很少有科技管理主体能够意识到科技管理决策的大数据驱动作用,也很少能够利用到科技管理大数据进行科技管理决策,因此要在科技管理部门主体间建立大数据驱动科技管理决策的意识,让他们建立大数据科技管理的平台,充分挖掘科技管理数据,真正实现大数据驱动的科技管理决策。
(2)推动科技管理主体间数据充分共享。过去,数据尚未引起充分重视,科技管理部门在做决策时,很少参考其他部分的相关信息,即便是参考了也仅限于某一单位或部门的内部信息。大数据为科技管理部门带来了极大的好处,科技管理主体部门掌握的科技管理数据,若不加以充分利用,会造成巨大的资源浪费。通过充分推进科技管理主体间的数据共享,能够挖掘新的价值,让科技相关数据增值,可以大大提高科学决策的准确性。同时,数据充分共享是科技管理大数据功能的外在体现,可以让不同类型的用户了解数据概况,共同推动决策。
(3)建立科技管理大数据的动态分析模型。科技管理决策需求的及时性和准确性,造成大数据的动态性对现有的增量式机器学习方法的巨大挑战。针对大数据动态增量问题,可以在科技管理大数据分析过程中增加一个训练学习、执行预测和动态反馈形成自适应的多步骤自适应学习模型。同时,利用大数据的强化学习模型,在科技管理决策中,学习历史管理和决策经验,分析科技管理中的增量数据,形成新的科技管理和决策的变化,从而帮助提高科技管理决策的精准度。
(4)建立科技管理大数据隐私保护。目前大数据隐私保护问题已经被广泛关注,科技平台相关数据也属于隐私保护的敏感信息范畴。在大数据的应用过程中往往不可避免地触及到敏感数据的传输、交互及分析,特别是在跨平台、跨领域数据的决策分析中,隐私数据暴露显得尤为突出。如科技创新观点、创新思路、科研经费的支出等在提交审查过程中发生的信息暴露。现阶段,由于缺乏有效的隐私保护手段,一定程度上放慢了科技管理大数据决策的落地,在技术层面和管理层面,数据隐私都面临严峻的挑战。