面向开放科学的知识服务智能化:人机协同视角*

2022-12-26 03:16张双志张龙鹏
情报杂志 2022年12期
关键词:科研人员科学家公众

张双志 李 敏 张龙鹏

(1.成都大学师范学院 成都 610106;2.电子科技大学公共管理学院 成都 611731)

0 引 言

2021年11月,联合国教科文组织第41届会议审议通过的《开放科学建议书》将“开放科学”(Open science)定义为一个集理念与实践为一体的包容性框架,主张科学应向不同区域、学科以及职业生涯不同阶段的科研人员,还有传统科学界以外的公众科学家开放知识创造、评估和传播的全过程[1]。开放科学是全球科技发展的大势所趋,推进共享、共赢和可持续的科学研究是科技界的共同理想和目标[2]。知识服务被视为推动开放科学实践的重要手段,在支持知识增长和共享方面具有独特优势,助力增加不同知识持有者参与科学研究的机会,使职业科学家、公众科学家、学术团体等协同生产知识成为一种可能。然而,面向开放科学的知识服务却面临着组织中心化、资源配置不佳、以及协同生产失衡的发展挑战,这明显制约了期刊论文、图书著作、研究报告、专利发明等知识资源在知识持有者之间的便利可及性。这些问题并不能单纯依靠制度建设本身获得较好解决,可考虑从外部环境中寻找解决路径。

新一代数字技术为知识服务未来形态的塑造提供了无限可能性,关注知识生态系统构建的去中心化组织也孕育而生[3]。人工智能的嵌入打破了知识服务传统的“中心—边缘”式组织架构,促使每个有意愿参与科学研究的知识持有者都可以公开使用、可访问和可重用知识资源[4],构建了一个突破时空限制、数据快速解析与内容迭代更新的知识服务平台。因此,面向开放科学的知识服务智能化是指充分利用人工智能对知识资源从知识采集、知识标的、知识计算到知识推送进行全生命周期管理,在即时满足知识持有者使用需求的同时,也能快速洞悉知识的未来趋势,以此为科学研究提供可选择的发展方向。但现有文献尚未对面向开放科学的知识服务智能化展开系统研究,鉴于此,本文针对开放科学环境下知识服务存在的发展困境,探讨“人工智能+”破解知识服务困境的逻辑机理,并进一步阐述知识服务智能化的总体架构、驱动机制以及实现路径,为满足用户个性化、精准化的知识使用需求提供学术洞见。

1 开放科学环境下知识服务面临的发展困境

聚焦知识检索、知识推送、知识咨询、知识订阅等内容的知识服务,在推动开放科学实践的进程中面临诸多困境,例如组织中心化、资源配置不佳、协同生产失衡等,这需要引起学界的重视并提出相应解决路径。

1.1 开放科学环境下的知识服务面临组织中心化

从“三重螺旋”(大学—产业—政府)向“四重螺旋”(大学—产业—政府—公众)演化的知识生产模型Ⅲ,认为公众既是科技创新的用户群体,也是科学研究的重要参与者[5],这引发知识服务向体制化科学界外的公众开放知识创造、评估和传播的全进程。但由于以出版社、图书馆、科技馆等为代表的传统知识服务组织存在门槛效应[6],公众科学家很少能直接获取其提供的知识资源,这与开放科学的开放获取原则相去甚远。而且,传统知识服务组织的“中心—边缘”式运行逻辑客观上加剧了知识资源分布不均的现象。可见,知识服务组织存在的中心化问题不仅禁锢了利益相关者参与开放科学的积极性,也可能会导致科学知识生产出现停滞、甚至是退化的现象。

1.2 开放科学环境下的知识服务面临资源配置不佳

开放科学的核心目标是保证科学研究的可持续性,这涉及到科学出版物、研究数据、基础设施等方面的知识资源共享使用[7]。但由于组织壁垒、服务边界、制度藩篱等因素的存在,知识服务在不同区域、不同学科、以及不同群体之间存在资源分配不佳的问题。从区域差异来说,与广袤的中西部地区相比,东部地区由于拥有数量众多的科研机构、出版社、图书馆等,有能力提供类型多样的知识服务。就学科差异而言,以医疗健康领域为例,为引导公众对身体健康监控数据的及时共享,许多医疗研发机构会主动为其提供全周期的知识服务[8],而一些“冷门”学科能获取的知识服务就明显不足。从群体差异来说,无论是在体制内的专家型科学家与新手科学家之间,还是在体制外的职业科学家与公众科学家之间,后者往往都是知识服务享受不充分的群体。

1.3 开放科学环境下的知识服务面临协同生产失衡

在科研人员越来越广泛和多元化的背景下,特别是当具有不同目标、动机和能力的公众科学家涌入科学研究领域后,传统知识服务的预定义面临解构失效的风险,科学研究边界的不可预测性也愈发明显。“公众科学”(Citizen science)作为一种新型研究范式,是指公众以智力形式,或以智力周边的知识、工具、资源等方式参与科学研究[9]。因此,在面对开放科学的开放获取、开放数据、开放教育资源、开放评价等多重要求时,公众科学可以在其中发挥更大的“群体智慧”[10]。然而,当前的知识服务在采用公众科学研究范式方面存在明显不足,未能有效协调各知识持有者积极参与知识内容和解决方案的生产,从而限制了为深入推进开放科学实践提供类型广泛、粒度不一的知识服务能力。

2 “人工智能+”破解知识服务困境的逻辑机理

人工智能的技术开放性、可供性和生成性有助于破解知识服务在推进开放科学实践中所面临的发展困境,实现组织去中心化、资源优化配置和协同生产机制的构建,具体的逻辑机理如图1所示。

图1 “人工智能+”破解知识服务困境的逻辑机理

2.1 技术开放性破除知识服务组织的中心化壁垒

传统的主客二分式组织架构存在削弱一线科研人员参与知识服务的积极性,但人工智能的“开放性”(Openness)为破除知识服务的组织壁垒提供了变革途径。去中心化的组织架构允许职业科学家、公众科学家、行业企业、学术团体等利益相关者自由展开跨组织边界和层级的知识共享[11],并参与跨地域、跨学科以及跨群体的知识资源联合治理,根据自身需要建构或补充知识内容和解决方案。其中,数据共享是推动知识服务开放性建设的关键,这有利于减少科研人员在资料收集、数据整理等方面的不必要重复劳动,而把时间和精力主要用于知识资源的再生产方面[12]。未来技术库、技术路线图、科研项目库、案例数据库等大数据在智能平台上的集成,通过机器学习、深度学习等算法的标识和分析,有助于产出更高质量的知识内容方案,从而赋能开放科学的深入推进。

2.2 技术可供性促进知识服务资源的优化配置

人工智能的“可供性”(Affordances)为知识持有者利用相同的智能工件、智能平台与智能基础设施生成类型多样的知识资源提供了媒介载体。具体而言,人工智能将在技术资源、空间资源和制度资源方面为激发知识持有者的创新潜力提供支撑。关于技术资源供给,人工智能不是某种单一的技术,而是由数据、算法和算力等构成的技术群,科研人员可根据不同的场景需求运用相应的技术以达成预期目的。关于空间资源供给,物联网(IOT)、分布式网络等技术重新定义了知识服务的系统边界及其嵌入科学研究的可能性,推动基于邻近性原则的知识空间机制重构。关于制度资源供给,互联互通的知识服务有助于实现跨区域、跨学科、以及跨群体之间的知识交流,充分借鉴和整合不同领域的优质知识资源[13],从制度层面打造了促进科学研究发展的质量文化。

2.3 技术生成性构建知识服务的协同生产机制

开放科学倡导构建一种全新的开放式创新模式,强调知识资源能被知识生产者与消费者平等、公平地获取共享,为不同研究群体、包括传统科学界以外的社会公众提供科学出版物、研究数据、教育资源、开源软件和源代码等多重支撑[14]。人工智能的“生成性”(Generativity)指涉“一项技术在大量、多样和不协调的使用者驱动下产生非预期变化的总体能力”[15],其加持知识服务聚焦于理解开放科学背后的不确定性,以及知识内容和解决方案如何应对这种不确定性。换言之,人工智能通过对数字化的知识资源进行快速汇聚、标的处理和迭代分析,形成在内容生产时即可考虑服务需求的响应式系统。面向开放科学的知识服务智能化,迫切需要知识持有者之间的共建共享(例如数据库建设),他们在协同生产中既是知识服务的建设者,也是知识服务的受益者[16]。

3 知识服务智能化的总体架构及驱动机制

知识服务的组织去中心化、资源优化配置及协同生产构建如何落地,需要结合人工智能的算力、算法、数据等关键要素为知识资源的数字化表达、集成化获取、智能化分析提供技术支撑。接下来,在系统搭建知识服务智能化总体框架的基础上,根据现有文献进一步阐明知识服务智能化的驱动机制。

3.1 知识服务智能化的总体框架

围绕打造知识资源共享和按需使用的智能化服务系统,构建标准统一的数字底座、集约高效的平台体系和泛在连接的统一门户,高效赋能开放科学的全场景智能应用,为实现数据驱动、一体协同、全业务融合的知识服务智能化提供总体框架,具体的结构设计如图2所示。首先,数字底座涉及算力、算法、数据、知识等四大信息基础设施体系,为知识全要素数字化、知识资源运行实时可视化、知识管理决策协同化和智能化提供强有力支持。其次,在数字底座的基础上构建涵盖数据平台、操作平台和业务平台的共性系统平台,为加快知识服务全场景融入和支撑开放科学的深入推进提供必要的一体化数字界面。再次,基于数字底座和平台体系,建设一条兼具智能运行和安全可信的“知识服务链”,为各知识持有者共同参与科学研究提供知识检索、知识推送、知识咨询和知识订阅等全方位的知识服务。最后,面向职业科学家、公众科学家、知识管理者等不同对象,提供便利可及的统一门户,实现知识服务在APP、小程序、浏览器、微信公众号等常见的媒介载体上“一键触达”。

图2 知识服务智能化的总体架构

3.2 知识服务智能化的驱动机制

现有文献发现驱动人工智能创新的影响因素比较多,但其中最直接的影响机制是“分布式创新”(Distributed innovation)和“重组创新”(Recombinant innovation)[17-18]。因此,遵循已有研究结论对知识服务智能化展开分析,发现开放科学环境下的知识服务参与者是分布式存在的[19],且具有不可预定义性,需要对不同来源的知识资源进行快速的重组创新[20],以便满足不同知识持有者个性化、精准化的知识服务需求,为促进知识的迭代更新提供必要支撑。

分布式创新在本质上是一种去中心化的研究范式[21],即不同知识持有者通过自选择参与、自组织协调和合作对共同感兴趣的知识服务议题进行共同生产,以快速提升知识内容方案的生产效率。一方面,人工智能在知识管理者与科研人员、职业科学家与公众科学家等不同主体之间塑造了一种新型的多对多互动模式,这有助于消解不同知识服务提供者之间的组织壁垒。另一方面,离散且平等分布的数字节点网络,为扩大知识持有者的参与数量和规模提供了平台支撑,有相近或相同需求的科研人员在数字平台上组建具有身份认同的虚拟社区,并在此社区中共建共享知识资源,从而打造服务科学研究的知识服务数据库。简言之,分布式创新大幅降低了知识检索、知识推送、知识咨询、以及知识订阅的成本,吸纳许多充满活力的公众科学家共建共享高质量的知识服务。

重组创新并不是一个新概念,而是源于熊彼特对创新的定义,即创新就是对现有生产要素进行重新组合[22]。结合“人工智能+”的数字属性,将知识服务智能化的重组创新定义为知识持有者聚焦数字化知识资源的重组使用和重组创造,通过“拆装”和“整合”现有的工件、平台、基础设施等资源要素,为新问题的解决提出知识内容方案,甚至是创造新的知识见解[23]。知识资源的数字化使得知识服务具有“可重新编程”(Reprogrammable)的特性,这可从资源端的设计思维和使用端的需求思维进行理解。资源端聚焦现有知识资源和潜在可获得的知识资源,通过智能算法对其重新排序、组合和建构类型多样的知识服务方案。使用端强调如果要创造新的知识价值应该如何组合数字化的知识资源,以此预研一批具有引领性的知识服务方案,反过来推动知识持有者需求的转型升级,从而创造出远远超出最初预期的知识成果。

4 开放科学环境下知识服务智能化的实现路径

知识服务智能化涉及如何构建一个规模庞大、关联甚广的服务平台,但这并不能一蹴而就。鉴于此,从组织搭建、平台打造、机制构建的角度设计知识服务智能化的实现路径,以期深入推进开放科学的发展。

4.1 搭建联盟链架构,助力知识服务的组织去中心化

人工智能加持区块链将从流程驱动、组织适配、数据使能等维度搭建知识服务的联盟链组织架构,实现开放科学环境下知识服务不同环节之间的协作,重构“知识服务生产者—知识服务消费者”的双轮驱动模式。具体如图3所示,在联盟侧链上开展高频少量的某个研究项目的知识服务交易,而联盟主链则通过与多个侧链的交易信息进行互联互通,最终实现知识服务从生产、分配、流通到消费在链上的有效衔接与高效运转。去中心化联盟链组织的构建,除了有助于出版社、图书馆、科技馆等组织内部技能和专业知识的分享交流外,也获取了新的外部合作所带来的知识红利,这无疑对推动开放科学的深入实践是十分必要的。例如,由欧盟委员会资助的公众科学计划“Ground Truth 2.0”在全球布局了6个观测站,鼓励职业科学家与公众科学家联合就当地社区感兴趣的环境保护、气候观测、城市规划、社会治理等问题展开合作,并在研究过程中及时向公众科学家提供必要的知识图谱、研究数据等知识服务[24],这就在充分调动公众科学家参与积极性的同时,也确保了相关研究项目的顺利推进。

图3 知识服务智能化的联盟链架构

4.2 “知识服务链”打造一站式智能平台,助力资源共享

集成数据、算法、算力的人工智能可能会导致许多出版社、图书馆、科技馆等知识服务组织无力统合散落在不同系统和平台中的数字技术,从而不能展现出“人工智能+知识服务”的全部甚至是部分效应。显然,无法实现数据自由交换的分裂式平台,已经严重影响科研人员对知识服务智能化的使用体验。针对不同的开放科学项目,识别困扰业务发展的核心场景,利用自然语言处理技术、知识图谱、机器学习、深度学习、神经网络等算法模型对此深挖进去,从而形成一个便利可及的体系化智能平台。构建聚焦开放科学核心业务的场景化解决方案群,助力推动各利益相关者持续性释放知识创造力。具体如图4所示,利用人工智能加持区块链构建一条完整的“知识服务链”,将链下数据集成、链上链下互操作、链间互操作、以及应用层互操作置于统一的技术框架中,实现知识服务从生产、流通、分配到消费的数字化、网络化和智能化转型,从而打造了跨越数据边界、知识资源共享和按需使用的知识服务平台。

图4 一站式“知识服务链”平台

4.3 构建激励机制,助力知识服务的协同生产

协同生产作为知识服务的变革趋势,需要出版社、图书馆、科技馆等组织广泛吸纳职业科学家、公众科学家等科研人员积极参与知识内容和解决方案的创造、评估和传播。其中,激励机制的构建是实现知识服务协同生产的关键。科研人员在参与开放科学实践中所产生的附加成果,例如研究数据、知识图谱、软件及源代码、实验日志等都是知识服务的重要内容。但由于这些附加成果与传统的学术产出形式不同,可能无法以期刊论文、会议论文、学术著作等科学出版物进行传播,这可能会削弱科研人员提供知识服务的积极性。鉴于知识服务成果在推动科技创新中所发挥的基础作用,出版社、期刊编辑委员会、科研机构、学术团体等应对科研人员在开放科学实践中产生的附加成果,采用但不限于同行评审通过后作为学术评价和职称认定的重要依据。当然,随着开放科学实践的日趋深入,如何治理研究数据私有化、利用研究数据牟利、科研人员“机会成本”增加、以及商业模式下的科技出版高额处理费等负面现象,成为确保学术交流多样性和对知识服务产出进行知识产权保护的重要议题。

5 结 语

算法作为人工智能的核心,在自适应学习过程中有可能会出现连算法工程师等专业人员都不能理解的“黑箱”问题[25]。究其原因,在于算法并不真正“认识”这个世界,其对事物的解读更多是停留在相关分析层面,甚至有时候连这种相关分析都是模糊且不精准的。因此,面向开放科学的知识服务智能化在算法黑箱的影响下并没有预期的那么“智能”,为破解这一新型“技术利维坦”困境,未来应重点关注以下两个方面。

一方面,关注知识服务智能化的技术支撑,深化人工智能加持区块链下的“知识服务链”的研究。区块链被视为价值互联网的核心技术群,本质是通过链式时间戳、共识算法、智能合约等一系列技术,形成链上节点之间的信任和共识机制[26],这有助于在交易流通中塑造一种新型的生产关系,实现数据的安全存储、可信传输及共同生产,从而充分调动科研人员参与知识服务的积极性。因此,基于区块链技术的知识服务智能化如何实现值得深入研究。

另一方面,关注知识服务智能化的结果使用,进一步探索如何科学解读人工智能的分析结果并从中获益的问题。人工智能的开放性在塑造知识服务共同体的同时,也在知识生产和产权占有之间制造了分歧,即客观上存在“开放悖论”的困境[27]。未来研究可以尝试,将知识产权保护机制引入知识服务智能化,建构一个适合知识服务的知识版权开放、共享与使用的监管机制。知识产权的清晰化有助于科研人员不再满足于人工智能所呈现的相关分析结果,而是投入更多的时间、精力和智力去探究现象之间的因果关系。

猜你喜欢
科研人员科学家公众
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
公众号3月热榜
公众号9月热榜
公众号8月热榜
公众号5月热榜
假如我是科学家
企业科研人员激励问题及对策研究
与科学家面对面