中图分类号:R285文献标识码:Adoi:10.3969/j.issn.1673-7202.2021.04.001
本指南遵守了世界中医药学会联合会发布的《世界中联国际组织标准管理办法》和《标准制定和发布工作规范》(SCM 0001-2009),版权归世界中医药学会联合会所有。
网络药理学是人工智能和大数据时代药物系统性研究的新兴、交叉、前沿学科,强调从系统层次和生物网络的整体角度出发,解析药物及治疗对象之间的分子关联规律,被广泛应用于药物和中药活性化合物发现、整体作用机制阐释、药物组合和方剂配伍规律解析等方面,为中药复杂体系研究提供了新思路,为临床合理用药、新药研发等提供了新的科技支撑。
在大数据背景下,随着网络药理学的影响力和应用日益广泛,网络药理学在理论分析、算法发展和实际应用等方面面临着重要的发展机遇和挑战。整合临床、实验的海量数据,结合科学验证,揭示药物对疾病的调控机制,是网络药理学研究的主要任务。然而,目前网络药理学研究存在质量良莠不齐、数据缺乏规范、科学检验不足等问题,亟须建立严谨规范、科学统一的网络药理学研究评价标准,以保障该新兴学科的健康发展。
本文件以网络药理学的核心理论“网络靶标”为基础,建立网络药理学评价的规范性标准,推动基于“网络靶标-系统调节”的研发模式成为更严谨、更科学、更普适的新一代药物研究范式,推动网络药理学更规范地开展计算、实验、临床应用,促进该学科快速、健康与有序发展。
由于网络药理学研究的多样性、复杂性,以及目前研究水平与条件的局限性,其评价方法尚有诸多问题亟待进一步解决。本文件将结合网络药理学研究以及学科发展,不断修订和完善。
1 范围
本文件规定了网络药理学研究过程中数据收集、网络分析,以及实验验证的原则、流程和评价指标等内容。
本文件适用于从事网络药理学及相关学科的研究或审评人员,进行中药、植物药、动物药、化学药、生物药等药物作用分析,以及疾病机制分析。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 36344信息技术 数据质量评价指标;
GB/T 34945信息技术 数据溯源描述模型;
GB/T 6379测量方法与结果的准确度(正确度与精密度);
AIOSS-01人工智能 深度学习算法评估规范;
GA/T 1587声纹自动识别系统测试规范。
3 术语和定义
下列术语和定义适用于本文件。
3.1 网络药理学
融合系统生物学、生物信息学、网络科学等学科,从系统层次和生物网络的整体角度出发,解析药物与治疗对象之间的分子关联,揭示药物的系统性药理机制,从而指导新药研发和临床诊疗,是人工智能和大数据时代药物系统性研究的新兴原创学科。
3.2 网络靶标
生物分子网络中,能够机制性关联药物与疾病,并定量表示药物整体调节作用机制的网络关键环节,包括关键分子、关键通路或关键模块等。
3.3 物质基础
药物所含化学成分及其相关属性,包括化学物质的名称、类型、理化属性、药代动力学参数等。
3.4 药物靶标
体内能被药物作用的生物分子,包含蛋白质(Protein)、核糖核酸(RNA)、脱氧核糖核酸(DNA)等。
3.5 网络分析
针对疾病相关或药物干预的生物分子网络进行深度分析和挖掘,包括网络基本分析(度、介数、聚集系数等网络基本参数)和网络深度分析(网络模块、网络动态分析等)。
3.6 生物功能注释
针对疾病相关或药物干预的生物分子网络,应用生物信息学方法,进行生物通路(Pathway)、基因本体(GO)等功能注釋与富集。
3.7 生物功能预测
基于网络分析的规律性结果,应用生物信息、人工智能等进行功能预测。
3.8 准确率
正确检出的信息数量与被检索数据库中相关信息总量的比率。
3.9 查准率
经验证正确检出的信息量与检出信息总量的比率(来源:GA/T 1587,3.13,有修改)。
3.10 查全率
正确的检出信息量与被检索数据库中相关信息总量的比率,用于衡量信息检索系统检出信息的能力
(来源:GA/T 1587,3.14,有修改)。
注:查全率也称召回率、灵敏度。
3.11 特异性
干扰物存在时,分析系统可以正确区分或检测被测量对象的能力。
3.12 F值
查准率与查全率的加权调和平均值,用于评价分析方法的有效性。
公式为:F=(α2+1)×查准率×查全率/α2×(查准率+查全率)。
注:当α=1时,即为F1值
(来源:GA/T 1587,3.15,有修改)。
3.13 信度
在一定条件下,采用同样方法对同一对象重复分析时所得结果的一致性及稳定性程度。
3.14 效度
通过相应分析方法或手段能够准确判断出拟分析对象真实情况的有效程度。
3.15 一致率
在相同条件下,用某种分析方法重复分析同一受试对象时,分析结论一致的比例。
4 评价要求
在网络药理学评价中,要求从可靠性、规范性和合理性3个方面进行评价。具体要求如下:a)可靠性评价:评估主要数据及其关联信息的获取、软件算法与分析方法的设计以及验证方法的选择与模型构建是否可靠、能否满足分析要求。评价要素与评价指标的选择可参考附录A中的表A1。b)规范性评价:评价数据信息的提取与转换、软件/算法的开发、网络的构建与分析以及实验验证等流程是否规范,相关技术方法的应用是否准确,用于保障分析结果的准确性和可重现性,评价要素与评价指标可参考附录A中的表A2。c)合理性评价:评估数据筛选与过滤、网络分析指标的选择与阈值的确定、验证模型及检测指标的选择等内容是否合理性,评价要素与评价指标可参考附录A中的表A3。
5 评价内容
网络药理学评价内容分为基础性评价和扩展性评价,具体内容参见表1。
5.1 基础性评价
在网络药理学研究中,针对不同的分析对象(疾病、药物)和分析目的(数据库开发、算法开发、机制研究、诊疗发现、药物研发等),必须开展的评价内容,以保证分析结果的真实可信。
5.2 扩展性评价
在基础性评价之上,针对不同的分析对象和分析目的,可选择开展的评价内容,使评价活动更加深入和客观,以提升网络药理学分析结果的可信度。
6 评价的技术内容
网络药理学评价的技术内容分为数据收集、网络分析和结果验证3个方面,具体内容参见表2。
6.1 可靠性评价
6.1.1 数据收集
主要评价药物的物质基础、生物靶标等基础数据来源及收集方法的可靠性。评价内容如下:
1)数据来源,评价使用数据的出处,如文献、数据库、实验数据等;
2)数据信息,评价使用数据的整体情况,如数据总量、收集时间、相关数据库版本等;
3)关联信息,评价不同数据间进行关联的相关内容,如关联信息的数量、种类等。
本文件优先推荐采用经严谨实验验证或权威文献来源的数据,对于软件预测和非文献来源的数据库数据,应尽量提供数据的可信度评价,推荐采用高信度的数据。
6.1.2 网络分析
评价生物靶标网络分析中新开发算法的可靠性,或拟选择分析方法的正确性与稳定性。主要评价内容如下:
1)软件算法,评价分析过程应用的软件或算法,如已成熟应用的软件或算法、原创的软件或算法;
2)分析方法,评价分析过程采用的具体方法,如总体技术路线、实验研究思路等。
如果采用新開发的算法,常用的评价指标包括算法实现、功能的正确性,以及算法性能的准确率、召回率和F值等。
如果将相关领域已成熟的分析方法应用于网络药理学分析,建议采用标准数据集或实验数据对拟选用的方法进行可靠性分析,其中标准数据集应参考数据收集进行可靠性评价。
如果采用已有的网络药理学分析方法,应明确标注该分析方法的出处。
6.1.3 结果验证
评价验证过程中,采用方法的可靠性、可重复性等,以保证验证结果和最终结论的可信度。主要评价内容如下:
1)验证方法,评价结果验证过程采用的具体方法,如文献验证、计算机辅助验证、实验验证、临床试验等;
2)模型构建,评价结果验证过程采用的模型构建方法与终点指标。其中,评价模型包括计算机模型的构建、体内外实验模型的建立、临床研究队列的入组等;终点指标包括金指标、代表性指标等。
本文件优先推荐采用体、内外实验或临床试验进行验证。
6.2 规范性评价
6.2.1 数据收集
评价数据收集过程中,数据信息的完整性、数据提取的明确性与数据处理的规范性。主要评价内容如下:
1)信息提取,评价提取/获取拟分析内容相关信息的方法,如信息提取的规则、范围等;
2)信息转换,评价不同数据信息进行转换的方式和方法,如不同数据库信息的转换、异常信息处理等。
6.2.2 网络分析
评价分析流程的明确性、方法评价的规范性以及分析方法的可溯源性。主要评价内容包括:
1)算法实现,评价拟采用分析软件或算法的实现过程,如软件或算法的调用方式、原创算法的开发方法等;
2)分析路径,评价进行分析的主要过程,如网络分析的流程等。
6.2.3 结果验证
验证网络药理学的分析结果时,评价采用操作流程和结果分析过程等验证流程的规范性,包括计算机模拟过程、体内外实验过程、临床试验流程等。
6.3 合理性评价
6.3.1 数据收集
评价数据收集过程中,针对信息的传递途径、信息的处理过程等内容进行合理性评价。要的评价内容包括:
1)数据溯源,评价拟分析的数据能否追溯,如参考文献具体信息、实验或临床试验详细结果等;
2)数据筛选,对拟分析数据进行选择的相关过程进行评价,如筛选原则、筛选条件等。
针对药效成分的筛选,应充分考虑分析对象、吸收途径、药效部位、显效成分、代谢形式、生物利用度、成药性等影响药效学行为因素,选取影响药效学行为的参数进行药效成分筛选。
针对靶标或靶标间相互作用等信息的筛选,应着重考察数据的可信度、获取方法合理性等因素。
6.3.2 网络分析
针对用于筛选重要作用靶标(群)、关键药效成分(群)等要素分析指标进行合理性评价,包括软件/算法参数、网络分析参数等。其中,网络分析参数包括节点与边的特征(如节点度、节点中心性、边权重等)、网络的凝聚性(如密度、聚类系数、子图、连通性等)、网络的可分割性(如层次聚类、谱分割等)、网络模块性、网络基序等。
针对研究的具体疾病,应该综合考虑以上指标,建立合理的病证生物分子网络,确定适宜的网络靶标。
如使用全新计算方法确定药效成分群与网络靶标,还应该考察所选药效成分及网络靶标对整体网络稳态的重要性。
6.3.3 结果验证
评价用于验证网络药理学分析结果的试验设计、检测方法等具体实现过程的合理性。主要的评价内容包括:
1)验证模型,评价结果验证所采用的模型,如计算机模型、实验模型、临床研究队列等;
2)检测指标,评价结果验证所参考的具体检测指标,包括计算机模拟的输出结果、算法效能的检测指标、实验或临床试验的检测指标等。
对于新开发的网络药理学分析算法,需根据结果类型提供适宜的性能评价指标,对其预测结果进行验证,必要时可采用标准数据集进行验证。
7 评价过程
网络药理学评价的一般流程见图1。
主要起草单位:清华大学、世界中医药学会联合会网络药理学专业委员会。
参与起草单位:中国中医科学院中药研究所、中国人民解放军总医院第五医学中心、北京中医药大学、上海中医药大学、安徽中医药大学、天津中医药大学、浙江中医药大学、澳门大学、沈阳药科大学、温州医科大学、遵义医科大学、兰州大学、北京交通大学、天津国际生物医药联合研究院、清华-福州数据技术研究院。
主要起草人:李梢。
参与起草人(按姓氏拼音排序):陈宜涛、丁清扬、戴建业、段贤春、胡元佳(中国澳门)、赖新星、刘清飞、牛明、项荣武、向铮、许海玉、王鑫、杨洪军、杨扩、杨铭、于海洋、张博、张鹏、张倩茹、赵慧辉、赵静。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。