杨中方 金依霖 何加敏 朱政,2,3 胡天天 余骏雯
(1.复旦大学护理学院,上海 200032;2.上海市循证护理中心,上海 200032;3.纽约大学护理学院, 纽约 10010)
随着信息技术的快速发展和大数据时代的到来,症状网络的应用逐渐受到广泛关注。症状管理会随着个人结果以及人、健康/疾病或护理环境的变化而发生改变,是一个从多维角度开展护理研究的过程[1]。症状管理可帮助理解症状(群)间的作用机制、制定及检验健康管理策略以及评估干预效果,是一种指导选择健康管理策略的概念,具有很强的普适性[2]。症状网络区别于传统的医学研究,能够将症状和疾病之间的关系加以整合,通过分析症状网络的拓扑结构和网络特性,从更全面的视角发现疾病或症状之间潜在的病理机制和关联模式。症状网络通过分析症状与症状间的交互关系,有助于了解不同症状之间的关联程度、相互作用以及可能的因果链条,从而为个体化的精准诊疗和照护提供支持,促进临床决策的制定。同时通过分析症状网络中的症状变化和网络演化,可以追踪疾病或症状的发展路径和风险因素,预测疾病的预后。鉴于症状网络的重要研究意义,本文旨在介绍基于数据类型分类的3种主要症状网络类型:同期网络、动态网络和时序/个体化网络。对于每种类型,本文将详细阐述其数据基础、网络模型、分析方法及在健康管理相关研究中的应用案例,以便帮助读者更好地理解症状网络在解决现实问题中的潜力和优势。
基于症状的数据类型,症状网络可分为同期症状网络、动态症状网络和时序/个体化症状网络。在所有类型的症状网络中,每个节点代表一个症状。网络中的边代表2个节点之间的条件独立关系,边越粗,2个节点之间的关联性越强[3]。构建症状网络最常用的统计分析软件为R语言,通过R语言的qgraph软件包可实现网络结构的可视化。不同类型的症状网络具有不同的数据特点、网络模型和分析方法,具体如下。
1.1同期网络 同期网络是指在特定时间点或时间段内收集的数据所构成的网络,用于理解疾病或症状间的关联性[4]。见图1。
图1 同期症状网络示例
1.1.1同期网络概述 同期网络是一种偏相关网络,常用于分析横截面横断面数据[4],但目前也出现了采用时间序列数据来构建同期网络的研究。在Curtiss等[5]的研究中,研究者使用了时间序列网络模型来评估34例焦虑症和抑郁症患者积极和消极情绪的同期网络结构,以识别积极情绪和消极情绪节点在时间序列数据构建的同期网络中是否表现出更强的中心性,以厘清积极情绪、消极情绪与基于智能手机的体育锻炼估计值之间的动态关系。在同期网络中,同价节点表现出正关联(如悲伤和焦虑之间等),相反价的节点表现出负关联(如悲伤和快乐之间等)。这一结果证明在横断面和时间序列水平上,同价情感状态之间存在稳健的正相关关系,而相反价情感状态之间存在负相关关系。
同期网络往往为无向关联网络,常通过弹簧布局算法来生成[6]。该算法可将具有较强关联的节点放置在网络的中心位置,相互之间比较接近。同期网络分析中还可识别出与总体严重程度明显相关的协变量,以厘清在控制了混杂因素后症状之间的真正关系。同期网络的准确性和稳定性采用Bootstrapping方法来评估,可使用R软件的bootnet包实现。通过计算边缘权重值的95%置信区间(CIs)来评估准确性,CIs通常使用非参数引导法来构建。通过计算节点预期影响的相关稳定性系数来评估稳定性,通常采用个案剔除自举法实现。相关稳定系数最好是>0.5,至少要>0.25[6]。
同期网络可通过节点的中心性指标从机制角度识别核心症状。用以下3种中心性指标进行中心性分析:强度中心性、中介中心性和紧密中心性[3]。从机制的角度来看,强度中心性、中介中心性和紧密中心性越高的症状,被认为越重要。较高的强度中心性意味着该症状更有可能与其他症状一起出现。中介中心性是由1个节点作为2个节点之间最短路径上桥梁的次数来衡量的。中介中心度较高的节点具有更大的网络影响力。紧密中心性是由1个症状节点和所有其他节点之间的平均距离(逆向距离)表示。路径越短,紧密中心度值越大。∑s(2个节点之间所有Spearman系数的绝对值)被用作表示网络密度的指标。
同期网络使用mgm(mgm是R中的软件包,被用于存储“混合”数据,如顺序等级变量和连续变量,并利用这些数据构建网络模型。这个软件包的全称就是“mgm”)来确定每个节点的可预测性[7]。节点可预测性是评估网络中所有其他节点对给定节点的预测程度的指标[8]。具有较高可预测性的症状表明可以通过其邻近节点来控制该症状。相反,如果可预测性较低,需要直接对症状进行干预或寻找网络外的标记。同期网络往往需要进行差异测试,来确定不同变量间的网络连接和中心性的估计是否不同。Zhu等[6]的研究在基于多态相关矩阵的最小绝对收缩和选择算子正则化的部分相关网络中,对边缘权重和中心性指数进行了自举式差异检验。
1.1.2同期症状网络的应用领域 Bringmann等[9]采用同期网络构建抑郁症症状的网络结构模型,发现失重症(即“丧失快乐”)是最中心的节点,与其他症状表现出高度的连接性。此外,网络结构呈现2个节点群落,这与抑郁症的忧郁型和非典型亚型的表现一致。Fisher等[10]在情绪和焦虑症患者的异质样本中进行了一项时间序列研究,发现消极情绪和积极情绪在同期网络结构中高度集中,但抑郁和焦虑2个主要症状却不在同期网络中。积极的情绪节点表现出最大的出强度中心性,预测了下一个时间点的其他几个节点。Curtiss等[11]研究了双相情感障碍患者和健康者的情感与体动仪记录的身体活动的同期网络结构。结果显示,2组患者的积极情感和消极情感节点的中心性没有明显差异。此外,健康组人群的身体活动在同期网络中表现出比双相情感障碍人群更多的连通性,这表明身体活动在情绪心理病理学中对情感的影响起着突出作用。目前,国内研究者较少发表同期症状网络分析的文章,有研究[12]在对2 927例HIV阳性患者构建同期网络发现,随着患者HIV阳性年限的增加,16个HIV相关的心理症状发生率及其严重程度下降,但网络的总连接密度上升,提示HIV阳性年限越长,患者的心理变得更加脆弱,更容易通过一个心理症状快速激活其他症状。
1.2动态症状网络 动态症状网络是描述在不同时间点或时间段内,症状之间交互关系动态变化的网络[13]。与同期网络不同,动态网络关注的是症状随时间推移而发生的变化。见图2。
图2 动态症状网络示意图
1.2.1动态症状网络概述 当症状在几个时间点测量时,就可以估计横断面(同期)的症状间联系(在同一时间点t;a)和纵向(时滞或时间)的症状间联系(从t~t+1;b),其节点间的联系具有方向性,所构建网络为有向网络。另外,节点之间的所有时间性连接都互为等效,而且相互之间的联系可能强度不等。值得注意的是,动态网络分析并不局限于具有离散和等距测量时间点的研究。此外,尽管通常真实世界中只能测量相对较少的离散时间点的结果,但原则上这些结果可以代表连续的时间过程。
动态症状网络通常采用多级向量自回归(vector autoregression, VAR)方法的修改版本分析多个时间窗口间(即面板数据)多种症状的短期动态变化。多种症状从一个时刻到另一个时刻之间的时间动态由VAR模型表示[14]。在VAR模型中,时间点t的因变量(如症状“悲伤”)在自变量的滞后t-1面板上进行回归。通常为了考虑个体之间的差异,假设所有回归系数在人群水平上呈正态分布,可获得由固定(平均)和随机(个体)效应组成的多级模型。
1.2.2动态症状网络的应用领域 因其关注短期症状动态变化,动态症状网络常被应用于心理精神疾病领域的机制研究。正如相关的认知理论[15-16]认为,认知过程的变化(例如消极思维)会导致情感等症状的短期动态变化,动态症状网络的研究目的正在于此。在临床实践中通常可以观察到,当患者的一种症状(例如睡眠问题)得到缓解,其他症状(如头疼)也会逐渐减弱,这预示着康复的开始。相关研究[17-18]通过对抑郁症和压力性生活事件等因素构建动态症状网络发现,抑郁症危险因素和压力性生活事件对抑郁症状有不同的影响。症状之间的相关性直接受到生活压力事件的影响,并且不能用潜在常见原因的变化来解释,这进一步支持了症状之间具有自主相互影响的观点。动态症状网络能够客观地描述症状之间的相互作用,可以为临床研究和实践提供重要线索。梁一鸣等[19]使用动态网络模型分析了197名地震儿童幸存者4年的创伤后应激综合征首次出现症状纵向数据,结果发现,闪回的中心性居高不下,侵入性想法和创伤线索引发生理性反应的中心性随时间推移而增强,而创伤线索引发情感反应和未来无望的中心性呈弱化趋势,这为建立灾后阶段性干预模型提供了见解。
1.3个体化症状网络 个体化症状网络是指基于个体的特定特征、行为或症状组数据构建的网络[4]。个体化网络描述了不同个体症状之间的关系和相互作用,突出了个体之间的差异性和个体特征在网络中的重要性。通过建立个体的症状网络,结合个体的人口学资料、社会经济学资料和疾病资料等多维数据,可实现精准的症状风险评估、个体化的预防、治疗和护理,提高个体健康结果的预测准确性和健康管理效果。
1.3.1个体化症状网络概述 单个个体的症状会随着时间推移发生动态变化,所以个体化症状网络包含同期网络和动态网络。单个个体的密集时间序列数据可构建个体化症状网络,作为理解该动态变化的有效途径[4]。这些密集的时间序列数据可以通过生态瞬间评估(ecological instantaneous assessment, EMA)收集[20],也称为经验抽样法(experience sampling method, ESM)。EMA是一种在个体的自然状态下实时收集数据的方法,用以评估个体在日常生活中的行为、情绪、感受和环境,有助于减少回忆偏倚,获得更真实和准确的信息。个体化症状网络通常采用VAR的统计方法来估计,该方法多用于大型数据集的分析[21]。值得注意的是,VAR分析本身侧重于对时间关系(不同测量窗口之间发生的关系)的估计,即动态网络。然而,VAR模型的残差则可以进一步用于估计同期关系(发生在同一测量窗口的关系),即同期网络。
VAR方法的主要局限性在于,即使用于估计同期网络,其结果也取决于所使用的滞后间隔。如果滞后间隔短于动态的时间范围,则可能无法发现有意义的关系(例如食欲不振导致的体重减轻可能在几天或几周内发生,而不是几小时内)。相反,如果关系发生或变化过快,它也可能无法被检测(例如关系的影响若在几分钟后消散,则可能无法在每小时或更长时间间隔测量个体化数据的设计中捕获它)。最佳滞后间隔通常是未知的,不同变量的最佳滞后间隔不同,甚至同一变量可能因个体而异。滞后间隔时间的选择通常依赖研究者的临床和科研经验及研究的可行性。
1.3.2个体化症状网络的应用领域 个体化网络常用于研究个体随着时间推移可能出现的心理动态变化。如Kroeze等[22]将1例患有焦虑和抑郁症状的67岁女性患者作为个体化网络分析对象,对其情绪和情境相关变量进行2周的密集监测并进行EMA,结果发现感觉放松会增加体力活动,从而在接下来的几个小时内引起身体不适。身体不适会因为其症状与其担心的躯体(焦虑)症状相似而产生压力。这让个体更加深刻地认识到,以躯体症状表现出来的压力在她的焦虑症中起着核心作用,这对关于如何应对由躯体(焦虑)症状引起的压力具有启示作用。个体化症状网络的局限性在于监测到的症状动态可能无法推广到任何其他时态,这值得进一步探索。此外,个体化网络还被用于研究日常生活中物质使用的预测因素和后果,不同时间间隔的渴望和使用之间的关系[23],以及物质使用动机[24]。
症状网络是描述和分析疾病的症状之间相互关系的网络模型。根据数据类型的不同,将症状网络分为同期网络、动态网络和时序/个体网络3种类型。尽管3种症状网络在不同领域的应用前景广阔,但仍存在潜在挑战。首先,症状网络的构建需要大量的数据,并且对数据的质量和准确性有较高的要求,因此,研究人员需要开发更精确和可靠的算法和代码来筛选和处理数据,以提高症状网络分析结果的准确性和可靠性。其次,症状网络的分析和结果解释需要结合专业领域知识和专家经验,以确保对网络结果的正确解读和有效应用。此外,隐私和伦理问题也需要充分考虑,特别是在个体化医疗和健康数据共享的场景中,应确保在使用症状网络时保护用户的隐私和数据安全。尽管如此,症状网络研究在健康管理中的作用和意义仍不容忽视。首要作用在于发现症状关联,能够揭示不同症状之间的关联模式,帮助我们了解某些症状可能与其他症状共同出现、相互影响的规律,这有助于早期发现和诊断复杂的疾病,提高对疾病的认知水平。预测疾病风险也可通过症状网络分析实现,这有助于实施精准的健康干预措施,降低疾病风险,提高患者的整体健康水平。症状网络还可通过对不同患者症状网络的比较,更好地理解个体之间的差异,从而制定出更适合个体需求的医疗方案,为个性化医疗奠定了基础。随着健康大数据的不断积累,症状网络研究将有更丰富的数据可供分析,从而更全面地认识不同症状之间的关联。同时,数据处理技术的不断提升也将使得症状网络的构建和分析更加高效和准确,从而实现更加精准的预防和早期干预,这将对提高整体健康水平和降低医疗成本产生积极影响。未来研究可探索将症状网络与其他数据源和模型进行整合,以获得更全面和深入的研究结果。此外,研究人员应进一步拓展症状网络的应用领域,包括健康政策制定和医疗资源分配等方面,以提升症状网络在更广泛范围内的价值和影响力。