Mamadou S. Diallo,Andre Simpson,Paul Gassman,Jean Loup Faulon,James H. Johnson,William A. Goddard,Patrick G. Hatcher 著袁 飞 巩冠群* 译
1 加州理工学院贝克曼研究所139-74 材料和工艺模拟中心 加利福尼亚州帕萨迪纳 91125
2 霍华德大学土木工程系 华盛顿特区 20059
3 多伦多大学斯卡伯勒学院物理科学系 加拿大多伦多 MIC 1A4
4 太平洋西北国家实验室环境分子科学实验室 华盛顿州里奇兰 99352
5 桑迪亚国家实验室计算生物学和进化计算部 加利福尼亚州利弗莫尔 94551-0969
6 俄亥俄州立大学化学系 俄亥俄州哥伦布 43210
7 中国矿业大学化工学院 徐州 221116
腐殖质(HS)是地球上最丰富的碳库。腐植酸(HAs)是本研究的初始焦点,一般操作上定义为在低pH 值(<2)下不溶于水,在较高pH 值(>2)下可溶于水的HS 组分。它们对各种生物化学和环境过程有重大影响。它们充当(i)土壤稳定剂,(ii)植物的养分库和水库,(iii)有毒金属离子、放射性核素和有机污染物的吸附剂,(iv)具有催化活性的化学缓冲液。由于HAs 是通过其在水溶液中的溶解度定义的,因此这些物质的二维和三维结构模型的开发一直是环境化学、土壤化学和有机地球化学中的一个突出问题。传统的方法通常用于阐明未知化合物的结构。在传统方法中,结构模型是从一系列分析数据中通过反复的试差过程(假设结构与可用的分析数据相匹配)推导出来的。在过去的二十年中,一些研究者使用这种方法为HAs 生成了二维结构模型。Stevenson 提出了一个二维模型,该模型包含了“典型”土壤HAs 的许多关键结构特征。Schluten 和Schnitzer 结合元素分析、13C NMR、热解质谱和氧化降解数据来开发土壤HA 的“最先进的结构概念”。许多研究人员也使用传统方法为HAs开发结构构建块。Steelink 将元素分析数据与滴定数据相结合,开发了他的HA 构建块。Jansen和他的合作者们得到了一个结构性的HA 构建块,它“更充分地结合了实验数据和逆向生物合成分析的结果”。提出的Temple-Northeastern-Birmingham(TNB)腐植酸构建块是Steelink 的HA“单体”的改进版本。然而,这种传统的HA模型构建方法存在2 个主要问题。首先,在大多数情况下,这一过程是手动进行的;因此,对于多功能的地球大分子如HAs 来说,这是一个耗时且不太可靠的过程。第二,也是最重要的一点,当从同一组分析数据中可以推断出许多结构模型时,传统的方法不能提供任何选择适当异构体的方法。因此,用计算化学方法对传统方法生成的HAs 结构模型的物理化学性质进行后续计算时,难以获得可靠的结果。
本文描述了开发HAs 三维结构模型的综合型实验和计算框架(图1)。它结合了实验表征、计算机辅助结构解析(CASE)和原子模拟,生成与HAs 的分析数据和热力学/结构特性相一致的所有三维结构模型或这些模型的代表性样本。这种方法基于4 个基本前提:(1)不同来源(如土壤、植物、沉积物和河流)的HAs 具有不同的结构特征。不能用单一的结构模型来描述不同来源的HAs。(2)在给定一组可靠的结构数据的情况下,图1所示的分层方法可用于生成所有三维模型或这些模型的代表性样本,这些模型与相关HA 的结构数据最匹配。(3)通过标准的和经过验证的计算化学方法,将这些模型用于随后的体热力学和结构性质(例如密度、溶解度参数、13C NMR 光谱等)的计算。(4)只有产生与实验数据一致的体热力学和结构性质的模型可以认为是HA 的可靠三维结构模型。
图1 腐殖质三维结构建模的分层方法Fig.1 The hierarchical approach for modeling the 3-D structures of humic substances
以切尔西土壤HA 为模型物质,对新方法进行了验证。HA 样品是从霍顿淤泥中提取的,霍顿淤泥是一种广泛存在于美国大湖区(密歇根州、威斯康星州、明尼苏达州、伊利诺伊州、印第安纳州和俄亥俄州)的沼泽土壤。本研究选择霍顿淤泥作为HA 源样本部分原因是其来源数据的可用性和对切尔西土壤HA 形成机制的深入研究。霍顿淤泥由占据洪积平原和冰渍的“封闭洼地”“厚度在51 英寸以上的草本有机沉积物中非常深、排水非常差的土壤”组成。导致其形成的原生植被主要由草、莎草、芦苇、天花菜类植物和香蒲组成。霍顿淤泥排水不良,其原生植被特征以及有机质在沼泽土壤中的平均停留时间相对较长表明,植物和微生物降解产物(如木质素降解产物、多酚、糖、氨基酸等)的缩合是切尔西土壤HA 的主要形成途径。
切尔西土壤HA 是基于国际腐殖质学会制定的标准方法提取的。提取的切尔西土壤HA 样品通过元素分析、漫反射FT-IR 光谱、一维1H 和13C 溶液NMR 光谱、二维溶液NMR(TOCSY 和HMQC)光谱和电喷雾电离四极杆飞行时间质谱(ESI QqTOF MS)进行表征。在支持信息的“实验方法和步骤”一节中给出了提取和表征方法的详细说明。
利用CASE 软件的SIGNATURE 生成了与定量/定性分析数据相一致的切尔西土壤HA 的所有三维结构模型。SIGNATURE 程序执行3 个基本任务。首先,它计算出一个详尽的、不重叠的分子碎片和相关碎片间键的清单,这些分子碎片和碎片间的键与相分子关HA 的结构输入数据最匹配。在第二个任务中,软件评估于步骤1 中发现的分子碎片和碎片间的键清单一致的结构模型总数。最后,SIGNATURE 通过随机连接步骤1 中发现的分子碎片和碎片间的键,生成相关HA 的所有三维模型或这些模型在统计学上具有代表性的样本。这个CASE 程序基于特征描述符。一个原子的特征可以被看作是在分子建模软件如Cerius2中定义的原子类型字母表上的一串字符。原子特征可以定义为0、1、2 和h 级别。在任何给定的分子群G 中,x 原子的h_特征是以x 为根的树,它描述了到距离h的键合环境。一个分子基团或一个化学键的h_特征可以很容易表示为其h_原子特征的线性组合。对于类似HAs 的复杂的地球大分子,特征描述符提供了一种简单而可靠的编码方法:(i)将元素分析数据编码为0 级原子特征,(ii)将1H/13C NMR 光谱定量数据编码为1 级或2 级原子特征,(iii)定性数据(例如来自FT-IR 光谱、定性一维/二维NMR 光谱、ESI 质谱等的分子碎片和碎片间的键)作为1、2 或更高级别的分子特征。一旦这些定性和定量数据被编码成HA 的相关特征,下面的守恒定律就为在结构解析中使用特征分子描述符提供了概念框架:分子碎片的h_特征之和+碎片间的键的h_特征之和=相关HA 的h_特征之和。
设hσ(S)和hσε(S)为相关HA 的实验导出的输入h_特征和相关标准误差的集合。每个分子碎片(MF)fi(1 <i<I)的数量xi和每个碎片间的键(IB)bj(1 <i<J)的数量yj可以通过下列方程组来计算:
其中I和J是分子碎片和碎片间的键的总数。由于SIGNATURE 程序的目的是构建分子模型,所以xi和yj总是正整数。由于实验数据有限,方程(1)给出的线性系统通常是不确定的,并且有多个解。然而,为了解析HA 结构,我们寻求最佳的解决方案[方程(2)],即使分子碎片和碎片间的键的特征与相关的HA 的特征之和之间的差异最小化:
其中σ(S)={0σ(S),……,hσ(S),和σε(S)=0σε(S),……,hσε(S)}是输入原子/分子特征和相关的标准误差的向量,Σ 是所选输入分子碎片和碎片间的键的特征矩阵[ 方程(3)],而X=(x1,……,xI,y1,……,yJ)是解向量。方程(2)正式描述了一个整数线性规划问题。SIGNATURE使用2 种基本方法来解决此问题:系统枚举和模拟退火。一旦确定了最佳分子构建块(即MFs 和IBs 的类型和数量),SIGNATURE 就会通过随机连接相关HA 的分子碎片和碎片间的键来生成与输入数据一致的所有三维模型。SIGNATURE 用户还可以施加结构约束,例如生成在指定范围内具有数均分子量的三维模型。因此,如果有相关的分析数据,SIGNATURE 具有为木质素和沥青质等复杂有机地球大分子生成具有代表性的三维模型的固有能力。在支持信息的“计算机辅助结构解析程序”一节中,对SIGNATURE 软件背后的数学理论进行了总结。
利用分子力学(即能量最小化)和NPT MD(等温等压系综分子动力学)模拟计算了SIGNATURE生成的切尔西土壤HA 三维结构模型的体热力学性质(摩尔体积、体密度和溶解度参数)。每个SIGNATURE 生成的结构模型首先进行能量最小化,然后在3000 K下进行3组15 ps的恒容-恒温(NVT)MD 模拟(最终均方根推力为0.1 Kcal/molA)。随后,将每个退火模型放置在具有周期性边界条件的三维单元中,并使用Cerius2无定型结构建立模块将其填充至1.0 g/cm3的体密度。然后对模型进行能量最小化,以消除填充引起的不良接触。每个最小化的三维周期模型随后在T=300 K 下进行25 ps 的NPT MD 模拟,直到其体密度保持恒定。大多数情况下,进行能量最小化只需要2 个周期的MD 模拟,所有MD 模拟和能量最小化过程都采用了能量优化力场(具有范德华相互作用的6 势Lennard-Jones势)。用电荷平衡(Qeq)程序计算所有的部分原子电荷。利用Ewald 求和计算了所有周期系统的长程静电和范德华相互作用。相反,对于非周期系统,这些相互作用直接以截止半径为30 Å 进行处理。在所有的NPT MD 模拟中采用了Berendsen 热耦合方法(时间常数为0.1 ps)和Andersen 压力控制方法(单元质量前因子为0.04)。在完成MD 模拟和能量最小化运行后,计算了每个模型的单元体积(VP)、缩合相应变能(EP)和气相应变能(Enp),并将每个切尔西HA 三维模型的摩尔体积(Vm)、体密度(ρ)和内聚能(Ec)分别表示为:
其 中,Na是 阿 伏 加 德 罗 常 数,Mn是 由SIGNATURE 生成的切尔西HA 模型的摩尔质量。根据Barton 的研究,Hildebrand 溶解度参数(δ)表示为:
方程(4)~方程(7)可用于在生成具有代表性的三维结构模型样本后,通过MD 模拟计算HAs 的体密度、内聚能和Hildebrand 溶解度参数。
利用Chem Draw Pro 的NMR 模块计算了所选切尔西土壤HA 三维模型的化学位移值,并将其输入Bruker Analystik 发布的商业NMR 模拟软件包“NMRSIM”中。用弛豫参数为40 ms 的T1/T2 计算了所选切尔西土壤HA 三维模型等摩尔混合物的13C NMR 光谱,该弛豫参数是针对切尔西土壤HA 样品进行实验测量的。将所测得的FID13C NMR 光谱在“XWIN NMR”中使用指数乘法处理,并先进行100 Hz 谱线加宽,然后再进行傅立叶变换。
切尔西土壤HA 的C(51.31%)、H(4.00%)、O(39.67%)、N(4.12%)和S(0.93%)有机归一化权重分数以及O/C 原子比(0.58)是典型的土壤腐植酸特征。它的漫反射FT-IR 光谱(图2)显示了许多土壤的光谱中发现的典型宽峰和肩峰。在3800 到2200 cm-1之间的区域显示出非常宽的峰,有4 个不同的频率范围。3500 cm-1以上的高频振动属于非键合的OH 伸缩,其中大多数在3400 ~3000 cm-1区域出现的低分辨率宽的肩峰是芳香族C-H 伸缩,3000 ~2800 cm-1区域具有对称和不对称的脂肪族CH2和CH3伸缩的高强度峰。相反,2800 ~2400 cm-1区域的弱峰是COOH 基团的OH伸缩。在1800 ~1300 cm-1区域,观察到几个峰,包括:(i)来自COOH 基团的C=O 伸缩,(ii)芳香族C=C 的伸缩,(iii)CH3基团的CH 变形,和(iv)CH2基团的CH 弯曲。在1270 ~760 cm-1区域,我们观察到几个峰,包括:(i)芳香族C-H 和C-OH 伸缩和(ii)C-H 面外弯曲。它们属于单羟基、二羟基和三羟基取代芳香烃。在1270 ~760 cm-1区域也观察到碳水化合物的特征性脂肪族C-O 和C-OH 伸缩。
图2 切尔西土壤腐植酸的漫反射FT-IR 光谱Fig.2 Diffuse reflectance FT-IR spectrum for Chelsea soil humic acid
切尔西土壤HA 的13C NMR 光谱(图3a)也显示了许多土壤HAs 的13C NMR 光谱的典型特征。脂肪族区域(以峰1 为中心,>50 ppm)可能来自(i)多肽或氨基酸侧链中的碳原子,(ii)直链或支链烃链中的碳原子,或(iii)从吸电子官能团如酯、羧酸、醚或羟基中分离一次或两次的碳原子。峰2 属于甲氧基芳香族碳,是木质素衍生芳香化合物存在的良好指示剂。这种分布与HMQC 光谱(图5)的交叉峰1 一致,表明连在该碳上的质子与木质素和类似来源的HA 中观察到的芳香族质子通过空间相互作用。峰3 属于氨基酸或多肽的α 碳。TOCSY 光谱(图6)与切尔西土壤HA 样品中存在的此类成分或构建块一致。峰4 通常归因于糖,尽管醚、酯、羟基碳也可能在该区域产生共振。在己糖中,异构糖碳(峰5)与“环”碳原子的比例为1 ∶5。对于切尔西土壤HA,峰4 与峰5 的比例约为0.03 ∶11;由此表明,以峰4 为中心的大部分宽峰由糖产生。峰6 属于无氧芳香族碳,而峰7 属于多酚结构的氧取代芳香族碳。峰9 来自含羰基或羧基的化合物(例如脂肪酸、氨基酸、糖和木质素衍生的芳香烃)。
图3 切尔西土壤腐植酸的一维溶液13C NMR 光谱Fig.3 1-D Solution 13C NMR spectra for Chelsea soil humic acid
图6 在DMSO-d6 中的切尔西土壤腐植酸TOCSY 光谱的扩展区域Fig.6 Expanded region of the TOCSY spectrum of Chelsea soil humic acid in DMSO-d6
切尔西HA 的1H NMR 光谱(图4)非常宽。由于几乎连续重叠,单个质子信号的整合几乎是不可能的。但是,可以将图4 中突出显示的广泛区域整合起来。A 区主要由脂肪族质子组成。切尔西HA 的二维HMQC NMR 光谱(图5)显示了几个与直链或支链烃上的CH2基团一致的交叉峰。除了来自游离氨基酸的小的可交换信号(图4 下部的峰11 和12)之外,B 区主要由非可交换的脂肪族质子组成。相反,C 区显示来自不可交换的(即CH2-CO-O-R、CH2-O-R、氨基酸、糖等)和来自糖的可交换官能团OH 的各种信号。在相应的图表中提供了一维和二维NMR 光谱的更详细的说明。总体而言,DRIFT 和NMR 光谱实验的结果与植物和微生物降解产物(如木质素降解产物、多酚、糖、氨基酸等)的缩合是切尔西土壤HA 的主要形成途径的假设是一致的。
图4 溶解在DMSO-d6 中(上)和溶解在加了100 μLD2O 的DMSO-d6 中(下)浓度为1 mg/mL 的切尔西土壤腐植酸的一维溶液1H NMR 光谱Fig.4 1-D Solution 1H NMR spectra for Chelsea soil humic acid at a concentration of 1 mg/mL,in DMSO-d6 (top) and DMSO-d6 with the addition of 100 μL of D2O (bottom)
图5 切尔西土壤腐植酸HMQC 光谱(在DMSO-d6 中)具有交叉峰的区域Fig.5 Region of the HMQC spectrum (in DMSO-d6) of Chelsea soil humic acid with cross-peaks
可靠的摩尔质量数据是开发HAs 三维结构模型的关键。在20 世纪70 年代早期,Swift 和他的同事对HS 的水溶液进行了超速离心和凝胶渗透色谱(GPC)研究。他们得出腐植酸的平均摩尔质量从10000 道尔顿到100000 道尔顿不等。在过去的二十年里,几乎所有的大分子物理化学标准方法[如:蒸汽压渗透法(VPO)、高压尺寸排阻色谱法(HP-SEC)、流场分离法(FFF)等]已被用于测定HS 的数均摩尔质量(Mn)和重均摩尔质量(Mw),虽然得出的测量值之间存在一些差异,但人们一致认为黄腐酸(FAs)的摩尔质量比HAs 低得多。对在四氢呋喃、HP-SEC 和FFF 中的VPO 研究表明,FAs 的Mn值在600 ~1500 道尔顿之间。类似地,FFF 研究已经证实,从水生、土壤、泥炭和煤炭样品中分离出的HAs 的Mn值在800 到2500 道尔顿之间。近年来,利用ESI 傅里叶变换离子回旋共振质谱(ESI FT-ICR MS)、ESI QqTOF 质谱和ESI 多级串联质谱(ESI-MSn)等更先进的分析手段对HS 进行了表征,所得出的质谱显示了1000 ~2000 道尔顿的一个广泛峰分布。然而,大多数最强烈的峰出现在1000 道尔顿的m/z比以下,因此表明被测试的HAs 分子量不大。
切尔西土壤HA 的ESI QqTOF 质谱如图7 所示。这与Kujawinski 等最近得出的雷尼尔山土壤HA 的ESI QqTOF 质谱相似。该样品代表了加拿大和美国太平洋西北地区森林土壤中降解的木材HAs。切尔西土壤HA(见支持信息的“实验方法和步骤”一节)和雷尼尔山土壤HA 的ESI QqTOF 质谱在相同的实验条件,使用俄亥俄州立大学校园化学仪器设施的微质量Q-TOF II 质谱仪获得。通过超高分辨率ESI FT-ICR MS 进行表征,Kujawinski 等证实了雷尼尔山土壤HA 样品中存在木质素降解产物。ESI QqTOF 和FT-ICR 质谱也证实了在雷尼尔山土壤HA 样品中存在大量相对低分子量化合物。切尔西土壤HA(图7)的ESI QqTOF 约为1200 道尔顿,从而表明较高分子量的化合物也不是切尔西土壤HA 的重要成分或组成部分。
图7 切尔西土壤腐植酸的电喷雾电离四极杆飞行时间质谱(ESI QqTOF)Fig.7 Electrospray ionization quadrupole time-of-flight (ESI QqTOF) mass spectrum for Chelsea soil humic acid
SIGNATURE 生成切尔西土壤HA 三维分子模型分两步:
(i)确定分子构建块和碎片间键的最佳集合;
(ii)生成的所有三维结构模型与此构建块和碎片间键的集合一致。
第一步是运行SIGNATURE 程序的“解析”模式。在该模式下,程序求解方程(2),用以确定与输入数据最匹配的分子碎片和碎片间键的最佳数量。切尔西土壤HA 输入的原子/分子特征如表1 所示。它们来自元素分析和定量13C NMR 数据(图3A),假设标准误差为20%。
表1 实验得出的切尔西HAa 的输入原子特征[hσ(S)exp]Tab.1 Experimentally derived input atomic signatures [hσ(S)exp] for Chelsea soil HAa
表2 给出了用作SIGNATURE 输入的一组分子碎片(即“前体分子”)和碎片间键的集合。与DRIFT 和NMR 光谱数据以及切尔西土壤HA 假设的形成途径一致,我们选择了34种木质素降解产物、20 种氨基酸、14 种碳水化合物、16 种多酚和19 种脂肪酸作为“前体分子”(表2)。同样,选择“前体分子”中的键合位点和相应的碎片间的键(表2),以确保它们可以通过已知的各种缩合机制(包括生物和非生物氧化偶联、糖胺缩合、烷基-芳烃取代等)进行共价连接,以介导有机土壤中HA 的形成。为了确保生成的三维结构模型的摩尔质量与切尔西土壤HA 的ESI QqTOF 质谱一致(图7),我们将候选模型的C 原子数约束在40 ~75 之间。
表2 续
表2 切尔西土壤腐植酸的定性输入参数:被选中的切尔西土壤腐植酸(HA)的“前体分子”和碎片间键的清单aTab.2 Qualitative input parameters for Chelsea soil humic acid: selected list of “precursor molecules” and interfragment bonds for Chelsea soil humic acid (HA)a
使用模拟退火搜索进行10 个循环(Tinitial=100K,Tfinal=1000 K 和Tincrement=100 K)来求解方程(2)。切尔西土壤HA 的最佳分子碎片(表3)包括2 种木质素衍生的芳烃(对香豆酸和对茴香酸)、2 种多酚(2,3,6-三羧基苯酚和间苯二酚)、1 个氨基酸(甲硫氨酸)和1 个碳水化合物(半乳糖醛酸)。它的最佳碎片间的键包括3 个芳香族Caro-O 键、1 个芳香族Caro-N 键和1 个脂肪族Cali-O 键。这些分子碎片和碎片间的键的组合产生了18 个切尔西土壤HA 的三维结构模型。每个模型的分子式为C45H43O24N1S1,摩尔平均分子量为1016 道尔顿。该值在切尔西土壤HA 的ESI QqTOF 质谱的质量范围内(图7)。如表4 所示,切尔西土壤HA 模型的特征误差(即实验得出的原子特征和预测的原子特征之间的差异)相对较低。在所有情况下,包括芳香族碳特征(误差19.30%)在内的特征误差均小于或与输入数据中假定的标准误差(20%)相当(表1)。平均特征误差为3%。也就是说,SIGNATURE 生成的切尔西土壤HA 模型中每100 个碳原子中大约有3 个原子缺失或过量。
表3 切尔西土壤腐植酸的特征输出参数a:与表1 和表2 的结构输入数据最匹配的分子碎片和碎片间键的清单Tab.3 Signature output parameters for Chelsea soil humic acida: list of molecular fragments and interfragment bonds that best match the structural input data from tables 1 and 2
表4 切尔西土壤腐植酸的原子特征a:模型预测与实验得出的输入数据Tab.4 Atomic signatures for Chelsea soil humic acida: model predictions versus experimentally derived input date
在本研究的第三阶段,我们使用SIGNATURE,通过随机连接表3 中给出的最佳“前体分子”和相应的碎片间的键来生成切尔西土壤HA 的所有18 个三维结构模型的模型异构体。随后,使用“计算方法和步骤”一节中所述的步骤来计算每个模型的应变能、摩尔体积、密度和溶解度参数。3 个具有高应变能(> 1012kcal/mol)的切尔西土壤HA模型异构体被去除。具有低体密度(0.74 g/cm3)的第4 个模型也被去除。其余的切尔西土壤HA模型异构体的体密度(ρ)和溶解度参数(δ)如图8 所示。据估算,HS 的体密度范围为1.20 至1.45 g/cm3。Poerschman 和Kopinke 最近整理了来自各种来源的“腐殖质有机质”(HOM)的溶解度参数数据(图9)。他们发现其值范围“非常狭窄”(即23.0 ~28.0 J1/2/cm3/2)。基于这些文献值,切尔西土壤HA 模型异构体中只有5 种表现出的体密度和溶解度参数的大小与文献中的实验估算值相当。每个切尔西土壤HA 模型异构体的三维结构、体密度和溶解度参数如图10 所示。这些模型具有以下特征:(1)它们是结构不同的模型异构体,其分子组成与实验表征数据一致。(2)它们是“分子异质”化合物,包含了通常存在于从有机土壤中提取的HAs 中的重要构建块(例如,木质素衍生的芳香族化合物、糖、氨基酸和多酚)。(3)它们由相对较小的化合物组成(即数均分子量为1016 道尔顿)。(4)它们具有与有机/无机溶质、金属离子和矿物表面相互作用的多个官能团(例如COOH 和OH 基团)。(5)它们具有通过氢键、范德华力等在水溶液中形成高分子量非共价键的超分子聚集体所需的结构特征。(6)它们还表现出通过基质辅助的共价相互作用(如化学交联)在土壤中形成高分子量超分子组装体所需的结构特征。(7)他们计算的体密度和溶解度参数与文献中得到的实验估算非常吻合。
图8 选中的SIGNATURE 生成的切尔西腐植酸的三维模型估算的体密度(A)和溶解度参数(B)Fig.8 Calculated bulk densities (A) and solubility parameters (B) of the SIGNATURE generated 3-D models for Chelsea soil humic acid
图9 Poerschman 和Kopinke 根据文献吸附数据估算的“腐殖质有机质”(HOM)的溶解度参数Fig.9 Solubility parameters for “humic organic matter” (HOM) estimated by Poerschman and Kopinke from literature sorption data
图10 选中的SIGNATURE 生成的切尔西腐植酸模型异构体的三维结构、体密度(ρ)和溶解度参数(δ)Fig.10 3-D structures and bulk densities (ρ) and solubility parameters (δ) of the selected SIGNATURE generated model isomers for Chelsea humic acid (HA)
这些模型异构体的等摩尔混合物的模拟13C NMR 光谱与测量光谱相比具有优势(图3B)。
HAs 对环境和生物地球化学过程的影响相当重要。然而,尽管进行了两个世纪的研究,HAs的三维结构的基本问题仍未解决。这是有关水溶液、土壤和矿物-水界面中HAs 的分子和超分子结构争论不断的主要原因。Swiftand 等认为,HAs由高分子量的大分子组成,这些大分子在水溶液中呈无规则卷曲构象。相反,Piccolo 等认为HAs 是水溶液中小分子的非价键结合聚集体,而Wershaw等则认为HAs 在水溶液中形成“胶束状”聚集体,在矿物表面形成“膜状聚集体”。另一方面,MacCarthy 和Rice 认为,HAs 是“复杂的”和“异质的”有机化合物的混合物。尽管图10 所示的切尔西土壤HA 的三维结构模型不符合以下观点:HAs 是(i)高分子量大分子或(ii)大量有机化合物的复杂混合物。目前,我们还不能对水溶液、土壤和矿物-水界面中HAs 的三维结构的基本问题提供确切的答案。
需要估算的2 个关键问题是SGNATURE 生成的模型对(i)“前体分子”和相关碎片间键的输入清单以及(ii)碳原子数的约束条件的灵敏度。如前所述,输入的切尔西土壤HA“前体分子”和碎片间的键(表2)选自定性DRIFT 和一维/二维13C/1H NMR 光谱数据的分子碎片库,以确保它们可以通过已知的共价键缩合机制介导有机土壤中HA 的形成。尽管切尔西土壤HA 的“前体分子”清单中包括了微生物降解产物,例如多酚和脂肪酸,但对于从其他有机土壤的“更深”有机层中分离出来的HA 来说,这些可能不是重要的构建块,而微生物降解产物例如肽聚糖和角质酸可能更普遍。因此,图10 所示的SIGNATURE 生成的三维结构模型可能仅代表从有机土壤(如霍顿淤泥)表层中分离出的HAs。由于需要生成切尔西土壤HA 的三维结构模型,且摩尔质量应在切尔西土壤HA 的ESI QqTOF 质谱的m/z范围内(图7),因此候选模型的碳原子数约束在40 到75 之间变化。满足表1 给定的结构输入数据,在指定的特征误差内(表4)这个约束可以很容易地被放宽,以生成不同摩尔质量的切尔西土壤HA 三维结构模型的集合。实际上,这是我们方法的关键优势之一,该方法将用于后续研究中,以探索HAs 的三维结构建模中的“多分散性”问题。
测量不确定性对HAs 体密度应用的影响作为模型选择标准也需要被评估。从实用以及基本的观点来看,HAs 可以描述为无定型材料。体密度(ρ)和溶解度参数(δ)是无定型材料系统最重要的热力学性质。无定型化合物的整体性能主要受其形成在能量上有利的三维紧密排列的分子排列的能力控制。因此,不能得到准确的密度和溶解度参数的HA 的三维结构模型值得怀疑。尽管Poerschman 和Kopinke 对“腐殖质有机质”溶解度参数的文献汇编具有统计意义(图9),但没有发现测量或估算的HAs 体密度的数据集合足以对不确定性进行有意义的统计估算。因此,通过考虑HAs 的“可接受的”体密度较大区间(即1.20 ~1.45 g/cm3),可以放宽SIGNATURE 生成的切尔西模型异构体的密度选择标准。
我们还需要评估用于模拟SIGNATURE 生成的切尔西土壤HA 模型的等摩尔混合物的13C NMR 光谱的计算程序的可靠性(图3B)。首先,使用Chem Draw Pro 的NMR 模块估算相关的化学位移。我们不太确定将这种方法应用于像SIGNATURE 生成的结构模型这样更大的“分子”时,其可靠性如何。其次,使用实验测得的弛豫参数T1/T2 为40 ms,计算出切尔西土壤模型混合物的13C NMR 光谱。尽管此计算程序似乎合理,但尚未在定义明确的较小化合物的混合物上得到验证:尽管有这些简化的假设,但SIGNATURE生成的切尔西土壤HA 模型的等摩尔混合物的模拟13C NMR(图3B)光谱与实测光谱相比要好,除了图3B 中以80 pm 为中心的特征外。在随后的研究中将探讨开发改进和经过验证的程序,以模拟SIGNATURE 生成的HAs 三维模型的一维和/或二维NMR 光谱。
因为我们的方法基于对相关HA 的起源的了解以及对它的形成机制的洞察,所以主要通过植物和/或微生物降解产物缩合形成的HAs 似乎是评估该方法适用性和局限性的理想选择。因此,将其系统地用于来自有机土、软土、降解木材和泥炭土的大量HA 样品及其分离碎片,应有助于促进具有代表性的三维结构模型的开发。这些模型可用于随后的综合实验和计算研究中,以解决相关HAs分子和超分子结构的一些关键问题:(1)在多大程度上可以将整体HAs 形容为数量有限的“分子异质”的多分散混合物?(2)有机地球大分子例如没有明确定义头和尾的HAs 在水溶液中是自组装成有序的胶束还是形成非共价键合的分形聚集体?(3)在多大程度上HAs 可以形成具有与整体土壤HAs 一致的热力学和结构特性的高分子量共价键合的超分子组装体?
本文所述的完整实验和计算方法(图1)还提供了通过MD 模拟估算HAs 的热力学和理化性质所需的生成三维结构模型的方法。Diallo 等最近将该方法与Flory-Huggins 溶液理论相结合,在不使用任何经验推导的可调参数的情况下,获得了18 种疏水性有机化合物(HOCs)与溶解的切尔西土壤HA 的结合常数的良好估算。我们目前正在评估切尔西土壤HA 的三维结构模型(图10)在一个完整的多尺度建模框架(即原子模拟与平均场统计热力学相结合)中的应用程度,以预测切尔西土壤HA 上的HOC 吸附,而无需使用任何经验推导的可调参数。
用于提取和表征切尔西土壤HA 的实验方法和步骤,以及在“计算机辅助结构解析”一节中SIGNATURE 软件背后的数学理论的总结可通过http://pubs.acs.org 免费下载。
致谢和参考文献(略)