大数据时代的农药创制

2015-08-11 03:15姚建华徐雯丽蒋舒仰中国科学院上海有机化学研究所上海200032
上海化工 2015年2期
关键词:助剂毒性化合物

姚建华 徐雯丽 李 佳 黄 迎 凌 敏 胡 静 蒋舒仰中国科学院上海有机化学研究所 (上海 200032)

综述与专论

大数据时代的农药创制

姚建华徐雯丽李佳黄迎凌敏胡静蒋舒仰
中国科学院上海有机化学研究所 (上海200032)

摘要随着农药创制研究和应用工作的不断积累和深入,农药的各种性质,如活性、毒性、代谢等的测量、记录和分析数据,已有一定的积累,并达到了一定的规模。随着信息技术的发展,在农药创制中,有效地利用这些数据已成为可能。阐述了大数据的定义、特点,提出了大数据时代的农药创制理念和农药创制的现代模式。

关键词农药创制大数据数据分析性质预测

2010年11月,联合国粮农组织和世界卫生组织将农药定义为:在农业生产和农作物存储过程中,具有杀死或控制有害生物、控制害虫的行为或生理状态的功能[1],以任何形式存在的单一组分或多组分的混合物及其制剂。农药的分类方法很多,根据防治对象的不同,主要可分为以下几种类型:杀虫剂、杀菌剂、除草剂、除藻剂、防污剂、抗微生物剂、杀线虫剂、杀螨剂、昆虫信息素、驱虫剂和杀鼠剂等[2]。基于农药的定义,农药与化学、生态学、生物学、毒理学以及食品安全、人类健康、环境等领域的密切关系显而易见。

早在公元前2000年,人类就开始使用农药保护农作物。从20世纪开始,农药的研究和开发工作逐步进入规范化状态。至今,在农药研究和开发过程中,已产生了大量的化学、毒理学、生态学、生物学以及环境、食品安全、人类健康等方面的实验数据。人类使用农药的历史很长,规范化的农药研究和开发也已有100多年的历史,农药的创制理念和模式在很大程度上也有更新和完善,正逐步从传统模式——“经验/灵感,实验”的组合,转化为现代模式——“经验/灵感,虚拟技术和实验”的组合。

随着信息科学[3]的发展,虚拟技术在科研、生活、工业等领域都显示出它的作用和魅力。同样,大数据时代,在农药研究和开发领域,特别是在提高新农药的创制效率、降低创制过程中的污染方面,它也将显示出其特有的作用。本文将介绍大数据时代的农药创制理念和模式。

1 大数据

随着信息科学和技术的发展,信息的记录和存储已变得非常便利,从而使得人类存储信息量的增长速度比世界经济增长速度快4倍,而计算机数据处理能力的增长速度则比世界经济的增长速度快9 倍[4]。在这种情况下,大数据的概念产生,并已成为现实。

大数据通常是指采用超常功能软件工具获取、组织和管理的数据集,一般情况下,数据的原始积累需要很长的时间。大数据的大小是不断变化的,如2012年,数据集中数据量就从百万兆字节级变化为千万兆字节级[5]。大数据的特点主要有5个[5]:数据的量(Volume)、数据的多样性(Variety)、数据的速度(Velocity)、数据的可变性(Variability)和数据的复杂性(Complexity)。即“4V1C”。数据的量是评价数据价值和潜力的主要依据之一;数据的多样性体现数据表征对象的范围,对象范围大,数据的价值和潜力就越大;数据的速度是指产生和处理数据的速度,速度越快越符合实际需求;数据的复杂性是指数据及其管理的复杂性,由于大数据的多样性、变化性和巨大的数据量,导致数据本?身的复杂性较高,因此,具有处理大数据能力的方法的复杂性也非常值得关注。大数据的5个特征将随时间的推移而发生变化,具体如图1所示[6]。

大数据是一种资源,也是一种工具。它告知信息但不解释信息[4]。大数据中的“大”不只因为其“量”大,而且还因为它的多样性和复杂性。分析大数据一般会应用多种数据分析方法。因此,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理某个特别现象相关的所有数据。通过分析大数据,我们可以更清楚地看到一些传统数据无法揭示的现象。也许,大数据将改变人类探索世界的方法,即人类将在大数据的指导下探索世界,而不是仅用假想的方法。利用大数据作分析预测的流程[7]如图2所示,即应用数学算法分析海量数据,以预测某些事件/性质的潜在可能性。

图1 大数据5大特征变化趋势

图2 大数据的分析预测流程

2 农药创制的现代模式

众所周知,农药与化学、生物学、生态学、毒理学、环境以及人类健康关系密切。随着人们对环境、生态保护意识的增强以及对人类健康的日益关注,对农药的评价,已从单纯地评价农药的效力,扩展为既评价农药的效力,又评价它的环境友好性以及对人类和其他生物可能的危害性和毒性。

通常,农药包括活性化合物和助剂两部分。活性化合物的作用是杀虫、杀菌、驱虫、除草、杀螨、杀鼠等,助剂的功能是辅助活性化合物在被作用的生物上产生效力。因此,在农药创制中,活性化合物和助剂的设计和开发同等重要。从本质上讲,活性化合物和助剂都是化合物。就活性化合物而言,人们主要关注它的生物活性(如杀虫、杀菌、除草等),急性毒性,致突变毒性,致癌毒性,代谢物及其对环境、生态和人类健康的影响。对于助剂而言,人们关注的是它与活性化合物组合后,是否能使活性化合物在相关的生物体上产生预期的效果。农业生产对农药要求日益提高的同时也对助剂的性能提出了更高的要求,高效化、功能化、复合化、精细化、专业化、系列化、节能化、环保化已成为现代助剂发展的总趋势。因此,助剂的急性毒性、致突变毒性、致癌毒性、代谢物及其对环境、生态和人类健康的影响等因素的评估,必须得到足够的重视。

目前,在农药创制领域,科研人员已经认识到虚拟设计技术在提高农药创制效率、降低创制过程中治理污染等方面所起的重要作用。在国家科技部基础研究项目的资助下,建立了若干具有自主知识产权的计算机辅助化合物设计方法和软件系统[8],并建立了“农药的虚拟设计平台”(如图3所示),该平台已在我国的农药和环保领域得到实际应用,图4显示了该平台所设计的化合物数量。该虚拟设计平台主要由三大部分组成:数据库、知识库和软件(主要功能为预测和机理研究)。在该平台设计中,融入了大数据的理念——数据涉及化学、生物学、环境学、毒理学等学科,即数据既具有量大的特点,又具有复杂性。它体现了多学科合作的特征。

图4 2005~2013年化合物设计数

该平台中的数据库系统包括农用化学品数据库、化合物毒性数据库、农药代谢数据库和农药靶标数据库等;知识库系统包括代谢知识库、毒性知识库和生物活性知识库;软件主要包括化合物农药活性、毒性、代谢途径预测系统,配体与受体相互作用计算软件等。该平台将信息检索、性质预测和机理研究三个功能集成在一起。

随着农药创制领域的科研人员对虚拟技术在农药创制中作用认识的不断深入和提高,计算机辅助化合物设计方法和技术不断发展,传统的农药创制模式,最终将被现代的农药创制模式——“经验/灵感,虚拟技术和实验”的组合模式(由图5所示)所取代。

图5 农药创制的现代模式

4 展望

农药涉及多个学科领域,农药创制需要多学科的通力合作。在大数据时代,农药创制模式正在由传统模式向现代模式转变。由于多学科的合作,在创制过程中,可以获得更多描述农药的数据。对这些数据进行深入分析,也许可以得到隐藏在数据中不易察觉的重要信息。Viktor Mayer-Schonberger博士等[4]预言:大数据将改变人类探索世界的方法。在小数据时代,我们会假想世界是怎么运作的,然后通过收集数据来验证这种假想。在不久的将来,我们会在大数据的指导下探索世界,不再受限于各种假想。我们的研究对象是数据,也因为数据,我们发现了原本不相关的物质间的关系。在癌症研究中,人们已认识到大数据的理念和技术对于研究的重要作用,他们的预言已得到认可。该预言是否适用于农药创制领域,相信相关的科研人员会有自己的结论。

参考文献:

[1]WORLD HEALTH ORGANIZATION,FOOD AND AGRICULTURE ORGANIZATION OF THE UNITED NATIONS, Manual on development and use of FAO and WHO specifications for pesticides[Z].FAO/WHO Joint Meeting on Pesticide Specifications,Rome,2010.

[2]Pesticide[DB/OL].http://en.wikipedia.org/wiki/Pesticide, 2014-10-1.

[3]信息科学[DB/OL].http://baike.baidu.com/view/71603. htm?fr=Aladdin,2014-10-1.

[4]Mayer-Schönberger V,Cukier K.Big data:a revolution that will transform how we live,work and think[M].UK: Houghton Miffin Harcourt.2013.

[5]Big data[DB/OL].http://en.wikipedia.org/wiki/Big_Data, 2014-10-1.

[6]Big data meets big data analytics[DB/OL].http://www.sas.com/content/dam/SAS/en_us/doc/whitepaper1/big-datameets-big-data-analytics-105777.pdf,2014-10-1.

[7]Big data analytics and predictive analytics[DB/OL].http://www.predictiveanalyticstoday.com/big-data-analytics-and-predictive-analytics/,2014-10-1.

[8]http://202.127.145.116,2014-10-1.

中图分类号TQ 450

收稿日期:2014年10月

基金项目:国家973项目(2010CB126103)

第一作者简介:姚建华女1963年生研究员法国巴黎第七大学博士目前主要从事化学信息学及其应用研究

Pesticide Discovery in the Era of Big Data

Yao Jianhua Xu Wenli Li Jia Huang Ying Ling Min Hu Jing Jiang Shuyang

Abstract:A long with the in-depth development of research and app lication of pesticides,the data ever measured, recorded and analyzed about the properties of pesticides(e.g.,activity,toxicity,metabolism)has been accumulated to a large scale.As information technology develops,it is possible to efficiently use the large-scale data in pesticide discovery. Elaborates the definition and features of big data and proposes the concept and modern mode of pesticide discovery in the era of big data.

Key words:Pesticide discovery;Big data;Data analysis;Property prediction

猜你喜欢
助剂毒性化合物
碳及其化合物题型点击
碳及其化合物题型点击
农药减量增效助剂应用技术
动物之最——毒性谁最强
苦豆子总碱对PC12细胞的毒性
例析高考中的铁及其化合物
塑料助剂的应用
橡胶助剂绿色化势在必行
食品工业清洗助剂的开发
新型三氮烯类化合物的合成与表征