[美]马克·波尔金 钟义信
科学研究的主要活动,可以归结为获得关于自然界、人类、文化、社会和技术等各个领域的信息,进而加工成为相应的知识。于是,由通信、计算机、互联网、移动互联网、物联网、人工智能等构成的各种信息加工过程就成为当代自然科学与人文科学领域的科学研究的核心技术体系。无论要得到什么领域的知识,都必须基于信息获取、信息传递、信息加工等过程。②H.C.von Bayer, Information:The New Language of Science,Harvard:Harvard University Press,2004.弗里敦(R.B. Frieden)就曾在他的著作中阐述过物理学的知识是如何从信息中提炼出来的。①R.B. Frieden,Physics from Fisher Information,Cambridge:Cambridge University Press,1998.更加深刻的例子是著名物理学家惠勒(John Wheeler)提出的论断:It from bit,即“所有的知识都源于 信息”②J A.Wheeler,“Information,Physics,Quantum:The Search for Links”,in Proceedings of the 3rd International Symposium on the Foundation of Quantum Mechanics,1989,pp.354—368.。
分析表明,科学研究经历了和正在经历几种不同的研究水平。最原始的水平是“就事论事的研究”,即直接去观察和获取研究对象的信息,积累实验的数据,然后,在此基础上加工提炼相应的理论。这是十分朴素也是十分自然的科学研究模式和水平。实际上,在自然科学和社会科学领域,在物理学、经济学以及人文科学等研究中,人们就是利用这样的方法建立了相应的理论模型并检验这些模 型。
比“就事论事”研究水平更高一层次的研究水平,称为“方法性的研究”。它所关注的,不仅是“获取对象信息、积累实验数据和加工提炼相应理论”这些研究过程本身,更为关注的是这些研究过程的性质、方法和效果。比如,实证论的方法学就认为,应当根据感觉经验把科学理论的内容进一步提炼为可判定逻辑的真值和数学的命题。这样,有意义的科学结论的主要性质就是其可证伪性。③K. Popper,The Logic of Scientific Discovery,New York:Basic Books,1959;K. Popper,Conjectures and Refutations,London:Routledge,1963.如果能够找到否定性的根据(理论上的根据或事实上的根据),那么,这样的研究结论、科学假说和科学理论就是可证伪 的。
拉卡托斯研究了数学和科学的发展过程。依照他的准经验方法,数学和科学研究的基本过程就是一种试错的探索计划。④I.Lakatos,The Methodology of Scientific Research Programs:Philosophical Papers(Volume I),Cambridge:Cambridge University Press,1978.因此,在他们的工作中,数学公理化的方法虽然具有一定的阐述性价值,但实际上,数学家们是在通过融通他们的数学经验来发现新的概念、算法和原理。科学家们特别是物理学家们的确就是这么做的。有趣的是,他的这种方法后来被规范化为一种算法和计算理论,其中把试错预测作为回归方法的一种自然推广。⑤H. Putnam,“Trial and Error Predicates and the Solution to a Problem of Mostowski”,Journal of Symbolic Logic,Vol.30,No.1,1965,pp.49—57.
与此同时,作为科学方法学的操作主义,曾经集中关注了各种科学概念的度量和应用过程。⑥P. W. Bridgman,The Logic of Modern Physics,New York:Macmillan,1927;P. W.Bridgman,The Nature of Physical Theory,New York:Dover,1936.在这里,他们把科学理论紧紧地与可证伪性原理关联起来以验证它的意义。因此,在方法学的水平上,度量和度量的方法都成为了科学研究的重要方面。①M.Burgin and L. Kavunenko,Measurement and Evaluation in Science,STEPS Center,Kiev(in Russian),1994;H.Chang,Inventing Temperature:Measurement and Scientific Progress,New York:Oxford University Press,2004.由此,就有了一类度量理论。②H. A Dingle,“Theory of Measurement”,The British Journal for the Philosophy of Science,Vol.1,No.1,1950 pp.5—26;T.S.Kuhn,“The Function of Measurement in Modern Physical Sciences”,Isis,Vol.52,No.2,1961,pp.161—193;H.E. Jr.Kyburg,Theory and Measurement,Cambridge:Cambridge University Press,1984;F.S. Roberts,“Measurement Theory:With Applications to Decision-making,Utility,and the Social Sciences”,Encyclopedia of Mathematics and its Applications,Vol.7,MA:Addison-Wesley,Reading,1979.
与上述两种研究水平相比,信息生态学的方法将把现代科学研究推进到第三个高度的水平,这就是“生态学的研究”。在这里,人们把自然界、社会、技术、结构系统等都作为相互作用、相互关联的统一整体进行全局的研究。信息生态方法学就为实现第三高度的科学研究水平提供了一种统一的研究方 法。
本文的第一作者总结了一般生态学原理,③M.Burgin,“Principles of General Ecology”,in Proceedings,Vol.1,No.3,148;doi:10.3390/IS4SI-017-03996.第二作者提出了信息生态方法学的理论。④钟义信:《从机械还原方法论到信息生态方法论》,《哲学分析》2017年第5期。本文的目的,就是把一般生态学原理与信息生态方法学理论有机联系起来,为现代科学研究提供新的坚实而有效的方法学基础。
以下,本文第二节将介绍和分析包括生物学、技术学、社会学、知识学和信息学等不同领域的生态学研究方法,了解生态学方法的理论和实践成果。第三节将提出一般生态学的要点,它们是构建科学研究中的信息生态方法学和哲学所需要的基础。第四节将给出信息生态方法学的简明而严谨的定义,第五节则将面向信息科学研究领域建立科学研究中的信息生态方法学基 础。
在生态学的研究中,“生态系统(Eco-system)”这个概念最早出现在乔治·帕金斯·马什(George Perkins Marsh)1864年出版的《人与自然》一书中。不过,根据文献的记载,“生态系统”这个术语是在很多年以后应坦斯莱(Arthur Tansley)的要求由克拉珀姆(Arthur Roy Clapham)建立起来的。⑤A.J.Willis,“The Ecosystem:An Evolving Concept Viewed Historically”,Functional Ecology,Vol.11,No.2,1997.
至于术语“Ecology”(生态学,德语是 Ökologie),则是由德国学者海克尔(Ernst Haeckel)于1866年由希腊文杜撰的:其中,第一个希腊文单词是oikos,意思是“居住地”;第二个希腊文单词是logos,在古希腊时代是“秩序,意义,基础或思维”的意思。两个字的合成,就具有“生存环境的合理秩序”的含义。⑥E.P.Odum, Fundamentals of Ecology,Boston:Cengage Learning,2004.
海克尔的思想激励了欧洲的植物学家去关注某一地域的植物群体及其相互依赖的关系,从而引发了“生态学”的科学研究。其实,生态学不仅研究植物群体本身,同时也研究其他生物物种。在当代科学的语境中,人们通常把生态学理解为关于各种生物系统之间以及这些生物系统与它们的环境的综合性研究,核心的问题是要阐明各种生物系统之间以及生物系统与环境之间的相互作用过程及其相互关 系。
在此时期,生态学(更准确地说是生物生态学)包含植物生态学和动物生态学两个子学科。植物生态学研究植物的分布和多样性、环境因素对植物多样性的影响,以及各种植物与其他有机体之间的相互作用。①J.E. Weaver and F.E.Clements,Plant Ecology,New York:McGraw-Hill Book Company,1938.动物生态学研究各种动物、动物之间的相处情况以及动物与环境之间的相互关系,这种相互关系决定了它们的分布和多样性状况。植物生态学与动物生态学一起构成了生物生态 学。
研究人员还开创了其他领域的生态学。其中的一个是人类生态学,它是人类与自然界、社会、技术环境之间关系的跨学科和交叉学科研究,涉及地理学、社会学、心理学、人类学、动物学、认识科学、公共卫生学、家庭经济学以及自然生态 学等。②G.L.Young,“Human Ecology as an Interdisciplinary Concept:A Critical Inquiry”,Adv. Ecol. Res.,1974,pp.1—105.
还有工业生态学,就是把工业生产作为更大系统和更广泛过程的一部分来研究,目的是有效减少工业的生产、消费和消耗对环境所造成的影 响。
再如商业生态学,它在商业生态系统的框架下来研究各种商业机构。商业生态系统是由各种互相依赖的商业组织构成的动态网络,包括这些组织内部的各种机构、它们的供销商和供销渠道、标准化组织以及零部件供应商,还包括那些对核心商业具有重要影响的贸易伙伴、法规组织、仓储机构和工会组织,等等。此外,还有知识生态学。③P. Shrivastava,Knowledge Ecology:Knowledge Ecosystems for Business Education and Training;Availableonline,1998;Y. Malhotra,“Knowledge Management for Organizational White Waters:An Ecological Framework”,Knowledge Management,Vol.2,No.6,1999,pp.18—2;G.Pór,“Nurturing Systemic Wisdom through Knowledge Ecology”,The Systems Thinker,Vol.11,No.8,2000,pp.1—5;D.A.Bray,“Knowledge Ecosystems:A Theoretical Lens for Organizations Confronting Hyper turbulent Environments”,in Organizational Dynamics of Technology-Based Innovation:Diversifying the Research Agenda,MA:Springer,2007,pp.457—462.知识生态学是关于知识管理学的一种研究方法,目的是研究各种不同系统之间知识相互作用的动态进化情形,以便通过增强合作的进化网络来改善决策和创新效 果。
数字生态系统概念的引入刺激了数字生态学的发展。④D.Hai,H.Farookhand E.Chang,“A Human-Centered Semantic Service Platform for the Digital Ecosystems Environment”,World Wide Web,Vol.13,No.1—2,2010,pp.75—103.所谓数字生态系统,是指一种具有自组织性、变尺度性、可持续发展的分布式的、适应性的、开放的社会—技术系统。数字生态系统的具体化,还衍生了数字健康生态系统①D.Hai,H. Farookh,and E.Chang,“A Framework for Discovering and Classifying Ubiquitous Services in Digital Health Ecosystems”,Journal of Computer and System Sciences,Vol.77,No.4,2011,pp.687—704.、数字生态系统②D.Hai,H. Farookh,and E.Chang,“Semantic Service Matchmaking for Digital Health Ecosystems”,Knowledge-Based Systems,Vol.24,No.6,2011,pp.761—774.、数字交通生态系统③D.Hai,H. Farookh,and E.Chang,“A service Concept Recommendation System for Enhancing the Dependability of Semantic Service Matchmakers in the Service Ecosystem Environment”,Journal of Network and Computer Applications,Vol.34,No.2,2015,pp.619—631.和数字商业生态系统④A.Corallo,G. Passianteand A.Prencipe(eds),The Digital Business Ecosystem,Northampton,Massachusetts:Edward Elga Publishing,2007.。数字商业生态系统的出现,是与其用户的社会—经济生态系统伴随相关的。⑤F.Nachira,A.Nicolai,P.Dini,M.Le Louarn and L.Rivera Leon(eds),Digital Business Ecosystems,European Commission,2008.除此之外,波尔金提出并研究了技术生态学⑥M.Burgin,“Techno-Ecology and Problems of Education”,in Intellectual Innovations in Society and Development of Education,Novosibirsk,1998,pp.175—178.(in Russian),柏特森(George Bateson)提出了心智生态学⑦G. Bateson,Steps to an Ecology of Mind,St. Albans:Jason Aronson Inc.,1973.,达米阿尼(Damiani)等人提出了电子学习生态系统⑧E.Damiani,L. Uden and W. Trisnawaty,“The future of E-learning:E-learning ecosystem”,in IEEE Digital Ecosystems and Technologies Conference (IEEE DEST),2007.,波克钦(Murray Bookchin)还提出了社会生态学⑨M. Bookchin,The Ecology of Freedom,Stirling:AK Press,2005.,等 等。
可以看出,生态学的概念和方法正在整个科学研究领域广泛渗透。这不是一种偶然发生的现象。这是因为,世界上各种事物本来就存在各种各样的内在联系。过去,人们为了研究的方便,把它们逐一分割开来进行分门别类的独立研究,虽然取得了一个又一个局部的成果,却丢失了各门各类事物之间相互关联的规律,当然也就丢失了宏观整体的规律。现在,人们需要认识宏观整体的规律,就不能不去深入研究这些局部之间的相互作用和相互关系。这是生态学必然要兴起的原 因。
20世纪80年代,钟义信在中国开启了信息生态学的研究。⑩钟义信:《信息科学原理》,北京:北京邮电大学出版社1988年版。他把一直被人们分别研究和独立发展的各种信息过程——信息获取(感测与识别)、信息传递(通信与存储)、信息处理(计算与认知)、信息再生(智能与决策)、信息执行(显示与控制)——作为信息的生态链加以研究,发现了它们相互作用的规律,并命名为“信息科学原理”;后来,他又进一步提炼为“信息转换原理”⑪钟义信:《信息转换原理:信息、知识、智能的综合理论》,载《科学通报》2013年第14期。 R. Capurro,“Towards an Information Ecology”,in Information and Quality,edited by I.Wormell,London:Taylor Graham,1990,pp.122—139;T.H.Davenport and L.Prusak,Information Ecology,Oxford:Oxford University Press,1997.。西方研究者也独立地启动了他们的信息生态学研究。⑫钟义信:《信息转换原理:信息、知识、智能的综合理论》,载《科学通报》2013年第14期。 R. Capurro,“Towards an Information Ecology”,in Information and Quality,edited by I.Wormell,London:Taylor Graham,1990,pp.122—139;T.H.Davenport and L.Prusak,Information Ecology,Oxford:Oxford University Press,1997.
总之,作为信息科学的研究,就应当站在“信息”的统一立场,对各种信息处理系统的性质和功能进行整体性研究,而不应当停留于分别独立的研究,这样才能够更好地理解现实世界的各种信息过程。如果说植物生态学是要研究植物系统的相互关系,那么,信息生态学就是要研究各种信息处理系统之间的相互关系。由此就可理解,信息生态学方法学对于信息科学的健康发展具有何等实质性的重要意 义!
“生态系统”是由英国学者坦斯莱提出的一个概念,它是各种领域生态学的共同核心。这就是为什么本文一开始就要从最一般的场景来定义这个概念。为此,首先就要了解世界的全局结构将会如何影响生态系统的组 织。
世界的宏观结构可以由图1的“存在三元组”来表 示。
图1所示的存在三元组并非互不相关,相反,它们互相交叠,互相作用:人的精神世界离不开物质世界,它又会反过来影响物质世界。同时,人们关于物理世界的知识则在很大程度上依赖于人的精神世界与物理世界的相互作 用。
其实,不仅人有精神世界,所有的信息处理系统也有它们自己的“精神世界”。比如,计算机存储系统的内容就可以在一定程度上被看作是它的精神世界,计算机的操作系统就是它的精神世界的一个重要部 分。
结构世界(世界的结构)包含着各种结构。这个概念与柏拉图的“思想世界/形式世界”是一致的,因为思想或形式都与结构相伴。各种结构就像各种具体的事物一样存在着,它们共同构成了世界的结构。当需要学习或创作某种系统或者需要启动某种过程的时候,就需要利用这些结构的知识来实现。结构当然包含着各种相互关系,正是它们把事物联系在一 起。
世界的全局结构可以生成三类生态系统:(1)物理生态系统,它的成分就是各种物理系统和过程;(2)精神生态系统,它的成分就是各种精神系统和过程;(3)结构生态系统,它的成分就是各种物理系统的结构和过 程。
如果把这三种生态系统组合成为一个生态系统,就得到了总的生态系统。这个总的生态系统也具有三个组成部分:(1)生态系统的物理方面及其环境;(2)生态系统的精神方面及其环境;(3)生态系统的结构方面及其环 境。
一个生态系统可以用三个参量来表征:(1)空间中的某个区域(或者科学论域中的某个领域)。通常认为,某个生态系统的所有成分都在这个区域之内。(2)基本成分的形式。它的意思是,从生态学研究的观点来看,需要明确某个生态系统的哪些成分是最基本的。(3)基本关系的形式。就是说,从生态学研究的观点来看,需要明确某个生态系统的哪些关系是最基本 的。
例如,某个自然生态系统由某个地区内的若干生物体构成,这些生物体之间存在动态的互相作用,同时也与非生物的环境相互作用。因此,这些生物体就是这个自然生态系统成分的基本形式,而在地球上选定的地区就是它的区 域。
为了从形式上定义一个生态系统,需要利用三个集合:(1)一个表示空间区域的集合R,如地球上的森林区域或沙漠区域。(2)一个表示成分的集合E,如生活在这个区域的各种动物、生长在这个区域的各种植物以及自然要素,如这个区域的河流山脉等。(3)一个表示成分之间关系的集合C。
定义3.1一个(R,E,C)—生态系统,是指这样一个系统,它以E的元素为成分,这些成分都属于区域r∈R,成分之间的关系是C中的连接。
在一个信息生态系统里,所有的信息处理系统构成了它的成分的基本形式,地球上某个选定的地区(也可能是整个地球)定义了它的区域,在此区域内这些信息处理系统之间互相作用,也与它们的环境互相作用。显然,信息生态系统的研究将集中于其中的信息处理系 统。
值得注意的是,存在许多不同种类的信息处理系统:技术信息处理系统、生物信息处理系统、人类信息处理系统,等 等。
生态信息系统的成分存在三个等级:第一,基本的或主要的;第二, 次要的或辅助性的;第三,更次要的或背景性 的。
生态学研究的目的是要理解生态系统主要成分的性质和功能,以及生态系统的基本关系。生态系统的主要成分和其他成分是指那些由相似个体组成的族群。比如,在自然生态系统中,它的成分就包括人类、动物、植物和病 毒。
信息,是可供人类和各种生物用来求生避险的一类极其重要的资源。为此,人类拥有各种用来获取、处理和利用信息的器官组织:(1)用来从环境中接受信息的感觉器官;(2)用来在人体内部传递信息的传导神经系统;(3)用来处理信息、生成知识和生成解决问题的智能策略的中枢神经系统(大脑);以及(4)把中枢神经系统发出的智能策略转变为智能行为的执行器官。它们构成了人体内高度和谐的信息与智能系 统。
另一方面,人类还创造了丰富的信息技术系统来增强人类信息器官的功能。例如,感受各种信息的传感系统、传输与分配信息的通信系统与网络系统、处理信息的计算机系统、生成知识和制定决策的人工智能系统以及执行策略的控制系统,等 等。
不过,与人类信息器官的工作情况相比,技术信息系统的工作却存在明显的反差。一方面,人类信息器官的工作非常稳定、和谐、可靠和可信,有效地支持了人类的进步;另一方面,各种技术信息系统的工作却不那么令人满 意。
问题在哪里呢?分析表明,主要的问题不在于各种信息处理技术系统本身,而在于各种信息处理技术系统之间的相互关系。起初,各种信息处理的技术系统都是分别独立研究、设计和应用的,没有考虑与其他信息处理技术系统的关系。比如,计算机系统的早期设计只考虑计算机系统自身的工作要求,而没有考虑与其他信息系统的协同工作。后来,随着技术的不断进步,计算机之间需要通过通信网络互相联合工作,于是形成了互联网络。但是,与人类自身负责信息传递的传导神经系统与负责信息处理的中枢神经系统的工作性能相比,互联网的工作协同性和理解能力存在很大差 距。
由此可知,相对于人类信息系统,各种技术信息系统存在的差距主要归因于后者研究和设计的方法学方面。具体来说,人类信息系统是由“自然选择”这种强大的自然法则所主导,以“优胜劣汰”为准则,按照人体大系统全局优化的进化法则形成的,因此,优秀的信息系统体系被保留下来,而不够优秀的系统体系则被淘汰了;各种技术信息系统的研究和设计(特别是在初期)却没有全局的目标,也没有全局的优化和统一的准则,而是由各个部门分别独自研究设计,然后才根据实际的需要逐步研究各种不同信息系统之间的联合工 作。
总之,技术信息系统的发展是按照“分而治之”的方法学思想,由此及彼,由简单到复杂,一步一步积累起来的,因此,既缺乏系统全局的协同和优化,更缺乏不同信息系统之间以及各种信息系统与环境之间和谐共生的理念。而所有这些问题,正是“信息生态方法学”所要解决而且能够解决的问题。换言之,这里就需要完成“机械还原方法学”向“信息生态方法学”的转变。①钟义信:《从机械还原方法论到信息生态方法论》。
本节将以信息科学为例,具体考察信息生态方法学究竟能为信息科学的进步发挥什么样的重要作 用。
值得注意的是,随着信息时代的不断进步,信息科学将在整个科学体系中发挥越来越全面的主导作用。因此,信息生态方法学对信息科学发挥的作用也将越来越广泛地波及整个现代科学领域。而且,本质上说,所有学科领域的研究过程都是信息获取和信息加工的过程。因此,本节的讨论不仅仅对信息科学而言是重要的,而且对整个现代科学研究领域而言也具有重要的意 义。
为了深刻理解信息生态方法学的含义,准确把握信息生态方法学的应用条件,这里首先需要阐明“信息生态学”的定义。①Y. X. Zhong,“The Law of ‘Information Conversion and Intelligence Creation’”,in Information Studies and the Quest for Trans-disciplinarity, New York,London,Singapore:World Scientific,2017.
定义5.1信息生态学是对某种论域内各种信息处理过程(系统)及其环境的整体性研究,旨在阐明在环境约束下这些信息处理过程(系统)所应当遵循的工作方式以及这些信息处理过程(系统)之间应当保持的相互关系。
从科学研究的角度来说,迄今存在两种基本的方法学:一种是还原论,另一种是整体论。还原论方法学的主要特征是“分而治之”,把复杂系统分解为一组要素,把系统理论还原为要素理论。整体论方法学的特征则相反,它认为系统的性质和功能不等于要素的性质和功能的简单求和,因此坚持在整体上来认识系统,强调系统内各种要素之间协同合作的相互作用与和谐默契的相互关系。如果忽视了系统的整体性,忽视了系统各种要素之间的协同性与和谐性,就将无法正确理解整个系 统。
信息生态方法学比一般的整体论更进步的特点在于:它不但强调整体性,而且强调整体与环境之间保持协调关系;不但强调整体的不可还原性,而且强调整体与环境共同的生态演化(即不断改善系统的生存状态)。②Y. X. Zhong,“Information Ecology”,Proceedings,Vol.1,No.3,doi:10.3390/IS4SI-2017-03996.
本文建议把“信息生态学”作为研究信息科学的方法学,并考察由此给信息科学的研究所带来的主要新进 展。
研究模型,是一个研究领域的基本蓝图。如果蓝图不明确或者不准确,就必然在整体上影响这个研究领域的成功。信息科学的研究已有半个多世纪的历史,人们提出了通信系统的模型和计算机系统的模型等等,但是一直没有统一的研究模型。为了使信息科学的研究达到“生态学研究”的水平,首要的问题就是要用信息生态学的观念来审慎分析和精心构筑信息科学的研究模型。图2所示的“主(体)客(体)相互作用”模型就是这一研究的创新结果。①钟义信:《高等人工智能原理》,北京:科学出版社2014年 版。
图中的“主客相互作用”模型含有三类部件:(1)主体。主体的特点是具有目的和知识,因此,它可以是任何智能系统。当然,最典型也最有意义的主体是人类,他具有最复杂的目的和最丰富的知识。(2)客体。它是环境中的任何对象或问题。(3)相互作用。它是发生在主体与客体之间的双向过 程。
可以看出,图2的模型是一个典型的“信息生态学模型”,因为它完全符合定义5.1的要求,是对各种信息处理系统(它们蕴含在主体内部)之间以及各种信息处理系统与其环境之间的关系的整体性研 究。
图2的模型可以用来作为整个信息科学研究的抽象模型,因为“主客相互作用”是现实世界最普遍的信息过程。也就是说,信息科学研究的所有问题都可以由图2的模型来表示。这是因为,无论是什么主体,它的基本任务都是要认识环境和适应环境以至改造环境,认识环境就需要接收来自环境的信息(图中的“客体信息”),而适应环境和改造环境则需要由主体产生一定的行为反作用于环境(图中的“智能行 为”)。
在数学上,图2的模型称为“双向基本三元组”结构,它的一般形式可以表示 为:
这是一个双向的基本三元组 X =(X,f/g, Y),其中X和Y是两个实体,f 是由X到Y的关系,g是由Y到X的关系。在图2的模型中,X可以表示主体,Y可以表示环境中的客体,g代表环境中的客体发出的客体信息,f代表主体生成的智能行为。如果两个实体代表在通信中的两个人,那么,f和g就分别是X给Y发送的信息和Y给X发送的信息。波尔金对基本三元组的性质进行了研究。①M. Burgin,“Theory of Named Sets as a Foundational Basis for Mathematics”,in Structures Mathematical Theories,San Sebastian,1990,pp.417—420;M. Burgin,Theory of Named Sets,Mathematics Research Developments,New York:Nova Science,2011.
总之,无论从理论研究的角度看,还是从具体问题的角度来看,图2都是信息科学领域十分典型、十分有用的研究模型,而面向图2模型的信息生态学方法则可以作为信息科学研究的普遍适用的方法 学。
还要指出,在图2的模型中,符合“信息生态学”要求的主体所产生的(反作用于客体的)行为应当具有足够的智能水平,否则,主体将会遭受生存发展的风险。这里,所谓主体的行为必须有足够的智能水平,是指:(1)主体产生的行为应当能够达到主体的目的,否则就是失败的行为;(2)主客相互作用应遵从客观规律,不能破坏客观规律;否则,也会遭遇风 险。
另外还需要指出,“主客相互作用”模型中的主体不一定是单个的人,它也可以是团体甚至是社会,唯一需要满足的条件是:团体主体必须具有共同的目的和知 识。
总之,图2是现代信息科学研究所需要的统一的抽象模型,它能概括几乎所有的信息科学领域研究的问题。不过,对于具体的信息科学研究来说,人们肯定还希望把图2的模型加以具体化。为了这个目的,我们就得到了图3的模型。②钟义信:《机器知行学原理》,北京:科学出版社2014年 版。
由图3与图2的对比可以看出,两者完全一致,只是图3把“主客相互作用”模型中主体所执行的信息过程具体表现为以下四 类。
过程(1):客体信息被转换为感知信息(感知选择单元的功能)。过程(2):感知信息被转换为知识(认知单元的功能)。过程(3):在相关知识支持下,在目的导控下,感知信息相继被转换为基础意识、情感和理智,并被综合成为主体的智能策略(决策单元的功能)。过程(4):智能策略被转换为智能行为并反作用于客体(执行单元的功 能)。
上述四个过程完成了“主客相互作用”的基本回合。但是,如果主体的智能行为反作用于客体之后得到的结果与“目的”之间存在误差,那么,这个误差本身就是一种新的信息,说明上述基本回合不够理想。为此,必须把这个误差信息反馈到感知单元,据此通过学习增加知识、优化策略,从而改进智能行为的效果。这种“误差反馈—学习优化”的回合也许要反复多次,才能使智能行为所产生的误差减小到满意的程 度。
需要引起注意的是,图3模型中的“感知选择”单元并不是普通的“传感单元”。实际上,传感单元(包括人的感觉器官)只能感受有客体信息的存在,但不能分辨这个客体信息是否与主体的目的有关。而感知单元则不但能够感受客体信息的存在,而且能够分辨这个客体信息是否与主体的目的有关,从而能够决定要对这个客体信息作出何种响应——或者不予理会(若它与主体目的无关),或者要把它选择进来并据此生成感知信息(若它与主体目的有 关)。
综上所述,图3所示的信息科学研究模型表现的是一类开放的、大规模的、复杂的信息系统(过程),涵盖了人类各种信息活动,确实是信息领域研究所需要的科学模 型。
构筑了信息科学的研究模型,就相当于描绘了反映信息科学研究内容的总体蓝图。有了正确的蓝图,接下来要解决的问题就是:如何精心选择合适的研究路径来研究所构筑的研究模型,以便揭示信息科学的基本规 律?
此前的信息科学研究存在若干不同的研究路径:结构主义研究路径、功能主义研究路径和行为主义研究路径,等等。其中每一种研究路径都取得了不少的成果,但每一种路径也都各自面临着严峻的挑战。那么,究竟什么样的(已有的、新创的)研究路径才适合于信息科学的研究 呢?
正如上面所强调的,信息生态方法学关注的焦点问题,是领域中各种信息处理系统之间的相互关系以及这些系统与环境之间的关系。那么,从图3所表示的信息科学研究模型可以十分清晰地看出,在“主客相互作用模型”的总体框架中,最为本质的关系乃是一系列的转换①钟义信:《信息转换原理:信息、知识、智能的综合理论》。:
或更简洁地表示 为:
不难理解,关系(5.1)或(5.2)是“主客相互作用模型”的全局灵魂和生命线,只要遵循并妥善完成这一系列转换,主体就可以达成自己的目的并与环境中的客体实现和谐相处。而且值得特别指出,关系(5.1)或(5.2)也是在“主客相互作用”过程中,主体生成智能策略和智能行为的根本工作机 制。
更具体地说,只要能够实现关系(5.1)或(5.2),就可以保证:(1)在主客相互作用的过程中,主体能够生成智能策略和智能行为,因而(2)主体就能够达成自己的目的,(3)主体就能与环境和谐相 处。
可见,关系(5.1)或(5.2)就是信息领域科学研究的最佳研究路径。由于(5.1)或(5.2)是“主客相互作用过程”生成智能策略和智能行为的根本机制,我们就把信息领域科学研究的这种全新研究路径命名为“机制主义”的研究路径。
不难理解,这种全新的“机制主义研究路径”是比“结构主义研究路径”“功能主义研究路径”和“行为主义研究路径”更具本质意义的研究路径,这是因为:对于一个系统而言,机制反映了系统的本质和灵魂,结构和功能都只是为机制服务的,而行为则是机制所实现的外部表现。正像飞机设计的奥妙在于理解和遵循了鸟类飞行的空气动力学原理,而不是简单地模拟鸟类的结构;与此类似,信息科学系统研究的奥妙则在于理解和遵循智能生成的机制(也是信息生态学在信息系统实现的机制),而不是机械地模拟原型智能系统的结构、功能或行为。①Y. X.Zhong,“Structuralism?Functionalism?Behaviorism?Or Mechanism?Looking for Better Approach to AI”,International Journal on Intelligent Computing and Cybernetics,Vol.1,No.3,2008,pp.325—336.
总体来说,机制主义研究路径就是实现(5.1)或(5.2)的信息转换,至于选择什么样的结构和功能来实现这些信息转换,以及要表现什么样的外部行为,则依具体的研究问题的不同而不 同。
以上三点分别解析了信息生态学的概念、在信息生态方法学指导下建立了信息领域科学研究的主客相互作用模型和机制主义研究路径。在此基础上,现在就可以利用机制主义研究路径来系统地阐明主客相互作用模型中的各种基本关系。②钟义信:《信息科学与技术导论》,北京:北京邮电大学出版社2015年版。
对照图3的模型可知,第一类关系是客体信息与感知信息之间的相互关系(其他各类关系将留待以后讨论)。长期以来,人们一直以为,人类的感觉器官或技术上的传感器承担了客体信息向感知信息转换的功能。其实不然,人类的感觉器官和技术上的传感器所承担的功能只是把客体信息转换成为了作为感知信息表层的“语法信息”,即香农(Shannon)理论意义上的信息,也就是“既忽略了内容因素也忽略了价值因素的信息”,这显然不是完全的感知信 息。
为了理解这个论点,有必要首先阐明客体信息与感知信息的概念。①钟义信:《信息科学原理》,北京:北京邮电大学出版社1988年 版。
定义5.2客体信息,是指客体自身所呈现出来的形 态。
这里的“形态”包括客体对外呈现的形状、姿态、大小、颜色、重量、结构,等等。按照这个定义,现实世界的每个客体都在时时刻刻地产生自己的客体信息,它是现实世界普遍存在的现 象。
显然,客体信息只与客体本身有关,而与主体的意志和愿望无关。因此,客体信息有时也被称为“本体论信 息”。
定义5.3感知信息,是指主体从客体信息所感知的信息。
感知信息既与客体有关,也与主体有关。它来源于客体,同时又注入了主体的目的因素和知识因素。由于这个缘故,感知信息有时也被称为“认识论信息”。同样因为这个缘故,感知信息就具有比客体信息更加丰富的内涵:(1)由于主体具有感觉能力,因此能够感觉到客体的形态,这便是感知信息的形态分量,习惯上被称为“语法信息”;(2)由于主体具有目的性,因此能够检验这样的客体是否与主体的目的有关,如果有关,究竟是有利还是有害?这便是感知信息的效用分量,被称为“语用信息”;(3)由于主体具有理解和抽象能力,因此能够对于同时具备条件(1)和(2)的客体赋予其特定的含义和名称,这便是感知信息的内容分量,被称为“语义信 息”。
由此,还可以得到“语义信息”和“全信息”的定义②钟义信:《信息科学与技术导论》,北京:北京邮电大学出版社2015年 版。:
定义5.4语义信息是主体对“语法信息与语用信息共同体的抽象与命名”。
定义5.5感知信息是语法信息、语用信息、语义信息的三位一体。同时具备这三个分量的信息也被称为“全信息”。
对于任何正常的人类主体来说,感知信息的三个分量不可或缺,几乎没有什么人只对形式感兴趣而对效用和意义不感兴趣。即使对于其他生物主体,情形也是如此,只不过它们能够感知的语法信息、语用信息和语义信息要比人类感知的语法信息、语用信息和语义信息简单得 多。
需要说明的是,“语法、语义、语用”是从“符号学”借用过来的术语,并且已经约定俗成(所以不便弃用或改用)。但是需要注意,符号学的创始人和后续的研究者们对这三个概念的定义与本文的定义有所不同,特别是,符号学对其中的“语义”和“语用”的概念定义不够严谨,因此引出了一系列的争议。尤其在“语言学”领域,这种争议相当激烈,而且至今没有弥合的趋势。为此,本文作者希望,信息科学领域的读者恪守本文给出的定义,以避免那些不必要的含混和争 议。
还要指出,符号学的创始人和后续的研究者们只是分别定义了上述三个概念,却从来没有深入分析这三个概念之间究竟是否存在什么样的逻辑关系。从这个意义上可以说,“符号学”对于“语法”“语用”“语义”这组基本概念的研究是不充分、不到位的。这也是引起许多歧义和争论的直接原 因。
为了深刻认识和准确把握感知信息定义中关于“语法信息”“语用信息”和“语义信息”这三个基本概念,这里有必要具体分析它们的生成机理,从而揭示出三者之间内在的深刻关联(进而也可以消除现存的一些误解和争 论)。
图4就是语法信息、语用信息和语义信息的生成机理模型①钟义信:《信息科学与技术导 论》。。
图中,虚线以内表示的就是主体的感知单元。它的输入是客体信息,用符号S表示,它的输出是主体所生成的感知信息的三个分量:语法信息(用符号X表示)、语用信息(用符号Z表示)和语义信息(用符号Y表 示)。
那么,这些信息是怎样生成的呢?在考察它们的生成过程之前需要说明:在这三个分量之中,语法信息(即形态信息)是具体而直观的信息,因此可以直接感觉出来;语用信息(即效用信息)也是具体而明确的信息,可以直接检验出来;而语义信息(即内容信息,有时也叫意义信息)则是抽象的信息,既不能直接感觉出来也不可能直接检验出来,只能通过具体的语法信息和语用信息的共同体(笛卡尔积)来抽象定义。在明确了这些性质之后,现在就可以理解它们的生成机 理 了。
从图4的模型可以看出,整个模型中的核心单元是“综合知识库”,它存储着主体的“目的”(用符号G表示)和主体此前所积累起来的大量的“语法信息—语用信息”偶对(用列表{x,z}表示)。至此,感知信息生成过程就可以描述如 下。
(1) 语法信息(X)的生 成。
当外来的客体信息(S)作用于主体的时候,主体的感觉器官(机器的传感系统)就可以直接把它转换为语法信息(X)输出(这是人尽皆知的过 程)。
(2) 语用信息(Z)的生成却要分为两种互补的情 形。
(2-1) 如果这个客体是以前曾经处理过的,于是,综合知识库的列表{x,z}中就会存储它的“语法信息—语用信息”偶对。这时,就可以利用上面所产生的语法信息(X)作为检索子(关键词)对综合知识库的列表{x,z}进行搜索,只要发现了其中某个语法信息 xk与X匹配,那么与 xk相应的 zk就是它的语用信息Z。
(2-2) 如果这个客体是以前从未处理过的,因此,综合知识库的列表{x,z}中就不会有它们的偶对。这时,就可以通过计算X与G的相关性(即图4中的“目的检验”单元)得到所要求的语用信息Z。如图4所示,2-2与2-1遵守“或”的关 系。
(3) 语义信息(Y)的生成。
根据定义5.3的释文(3),把以上两步得到的{X,Z}映射到语义信息空间(这就是一个抽象过程)并给映射的结果命名,便得到了语义信息(Y)。
图4的模型和上述三个步骤实现了由客体信息到感知信息的转换,同时也展现了客体信息与感知信息之间的相互关 系。
特别值得指出的是,以上的分析,在历史上第一次揭示了语法信息、语用信息、语义信息三者之间的内在逻辑关系,也为语义信息提供了严格的定义①钟义信:《信息科学与技术导论》。:
公式(5.3)中的符号 是“映射与命名”算子。颇为有趣的是,这个号也正是命名集理论的基本算子。①M.Burgin,Theory of Named Sets,Mathematics Research Developments,New York:Nova Science,2011.
我们注意到,近十多年来学术文献中虽然大量使用“语义信息”的术语,而且也在利用语义信息来说明和解决各种信息处理问题,但是并无文献给出过语义信息的严格定义。因此不同的使用者对语义信息各有不同的理解,存在很大的任意性。自然,这样随意的语义信息概念并未对信息研究作出人们所期待的 贡 献。
在这种情况下,严格而准确地界定“语义信息”内在含义的定义5.4及其定义表达式(5.3)将对信息处理和整个信息科学研究产生特别重要的意 义。
定义5.4和表达式(5.3)还表明,这样定义的语义信息可以成为语法信息和语用信息的合法代表:一旦获得了语义信息,也就获得了语法信息和语用信息。这就是为什么人们最为关注的是语义信息的原 因。
本文论述了信息生态方法学的优势是:可以把科学研究从“就事论事的研究”水平和“方法性研究”水平提高到“生态学研究”的水平。后者是当今以及未来科学研究的重要特征,体现了开放信息系统的特点、复杂信息系统的特点、智能信息系统的特点、整体优化的特点以及和谐演化的特 点。
为此,本文介绍了生态学的发展简史和各种生态学的概念,给出了一般生态学的理论要点,特别阐述了信息生态学的定义和信息生态方法学对信息科学研究领域所作出的开创性贡献,包括:构筑了信息科学研究的统一的抽象模型和具体模型,创建了比结构主义、功能主义、行为主义更优越的机制主义的研究路径,揭示了信息科学研究领域客体信息与感知信息之间的转换原理,阐明了语法信息、语用信息、语义信息的定义及其相互关系。这一切都是“信息生态方法学”所作出的历史性贡献,突破了香农信息论的局限,也超越了符号学的结 果。
这些结果,是“信息生态方法学”优于“机械还原方法学”的重要见证。换句话说,以上这些结果只能在“信息生态方法学”的指导下才能揭示出来;以“分而治之”为特征的机械还原方法学不可能得到上述这些重要的结果,不可能揭示信息科学领域这些重要的关系和规 律。
事实上,整个科学研究的知识,都是通过人类的信息获取和加工过程所产生的结果,因此应当把科学研究建立在先进的信息加工模型及其数学模型基础之上。就作者所知,人们迄今已经建立了不少这类模型,比如:表征命题逻辑与谓词逻辑系统科学理论的标准实证模型①F.Suppe(ed.),The Structure of Scientific Theories,Urbana:University of Illinois Press,1974;F. Suppe,“The Positivist Model of Scientific Theories”,in Scientific Inquiry,New York:Oxford University Press,1999,pp.16—24.,展示数学模型系统科学理论的结构主义模型②J. D.Sneed,The Logical Structure of Mathematical Physics,Dordrecht:D. Reidel,1971;B. van Frassen,“The Semantic Approach to Scientific Theories”,in The Nature of Scientific Theory,2000,pp.175—194.,涵盖现有其他各种理论和实际知识的结构规范化模型,等等。它们表现了知识的先进表示方法。③M. Burgin and L. Kavunenko,“Measurement and Evaluation in Science”.
信息生态方法学在信息科学领域还有更多的重要作用和精彩的结果可以逐一展示,包括感知信息与知识的关系,感知信息与智能策略(基础意识、情感与理智的综合集成)的关系,智能策略与智能行为的关系,等等。不过,由于篇幅的原因,我们将把这些成果留待以后陆续发 表。