邱德胜,沈冬香
(西南大学哲学系,重庆 400715)
科学划界问题是科学哲学的经典问题之一,主要研究科学与非科学、伪科学之间的边界问题,并寻求划定这一边界的标准。关于科学划界标准的探讨与科学哲学相伴相生,历史悠久,几经变革。各个主要的哲学流派或是代表人物基于自己的科学哲学观,先后提出了一元标准、历史标准、科学标准消解论、多元标准等,不一而足。客观说来,一方面,通过科学与非科学的分界,可以提高科学的地位,展现其不同于其他知识部类的优长,但这种分界如果过于严苛,必将导致一些重要的知识部类因被划入另册而受到打压和排挤,很难取得新的进步。另一方面,如果消解科学与非科学的边界,将导致科学的泛化,使科学与神话、巫术、迷信混为一团,虽然此时的科学与其他的文化形式具有平权的地位,但这对于科学的发展和进步而言必将招致毁灭性的打击。因此,重要的是,在使科学走下神龛的同时,又确保其合理的地位,才是当务之急。
当前人类正在迈入智能时代,以信息高速公路为基础,以人工智能、虚拟现实、万物互联、大数据应用等为技术内核的智能时代在立足实现社会生产和生活智能化的同时,其蕴含的新思想、新观点、新方法也将对科学的边界发起新的挑战,使科学既有的数据化、构造化、整体化特征得以凸显并成为衡量理论是否具有科学性的重要判据。因此,将数据化、构造化、整体化确立为智能时代科学划界的新标准,对于重新圈定科学的疆域,重塑智能时代的科学形象意义重大。
自古希腊以来的科学史无不反映出一个重要的特点,那就是人类在研究自然世界、探求自然规律的过程中,经常从数据化、构造化、整体化的角度思考问题、提出假说、建构理论,使人类对外在世界的把握逐步深入。历史演进到当代,人工智能、大数据应用等将为智能时代的知识生产提供新的技术手段,并使既有科学的数据化、构造化、整体化特征淋漓尽致地体现出来。因此,将数据化、构造化和整体化作为科学划界的新标准,既是对既有科学史的合理总结,也是对智能时代科学发展方向的合理期待。
数据是观察或事实的结果,用以表示未经加工的原始素材,既可以表现为符号或文字,也可以表现为图像或声音,而数据化就是将客观事物的原始素材加以标识和数据处理的过程。将数据化作为科学划界标准的首要因素,其原因主要有以下3个方面。
首先,科学发展的过程就是一个不断追求数据化、不断追求精确性的过程。回顾哲学史,万物皆可映射为数据的思想可溯源至古希腊哲学家毕达哥拉斯,他指出物质世界体现着数学的抽象规律,数是万物的本源:“数学是我们信仰永恒的与严格的真理的主要根源”[1]。近代物理学之父伽利略创造了以追求事物之量为目标的科学研究方法,广泛地运用数据来对科学研究对象进行定量描述。在近现代实验研究中,科学家普遍应用数据来代替过去模糊不清的自然语言,计量单位也由于数据化而变得越来越精确。民国著名哲学家罗家伦指出:“科学的努力,是向着准和确的”[2]。正是对于科学实验和计量中数据化的精确应用,让不同时间、不同地域的人们有了同一个不变的参照系,正是得益于科学研究对象的数据化和标准化,科学才具备了相互交流的基础。
其次,智能技术的发展与大数据相伴相生,没有数据化做铺垫,智能科技将寸步难行。在智能时代,一切自然物都可以用数据来表示,数据便代替自然物成为了新的科学研究对象,大数据组成的样本为人工智能的深度学习提供了原始材料,让人工智能研究得以可能。在数据的收集和处理中将会有更多的数据产生出来,反过来又可以促进算法性能的提高。立足智能时代,数据化成为了社会发展的重要趋势。在社会层面,一个国家的经济运行状况、科学发展水平均可以用数据来描绘。在个人层面,我们个体的身体状态与心理状况,也可以用相应的数据来表示。在当前的学科研究中,不仅物理、化学等传统自然科学全面数据化,新兴的人文社会科学也逐渐采用数据化的研究方式。
最后,将既有科学的数据化推进到智能时代,既符合科学知识的本质属性,也有助于智能时代的发展和进步,同时,科学的研究对象一旦实现全面数据化,还可以利用大数据挖掘等技术手段实现科学知识的增长和进步。举例来说,经济学通过采集社会经济层面的大量数据,并通过计算机进行模拟计算,来描述经济运行规律和预测未来的经济发展;基于深度学习技术的植物识别软件,其基本运作原理是把花草果蔬的特征转换成可以存储的数据,再通过基于卷积神经网络的通用图像识别引擎形成专业植物数据库,最后通过基于GIS的大数据统计分析系统进行花草识别。近年来,基于人工智能的面部识别技术被应用于心理学的情绪预测,并将人们的情感状况、心理状态由自然语言描述转换为相对精确的数据描述,以提高结果的客观性与精确性。简言之,科学大数据在为人工智能提供养料并推进其发展的同时,也为自身的发展和进步提供了新的可能。
科学的数据化为智能时代大数据的形成提供了重要基础,但仅有相关数据还远远不够,重要的是揭示数据背后的规律,进而总结出一般性的结论。如何将这个结论表达出来呢?最为简单有效的方式便是数学表达式,因而,基于数据化之上的科学便体现出构造化的特征。构造化是指科学知识的各个部分是有逻辑关联的,是用数学联系起来的[3]。对于数学在科学中的重要性,马克思曾经指出:“一种科学只有成功地运用数学时,才算达到了真正完善的地步”[4]。因此,一门科学是否成熟,关键是看它的规律能否通过数学表达式表达出来,而科学的这种构造化的特点在近代以来的科学中不断得到体现,并在智能时代上升到一个新的高度。
20世纪以来,著名物理学家爱因斯坦先后提出了多个极具价值的理论结论,如在他的狭义相对论中,不仅通过多个数学表达式阐述了狭义相对论的时空观,还通过E=mc2建立了质量与能量的直接数学转化关系。在量子力学的发展过程中,爱因斯坦提出了著名的光电效应方程Ek=hν-W0,很好地解释了困扰物理界多年的光电效应现象等,这些都体现了科学构造化的特点。
立足智能时代,随着大数据挖掘技术以及各种算法的运用,在输入数据和算法相同的情况下,无论是在国内还是国外,所得出的结果并无区别。因此,具有数学化特征的人工智能算法具有无歧义性,或者说普遍性、非地方性的重要特征。智能时代的科学发展,更需要用数学公式或者计算机程序语言来表达科学结论,用数学方式表达相比于完全的自然语言描述,更具精确性与无歧义性,更能满足科学的简单性原则,为科学追求事物的本质与联系提供了重要保障。
整体化不仅是人工智能发展的方法论基础,也是科学的本质特征,因为科学理论不是零散经验的简单拼凑,而是系统化、理论化的完整知识体系。科学的整体化体现在学科内部、学科间是一个紧密联系的“整体”。任何科学命题都包含一定的辅助性假设和修改性条件,这些理论与假设之间要能够相互印证。科学哲学家蒯因提出了科学的整体论特征:“我认为我们关于外在世界的陈述不是个别地而是仅仅作为一个整体来面对感觉经验的法庭的”[8]。
整体化还体现在经验、实验结果和理论之间要形成一个彼此印证的有机整体上。科学与经验世界相关,科学理论是直接或者间接从经验事实中推导出来的,一个成功的、完备的科学理论必定要符合实践的检验。在近代西方的化学研究中,斯塔尔提出燃素说来解释燃烧现象,指出燃烧过程应是物质丢失燃素,空气得到燃素的过程。燃素说在很长时期内都占据着化学界的领导地位,但在18世纪却出现了大量观察结果与理论不相符合的情况,即在实验中一些金属燃烧之后重量反而会增加,因此,传统的燃素说已经不能领导化学继续前进了。18世纪末,拉瓦锡在其撰写的《初等化学概论》一书中详细论述了以氧化反应为基础的新燃烧学说,开创了化学研究的新时代。
牛顿力学作为近代科学的杰出代表,其三大运动定律及万有引力定律不仅能满足数据化的要求,更能通过数学公式得以表达,同时,它还是一个包括辅助性条件在内的理论体系,内部逻辑严密、融洽和谐、浑然一体,表现出明显的整体化特征。此外,关于牛顿力学的实验观察与理论自身可以相互印证,如天文学家哈雷根据牛顿的天体运行理论,成功预言哈雷彗星的周期为76年,有力地印证了牛顿力学的正确性。简言之,牛顿力学完全具备数据化、构造化、整体化三大基本要素,是当之无愧的科学。
事实证明,人工智能的发展融合了物理学、化学、计算机科学、神经科学等多个学科,逐步实现了基于近代科学详细分工基础上的再联合。这种联合通过“数据化的语言”和“构造化的方法”不断推进科学的整体化进程。在智能技术的促逼下,各个学科通过数据化、构造化的重构之后,将实现学科内部甚至学科之间的语言统一,从而加强学科内外的整体性和一致性。换言之,人工智能时代下的科学研究要求学科内各环节、学科间各领域能够相互印证、有机联系,并实现整个理论体系的逻辑自洽,科学的整体化特征将进一步凸显出来。
将数据化、构造化、整体化作为科学划界的新标准有其合理性,下面从科学理论的形成过程、费格尔科学划界的5个指标两个方面加以论证。
从科学哲学的角度看,科学理论的形成大致有两种常见的方法。第一种是经验归纳方法。运用这种方法构建科学理论体系一般需要以下3个环节:第一是需要通过观察和实验等收集科学事实的方法得到关于研究对象的第一手数据;第二是需要通过比较与分类、分析与综合、归纳与演绎等整理科学事实的方法从数据中总结出一般性结论;第三是将诸多一般性结论通过公理化、逻辑与历史相统一以及从抽象到具体等方法建构为系统的理论体系。换言之,科学理论建构的第1个环节体现出科学的数据化特征;第2个环节则是对前述数据进行整理和分析,总结其中的规律,并借助数学表达式表达出来,由此体现出科学的构造性特征;第3个环节需要将多个一般性规律统合起来,建构为前后相容、逻辑自洽的理论体系,从而体现出科学的整体化特征。
第二种是假说演绎方法。运用这种方法构建科学理论同样需要经过3个环节:第1个环节是提出科学研究的问题,这里的问题可以来源于多个方面,如理论与理论之间的不一致、理论内部的不一致、新的观测与旧的理论不一致等;第2个环节则是着手对已有问题的解决,研究者会提出多种可能的尝试性的解决方案,可以表现为单个命题,也可以表现为系统理论;第3个环节则需要对各种解决方案进行验证,因为多种尝试性的解决方案不一定都是正确的,还有待观察和实验的数据的检验,有些可能被直接证伪,有些可能需要修正和完善。从以上3个环节可以看出,科学问题的解决与观察实验的检验相关、与命题或理论的解决方案相关,而观察实验的结果一般需要通过数据化的方式加以记录、命题往往可以通过全称判断或数学公式来表达、理论则展现为概念或原理相结合的体系,因此,科学的数据化、构造化、整体化特征便会表现出来。
对于科学理论的形成过程而言,不论是运用经验归纳方法还是假说演绎方法,科学史上相关的案例均不胜枚举。就经验归纳方法来说,开普勒三定律的建立极具代表性。丹麦天文学家布拉赫通过20多年的天文观测,得到了大量的第一手数据,德国天文学家开普勒在布拉赫数据的基础上,经过长达16年的计算,先后提出了开普勒第一、第二和第三定律,并借助数学表达式表达出来。基于三大定律,开普勒先后出版了《新天文学》(1609年)和《宇宙的和谐》(1619年)两部伟大著作,借此建构了完整的天文学理论体系,他因此被后世称为天空的立法者。
就假说演绎方法而言,量子力学的建立是其很好的例证。19世纪末20世纪初,为了探明黑体辐射中辐射波长和辐射能量之间的关系,德国物理学家维恩、英国物理学家瑞利和金斯分别提出了不同的数学表达式,但均只在部分区域与实验数据吻合,德国物理学家普朗克打破能量连续传播的传统观念,在前人工作的基础上利用内插法建立了普朗克公式,并由此提出能量子假说。此后,经过爱因斯坦、玻尔、德布罗意等人的发展,尤其是海森堡的矩阵力学、薛定谔的波动力学的提出,作为理论体系的量子力学才算得以真正建立起来,并在后来的实验中得以不断的修正和完善。量子力学成为一个立足微观世界,不断展示其理论活力和应用价值的重要学科领域。
从科学理论的形成过程观之,不论采取的是第一种还是第二种方法,均会体现出科学的数据化、构造化、整体化特征,符合以上特征的科学史案例俯拾皆是。由此,将数据化、构造化、整体化作为科学划界的新标准,不失为一种区分科学与非科学或伪科学的合理方法。
费格尔是逻辑实证主义的代表人物,奥地利著名科学哲学家,维也纳学派的早期成员之一。在他看来,科学与非科学的划界标准应该满足以下5个指标,分别是主体间可检验性、可靠性、确定性与精准性、一致性或系统性、全面性或广泛性[9]。
主体间可检验性意指一个命题或理论原则上能够经受任何人的查证和检验,与之相关的偏见、幻觉、假象等个人因素均会被排除在外,由此体现出命题或理论的客观性——即非主观性、可检验性、可重复性的特点[3]。命题或理论一旦能通过数据加以描述或刻画,其主观性会被祛除,其客观性会得以凸显,其主体间可检验性程度会大幅提高,因此,将数据化作为科学与非科学划界标准的因素之一,具有一定的合理性。
可靠性是指一个命题或理论进行检验后是正确的,或者至少我们可以极其合理地相信它是正确的。由此,对于科学的命题或理论而言,当初始条件和边界条件相同时,经过检验,应得出相同的结论。重要的是,科学命题或理论中蕴含的科学规律如果能通过数学表达式表达出来,对其进行检验就会更直接。同时,具有可靠性的科学应具有稳定的预测力,而科学的构造性将使这种稳定的预测力体现得更加的精准,反过来也印证了科学的可靠性。因此,将构造化作为科学划界标准的因素之一,理当具有一定的合理性。
确定性和精准性可以用在两个相关的意义方面:一方面在界定概念时应该确定和精准,以排除模糊性或歧义性;另一方面在阐述规律时要确定和精准,最好借助数据或数学公式来表述。比如:“X导致疾病Y的可能性更大”与“X导致疾病Y的机率是98%”两个句子相比,后者更加符合要求。对科学的确定性和精准性的要求,进一步说明了数据化和构造化对于科学划界的重要意义。
一致性或系统性是对一个学科或理论体系而言,观察、命题以及理论之间逻辑自洽,前后相容。数据化有利于消除自然语言的模糊性,使科学的语言更明晰,科学规律的构造化表述可以增强理论之间的联系并实现相互印证,有利于清除理论内部的矛盾,促进其一致性和系统性的提高。科学理论具有了系统性,一方面意味着理论体系内部自洽,更意味着理论体系具有了整体化的特征。
全面性或广泛性对科学理论而言极为重要。科学是由概念、原理和推论构成的逻辑自洽的理论体系。首先,科学的物质概念在客观世界中均应有对应物,即科学的物质概念有指称,以此确保科学具有实在性,而不是一种简单的文字游戏。其次,科学的原理展现为定理和定律的形式,一般用全称判断来表述,因而通过科学原理可以解释一类现象而不限于对个案的说明。如牛顿的万有引力定律不仅能解释物体降落的问题,也能解释天体运行论和潮汐作用力,因为其全面和广泛的解释能力而享有很高的地位。最后,由概念、原理和推论构成的理论体系具有整体性,这种整体性一方面可以继续发挥内含单个原理具有的解释和预测的功能;另一方面还可以将概念、原理及推论等各个单一的要素联系起来,发挥整体的优势,从而解释单个原理甚至其他理论不能解释的新问题、新现象,做出更加全面和广泛的预测。因而,将科学的整体化作为新划界标准的因素之一也具有其合理性。
综上所述,以费格尔科学划界的5个指标为依据,结合智能时代的新特点,将数据化、构造化、整体化作为科学划界的新标准有其合理性,基于这一新的划界标准,原有科学的边界也必将随之产生一些新的变化。
立足智能时代,以数据化、构造化、整体化作为科学划界的新标准,可以全面审视原有的知识部类,考察其科学性。重要的是,借助智能科技,可以对原有的知识部类进行改造和革新,使其逐渐迈进科学的大门。由此,原有的科学边界将得以重铸,科学的疆域会得以适当的拓展,我们对于科学的理解也会发生全新的变化。
自古以来,关于人类知识的分类方式见仁见智,不一而足,科学哲学家李醒民的观点极具代表性:“以我之见,最好还是把人类知识分为三大部类——自然科学(一般径称‘科学’)、社会科学和人文学科”[10]。一般而言,自然科学以自然为研究对象,关注物与物之间的关系。近代以来的自然科学注重数理传统和实验传统的结合,在伽利略、牛顿等人的推动下逐渐形成并走向壮大,不断体现出数据化、构造化和整体化的特征。立足智能时代,大数据、物联网和人工智能等技术将会对自然科学的研究对象、研究方法和研究结论产生重大影响,并将自然科学的数据化、构造化、整体化特征推进到一个更高的水平。
首先,大数据、物联网等技术拓展了科学研究的对象,提高了自然科学的数据化水平。通过传感器、卫星监测、粒子对撞机、基因测序仪等大数据收集技术可以对原来不可观测的对象加以观测,并将观测数据及时地传输到实验室中,供进一步的数据分析使用。这一方面拓展了科学研究对象的时空边界,另一方面为后续的数据分析和构造化结论的提出打下了基础。其次,数据挖掘、并行计算等技术可以有效处理海量数据,提高自然科学的构造化水平。数据挖掘和并行计算技术可以提升数据处理速度,降低时间成本,发现海量数据背后隐藏的规律,并借助数学表达式表达出来,从而提高了自然科学的构造化水平。最后,数据共享和深度学习可以带来科学研究层次的转变,引导学科领域的聚合,从而提高自然科学的整体化水平。通过海量数据的共享和深度学习,可以打破既有研究领域的边界,实现同一学科领域内以及不同学科领域之间的聚合,发掘更具基础性的科学规律,并使其解释范围更广,预测能力更强,从而提高了自然科学的整体化水平。
智能科技已经极大地改变了自然科学研究的面貌,尤其在诸多应用学科如脑神经科学、生态环境科学等方面起到了不可或缺的作用,随着智能科技的进一步发展和在自然科学研究领域的大规模应用,自然科学的数据化、构造化、整体化水平会进一步显现,因此,被智能科技改造之后的自然科学将继续成为划界新标准视野下的科学典范。
社会科学以社会作为其研究对象,其目标在于认识各种社会现象并发掘它们之间的关联。传统的社会科学虽然借鉴了自然科学定量研究的方法,但由于样本少、数据量小,主观性强等特点,导致得出的结论客观性不强,数据化、构造化、整体化程度相对较低,因此,传统社会科学的科学性经常受到一些学者的质疑。
随着智能时代的来临,智能科技为社会科学的研究提供了有力的工具和方法。目前,电子踪迹、数字文本、社交媒体与空间位置信息是最为常见的4种大数据类型,通过对这些数据的收集,可以获取社会科学研究的素材,形成社会科学大数据,同时,借助最新的分析处理技术,可以从海量数据中挖掘出有价值的知识数据,有可能催生新的科学发现。与传统定量研究方法相比,大数据有利于推动社会科学走向深度研究,原因在于:“ 一是大数据能够跟踪和记录人类行为和交互活动,实时获取海量结构化及非结构化的可供精细分析的海量数据;二是大数据赋予了社会科学更易于人类接收信息的数据可视化平台;三是大量深度学习工具带来的数据分析的精准化”[11]。由此,在社会科学大数据的收集、处理和分析过程中,发掘数据背后的规律,将充分体现出社会科学的数据化和构造化特点。
随着大数据技术与社会科学的深度融合,由大数据驱动的社会科学将会是一种跨学科、专业和领域的交叉研究。事实上,传统社会科学内部条块分割,研究方法各异,相互交流非常困难。“如经济学分析多使用面板数据、时间序列数据;社会学分析多使用截面数据;人口学分析多使用普查数据等”[12]。大数据将改变这种现状,因为大数据的收集并非按照学科专业展开,对大数据的分析和处理也将打破学科专业的局限,可以预见,基于社会科学内部和外部的交叉研究将会不断涌现,社会科学的整体化水平也会得以极大地提高。由此,在智能科技的作用下,社会科学的数据化、构造化、整体化水平会得以提前,逐渐成为符合新的划界标准的严格意义上的科学。
一般而言,“人文学科是关于人和人的特殊性的学科群,主要研究人本身或与个体精神直接相关的信仰、情感、心态、理想、道德、审美、意义、价值等的各门科学的总称。”[10]相对于自然科学追求普遍性、抽象性的研究结论而言,人文学科的研究更为具体,它关心个人的情感、生活的意义以及各具特色的价值观,因此,人文学科很难达到科学划界标准的数据化、构造化和整体化的特征,从这个角度来说,常规意义上的文史哲等人文学科不是科学。
随着智能时代的来临,智能科技对传统的人文学科也带来了新的研究手段和方法,使人文学科中的部分研究领域也逐渐向数据化、构造化、整体化的方向发展,有可能成为科学大家庭的成员。首先,在文史哲等人文学科中,一些能够采取定量研究方法探索一般规律的研究领域可以实现科学化。举例来说:当历史学家通过定量研究,通过统计的和经济的因素阐明历史事件时,他的工作便具有了科学性;在探究数理逻辑的推演规则、客观知识的发生机制等主题时,哲学研究也会体现出科学的特征。其次,被智能科技成功改造之后的人文学科有可能实现科学化。当前,将人类的行为通过数据的方式加以记录已经十分便利,重要的是,智能科技不仅可以将文本、图片、音频、视频转化为数据信息,还可以通过智能感知、情感计算等技术将以前难以客观化的人的思想、情感等心理活动实现数据化,由此,原来的生物人将转化为数据人。通过数据挖掘技术,找到人类的行为数据与情感数据之间的相关性,有可能发现适应于人类整体的一般规律。随着数据量的不断增大和智能算法、数据挖掘水平的逐渐提高,人文学科的科学性将会得到进一步的加强。
值得指出的是,人是最为复杂的动物,因而对人所开展的人文学科研究也会更为复杂。虽然智能科技可以根据与人的行为相关的全方位数据来分析人的情感活动,但这种分析能否直接揭示每个人生活的价值和意义,是一个值得思考的问题。同时,在获取人的相关信息时,还必须尊重人的隐私,把握一个合理的限度。事实上,合乎工具理性原则的智能科技只会根据规则对其分析的结果做出正确或者错误,成功或者失败的判断,但这种判断背后究竟意味着什么,智能科技则可能不得而知。人只有在生活实践中才能理解生活的意义,智能科技虽然参与了我们的生活实践,犹如过去人使用的镰刀、斧头和算盘参与人的生活实践一样,但并不能说它们就能理解我们生活的意义[13]。因此,在智能科技的作用下,人文学科的部分研究领域将会走进科学大门,但它永远不可能全部成为新划界标准意义下的科学,而这也许恰恰是人文学科的魅力之所在。
当前科技发展日新月异,科学的内涵与外延不断变化,因此,对科学划界标准的探求将是一个永无止境的前沿。立足智能时代,我们以数据化、构造化、整体化作为科学与非科学划界的基本标准,对于回应智能时代的哲学挑战,划定科学的边界,重塑科学新形象,指明科学发展方向将会有所助益。
基于新的划界标准,有几点需要强调:首先,有些知识部类(如人文学科的部分研究领域)虽然被划在科学之外,但这种划界只是一种知识类型的划界,并无上下高低之别,有些非科学依然具有其合理存在的价值和意义;其次,一些地方性知识如中医等有可能在经过智能科技的革新之后,摆脱伪科学的标签,迈进科学的殿堂,进而获得巨大的发展空间;再次,新标准要求我们在揭示数据之间的相关性的同时,还揭示其因果性,因为因果性作为相关性中的一种重要关系,对其的探求依然是科学研究最为重要的目标;最后,智能科技是一把“双刃剑”,它可以使一些知识部类经过改造后成为科学,也可以使一些文化现象如神话、迷信、巫术等还原其非科学的本来面目,而这恰恰是我们探究智能时代科学划界新标准的初衷之所在。