【摘要】理论的发展是学科进步的表现。管理学科的“理论丛林”中, 同样需要有优胜劣汰, 而筛选的过程就需要借助于证伪主义的方法论。用好理论证伪这个工具, 需要从概念、 样本、 数据、 结果等多个维度提升证伪的效力, 从而更好地推动管理理论的构建与发展。本文旨在将证伪的思维更好地运用到管理领域, 尝试构建一套初步的管理理论证伪的方法体系, 以供后续研究将此作为参考, 进而逐步形成提升科学性的方法论体系。
【关键词】管理理论;可证伪性;可靠证据;检验;证伪
【中图分类号】 F276"""" 【文献标识码】A""""" 【文章编号】1004-0994(2024)20-0009-4
一、 理论、 可证伪性与证伪
自然科学领域存在众多理论, 在过去的发展中不断地有理论被证伪(如著名的“地心说”), 同时也有一些新的理论产生。而管理领域似乎很少听到有被证伪的理论, 反而管理理论累积越来越多, 形成了所谓的近百种理论组成的“理论丛林”(贾明, 2023a、 2023b)。这不禁让人思考, 对于管理学科而言, 管理理论应该如何发展、 如何去伪存真, 建立更加有效的理论?
理论是对问题的解释, 解释的精练表述形成命题, 表述相关概念间的关系。在形成理论的过程中, 首先需要对问题有清晰的界定(贾明, 2024a)。提出研究问题是学者们讨论的起点, 只有大家都围绕同一个问题展开讨论, 才能将各种各样的观点进行总结、 提炼、 优化、 验证, 从而逐步形成被大家都能够认可和接受的对该问题的解释。如何确定讨论的是同一个问题?这本身就是一个问题。这就需要对问题的描述达成一致, 而这里最有效的办法就是借助概念来描述问题。例如, 物理学中的力、 加速度就是被构造出来用于描述自然界特征的概念。概念的名称和定义需要统一、 公认。
此外, 想要清楚界定问题, 光有概念还不行, 还需要明确限定条件, 从而更为准确地描述问题, 如在什么情况下研究概念A如何影响概念B?例如, 在宏观、 低速的情况下, 作用力如何影响物体的加速度(为何作用力越大, 物体移动越快; 发动机功率越高, 车跑得越快)?这里的限定条件就是后续形成的理论的边界条件, 也就是说理论只是在这个范围内能够起作用, 表现为能够解释与预测概念A和概念B这两者间的关系。
在提出了同一问题后, 学者们就要分析问题和解释问题。不同的学者、 不同的学科采用的思路、 方法不同, 不过目的都是一样的, 即希望能够找到解释问题的核心逻辑并形成理论。例如, 质量与物体下落速度有关吗?亚里士多德首先提出物体下落的速度与质量有关; 而伽利略随后提出物体下落的速度与质量无关。两套理论针锋相对, 现实情况似乎更加符合亚里士多德的理论, 比如在地球上把羽毛和铁球同时从高处放手, 铁球先落地。不管谁对谁错, 起码都给出了对“同一问题”的“符合逻辑”的解释。
接下来的问题就是, 如何检验哪个理论是对的?对于同一个问题的解释, 不可能存在两个相互矛盾的理论。如何判断理论的对错?这就要借助于证伪的方法。基于理论, 能够通过逻辑推理形成命题, 命题的正确与否就是判断理论正确与否的依据。在这里, 并不讨论什么理论是对的或者错的, 而是关注怎样提出的理论才是科学的(与伪科学区分开), 以及如何更有效地检验理论的真伪。
一个理论的命题能不能被证伪是划分科学命题与伪科学命题的边界(卡尔·波普尔, 2008)。例如, 理论分析提出命题“A影响B”, 就要有可能找到证据去反对“A影响B”, 这就是可证伪性。对于没有办法找到反例的理论(命题), 就不属于科学, 而是伪科学。例如, 有论断认为“如果看到晚霞, 明天就很可能是晴天”, 第二天即便是雨天, 也没有违背这个推断(说的是“很可能是晴天”, 但没有排除会下雨); 又比如“好人好报”, 这个论断没有说明什么是好报以及何时、 何地得到好报, 即便当前没有得到好报, 也不能否定命题, 故而无法证伪。由此可见: 科学的理论都有明确的界定和清晰的关系陈述, 没有模糊性; 而伪科学的理论都是含糊的界定和模糊的关系陈述, 不具有确定性。
具有可证伪性的理论是科学的理论, 科学的理论就可能被证伪。但是, 不能仅根据一个或者几个反例就推翻一个理论, 推翻一个理论要保持谨慎。通常有三个问题需要思考。
一是反例证据可靠吗?首先要评估证据的可靠性, 只有得到一个可靠的反例证据, 才能作为依据去证伪一个理论。其一, 这个证据的来源符合理论的基本设定。例如, 检验“天鹅是白色的”, 却去看鸭子的颜色, 那么有关鸭子颜色的证据显然是一个无关的或者无效的证据, 因为“天鹅是白色的”这个论断的前提是“天鹅”这个群体。其二, 可靠的证据还需要是可重复出现的。单一的证据具有偶然性, 虽然只要有一只黑天鹅, 就可以证伪“天鹅是白色的”, 但是如何保证现在看到的黑天鹅以前或者未来不是白天鹅?如果能够看到不同生长阶段的黑天鹅, 重复出现的反例证据就更加可靠。
二是理论可以修正吗?当获得可靠的反例证据时, 是否就要推翻原理论?这也不一定。不要轻易否定一个理论, 要考虑理论是否可以修正。例如, 结合反例证据的特征, 增加一些限定条件修正理论, 能够让理论更加精准, 有更加明确的适用范围, 从而提高理论的可靠性。比如, “天鹅都是白色的”, 当在A国发现黑天鹅后, 就可以将论断修正为“除了A国, 天鹅是白色的”。如果没有发现还有其他国家天鹅也有黑色的, 这个修正后的理论就更加可信。
三是如何提出新的理论?如果反例证据集与理论论断完全相反, 例如全世界各个国家都发现了黑天鹅, 在这种情况下, 就要考虑放弃原理论, 不再认为“天鹅是白色的”, 而要考虑提出新的理论来解释这些现象。此时, 就需要研究什么条件会导致天鹅是黑色的, 从而形成新的理论来解释天鹅的颜色问题。这体现了证伪在推动理论发展中的作用。
理论用于解释现实世界某个领域的现象。现实世界中, 每个学科都有看待世界的视角, 从而描绘成一幅科学的地图。假如科学世界是由像七巧板一样分割的区域拼起来的, 那么每个板块的边界就是对应理论的边界, 构成被某个理论支配的领域, 在这个给定的领域中, 不可能存在其他理论。一个给定的领域只能是一个理论。当然, 领域有大小的差别, 也就是说理论之间有解释力的差异, 有的理论适用的范围更广(如同七巧板, 有的板块更大), 具有更强的解释力。例如在自然科学领域, 牛顿的力学定理对于解释宏观环境下的低速运动是非常有效的, 可以解释现实生活中大部分现象。但是, 高速运动或者微观领域的运动(如量子)则是新的板块领域, 需要引入新的理论。
二、 管理理论及可证伪性
上面的论述逻辑同样适用于管理领域。只是管理领域的特点在于限制条件更多, 例如关于组织的特征维度、 人的特征维度众多, 使得对现实世界管理问题的领域划分会更加细致。如果说自然科学(如物理学)领域是用简洁的七巧板来划分理论领域和形成理论边界, 则管理领域更像是复杂的拼图世界, 由很多小的模块拼接而成。每个管理领域的划分更加细致, 限定条件也更多, 在这些限定条件围成的每个领域中, 都有一个管理理论; 各式各样的管理理论汇总起来, 就形成了“理论丛林”(贾明,2023a、2023b)。
当然, 管理的“理论丛林”中同样存在“大”理论和“小”理论的区别。“大”理论对应的拼图模块更大, 可以解释的管理活动范围更广。例如代理成本理论, 它的理论前提是在企业中只要存在委托人和代理人分离的公司治理结构, 代理人(比如经理)又是自利的, 就会产生代理成本。这个理论的设定场景具有很高的普适性, 在世界范围内很多企业都会出现能用代理成本理论解释的现象。但是, 如果该理论的设定不成立, 比如家族企业, 经理作为家族企业的成员, 不是自利的, 而是有很强的责任感, 甚至不用领取工资都会尽职尽责地经营公司。在这种情况下, 代理成本理论就不适用了, 因为企业的现实情景不符合代理成本理论的设定, 超出了代理成本理论适用的版图范围。故而在这个新的版图中要引入新的理论, 例如用管家理论来支配, 但这个管家理论的版图范围要小很多。
管理理论的使用取决于限制条件, 不能轻易说某个管理理论是错的。例如, 不能够用B区域的证据否定A区域的理论, 而只能用A区域的证据检验理论是否正确。大多数情况下, 证伪证据(反例)能帮助研究者修正理论, 例如缩小理论的适用范围; 极端的情况下才可能推翻这个理论。但是从现在的经验来看, 管理理论很少出现被推翻的情况, 原因在于总能找到一种情境, 使得这个理论能够解释一部分现象, 哪怕只是管理世界拼图中很小的一块。故而, 管理“理论丛林”中, 各个理论的边界不是固定的, 有的理论边界在扩大, 而有的理论边界在缩小。
怎样的管理理论可以被证伪?如前所述, 能够被证伪的理论才是科学的。管理理论要提升科学性, 就需要能够被证伪。首先, 理论要有清晰的前提设定。代理成本理论不限制企业所处的制度环境, 制度理论则不关心企业高管是否自利。其次, 能够基于理论做出符合逻辑的推断, 形成一个清晰的有关概念间关系的陈述。例如, 可以提出A正向影响B, 甚至是A不影响B。但是, 不能提出A可能正向影响B, 或者A既正向影响B也负向影响B。如果认为A可能正向影响B, 那么这个陈述是不能被证伪的。因为即便拿到一个反面的证据, 也跟这样一个陈述关系不矛盾。例如, 如果说“天鹅可能是白色的”, 那么即便是发现一只黑色的天鹅, 也不能证明这个陈述不对。
三、 管理理论的可靠证据与检验
要证伪理论, 还需要有可靠的证据。获取的证据可靠, 需要满足四个条件。
1. 概念能够测量。基于理论推导提出的命题陈述中涉及的概念要能够测量, 唯有如此, 才有可能获取相关的数据并形成证据来检验理论。概念的测量涉及概念操作化, 即将概念转化为内涵相同的变量。
概念是对客观世界中一类具有相同属性事物的抽象描述, 研究者基于概念的属性、 内涵、 外延来讨论因果关系, 构建假设命题(贾明, 2024b)。例如, 假设气温与汽水销量正相关。在这里, “气温”和“销量”用来表示两类事物。操作化指的是采用一定的规则对概念所表达的内涵进行具象化, 也就是让概念的内涵以“象”的方式呈现出来。比如, 用温度计上的刻度数值来表示“气温”, 用卖出去多少瓶汽水来表示“销量”。
表象是概念的展示。表象是主观设定的, 目的是将概念具象化。就如同照镜子, 概念是一面, 代表客观世界的真实, 而镜子里面的“象”是我们理解和具体看到的概念展示。这个镜像是否可靠取决于人的主观认识。就像我们每天早上照镜子, 如何确定镜子里面展现的胖瘦形象就是自己, 这取决于自己的经验。故而我们能做的就是尽量按照符合社会认知的角度描述概念的表象, 并让其他人相信和接受。例如, 测量身高为1.5米, 那么为何不能是1.7米或1.8米?这个测量标准就是人主观设定的(如设定1米有多长)。
一个概念可以具有不同的具体表象, 这取决于用什么“镜子”来“照”这个概念。例如, “气温”既可以用温度计来指示, 也可以用主观感受来评价(如很冷、 一般冷、 热、 很热等)。按照这个理解, 概念操作化过程中就会出现一些常见错误, 包括概念的扭曲、 夸大、 缩小。
概念操作化扭曲指的是测量得到的表象不能代表概念本身的内涵。例如关于工作场所不文明行为的研究, 较多文章采用已开发的量表对工作场所不文明行为进行衡量, 如询问受访者“你在工作中是否用含有轻蔑、 粗鲁或贬低的语言评论他人”等。但是, 受访者在填写这样的问卷时很少会进行真实回答, 哪怕实施了不文明行为, 也往往说没有, 这就会导致变量的衡量不准确, 偏离概念本身的定义。
概念操作化夸大指的是测量得到的表象超出了概念本身的内涵。例如关于企业环境绩效的研究, 有些研究直接用ESG评分来衡量, 这就超出了企业环境绩效的概念内涵, 而把一些无关的表象包括进来。
概念操作化缩小指的是测量得到的表象不足以代表整个概念本身的内涵。例如关于企业社会责任绩效的研究, 有些文章用企业慈善捐款衡量企业社会责任表现, 但是企业慈善捐款只是企业社会责任表现的一个方面, 并不能代表全部企业社会责任。
2. 选定可靠样本。确定有效的数据来源即选定样本, 这是一个既简单又复杂的问题。如前所说, 最有效的样本要符合理论的边界条件, 即在理论发挥作用的领域内选择样本。根据某个理论的前提划分出一个区域(样本选择条件), 属于这个区域的对象(由管理研究对象组成, 如企业、 组织、 个人)才是研究的样本总体(population), 抽样就要基于这个总体展开。
样本选择是管理研究中不太被重视的一个方面。很少有论文在介绍样本选择时会深入、 清晰地讨论这个研究的样本总体是如何设定的, 选择的样本是如何从总体中筛选出来的。例如很多研究中, 在理论部分可能根本就不涉及具体的中国情境, 而是在一般意义上进行论述、 推导, 进而提出假设关系, 但选择的样本却是中国企业的样本。显然, 中国企业会有一些独特的地方, 而这个是在理论推导和假设的论述中没有提及的。故而基于这个样本所得到的证据并不一定完全符合理论的前提设定, 从而降低了证据的可靠性。
3. 获取可靠数据。有了测量方法和样本, 就可以生成(generate)数据(这里用“生成”指的是数据既可能是现实中已经有的, 研究者可以去收集, 也可能是现实中还没有的, 需要研究者创造条件产生)。但要注意, 生成数据的过程需要符合规范。通常研究者所提出的研究假设是因果关系。要检验因果关系, 就要按照因果关系的检验要求来规范数据生成的方法和流程。因果关系的检验需要具备四个条件: 除了要有理论逻辑支持A影响B, 在定量分析层面还需要满足三个条件, 即自变量要比因变量先发生数值变化、 不存在其他替代因素能够解释因变量的变化、 A与B之间具有相关性。
自变量比因变量的数值先发生变化, 这个不是一种人为的假定, 而是一种事实上的时间先后的关系。这里并不是指研究者收集自变量和因变量数据的先后顺序, 而是指自变量的数值变化要比因变量的数值变化先发生。为了满足这一要求, 需要参照自然科学的实验设计思路, 即先操控自变量的数值变化, 再观察由此引发的因变量的数值变化, 以此来满足这一条件。
同时, 在实验设计中还需要做必要的控制, 以排除其他可能影响因变量变化的干扰因素的影响。研究者感兴趣的是因变量的变化是不是由自变量引起的, 故而要首先排除其他可能影响因变量变化的干扰因素。这个实验的可控性要求是保证研究可重复的关键。相比而言, 管理实验研究比自然科学的实验可能更难做到尽善尽美的控制。原因在于管理研究的对象是人, 而人的很多因素是没有办法操控的, 如情绪、 思维等。这就削弱了管理研究的证据可靠性。当然, 通过大量反复的研究, 实际上也能在一定程度上削弱这个方面的影响。
4. 形成可靠结果。有了数据, 接下来就是假设检验。假设检验的核心逻辑是“小概率事件”不可能在一次抽样中发生, 这属于统计学的信仰。如果有人觉得自己是幸运儿, 运气特别好, 不相信“小概率”, 就没有办法理解后面说的假设检验的逻辑。例如, 连续5次掷硬币都是正面朝上的概率约为3%。一般认为, 这就属于小概率事件, 故而任何人试一次基本不可能实现。但是, 这并不意味着这种情况绝对不可能发生。如果小概率事件发生了, 就属于异常事件, 需要特别关注。
在假设检验中, 通常把假设关系作为备择假设, 将它的对立面作为原假设(1 hypothesis)。例如, 如果假设是A与B正相关, 那么它的原假设就是A与B无关, 相当于认为它们之间的关系强度是零。这样一来, 如果研究者做了一次抽样获得了一些数据, 基于这些数据就可以计算得到样本均值, 据此估计总体的均值和方差。假定原假设成立, 如果一次抽样要得到当前的样本均值, 就可以根据样本总体的分布特征来进行推断, 计算得到一个概率, 这个概率就是通常所说的P值。对于P值多小才可以认为是小概率事件, 就需要有一个判断标准。
一般而言, 主观上认为0.05或者更小如0.01是小概率。P值小于这个小概率的标准, 就可以认为是小概率事件发生了。但是, 这又是不可能的(统计学的信仰: 小概率事件在一次抽样中不可能发生)。哪里出了问题?只能是原假设认为A与B不相关错了, 而要拒绝原假设。小概率事件的发生证伪了原假设, 备择假设可能是成立的。这里要强调一点, 虽然数据分析的结果并没有支持原假设, 也不能据此就认为备择假设一定是对的, 只是目前还没有找到支持原假设的证据。如同我们还要继续寻找“黑天鹅”, 在这个过程中却发现了更多支持“白天鹅”的证据。
四、 管理理论证伪的要点
总结来看, 管理理论的证伪是一件很复杂的事情。从证据可靠性的角度来看, 要证明某个管理理论是不对的, 就必须要有可靠的测量、 可靠的样本、 可靠的数据、 可靠的证据。证据是否足够有力取决于主观设定的判定标准。
通常研究都是汇报支持理论假设的证据, 也就是证实理论。越多的支持证据越会让我们相信理论是对的。但是, 更有利于管理理论完善的证据反而是那些支持原假设的证据。往往是那些证伪理论的证据能够激发更多的思考, 让研究者能够更进一步完善理论、 发展新理论。
其一, 明确理论和理论的边界。管理研究中的理论太多, 不清楚理论的边界会导致理论滥用。要提倡在论文中清晰明确地阐述用的是什么理论、 这个理论的前提设定是什么、 理论的设定与研究的问题是否匹配。一项研究中运用多个理论不是好的做法, 因为会导致理论的前提设定不清。
其二, 提高管理研究中证据的可靠性。只有可靠的证据才能作为判断理论真伪的依据, 而可靠的证据需要建立在可靠的测量、 可靠的样本、 可靠的数据和可靠的结果之上。
其三, 关注与理论相反的证据。不要漏掉这些修正或者创立新理论的机会。要关注这些反例证据, 对其进行深入的分析和猜测, 启迪后续的研究。支持理论的证据能够巩固理论版图的围墙, 而这些反例证据则是围墙上的裂缝, 它可能会推倒围墙、 重构版图。
管理研究要提升科学性, 除了理论命题要更加清晰、 有边界, 具有可证伪性, 还要着力从发掘可靠的证据入手。成稿中, 吸收了杜运周、 付汉良、 张涛、 陈思鳗等的意见, 在此表示感谢。
DOI:10.19641/j.cnki.42-1290/f.2024.20.002
【 主 要 参 考 文 献 】
贾明.工商管理学科向“硬”科学演进之路[ J].财会月刊,2023a(8):8 ~ 10.
贾明.提升工商管理学科有用性的反思[ J].财会月刊,2023a(17):3 ~ 6.
贾明.研以致用:管理研究中的机制、路径和对策[ J].财会月刊,2024a(18):41~ 43.
贾明.管理研究的思维方式(第二版)[M].北京:机械工业出版社,2024b.
卡尔·波普尔著.查汝强,邱仁宗,万木春译.科学发现的逻辑[M].杭州:中国美术学院出版社,2008.
(责任编辑·校对: 陈晶" 喻晨)