犯罪信息研判中的概率推理

2017-01-25 07:25:30马前进

政法学刊 2017年3期

关键词：概率规则频率

马前进

(江苏警官学院基础课教研部，江苏南京 210012)

犯罪信息研判中的概率推理

马前进

(江苏警官学院基础课教研部，江苏南京 210012)

在当前大数据背景下，信息主导警务已经逐渐成为新常态，其中一个重要方面就是犯罪信息研判。在犯罪信息研判中，侦查人员必须对获取的信息进行分析以对进行必要的预测，其中的一种重要方式就是概率推理。犯罪信息研判中的概率推理是以事件发生的概率作为前提或者结论的推理，用以计算侦查工作中大量存在的随机事件出现的概率。在进行概率推理之前，侦查人员必须首先确定简单事件的概率，而对简单事件的概率有三种不同的解释。在确定了简单事件的概率之后，侦查人员可以利用概率演算的规则计算出复合事件的概率。在此基础上，侦查人员可以在个体、样本和总体之间进行不同类型的概率推理。当然，侦查人员同时必须遵守相应的推理规则以避免相关的谬误，得到具有最大可靠性的结论，提高犯罪信息研判的准确度和精确度。

犯罪信息研判；初始概率；概率演算；概率推理

在大数据时代，信息主导警务战略应运而生。实施信息主导警务战略是公安工作的新亮点和警力的新增长点，是智慧警务工作机制的重要内容之一，是创新公安工作的有效切入点。在刑事案件侦查中，信息主导警务战略的一个重要方面就是所谓的犯罪信息研判。无论是从人到案的侦查模式还是从案到人的侦查模式，都需要对获取的犯罪案件或者犯罪嫌疑人的信息进行研判。犯罪信息研判是指“对获取的有关犯罪案件或者犯罪嫌疑人的信息进行分研究以作出新的判断的思维过程，包括时间、地点、位置、顺序、动作、人、物等案件诸要素乃至整个刑事案件的研判。”[1]在犯罪信息研判中，为了对事件进行精确的预判，必须对其进行定量化的描述。从现有犯罪信息得出定量化的结论，必须运用概率推理。

现实世界中的事件照其发生的可能性分为三类：必然事件、不可能事件和随机事件。在确定的条件下一定会出现的事件称为必然事件，在确定的条件下一定不会出现的事件称为不可能事件，介于必然事件和不可能事件之间的事件就是随机事件。随机事件(random variables events)也称偶然事件或者不确定事件，是指在某种条件下可能出现也可能不出现的事件。所以，随机事件都是相对于一定条件而言的。不难理解的是，必然事件和不可能事件都是随机事件的极端情形。

现实世界中的许多事件甚至大多数事件都是随机事件，在一定程度上可以说随机事件是事件的一种最常见类型。从表面上看，具有不确定性的随机事件似乎杂乱无章，纯属偶然，毫无规律可循，但是正如马克思所言“在表面上是偶然性在起作用的地方，这种偶然性始终是受内部隐藏的规律支配的，而问题在于如何发现这些规律。”[2]269也就是说，随机事件的出现也是有规律的，这种规律就是统计规律。

随机事件出现的统计规律一般以概率的形式出现。概率(probability)就是一定条件下的随机事件发生的可能性程度或者对这种可能性程度的数量刻画。也可以说，概率是赋予某个事件发生可能性的一个数值，用于测量在某种意义上，该事件发生的可能性有多大。某事件A发生的概率用P(A)表示，可以用0和1 之间的小数或者百分比来表示概率数值。一般而言，不可能事件发生的概率为0；而必然性事件发生的概率为1，介于其间的随机事件的发生的概率介于0和1之间。借助于概率，人们可以对于随机事件发生的可能性可以进行定量的刻画，这在用于预测时特别有用。随机事件的概率可以借助于随机实验求出，因此，随机事件一般与随机实验联系在一起。随机实验是指这样的实验：“我们可以事先知道它所有可能出现的结果，而且它可以在相同条件下重复进行，但是在每次实验前不能准确地预知它会出现哪一种结果。”[3]146

概率论(probability theory)是以随机事件的数量规律为研究对象的数学理论。概率论不仅要从数量上来刻画这样的随机事件发生的可能性程度，还要研究随机事件发生的可能性程度之间的一些关系。由于随机事件是概率论的主要研究对象，因此，在概率论中，随机事件有时也简称事件。

一、犯罪信息研判中简单事件初始概率的确定

概率推理的首要问题是如何确定一个简单事件或者单一事件的初始概率问题。这一问题与概率的解释有关。关于概率的解释大致包括：古典解释(先验解释)、相对频率解释(经验解释)和置信度解释(主观解释)等类型。

(一)概率的古典解释

概率的古典解释由拉普拉斯、帕斯卡等人提出，由凯恩斯等人发展。概率的古典解释认为，一个事件发生的概率，由事件能够发生的途径除以等可能的后果数来确定，即一个事件A出现的概率可以由以下公示计算出：

P(A)=f/n

其中f是有利的结果的数目，n是可能的结果的数目。从数值上看，0≤P(A)≤1。

拉普拉斯认为：“机遇理论在于将同一类的所有事件都归结为一定数目的等可能情况(即人们对其存在同样地不能确定的可能情况)，并且还在于确定出对欲求其概率的事件有利的情况数目。此数目与所有可能情况数目之比就是对所求概率的测度。也就是说，概率乃是一个分数，其分子是有利情况的数目，分母是所有可能情况的数目。”[4]428

需要注意的是，不要把一个事件发生的概率与打赌其发生的投注赔率混淆了。对于使用概率的古典解释的事件而言，打赌一个事件A将会发生的公平的投注赔率可以由以下公式计算出来：

O(A)=f:u

其中f是有利的结果的数目，u是不利的结果的数目。从数值上看，O(A)大于、等于或者小于1皆有可能。

由于u=n-f，所以上述赔率公式可以转换为：

O(A)=f:(n-f)

概率的古典解释也称概率的先验理论，是因为求出概率的计算独立于任何对实际事件的观察，完全与经验无关，只进行理论分析。根据这种观点，为了计算在某些特定情形下一个特定事件发生的概率，把该事件能够发生的途径数目，除以该情形下可能的结果总数目，如果人们没有理由相信任何一个可能的结果比其它结果更加可能。于是，一个事件的概率以一个分数来表示，在其中，除数是可能的结果的总数，被除数是待考察事件发生的结果数目。在这个解释下，概率不仅是先验的，而且是绝对的甚至不变的。

概率的古典解释预设了两个基本原则。预设的第一个原则是可能的结果数目是有限的，这些结果彼此之间是相互排斥的(即这些结果不可能同时出现)，并且这些所有可能的结果都被考虑到了。该原则也称全知原则。预设的第二个原则是对某一条件下某些随机事件，如果人们没有足够的理由认为其中的某些比别的更有可能发生，那么就应该认为它们具有相等的概率。第二个预设也称等概率原则。因此，如果存在N种可能性，那么每一种可能性的概率就是1/N。作为对称原理的一种，等概率原则也称中立原则，它是对概率进行直觉推理的一个重要组成部分。

概率的古典解释预设的这两个原则实际上也是概率的古典解释应用的两个必要条件。在理想状态或者情况下，人们可以将实际情形近似地看成这两个原则可以运用的情形或者场合。但是，就实际情况看，这两个预设极少甚至从未被满足过。由于主、客观条件的限制，人们不可能考虑到所有可能的结果，最多考虑一些常见的结果而已。虽然其它结果在实际的意义上也许是不可能的，但是就它们不包含逻辑矛盾而言，它们在逻辑上也是可能的。

不仅全知原则难以实现，而且等概率原则也是存在着诸多问题。第一，人们“没有足够的理由认为其中的某些比别的更有可能发生”充其量只能成为人们“认为所有这些随机事件具有相等的概率”的理由，不能成为“所有这些随机事件(确实)具有相等的概率”的依据：前者是一种主观认识，后者是一种客观情形。第二，等概率原则会导致所有结果的概率之和大于1的悖论，这违反了概率论“所有结果概率之和只能等于1”的基本假定。第三，等概率原则不能适用于事实上并非等概率的随机事件的概率确定，因为即使考虑了所有的结果，这些所有可能的结果发生的几率是不同的。例如，如果要确定某在逃犯罪嫌疑人逃亡某地的概率，所有能够考虑到的结果就不是等可能发生的。该犯罪嫌疑人可能逃亡其它地方，可能藏匿在本地，可能不久后投案自首，等等。很明显，所有这些可能的情形发生的可能性不尽相同。

从这个意义上说，概率的古典解释虽然简便易行，但是其应用范围其实是极其有限的。如果一组事件不具有等可能性或者实验结果又有无限多个可能结果，那么就不能使用概率的古典解释了，而应该使用概率的相对频率解释。

(二)概率的相对频率解释

概率的相对频率表解释由埃里斯(L.Ellis)开创，由文恩、皮尔斯、冯.米瑟斯发展，由赖辛巴哈充分发展并表达成系统。该概率解释认为将初始概率即原子经验概率陈述应该分析为频率概率的陈述，频率概率即一重复事件的一个无穷系列在长趋势中所表现的相对频率的极限。

先引入随机事件的频率的概念：设随机事件A在n次试验中出现了f次，则比值f/n称为该次试验中事件A出现的频率或频次，记为W(A)，而且

W(A)=f/n。

不难理解的是，任何随机事件在有限次试验中出现的频率或者频次总是介于0和1之间的一个比值，即

0≦W(A)≦1

如果试验次数不断增多以至于足够大，那么某随机事件出现的频率总是在某个常数附近摆动或者渐进于、收敛于、逼近于某个确定的常数，这个常数就是该随机事件出现的概率。也就是说，求出某事件出现的相对频率的极限值就是该随机事件出现的概率。这揭示了频率与概率之间的相对关系。

最早揭示频率与概率关系的是数学家贝努利提出的后来贝称为大数定律的极限定理：“一给定统计下事件的频率可能无限地接近它的概率。”[5]340

概率的相对频率解释也称概率的统计解释，它将概率定义为一个类的元素出现一个特定属性的相对频率，即一个事件A发生的概率可以由以下公式计算出：

P(A)=f0/n0

其中f0是观察到的有利的结果的数目，n0是观察到的结果的数目。从数值上看，0≤P(A)≤1。

例如，为确定一个惯犯采取反侦查措施的概率，可以调查100名惯犯组成的一个样本。如果这100名惯犯中有95名惯犯采取了反侦查措施，那么该惯犯采取反侦查措施的概率就是95%。这个数值是相当高的，提醒侦查人员提高警惕，提前应对。

概率推理的出发点是以一定次数的实验作为样本，并统计样本中某事件出现的次数与实验总数的次数的比率即事件的频率。然后，把样本中某事件出现的频率推至被研究对象的总体，由此得出一普遍性结论即陈述某事件的概率。

毋庸置疑，观察到的结果的数目越大，概率值也越趋近于某个稳定的数值。所以，为了确定某个事件发生的概率，采用大样本、大数据甚至全数据进行计算是很有必要的。概率的相对频率解释依赖于对某种事件发生的频率的实际观察，所以也称概率的经验解释或者客观解释。由于一个给定属性的概率随着选择用以计算的特定对象总体的变化而变化，因此，在运用概率的相对频率解释时，还要注意选择最适合的研究总体。很明显，概率的相对频率解释适用范围比概率的古典解释大得多。

这种概率解释将概率解释为相对频率的一个度量。相对频率特别适合于解释统计研究的概率判断。为此，需要确定对象总体和属性。在这个理论中，赋予的概率是这样的相对频率测度：该对象总体以这个频率体现了这个被研究的属性。当然概率也可以表示为分数，分母是对象总体数量，分子是具有该属性的对象的数量。在概率的相对频率解释中，概率被定义为总体成员体现某一特定属性的相对频率。在这种理论下，概率是相对的。

概率的相对频率解释强调了实证方法在确定初始概率中的作用，强调了概率的客观性，但是这种概率解释也存在着诸多方面的问题。“第一，概率的相对频率解释只能求出某类事件的概率，无法求出单个事件的概率，因为单个事件只发生一次，不可重复，也就没有频率可言。第二，极限频率的求出采用认定——修改——认定的方式，而这一方式只可能限于有限的经验，限于人类经验所能达到的范围，对于超出人类经验之外的范围无能为力。当然，这种概率解释还存在其它方面的问题。”[6]42

(三)概率的置信度解释

为了确定单个事件的概率，人们又提出了概率的置信度解释。概率的置信度解释由英国哲学家拉姆塞和意大利数学家芬内蒂提出，由美国数学家萨维奇加以发展。它用个人的信念或者置信度这样的术语来解释概率的含义。尽管这样的信念或者置信度是不明确的、模糊的，但是通过一个人所能接受的对某次打赌的投注赔率可以给出对信念或者置信度的定量的解释。

如果f是有利的结果的数目，u是不利的结果的数目，某人对A将会发生的公平的投注赔率是：

O(A)=f:u

那么此人赋予A将会发生的概率就是：

P(A)=f/(f+u)

概率的置信度解释虽然试图确定单个事件的概率，但是其主观性太强：不同的人对于同一事件完全可以给出不同的投注赔率，这样，同一个事件也因此具有了不同的主观概率——这无疑是让人难以理解和接受的。因此，概率的置信度解释也称概率的主观解释。如果概率被认为是事件的真的属性，而事件的真则是一个客观的问题，那么不同人对于同一事件赋予不同的置信度将会是一个非常严重的问题。这个问题有两种解决方法：一是将概率解释为信念的属性，二是将不同的个人主观概率的平均值作为事件的概率，以期接近事件的真实、客观的概率。

概率的置信度解释实际上是把概率看作是对合理信念的测定。如果人们完全相信某个事情，人们的合理信念的测定被赋予数值1；如果人们绝对相信一个特定事件不可能发生，那么该事件发生的信念度被赋予数值0；如果人们无法确定某个特定事件是否必然发生，那么他对该事件发生的合理信念度被赋予0至1之间的某个数值。概率是关于事件的一个属性，是人们合理地相信一个事件即将发生的程度。或者说，概率是一个陈述或者命题的谓词，一个完全理性的人总是依据这个数值相信该陈述或者命题。把概率解释为合理信念或者置信度的一个重要原因在于人们认为任何特定事件的发生总是存在部分已知和部分未知的结果，这样其中就不存在任何实际的、内在的、客观的概率。一个事件的概率值之获得只能建立在作出其概率值指派的人获得的证据之上，概率被解释为对合理信念的测度，而一个人的信念随着其知识的变化而变化。基于此，概率的置信度解释不仅是主观的，而且是也相对的。

由于概率的置信度解释认为任何事件自身不具有内在的或者关于它的概率，任何预测所具有的不同概率是相对于不同背景而言的，即相对于不同证据集而言的。但是，人们在作出概率断言之前，还是应该尽量收集最大量的证据集。

这三种概率解释都有自己的特色，也都有自己的不足。因此，在应用这三种概率解释时，要注意其应用条件和适用范围。

二、犯罪信息研判中概率演算的规则或逻辑句法

虽然概率推理的首要问题是如何确定一个事件的初始概率，但是概率推理的核心问题却是如何确定复合事件的概率。复合事件可以看成是由多个事件构成的整体。如果人们知道了复合事件的各个组成事件相互关联的方式，人们就能够根据构成复合事件的各个单个事件的初始概率算出该复合事件的概率。概率计算，也称概率演算，就是用单个事件的概率计算出复合事件的概率。不难理解的是，这一计算过程是一个特殊的推理过程，也是定量推理的一种类型。

概率计算不仅在日常生活中应用极其广泛，而且在侦查中也经常使用。比如，在侦查决策中，知道某个结果的可能性可以帮助侦查人员进行决策，从而使得侦查人员行事谨慎。

通过上述三种概率解释确定了简单事件或者单一事件的概率值之后，可以运用概率演算规则计算出复合事件的概率。复合事件的各个组成事件相互关联的方式引出了概率计算的规则。

(一)合取事件概率计算的乘法规则

合取规则用于计算若干事件同时发生的概率，也称乘法规则。共同发生或者同时发生是指构成某个复合事件的单个事件中至少两个以上事件的发生。无疑，有两个单个事件组成复合事件是复合事件最简单的情形。假定我们真正考察的就是只有两个单个事件A和B的发生。当我们要得到A并且B两者的概率时，我们就是求出它们共同发生的可能性大小。

1.一般的合取规则。一般的合取规则用于计算两个事件同时发生的概率。

P(A并且B)=P(A)×P(B/A)。

该规则的意思是：“两个不同事件共同发生的概率等于其中一个事件发生的概率与该事件发生的条件下另一事件发生的概率的乘积。P(B/A)表示在假设A已经出现的情况下B将出现的概率。”[7]145

两个同时发生的事件中的一个的出现与否是否会对另一事件的出现与否产生影响？这就涉及到构成合取事件的各个单个事件之间是否彼此独立的问题。如果构成复合事件的两个单个事件中的一个的出现与否丝毫不影响另一事件的出现与否，那么这两个单个事件就是彼此独立的；反之就不是彼此独立的。当两个事件彼此独立时，一个事件发生不会影响另一个事件发生的概率，这样上式中的P(B/A)= P(B)。这样就得到了彼此独立的事件同时发生概率计算的规则，即限制的合取规则。

2.限制的合取规则。限制的合取规则仅仅适用于两个彼此独立事件同时发生的概率。

P(A并且B)=P(A)×P(B)。

该规则的意思是：两个独立事件共同发生的概率等于它们各自概率的乘积。这里，P(A)和P(B)分别是两个独立事件A和B的概率，P(A并且B)是这两个独立事件共同发生的概率。

不难看出，两个事件彼此独立时共同发生的概率大于这两个事件彼此不独立时共同发生的概率。

(二)析取事件概率计算的加法规则

析取规则用于计算若干事件替代发生的概率，也称加法规则。若干事件的替代性发生是指这若干事件中至少有一个发生。替代性发生的概率总是大于每个单个事件发生的概率，如同在共同发生的情况下，两个事件共同发生的概率总是小于每个单个事件发生的概率一样。

1.一般的析取规则。P(A或者B)=P(A)+P(B)-P(A并且B)。

该规则的意思是：两个不同事件替代发生的概率它们各自概率的加和减去它们同时发生的概率。

两个事件中一个发生时另一个是否会同时发生？这就涉及到构成复合事件的各个单个事件之间是否相互排斥的问题。如果构成复合事件的两个单个事件不能同时发生，那么这两个单个事件就是相互排斥的；反之就不是相互排斥的。当两个事件相互排斥时，它们同时发生的概率就是0，这样上式中的P(A并且B)=0。这样就得到了彼此排斥的事件替代发生概率计算的规则，即限制的析取规则。

2.特殊的析取规则。P(A或者B)=P(A)+P(B)

该规则的意思是：两个互斥事件替代发生的概率等于它们各自概率的加和。这里，P(A)和P(B)分别是两个互斥事件A和B的概率，P(A或者B)是这两个互斥事件替代发生的概率。

不难看出，两个事件相互排斥时时替代发生的概率大于这两个事件不相互排斥时替代发生的概率。

(三)互否事件概率计算的减法规则

否定规则用于计算已知一个事件或者其否定事件发生的概率，求出其否定事件或者该事件本身发生的概率。

由于没有状态既是满足条件的又是不满足条件的，因此事件A和事件非A就是相互排斥的，事件A和事件非A不能同时都发生。因此，复合事件A并且非A发生的概率是0，即：P(A并且非A)=0

一切逻辑不可能事件即矛盾事件发生的概率都为0。

由于每个状态必定或者是这个事件，或者不是这个事件，因此，事件A要么事件非A必定至少有一个发生。因此，复合事件A或者非A发生的概率是1，即：

P(A要么非A)=1

一切逻辑必然事件发生的概率都为1。

如前所述，既然事件A和事件非A是互斥事件，那么根据互斥事件择一发生概率的加法规则：

P(A要么非A)= P(A)+P(非A)

这样，P(A)+P(非A)=1

进而得出：P(非A)=1-P(A)

这意味着某个事件A不发生的概率等于1减去该事件A发生的概率。同样，当一个事件不发生的概率是已知的或者容易计算的时候，运用该否定规则可以计算出该事件发生的概率。该规则也可以用于计算不独立的析取事件发生的概率。

根据发生的可能性，事件可以分为逻辑必然事件、逻辑不可能事件和逻辑可能事件。逻辑不可能事件又称逻辑必然不事件，逻辑可能事件发生的概率介于逻辑必然事件和逻辑不可能事件之间。虽然逻辑必然事件发生的概率为1，逻辑不可能事件发生的概率为0，但是侦查中遇到的大多数事件都是逻辑可能事件，只有极少数是逻辑必然事件和逻辑不可能事件。

(四)条件概率与逆概率

一个事件A的条件概率是在给定另一个事件B已经发生的情况下该事件A发生的概率，用P(A/B)来表示。

P(A/B)=P(A并且B)/P(B)

P(A/B)与P(B/A)称为互逆概率，彼此可以称为对方的逆概率。它们之间虽然数值未必相等，但是存在一种相互转换关系。根据上述的条件概率式，

P(A/B)×P(B)=P(A并且B)；

同样，P(B/A)=P(B并且A)/P(A)；

P(B/A)×P(A)=P(B并且A)；

由于P(A并且B)=P(B并且A)，所以，

P(A/B)×P(B)=P(B/A)×P(A)；

假设P(B)不等于0，那么可以得出：

P(A/B)=P(B/A)×P(A)/P(B)

这就是逆概率P(A/B)与P(B/A)之间的转换关系式。由于人们不可能不偏不倚地赋予事件A和事件B相等的概率，因此，逆概率P(A/B)绝大多数情况下与P(B/A)不相等。事实也确实如此。

一般而言，A在B 为真时的条件概率P(A/B)大于A在B 为假时的条件概率P(A/非B)，即：P(A/B)>P(A/非B)。

用概率式带入上式两边得出：

P(B/A)×P(A)/P(B)>P(非B/A)×P(A)/P(非B)；

该不等式两边同时除以P(A)，得出：

P(B/A)/P(B)>P(非B/A)/P(非B)；

也可以得出：P(B/A)/P(非B/A)>P(B)/P(非B)；

如前所述，P(B)和P(非B)称为B和非B的先验概率。P(B)与P(非B)可能前者大于后者，可能前者小于后者，当然，也可能前者等于后者。当P(B)大于P(非B)时，P(B)/P(非B)大于1，进而，P(B/A)/P(非B/A)也大于1，即P(B/A)大于P(非B/A)。这也就是说，如果某件事情发展的先验概率大于它不发生的先验概率，那么该事件基于另一事件发生的条件概率也大于该事件基于另一事件不发生的条件概率。

(五)贝叶斯定理

贝叶斯定理用于计算若干互斥且联合穷举的事件的条件概率，由18世纪英国著名数学家贝叶斯提出并以此命名。当互斥且联合穷举的事件的数目限制为两个时，用A1和A2表示这两个事件，贝叶斯定理可以表示为：[8]416

P(A1/B)= P(A1)×P(B / A1)/[ P(A1)×P(B / A1)+ P(A2)×P(B / A2)]

该规则可以证明如下：

根据一般的合取规则，

P(A1并且B)= P(A1)×P(B/ A1)；

P(B并且A1)= P(B)×P(A1/ B)；

由于P(A1并且B)= P(B并且A1)，所以

P(A1)×P(B/ A1)= P(B)×P(A1/ B)

该式两边同时除以P(B)，得出：

P(A1/ B)= P(A1)×P(B/ A1)/ P(B)

根据零一律，B=B并且(A1或者非A1)

根据分配律，B并且(A1或者非A1)=(A1并且B)或者(非A1并且B)

根据等价传递律，B=(A1并且B)或者(非A1并且B)

P(B)=P((A1并且B)或者(非A1并且B))

根据一般的合取规则和限制的析取规则，

P((A1并且B)或者(非A1并且B))= P(A1)×P(B / A1)+ P(非A1)×P(B /非A1)

根据等价传递律，B= P(A1)×P(B / A1)+ P(非A1)×P(B /非A1)

这样，P(A1/ B)= P(A1)×P(B/ A1)/ [P(A1)×P(B / A1)+ P(非A1)×P(B /非A1)]

由于A1和A2互斥并且穷举，也就是说A1和A2之间是相互矛盾关系，这样，

非A1= A2，将其代入上式，即可得出贝叶斯定理：

P(A1/B)= P(A1)×P(B / A1)/[ P(A1)×P(B / A1)+ P(A2)×P(B / A2)]

贝叶斯定理在实际中是非常有用的，它允许人们随着新信息的获取而改变对某特定事件发生的概率的估计。在考虑其它可能影响某事件发生概率的因素以运用贝叶斯定理之前运用前述三种方法求出该事件发生的概率值称为先验概率、初始概率或者验前概率；随着考虑所获得的新信息对该事件发生概率的影响，有必要性运用贝叶斯定理再次计算该事件发生的概率，这时计算出来的概率值称为后验概率或者验后概率。某事件发生的后验概率很可能不同于其先验概率，这也表明了枚举推理的结论随着前提中信息量的增减而变化。

贝叶斯定理在一定程度上克服了经典统计推理的不足，具有优越性和合理性等优点，也具有主观性、简单性和旧证据问题等诸多缺点。[9]

这些概率计算规则被证实是非常有用的，结果也是正确的，但是由于人们对事件发生的期望不同于事件发生的实际概率。也就是说，运用概率计算规则得到的正确结果与人们对已知事件进行因果分析后所期望的结论不同。于是，人们错误地认为，这样的结果是违反直觉的。当一个事件发生概率被认为违反直觉的时候，人们可能在概率判断上发生错误，进而作出错误的决策和错误的行动，进行类似赌博似的思维。当然，真正理智的人会遵守概率计算的结果。虽然人们一厢情愿地倾向于希望概率值符合期望值，但是真正理性的人应该根据概率值来调整期望值。

三、犯罪信息研判中的概率推理的类型、应用规则和应避免的谬误

概率推理(probability reasoning)是以事件发生的概率作为前提或者结论的推理，或者求出某个或者某类随机现象的概率的推理。它是概率论与归纳推理相结合的结果，其完整步骤为：确定简单事件的概率，确定复合事件的概率，将概率进行外推。概率推理在犯罪信息研判中的作用主要在于预测随机事件发生的概率。运用概率推理，“人们可以知晓某随机事件发生的可能性之大小，或曰某随机事件发生的机会之强弱。在这个意义上，概率推理就是关于几率或者机会的推理。”[10]84与枚举推理的结论是一个定性判断不同，概率推理的结论是一个概率判断。因此，概率推理是一种定量推理，便于人们对结论为真的可能性进行定量描述。

(一)犯罪信息研判中的概率推理的类型

概率推理有两种类型：一种从部分推至整体，一种是由部分推注个体。

1.从部分推至整体的概率推理。这种概率推理是指根据某类对象已经观察到部分成员具有某种属性的频率，推出该类对象的所有成员或者某个成员也以该概率具有该属性的归纳推理。其结构形式可以表示为：

某类对象S的n个成员中有m个成员具有属性P；

该类对象S的n个成员中也有成员不具有属性P；

所以，该类对象S的所有成员具有属性P的概率是m/n。

也可以表示为：

S1是P；

S2不是P；

S3是P；

……

Sn是(或者不是)P；

S1、S2、S3……Sn是S类的部分对象，且其中m个是P；

所以， S类对象所有成员是P的概率是m/n。

2.从部分推至个体的概率推理。这种概率推理的结构形式可以表示为：

已经观察到的S是P的频率是m/n，

Si是S中任意一个；

所以，Si是P的概率是m/n。

这种推理从一类对象足够多的部分成员具有某种属性的频率，推出该类某一或者任一成员也具有该属性的概率值。m/n表示已经观察到的n个S中m个具有P属性，并且m/n还表示任意的一种介于0和1之间的比值。如果m/n极大地逼近于1，则可推出Si是P这一结论；如果m/n极小地逼近于0，则不可推出Si是P这一结论。

统计推理和概率推理都是归纳推理的现代形式，也都使用概率统计命题，都是或然性推理。但是，在应用目的上，两者具有比较明显的区别：统计推理侧重于对实然事件的抽样统计，而概率推理侧重于对所观察事件频率的概括。

概率推理实际上是一种定量描述的特殊的枚举推理，本质上是从部分推至全体，其结论仍然是或然的。事实上，由于各种已知或者未知的其它因素的影响，在某些场合下观察到某种事件出现的概率与另一不同场合下观察到的该事件出现的概率不尽相同。例如，某城市虽然是每三天都会发生一起车祸，下个月未必如此。在考察范围过小的情况下，概率推理同样会犯“以偏概全”谬误。但是，概率推理是以对事件出现的可能性大小进行定量估计为前提，其结论的可靠性相对于不完全枚举推理所得的结论要可靠地多。

概率推理在一定程度上克服了枚举推理和求因果推理等传统归纳推理的缺陷。传统归纳推理最主要的缺陷有三点：“1.它没有对得自前提的或然性结论的可靠性程度进度深入的、定量的和精确的研究，而是致力于制定一些旨在提高结论可靠性程度的推理规则，甚至探求在某些预设之下运用这些规则如何得到准确无误的结论；2.它仅仅提出了一些非常初步的归纳方法，要运用这些方法得出比较可靠的结论，还需要满足许多条件，而传统归纳推理对这些条件的研究又是不够的；3.它对于归纳推理形式和类型的研究也非常不够。传统归纳推理的这些不足不仅使得它难以应对休谟提出的归纳推理合理性问题的严重挑战，而且难以满足实际的需要，在可应用性上大打折扣。”[11]6归纳推理是一种或然性推理，在经验认识中，人们最关心的问题是如何得出可靠性较高的或然性结论以及如何提高或然性结论的可靠性。概率推理借助于概率论工具，正好从逻辑的角度对这些问题进行了考察。

(二)犯罪信息研判中运用概率推理的规则

为了提高概率推理的结论的可靠度，必须遵守一些规则。

1.要尽量增加实验、观察或者调查等实证性操作的次数，尽量广泛地考察事件出现的范围。概率是建立在对事件做频率解释的基础之上的，它是频率的稳定值。这样，考察次数越多，考察范围越广时，频率就越会趋于稳定，越是收敛于某个确定的数值，也就越接近事件的概率，人们就越是能够通过频率更准确地把握概率，所得结论自然越是可靠。

2.时刻注意客观情况的变化，并使得对概率的估计也随着情况变化而变化。由于客观情况是不断变化的，相应的概率值也会随之变化。当然，这种变化包括时间、空间、对象以及其它客观因素的变化。只有始终注意这种变化并据此对概率值进行相应的调整，才能得出最接近事件的实际概率值的结论。

3.选择恰当的基准组类，注意前后考察的对象具有一般性、随机性和典型性。概率推理中的基准组类相对于统计推理中的样本。在一些情况下，选择某一类比的对象作为基准组类并不会产生多大差别，也无关紧要。但是，在另外一些情况下就可能产生重要甚至关键的差别。基准类的范围过大，情况自然有所不同。“什么样的标准才是最恰当和最精确的基准类并不是一个有定论的问题，人们只能这样说，要根据实际情况来选择——虽然这相当于什么也没说。如果以基准类为术语，那么一个事件发生的概率就是它发生的情形的数量除以基准类中的情形的数量。”[12]621

(三)犯罪信息研判中运用概率推理时应该避免的谬误

1. 在运用概率推理时，要防止出现“以偏概全”谬误，因为某一事件在某些场合出现的频率，与它另一场合出现的频率不能不同。

2. 在运用概率推理时，要注意避免所谓的“赌徒谬误”。赌徒谬误是指根据某件事最近不如所期望的那样经常出现，便武断地推断在不久后的将来它出现的概率将会增加。这种谬误产生的根源在于认识不到事件的独立性。由于赌徒们经常犯这种谬误而得名。赌徒们在赌博时，依据硬币正面朝上的可能性是1/2，在多次出现正面朝下的情形之后，就断定下次正面朝上的可能性就会增加，于是孤注一掷地增加赌注，但是事与愿违，最后还是输了。赌徒们孤注一掷的主要原因在于他们误解了统计概率中的“大数定律”。大数定律说的是：当试验次数做够大时，随机事件发生的频率与它们出现的概率会无限接近。但是，大数定律并没有提供人们关于下次投注中出现什么的具体信息，而只是告诉人们一个长远的概率。赌徒们没有理解投掷硬币时出现正面和出现反面都是独立的事件，先期事件对后期事件并无影响，无论先期是朝上还是朝下，硬币正面朝上的概率总是1/2，但是这不是硬币某一次正面朝上的概率。这里要区分总的概率与某一次发生的概率。

[1]马前进．大数据背景下犯罪信息研判中的统计推理[J]．公安学刊(浙江警察学院学报)，2015 ，(2) ：33．

[2]中央马列编译局．马克思恩格斯选集(第4卷)．北京:人民出版社，1995．

[3]邓生庆，任晓明．归纳逻辑百年历程[M]．北京：中央编译出版社，2005．

[4]郑文辉．欧美逻辑学说史[M]．广州：中山大学出版社，1994．

[5]江天骥．归纳逻辑导论[M]．长沙：湖南人民出版社，1987．

[6]江天骥．科学哲学名著选读[M]．武汉：湖北人民出版社，1988．

[7]梁彪．推理与决策[M]．广州：广东人民出版社，2002．

[8]赫尔利，等．简明逻辑学导论(第10版)[M] 陈波，等．译．北京：世界图书出版公司，2010．

[9]任晓明，黄闪闪．贝叶斯推理的逻辑与认知问题[J]．浙江大学学报(人文社会科学版)，2012 ，(4) ：109-111．

[10]普利斯特．简明逻辑学(第10版)[M]．史正永，等．译．南京：凤凰出版传媒股份有限公司，2013．

[11]熊立文．现代归纳逻辑的发展[M]．北京：人民出版社，2004．

[12]柯匹，等．逻辑学导论(第11版)[M]．张建军，等．译．北京：中国人民大学出版社，2007．

责任编辑：林衍

Probability Inference of Criminal Information Research and Judgment

Ma Qian-jin

(Dept. of Basic Courses, Jiangsu Police Institute, Nanjing 210031, China)

Under the background of big data, policing led by information technology has turned into a new normality gradually, one important aspect of which is called criminal information research and judgment. In criminal information research and judgment, the obtained information must be analyzed so as to do some forecasting, one important method of which is called probability inference. Probability inference in criminal information research and judgment regards probability of events' occurrence as its premise or conclusion, which is used to calculate probability of random events' occurrence in criminal investigation. Before probability inference, investigators must primarily infer certain probability from simple events and there are three different explanations of probability. After inferring certain probability from simple events, investigators can calculate the probability of complex events by virtue of rules of probability calculus. Based on that, investigators can make diverse kinds of probability inference among samples, individuals and populations. There is no doubt that investigators must comply with some corresponding inference rules to avoid some relevant fallacies, achieve the most reliable conclusion and enhance accuracy and precision of criminal information research and judgment.

criminal information research and judgment; initial probability; probability calculus; probability inference

2016-06-02

江苏高校品牌专业建设工程资助项目( TAPP)；江苏警官学院科学研究项目《智慧警务工作机制中的大数据思维和逻辑方法研究》(2016SJYSY04)

马前进(1977- )，男，湖北襄阳人，江苏警官学院基础课教研部教师，从事法律逻辑研究。

DF793

1009-3745(2017)03-0112-10