吴才琴
福建警察学院,福建 福州 350007
刷单行为是指商家的虚假交易行为,一般是由商家通过付费给刷单手或刷单软件的经营者,批量生成虚假交易记录和用户评价,从而提高销量数据和信誉度,进而提高网店的搜索排名。在众多同业、同行的激烈竞争中,为了争取更多消费者的关注和成交机会,部分电商选择通过刷单行为提高网店在电商平台上的搜索排名,既误导消费者,又损害同业竞争者的合法权利。刷单这一虚假交易行为,违反了《网络交易管理办法》第十四、十九、五十三条[1]及《中华人民共和国反不正当竞争法》第二十四条的规定[2]。近年来,刷单这一违法行为已经引起市场监管、公安及其他相关部门的重视。如今年伊始,市场监管总局在全国范围内加大对网络不正当竞争行为监管力度,严厉打击“刷单炒信”、虚假宣传等不正当竞争行为,截至上半年,共查办各类不正当竞争案件3128件[3]。
在相关部门如公安部门打击刷单行为的过程中,对刷单行为的研判是关键环节,然而刷单行为具有极大的隐蔽性,除了物流包裹是空包裹,其他交易记录、商品评价和物流信息均由电商平台和物流平台真实生成,因此当消费者、电商平台和相关监督管理部门面对电商平台上的海量数据时,难以对刷单行为进行全面而系统的人工研判。本文基于数据治理的思想,通过本福特统计学定律对电商的大量销售和评价数据进行检测,为今后公安及相关部门针对刷单行为的大数据治理及相关案件的电子物证痕迹侦测提供参考。
本福特定律又称为“首位数字定律”。它是指当统计数据足够多时,开头数字是1的数据最多,大约占了所有数据的1/3,开头数字是2的数据其次,往后依此减少[4]。该定律通常用于财务审计、金融、选举投票、人口统计、实验数据等方面的异常和规律的检测,为查处造假和舞弊提供依据。
根据本福特定律首位数字d的概率公式[4]可以开发出用于检测数据造假的程序。目前,相关程序有在线测试和可供下载的xls、VBA等形式。这些程序通常要求输入待检的数据为十进制,且待测数据达到足够数量,统计学理论上要求3000个以上为佳,数据量越大判断结果越准确,因此适合于对大数据进行初步检测。在实际操作中,这些程序通常仅要求输入30个以上数据,以超过100个为宜。人为编造的大数据不符合本福特定律,如按一定规则生成的价格、电话号码、邮政编码等,因此将人为编造的大数据输入本福特检验程序,输出结果将显示不能通过验证,由此可以判断数据是自然生成还是人为编造。相关程序输出结果通常为曲线图形式,当数据不符合本福特定律时,输出曲线会明显偏离标准曲线。此外,还有一些检验程序会进一步通过KS检验、Z检验和余弦相似性检验直接输出检测结果是真是假。通常KS检验、Z检验过于严格,数据量没有达到数学理论值或有些许偏差就会被判定为不符合本福特定律。所以当数据量较少、影响因素较多时,这两种检验结果只能作为参考,建议结合余弦相似性检验结果综合判断[5]。
电商平台上有海量的公开数据,这些数据可能成为证明刷单行为的电子物证。数据的海量性不仅体现在数据量的巨大,也体现在数据的多样性,如电商平台上有评价日期、追评数目、销量、成交量、评价者昵称、评价字数、评价图片数目、评价词汇和图片的相似度等多维度的数据。本文基于易于获得、便于统计的原则,筛选出了评价日期和销量数据这两组具有检验价值的数据进行检测。
随机选择淘宝自动推荐的一款手机壳(该款手机上架时间短,价格没有明显波动,手机壳销售也不受季节影响且数据时间仅选择一个月之内的短跨度,尽量减少了波动),将最近一个月的用户评价日期(共计200条,日期选用淘宝显示的“X天前”中的X值末两位数,即数值范围在0~29)输入本福特定律.xls格式检测程序,输出结果如图1所示,检测程序判断数据不符合本福特定律,余弦相似性约为0.86,相似程度分值为0,其中,评价日期尾数为1、4、5的小数值占比与本福特分布的标准值偏差较大,且尾数为1的评价日期占比显著低于标准值。
图1 某款手机壳用户评价日期的本福特定律检测结果
作为对照,选择手机在天猫官网的评价日期(官网评价仅有78条)进行测评,结果如图2所示。检测程序判断数据不符合本福特定律,但余弦相似性约为0.89,在数据量远小于图1的情况下,手机评价的余弦相似性仍高于上述手机壳,相似程度分值为0。其中,评价日期尾数为1、2、3、4的小数值占比与本福特分布的标准值偏差较大,且尾数为1、2的评价日期占比显著高于标准值。
图2 某款手机天猫官网用户评价日期的本福特定律检测结果
随机选择一款淘宝推荐的热销女装,打开该款女装的售卖网店,将该店所有商品按销量排序,记录成交量千位和百位两位数字,共计199组数据,可得到如图3所示的本福特定律检测结果。虽然检测程序判断数据不符合本福特定律,但余弦相似性约为0.94,相似程度分值为43,成交量尾数为1的数字占比显著高于本福特分布标准值,其它数值分布的误差均在5%左右。
图3 某网红女装店月成交量的本福特定律检测结果
再选择一家曾经因虚假宣传某品牌女包而下架该品牌箱包类产品的电商。该电商虽然不再售卖某品牌女包,而是改卖其他女性用品,但依旧经常被淘宝平台强力推广其直播间,在其直播间,可以发现同一件商品月销量数据显示上万件,而真正付款的只有600多件,虽然这种显著异常情况在该网店所有在售商品中占比不高,但仍可以在本福特定律检测结果中体现出来,如图4所示。检测结果显示该店所有在售商品月成交量的余弦相似性仅约为0.83,相似程度分值为0,成交量尾数为1、2、5、6的数字占比均与本福特分布标准值相差较大,其中,成交量尾数为1的数值显著低于标准值。
图4 某直播网店月成交量的本福特定律检测结果
通过检验其他类型网红和天猫电商数据,发现结果和上述4例相似,即应用本福特定律可以初步检测电商的销售量和评价数据是否异常,检测结果最好根据余弦相似性及尾数为1的数据占比是否低于本福特标准值进行评价。关于余弦相似性用于判断真假的数值,应通过大量计算同类商家的数据后进行选择判断。如果能结合商家的销量和成交量之间的差异综合考虑,评价结果将更有证明力。此外,还要注意考量数据量及某些商品受季节性降价促销时段等可能的影响因素。
目前,常见的本福特定律检测程序在刷单行为方面的检测还不够准确和智能,不能给出适合大多数网店销量和评价值的拟合结果,只能人工通过对比同类商家进行初步判断。此外,一旦该检测方法被广泛应用,不法商家完全有可能通过编辑算法,自动生成符合本福特定律的大批量数据,实现符合统计学规律的刷单造假。
本福特定律检测程序可以方便快捷地检测电商销量和评价数据的异常,对电商平台的数据质量进行初步研判,为相关案件的电子物证痕迹检测提供依据,且所检测数据均为公开性质的,不侵犯隐私权,相关部门可以合法地大批量获得,为实现大数据治理刷单行为提供借鉴和参考。常见的本福特定律检测程序在KS和Z检验上设定过于严格,不符合大多数网店正常销售的实情,必须通过余弦相似性结果及尾数为1的数据占比进行综合判断。另外,相似程度分值和数据组数通常不产生根本性影响。本福特定律检测程序的编程人员可以进一步改进程序设计,使之更适合刷单行为的智能化检测,便于相关部门利用大数据对不法交易行为进行更精准的研判和处置,实现对电商平台生态环境的大数据治理。