基于大数据的线下商户真实属地判定研究

2019-09-10 17:26:52郭开卫王颖卓王亚雄
现代信息科技 2019年10期
关键词:银行卡

郭开卫 王颖卓 王亚雄

摘  要:本文设计了大数据技术领域一种商户归属地的判定方法和装置,包括:接收查询请求,所述查询请求中包括商户标识信息;根据所述商户标识信息查询商户归属库,确定所述商户标识信息所对应商户的归属地,其中,所述商户归属库包括一一对应的商户标识信息及归属地,且所述商户归属库是基于历史交易数据建立的,能够提高判定商户归属地的准确率,为业务运营提供更有力的数据支撑。

關键词:线下商户;归属地;银行卡

中图分类号:TP311.13      文献标识码:A 文章编号:2096-4706(2019)10-0080-03

Abstract:This paper designs a method and device for determining the attribution of merchants in the field of big data technology,including:receiving a query request,the query request including merchant identification information;querying a merchant home library according to the merchant identification information,and determining the merchant identification information The attribution of the corresponding merchant,wherein the merchant home library includes one-to-one corresponding merchant identification information and a place of attribution,and the merchant home library is established based on historical transaction data,which can improve the accuracy of determining the attribution of the merchant,able to provide more powerful data support for business operations.

Keywords:offline merchant;attribution;bank card

0  引  言

受价格差利益驱动,商户的“套冒绕”行为频有发生,若简单地从商户收单机构归属地上判定商户归属地区,会造成数据失真。同时,商户注册登记时,归属地区的信息不做准确性校验,因此注册信息也不可信。如何从海量银行卡交易信息中,通过用户消费行为获取精准的商户属地信息,成为技术实现上要解决的难题。

1  技术背景

目前,对商户的归属地的判定有如下两种方式:

方式一:根据交易数据中收单机构所对应的地区确定商户的归属地。

方式二:根据商户注册时填写的注册地确定商户的归属地。

针对上述方式一由于受价格利益驱动,商户的“套冒绕”行为频有发生,若简单地从收单机构所对应的地区判定商户的归属地区,会造成数据失真。

针对上述方式二,由于商户注册登记时,商户归属地区不是关键属性,其信息不做准确性校验,会造成数据失真,因此注册信息也不可信。

2  实现方式

2.1  商户归属判定流程

图1为商户归属地的判定新方法流程图,该方法可包括:

S101:接收查询请求,该查询请求中包括商户标识信息。

S102:根据商户标识信息查询商户归属库,确定商户标识信息所对应商户的归属地。其中,商户归属库中包括一一对应的商户标识信息及归属地,并且商户归属库是基于历史交易数据所建立的。

2.2  商户归属库建立

图2为建立商户归属库的方法流程图,该方法可包括:

S201:从历史交易数据中获取交易渠道为固定位置交易终端的第一交易数据,第一交易数据中至少包括:第一账户信息、第一交易时间、固定位置交易终端归属地。

S202:从历史交易数据中获取交易渠道为移动交易终端的第二交易数据,第二交易数据中至少包括:第二账户信息、商户标识信息、第二交易时间。

S203:在第一账户信息与第二账户信息相同,且第一交易时间与第二交易时间之间的时间差在预设时间段内时,将固定位置交易终端归属地作为商户归属库中商户标识信息所对应的归属地。

其中,预设时间段可根据实际情况自行设定,例如,在一种应用场景中,若固定位置交易终端离商户较近,则可将预设时间段设置为30分钟或其他的较短的时间段,若固定位置交易终端离商户较远,则可将预设时间段设置为1小时或其他较长的时间段。

在上述步骤S201中,从历史交易数据中获取交易渠道为固定位置交易终端的第一交易数据时,可从历史交易数据中获取交易渠道为ATM(Automatic Teller Machine,自动柜员机)的交易数据,固定位置交易终端的归属地为ATM机器的归属地;也可从历史交易数据中获取交易渠道为“柜台”的交易数据,固定位置交易终端的归属地为该“柜台”的归属地。

在上述步骤S202中,在从历史交易数据中获取交易渠道为移动交易终端的第二交易数据时,可从历史交易数据中获取交易渠道为POS(point of sale,销售终端)的交易数据,也可从历史交易数据中获取交易渠道为其他类型的交易数据。

在第一账户信息与第二账户信息相同,且第一交易时间与第二交易时间之间的时间差在预设时间段内时,若存在同一个商户标识信息对应多个固定位置交易终端归属地,则将出现次数最多的固定位置交易终端归属地作为商户归属库中该商户标识信息所对应的归属地。为了提高判定商户归属地的准确率,还可周期性地更新商户归属库。

下面通过一个具体的例子对图2所示的方法流程进行详细的解释说明。

在该例子中,首先假设预设的时间段为30分钟,进一步假设用户1使用账户信息为“001”的银行卡于2016年11月28日09:00在ATM1机器上取了1000元,并假设ATM1的归属地为“上海市浦东新区”,然后用户1于2016年11月28日09:10又使用账户信息为“001”银行卡在商户标识为“A”的线下商户进行消费,此之间的时间差在预设的时间段“30分钟”内,因此,可生成如表1所示的对应关系。

进一步假设用户2使用账户信息为“002”的银行卡于2016年11月28日09:05在ATM1机器上取了2000元,并假设ATM1的归属地为“上海市浦东新区”,然后用户2于2016年11月28日09:15又使用账户信息为“002”银行卡在商户标识为“A”的商户进行消费,此之间的时间差在预设的时间段“30分钟”内,因此,可生成如下述表2所示的对应关系。

进一步假设用户3使用账户信息为“003”的银行卡于2016年11月28日09:10在ATM2机器上取了3000元,并假设ATM2的归属地为“上海市静安区”,然后用户3于2016年11月28日09:20又使用账户信息为“003”银行卡在商户标识为“A”的商户进行消费,此之间的时间差在预设的时间段“30分钟”内,因此,可生成如下述表3所示的对应关系。

对上述表1、表2和表3中记录的信息進行统计,可得到如表4所示的数据。

从表4中可以看出,商户标识“A”对应的归属地分别为“上海市浦东新区”和“上海市静安区”,并且商户标识“A”对应的归属地为“上海市浦东新区”出现的次数为2次,商户标识“A”对应的归属地为“上海市静安区”出现的次数为1次,因此,可将“上海市浦东新区”作为商户标识“A”对应的归属地。

2.3  商户归属库补充

上述建立好商户归属库以后,为了使得商户归属库中的商户更加全面,提高商户归属地判定的准确率,还可通过图3所示的方法流程,对商户归属库进行补充。

如图3所示,该方法流程可包括:

S301:从历史交易数据中获取交易渠道为移动交易终端的第三交易数据,第三交易数据中至少包括:第三账户信息、商户标识信息。

S302:根据第三交易数据中的第三账户信息,从预先设置的账户归属库中获取第三账户信息所对应的账户归属地。

S303:将第三账户信息所对应的账户归属地作为该商户标识信息所对应的归属地。

S304:判断商户归属库中是否存在该商户标识信息,若是,则结束流程,否则,转至步骤S305。

S305:将该商户标识信息以及该商户标识信息所对应的归属地添加至商户归属库中。

在上述步骤S301中,在从历史交易数据中获取交易渠道为移动交易终端的第三交易数据时,可从历史交易数据中获取交易渠道为POS的交易数据,也可从历史交易数据中获取交易渠道为其他类型的交易数据。

上述步骤S302中的账户归属库,可基于一定时间段内的历史交易数据,建立账户与账户的常用地区之间的对应关系,并根据账户与账户的常用地区之间的对应关系,建立账户归属库。例如,针对任一账户,可基于该账户在过去36个月内的交易明细数据,将36个月内交易量最大的地区作为该账户的常用地区,从而建立账户归属库。

若账户归属库中存在同一账户信息对应多个账户归属地时,可将出现次数最多的账户归属地作为该商户标识信息所对应的归属地添加至商户归属库中。

2.4  商户归属判定

基于相同的技术构思,本文提供一种商户归属地的判定装置,如图4所示。

接收模块401,用于接收查询请求,所述查询请求中包括商户标识信息。

确定模块402,用于根据所述商户标识信息查询商户归属库,确定所述商户标识信息所对应商户的归属地。其中,所述商户归属库包括一一对应的商户标识信息及归属地,且所述商户归属库是基于历史交易数据所建立的。

模块403,具体用于:

从历史交易数据中获取交易渠道为固定位置交易终端的第一交易数据,所述第一交易数据中至少包括:第一账户信息、第一交易时间、固定位置交易终端归属地;

从历史交易数据中获取交易渠道为移动交易终端的第二交易数据,所述第二交易数据中至少包括:第二账户信息、商户标识信息、第二交易时间;

若所述第一账户信息与所述第二账户信息相同,且所述第一交易时间与所述第二交易时间之间的时间差在预设时间段内,则将所述固定位置交易终端归属地作为所述商户归属库中所述商户标识信息所对应的归属地。

所述第一账户信息与所述第二账户信息相同,且所述第一交易时间与所述第二交易时间之间的时间差在预设时间段内时,若存在同一个商户标识信息对应多个固定位置交易终端归属地,则将出现次数最多的固定位置交易终端归属地作为所述商户归属库中该商户标识信息所对应的归属地。

模块403还用于:

从历史交易数据中获取交易渠道为移动交易终端的第三交易数据,所述第三交易数据中至少包括:第三账户信息、商户标识信息;

根据所述第三账户信息,从预先设置的账户归属库中获取所述第三账户信息所对应的账户归属地;

将所述第三账户信息所对应的账户归属地作为该商户标识信息所对应的归属地;

判断所述商户归属库中是否存在该商户标识信息,若不存在,则将该商户标识信息以及该商户标识信息所对应的归属地添加至所述商户归属库中。

综上,本文提供的一种商户归属地的判定方法和装置,包括:接收查询请求,所述查询请求中包括商户标识信息;根据所述商户标识信息查询商户归属库,确定所述商户标识信息所对应商户的归属地,其中,所述商户归属库包括一一对应的商户标识信息及归属地,且由于所述商户归属库是基于历史交易数据所建立的,因此能够提高判定商户的归属地的准确率。

3  结  论

本领域内的技术人员应明白,本文可提供为方法、或计算机程序产品。因此,本文可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

参考文献:

[1] 刁莹.用数学建模方法评价存储系统性能 [D].哈尔滨:哈尔滨工程大学,2013.

[2] 任崇广.面向海量数据处理领域的云计算及其关键技术研究 [D].南京:南京理工大学,2013.

[3] 赵振.一种自适应海量存储系统组织策略及关键技术研究 [D].武汉:华中科技大学,2006.

[4] 姚杰.分布式存储系统文件级连续数据保护技术研究 [D].武汉:华中科技大学,2009.

[5] 田敬.对等存储系统中的数据可用性与安全性研究 [D].北京:北京大学,2007.

作者简介:郭开卫(1981.09-),男,汉族,江西吉安人,高级工程师,本科,研究方向:大数据开发。

猜你喜欢
银行卡
复杂背景下银行卡号识别方法研究
银行卡被同学擅自透支,欠款谁偿还?
公民与法治(2020年3期)2020-05-30 12:29:58
谁划走了银行卡里的款
银行卡掉了怎么办
中外文摘(2017年6期)2017-11-13 15:33:09
国家外汇管理局:将采集银行卡在境外单笔1000元以上消费信息
男子点击短信链接 银行卡被盗刷11万
银行卡清算市场6月全面开放
关于审稿专家及作者提供银行卡号的启事
浅谈银行卡用户验收测试
感动的3个字
意林(2009年20期)2009-02-11 18:06:33