移动支付大数据人群特征及统计应用论析

2022-08-03 00:57国家统计局浙江调查总队课题组
统计科学与实践 2022年4期
关键词:数据源住户比重

□国家统计局浙江调查总队课题组

中国互联网络信息中心第47 次《中国互联网发展状况统计报告》 显示,我国移动支付市场规模位居全球第一,手机网络支付用户规模超8.5 亿。移动支付方式在居民消费中的广泛应用,为住户调查利用海量交易数据提供可能。国家统计局《“十四五”时期统计现代化改革规划》 明确提出,要探索推动网购等电子支付数据在住户调查中的应用。目前,该领域相关研究和实践尚处于起步乃至空白阶段。本文从“调查端”和“数据端”两个层面入手,梳理和分析使用移动支付群体的行为特征、统计应用的客观条件以及移动支付数据源的数据质量问题,为住户调查引入移动支付大数据提供思路和参考。

|调研对象基本情况

为了解浙江居民消费移动支付使用情况,国家统计局浙江调查总队组织开展居民消费支付行为专题调研。专题调研采用入户面访的形式,调研样本分布在不同经济区域,兼顾城乡、性别、年龄、从事行业、教育程度、收入水平等各个方面,共计收回有效样本2861 份。样本主要结构详见表1。

|浙江居民使用移动支付的行为特征

(一)移动支付整体占比较高,比例扩大

在日常消费金额中,居民使用移动支付方式比重在60%以上的占65.9%,其中90%以上的占37.0%,80%-90%的占16.5%,60%-80%的占12.4%。分城乡看,有70.5%的城镇居民移动支付比重超过60%,其中90%以上的占43.2%;64.4%的农村居民移动支付比重超过60%,其中90%以上的占34.3%。另外,从移动支付使用趋势看,比上年增加的调研对象占23.0%,持平的占75.4%。仅有1.6%的调研对象选择减少,并且集中在50 岁以上群体,其他年龄段均选择增加或持平。“增加”的原因主要包括移动支付便捷性、有优惠促销活动、无接触更卫生等。

表1 样本主要结构分布(单位:%)

(二)年龄和学历是影响支付行为的主要因素

分年龄看,剔除14 岁以下正在初中及以下就读的学生(主要考虑手机使用限制),总体呈现金字塔型分布,即随着年龄增加,使用移动支付的比重呈现下降趋势。其中15-39 岁各年龄段群体比重在60%以上的均超过80%,90%以上的均超过55%;而60 岁以上群体比重在60%以上的仅占22.4%。分教育程度看,受教育程度越高,使用移动支付方式的比重越高,其中大学本科和研究生及以上学历群体比重在60%以上的均超过90%。另外,人均年净收入10 万以上群体比重在60%以上的占84.7%,达到一定收入水平的群体在日常消费中更倾向于使用移动支付。

(三)移动支付平台选择相对集中

如图1 所示,在有使用移动支付的调研对象中,微信支付覆盖率达97.7%,居首位,其次是支付宝,覆盖率达84.7%,其他依次是京东支付、云闪付、多多支付、其他,分别为18.6%、17.7%、14.9%和3.2%。从平台使用优先次序看,在选择哪个支付平台是首选时,微信支付、支付宝遥遥领先,比重分别为65.4%和33.1%,并且同时使用微信支付和支付宝的比重达72.8%。从平台在不同年龄、教育程度、从事行业、收入水平等方面表现看,微信支付表现较为均衡,体现了作为全民社交工具的优势;支付宝则在中青年、高学历、高收入、非农就业群体覆盖率相对较高。

(四)对身份、消费等隐私信息让渡较为敏感

调研显示,有70.2%的居民不愿意由统计部门统一到相关平台获取其移动支付数据,仅有29.8%的居民表示愿意。对于愿意提供配合的居民,当问及是否提供其身份证号码时,其中仍有12.1%没有留下身份证号码。分年龄看,除15-19岁和50-59 岁群体不愿意率低于70%外,其他年龄段均在70%以上。分教育程度看,呈现出“学历越高、配合度越低”的特征,研究生及以上和大学本科学历群体的不愿意率,比初中及以下分别高出18.8 个和10.0 个百分点。据面访了解,近年来电信网络诈骗、个人信息泄漏等事件频发,调研对象对于涉及身份、消费等隐私信息被非法获取利用的防备心理普遍较重。

|住户调查引入移动支付大数据的客观条件

(一)分城乡类别看,均有着较好的移动支付应用基础

对于住户调查,无论城镇样本(U 层和UR 层)还是农村样本(R层),移动支付大数据均有着一定的社会应用基础(图2)。调研还显示,城乡居民消费支付习惯均呈现“两端分布”的特征,即移动支付或现金支付偏好相对明显。移动支付占日常消费金额比重在“80%以上”和“20%以内”的群体中,城乡居民占比分别为59.3% 和51.4%、17.8%和21.4%。在实际工作中,如果能适当加以引导,进一步强化“两端分布”趋势,降低“移动支付和现金支付混用”群体因消费习惯改变而造成的不确定性,对于后续模型构建和提高总体精度是有益的。

(二)从数源分布看,移动支付平台集中有利于控制系统偏差

居民日常使用的移动支付平台集中在微信支付和支付宝,对于推进移动支付大数据应用是有利的。一方面,随着居民移动支付习惯的建立以及移动支付场景覆盖率的不断拓展,移动支付市场已进入份额相对集中的稳定阶段。另一方面,调研显示微信支付和支付宝至少有一种使用的覆盖率达到98.9%,使得微信支付和支付宝的相关数据具有较强的代表性,基于上述数据源推算居民消费支出,有利于将系统偏差控制在较小范围内。

图1 居民移动支付平台覆盖情况(单位:%)

图2 城乡居民使用移动支付的比重(单位:%)

(三)从居民意愿看,整体配合程度不高但存在“可塑性”

微信支付和支付宝隐私保护条款规定了与第三方共享信息的情形和条件,明确需要按照法律法规及国家标准的要求以确认协议、具体场景下的文案确认、弹窗提示等形式征得用户的同意。因此,统计部门绕过居民利用内部掌握的身份信息直接获取其移动支付数据,受到隐私保护政策的限制。调研显示,不同地区之间居民配合意愿存在明显差异。统计部门需要对产生地区差异的原因进行深入调研和分析,并从中找出消除居民顾虑、提高配合意愿的办法(如通过采集手机号码代替身份证信息)。同时,对于配合意愿较高的地区,可以考虑作为移动支付大数据应用试点的候选地区。

(四)从长期趋势看,移动支付大数据统计应用向好

在宏观政策面,依据《浙江省“移动支付之省”实施方案》,到2022年基本建成全国领先的“移动支付之省”,移动支付将成为浙江省零售支付的主要方式之一,并实现全省城市全面覆盖、县域基本覆盖。可以预见随着移动支付技术创新及数字人民币的试点应用,现金支付在居民消费中的比重将进一步降低。结合前文不同年龄段群体使用移动支付的比重和趋势,随着时间推移及偏好移动支付的年轻一代加入主力消费人群,移动支付大数据在住户调查中的应用将具备更好的外部环境和社会基础。

|移动支付大数据与住户调查契合度分析

移动支付大数据由数源单位根据自身业务目标生成,属于居民消费和市场交易的衍生品,在生成机制及可控性方面与传统统计数据有着极大的差别。因此,还需要依据既定统计生产目的,围绕移动支付大数据的变量维度、数据质量等进行契合度分析,包括准确性、可比性、时效性以及成本效益等方面。

(一)移动支付数据源的变量维度

通过查阅《财付通隐私政策》《支付宝隐私权政策》 等,以及微信支付和支付宝APP,与住户调查相关的移动支付数据源大致分为三类,详见表2(以支付宝为例),数据序列最早可以追溯至2004年12月。

(二)存在颗粒度过粗和分类缺失的质量缺陷

依据联合国欧洲经济委员会研制的“大数据质量评估的建议框架(BDQF)”,对照住户调查相关表式,经过对比分析发现,移动支付数据源的质量缺陷主要在于数据颗粒度过粗和分类缺失(表3)。一是存在不同商品“混记”,与住户调查现金支出账详细记录居民消费的每一种商品的数量和金额不同,账单记录的是每一笔消费的交易金额,其中可能包括多种商品。以中小超市和网购平台为例,同时售卖百货用品、食品、服饰、电器等,而在移动支付账单中,仅记录消费总金额和商户类型(商品订单号),没有具体商品的名称、数量、计量单位和金额等信息。二是部分消费支出无法分类,如扫收钱码付款,因缺少对应的商品信息,需要借助商户名称、商户性质等信息进行辅助分类,但存在部分商品分类错误的隐患。以停车场为例,很多社会停车场的经营主体是某投资公司,如按照商户名称辅助分类,停车费将不会被计入交通出行。

|移动支付大数据统计应用的思考和展望

结合专题调研结果和契合度分析,当前推动移动支付大数据在住户调查中的应用已经具备一定基础,并且在数据采集时效性、成本以及抗干扰等方面,相对于传统调查方式具有不可比拟的优势。但居民在涉及让渡身份、消费等隐私信息方面仍有较大顾虑,加上移动支付数据源存在着短期内难以处理的质量缺陷。因此,就目前统计生产目标和数据处理能力而言,很难将移动支付大数据作为住户调查的主要数据源使用。可以考虑将移动支付大数据融入住户调查数据生产流程,辅助居民消费支出相关数据的生产以及数据质量的提升(图3 左)。

表2 移动支付数据源维度变量

表3 支付宝账单与现金支出账所需信息项比较

图3 移动支付大数据统计融合应用

下一阶段,在前期研究的基础上,将重点与数源单位围绕数据共享和技术支持开展对接,按照“找准切口、迭代升级”的思路推动跨界合作。具体内容包括:一是构建和评估潜在应用场景。如图3 右设想了一个场景,在住户调查“e 记账”APP 中导入移动支付数据,数据处理规则可以为部分可识别的消费记录由APP 自动编码归类,无法识别的消费记录由记账人员简要备注后编码归类,解决移动支付数据源的质量问题。二是推动移动支付数据标准化。协商数源单位按照《统计分类标准和目录汇编》,重新定义和设计移动支付数据分类,以实现与统计调查数据的互通共用。三是探索隐私计算技术运用。目前隐私计算技术经过不断迭代,开始在真实商业场景中大规模落地。数据以“可用不可见”的密态形式在机构间流动和计算,有利于打消数源单位对数据归属、数据安全和隐私保护的顾虑。四是建立融合应用管理体系。通过制度机制立规矩、设路径,规范外部数据源的收集、整理、筛选、存储、挖掘、分析、发布等流程,闭环式保护商业秘密和个人隐私。

猜你喜欢
数据源住户比重
循环热处理对93W–5Ni–2Fe高比重钨合金冲击韧性的影响
一种面向传感云的数据源质量评估框架
顶层住户的无奈——渗漏篇
图表中的交互 数据钻取还能这么用
简单的高招
基于Excel的照片查询系统开发与应用
数据有增加 图表自适应
射频感应电子门锁
家庭装修过分了