赛题背景
随着社会信用体系建设的深入推进, 社会信用标准建设飞速发展,相关标准相继发布,包括信用服务标准、信用数据釆集和服务标准、信用修复标准、城市信用标准、行业信用标准等在内的多层次标准体系亟待出台,社会信用标准体系建设有望快速推进。社会各行业信用服务机构深度参与广告、政务、金融、共享单车、旅游、重大投资项目、教育、环保以及社会信用体系建设。社会信用体系建设是系统工程,通信运营商需要打造企业信用评分体系,助推整个社会的信用体系升级。同时国家也鼓励推进第三方信用服务机构与政府的数据交换,以增强政府公共信用信息中心的核心竞争力。
任务描述
中国移动福建公司提供2018年x月份的样本数据(脱敏),包括客户的各类通信支出、欠费情况、出行情况、消费场所、社交、个人兴趣等丰富的多维度数据,参赛者通过分析建模,运用机器学习和深度学习算法,准确评估用户消费信用分值。
赛题内容和方向
随着社会信用体系建设的深入推进,社会信用传统的信用评分主要通过客户消费能力等少数的维度来衡量,难以全面、客观、及时地反映客户的信用。作为通信运营商,中国移动拥有海量、广泛、高质量、高时效的数据。如何基于丰富的大数据对客户进行智能评分是中国移动和新大陆科技集团目前亟须攻关的难题。运营商信用智能评分体系的建立不仅能完善社会信用体系,同时也为中国移动内部提供了丰富的应用价值,包括全球通客户服务品质的提升、客户欠费额度的信用控制、根据信用等级享受各类业务优惠等,希望通过本次算法比赛,征集优秀的模型体系,准确评估用户信用分值。
赛题价值
传统的信用评分主要以客户消费能力等少数维度来衡量,难以全面、客观、及时地反映客户的信用。中国移动作为通信运营商拥有海量、广泛、高质量、高时效的数据,如何基于丰富的大数据对客户进行智能评分是中国移动和新大陆科技集团目前攻关的难题。运营商信用智能评分体系的建立不仅能完善社会信用体系,同时也为中国移动内部提供了丰富的应用价值,包括全球通客户服务品质的提升、客户欠费额度的信用控制、根据信用等级享受各类业务优惠等,希望通过本次比赛,征集优秀的模型体系,准确评估用户信用分值。
赛题难点
本赛题的难点主要有几个方面:
1.行业信用度评分与行业应用场景、行业特征息息相关,因此需要参赛者了解基本通信行業特征,通过对通信业务进行解读,选取适合的字段进行建模。本赛题提供了涉及用户的身份特征、消费能力、人脉关系、位置轨迹、应用行为偏好信息等多个字段,需要理解信用度同字段的相关性,取舍字段信息。举例来说,透过用户的位置轨迹可以识别用户在不同热点商圈的消费能力、是否居住在高档小区、是否是商旅常客等高消费人群。同样,对于一个网龄10年以上不换号、每月通信费用在200元以上,从不欠费的用户,其对应的信用分也一定越高。
2.选择合适的模型。传统的评分模型通过对关键因素和权重的线性统计来评分,孤立、静态的理解各变量,无法准确、实时、动态地评价和预测消费者的信用变化情况,参赛者应通过对样本数据的分析,采用机器学习和深度学习等算法模型,更全面地进行综合评分。