互联网产业系统中用户隐匿数据获取的机制

2020-07-04 02:14舒煜
电脑知识与技术 2020年14期

舒煜

摘要:互联网产业作为数据爆炸时代的典型代表,其在数据获取、处理及利用方面存在天然性的优势,而如今看来数据本身其实是可以隐匿的,隐匿的数据与显性的企业运作系统之间存在着很大的关联,这些关联如何挖出是在现下的技术手段中是可以解决的,关键问题在于企业或者说行业内可否发现这些数据匿藏点并加以处理。这些问题在成熟的解决办法出来之前,一直会是研究者们探讨和研究的重点。

关键词:互联网产业;系统域;隐匿数据;存留机制

中图分类号:TP3-05 文献标识码:A

文章编号:1009-3044(2020)14-0058-02

1引言

当前产业互联网促进各行业协同发展及转型升级,同时带动了各企业信息化系统的高度建设,这里信息化系统并非单纯指的是操作及工作系统,而是指包括了企业内部用于协同办公的各组织性子系统集合及对外开放式的移动(或非移动)应用端的整合体系。以目前在产业趋向于网络生态化的角度来看,“大”系统(或者“大”整合)的概念已经成为主流,在这大趋势下的产业面向用户分析也势必会带来新的突破和挑战,传统信息分析方式和分析点是否能够支撑现行用户需求,能否成为以大数据为代表的决策支撑点都是有待考究,所以本文就以互联网产业为代表性行业,针对其整个内外系统中是否存在隐匿用户信息及信息获取机制做出一定的分析,也是从数据整合角度出发对该类型问题做出探索。

2隐匿点获取源分析

2.1企业内部系统的可拓数据

由于互联网产业存在特殊性,对信息数据的记录及细节点都十分完善,各个环节的信息内容都是存储在相应的数据库之中。就一般性的互联网企业而言,其类BSS-CRM系统域中的产品及“套餐”系统(PPM系统)、客户管理系统、VIP客户系统、互动服务系统及线上营销系统等都存在详实的用户数据信息,但是有些信息可能需要挖掘技术方可转换成价值信息。此外,在该类型企业的计费系统域中,在线费用计算系统、经费管理包及账务余额统计系统(ABM系统)也可以为企业提供用户信息的隐匿内容,这种隐藏着的信息挖掘其实是在以大数据应用为代表的技术手段的实现。

比如,在互动服务系统中的用户产品咨询或故障报修率可以作为用户是否具有产品脱离倾向的判断和依据;客户管理系统和VIP客户系统中消费能力可以作为定制化或一般化产品推荐的有力指向等,也就是说,这种企业内部系统数据的挖掘程度越高,潜在的用户信息就呈现得越明显,见图1所示。

2.2对外平台系统的可拓信息

当前网络平台的呈现样式不外乎三大类:企业常规网站、企业移动平台(App应用端)及企业微平台(企业微信及微博等),在此前关于企业网络移动平台的调研数据就显示86%的用户对App应用端存在“针对性使用”,即用户使用存在针对性和有效性,那么企业通过对App应用端的分析以此来预测用户心理也是具备针对性和有效性,由此可知,其不仅是外界与互联网企业重要的交互窗口,更是可以来抓取用户消费心理的重要渠道,评论区、者留言板块及聊天记录中都存在隐匿的数据,整合有效信息整理及处理冗余数据并加以分析可以从一定程度上对互联网产品在用户心里的重要程度及改进内容做出相应的指向。特别是根据App移动端的用户下载量、退定量及更新比例等网络平台数据,可以很好地预测用户对于产品的依赖程度,见图1所示。

3隐匿数据过滤处理

3.1系统域数据存留机制

当前系统数据对于企业来说,本身是可以做到海量保存。但是运用数据做分析时就必须得做到有效性,而有效的数据存留在庞大的数据库中就得实时做数据库的压缩处理,即对与“敏感数据”(企业想要得到的信息关键词)关联度较高的数据内容进行数据库的压缩,清理出冗余、无效的“脱敏数据”,以此在为数据做进一步分析前清理出计算空间。同时,根据企业想要得到的有价值信息内容的不同,可以建立N个关联词设置,以将相应匹配值较高的敏感数据进行分类,建立N个有效数据库,以备进一步挖掘之用。见图2所示。

3.2隐匿数据过滤流程分析

由上述分析可知,通过有效数据库的建立可以大大减少冗余、无效或脱敏数据的干扰,但是并不意味着有效数据就一定可以用做分析,因为数据分析还存在时效性和选择性的问题,N个有效数据库在不同的研究对象前可以是单独的抓取,也可能是混合交叉抓取。所以在各个有效数据库的信息数据大规模集中的同时,由于有效数据库中也有可能存在相似或者时效性等问题,比如企业App應用端和微平台中存在相似的用户操作记录、留言信息或用户缴费数据等,故还需要对敏感数据进行精简和处理。

因对隐匿数据中各部分的原始数据已经弱化数量、提高质量,故数据的价值性有所提高,那么对于用户潜在信息挖掘的程度也近一步增强。通过整合BSS-CRM系统域和对外平台端系统的分布式数据挖掘,采取BI软件技术等过滤及整合方式分析出用户在产品方面的各种消费行为或产品本身质量问题等,进而对企业在市场决策中起到关键作用。见图3所示。

4结语

对于互联网产业来说系统域本身就是一个载体,其承载的不仅是显性数据资源及用户信息,更重要的是让其成为企业在挖掘用户潜在价值信息及重要数据的支撑点,系统集成而带来的内部和外部子系统的可运用价值也会越来越高。数据本身其实是“静止”的,不经过滤和分析,其价值性可能无法直接体现出来,而信息的价值就是在于帮助行业来做相应的决策,所以在以当前产业互联网带动各领域转型升级的趋势来看,隐匿数据的挖掘和分析已经成为各行业的重点技术手段并以此带来更多的应用价值。