基于知识行为的小米社区用户画像研究

2021-09-07 10:00:00李旭光肖思琪李珊珊
农业图书情报学刊 2021年8期
关键词:画像小米标签

李旭光,肖思琪,李珊珊,张 恒

(南开大学商学院信息资源管理系,天津 300071)

1 引言

随着互联网的迅速发展及移动支付技术的快速普及,消费者的行为数据可得性越来越高,数据结构化程度越来越高,为数据挖掘和行为预测奠定了分析基石。为了解用户的潜在需求和行为规律,用户画像应运而生。用户画像是一种具体描述用户特征、属性的方法,比如有些用户看重产品质量,而有些用户更容易被产品外观设计吸引;有些用户认为售后服务是必须考虑的因素,而有些用户则认为价格才是决定是否购买的关键。用户与用户的不同可以达到千人千面的程度,但是这些用户又可以细分为拥有相似行为习惯的用户群体,群体内部拥有相同特征,群体之间特征相异。用户画像使用范围十分广泛[1],比如应用最为频繁的电商巨头,淘宝、京东、拼多多等,都有根据用户的购买记录、浏览记录、点击行为、停留时间等历史数据推荐产品的模块,比如淘宝“猜你喜欢”功能就是根据用户画像进行的精准推荐,大大提升了用户的转化率[2]。

用户画像核心价值在于帮助我们深入了解用户,找出用户的潜在需求,通过细分的用户特征打造细分市场,细分营销方案[3],如YAO 等[4]基于用户画像建立了个性化推荐系统,通过抓取豆瓣高质量评论建立了用户标签体系,实现了向用户精准推荐视频的操作,提升了用户体验。用户画像可以描述用户特征并进行用户聚类[5],不仅如此,用户画像在虚拟社区方面的应用可以帮助我们了解用户在购买后遇到的故障,关注的问题,亟待解决的需求[6]等售后问题。

综上所述,用户画像不仅可以在售前精准定位用户,挖掘用户需求,还可以帮助我们构建一个更有价值、高质量、和谐的用户社区,作为“第二售后”帮助用户、留存用户、转化用户[7]。

2 研究基础

在情报学领域,用户画像被广泛应用于了解科技管理部门的用户情报需求,探究情报工作人员和科研工作人员的信息需求,此外,情报学领域中社交媒体用户画像的研究也是一个热点方向。张海涛[8]从自然属性、信息需求属性、行为属性角度,按照关注信息的不同,将用户划分为3 类群体,每类群体画像都有10个以上属性标签,详细表现了不同群体用户在信息需求方面的特征。张艳丰[9]在研究社交媒体用户时应用用户画像归纳了4 类社交媒体倦怠用户的特征,阐释了不同社交媒体用户群体的不同特征。学者们在用户画像的应用方面有较多共同之处,赵辉[10]应用同样的研究方法和研究过程刻画了科技情报用户画像,并基于用户画像建立了标签关联的推荐算法,帮助科技情报部门探测感知用户需求。从目前情报学领域对于用户画像的应用来看,用户画像的研究遵循着一定范式,涉及文本聚类、分类、关键词提取、特征提取等多个步骤,根据研究问题需要还可与其他研究方法结合共同探究某一领域。随着人工智能技术的不断进步,用户画像的技术门槛也逐渐降低,研究人员应用该方法也愈来愈便捷。

在查阅已有用户画像研究后,发现刻画用户画像过程中有一个较为关键的步骤—用户分类。用户画像与传统用户分类不同,首先,两者在应用目的上有所不同,用户画像的最终目的是挖掘用户行为特征和潜在需求,作为调整业务、开发新产品的重要依据;用户分类则是将用户划分到不同的群体中,集中对不同用户群体实施不同服务策略。其次,从实施步骤上来看,用户分类是将新用户样本划分到已有分类群体,一般是按照某一标准的分类,是一个处理“增量”的过程;用户画像则是需要从海量用户数据中对用户聚类,根据聚类结果分类,是按照行为结果聚类并提取不同类别特征,详细描述每类用户群体标签和识别方式的过程。最后,从两者关系上来看,用户画像与用户分类部分过程交叉,用户画像过程中会有用户聚类、分类过程,因此两者并非毫不相关。

在对相关研究以及用户画像与用户分类的异同综述后,接下来探究小米社区用户之间的交互活动。活动理论可以帮助我们分析得更加清晰、全面,该理论融合了技术和情境,将人和虚拟情境紧密联系在一起。目前最完善、应用最多的是恩格斯托姆的活动理论模型,该模型既强调主体、客体、中介,又重视规则、分工以及共同目标即共同体的作用。活动理论最显著的特征就是将人类“活动”作为基本的分析单元,使得我们可以从主体、客体、共同体、工具、规则和劳动分工6 个方面深刻理解影响人类活动的内外部环境因素及其相互关系[11]。将小米社区及用户看成一个活动的有机体,按照恩格斯托姆的活动理论模型可建立小米社区的活动模型(图1)。

图1 小米社区活动图Fig.1 Xiaomi community activity map

从上述模型可见,小米用户是活动的主体,作为活动最重要的环节,与其他活动角色互动[12]。活动的客体是活动主体所作用的事物,小米品牌就是活动的客体是主体动作的作用对象。小米社区的运营规则,比如主体可以单独发帖也可以在帖子下评论,这就是活动需要遵循的规则。小米社区作为用户和品牌的中介,起到桥梁的作用,使得用户的主体作用可以作用于客体[13]。劳动分工是主体客体所承担的角色职责,小米商家作为共同体,与主体一起作用于客体,对小米品牌施加影响。

3 研究过程

用户画像过程是一个复杂又庞大的工程,本文遵循刻画用户画像的一般过程,包括以下4 个步骤。

(1)数据获取与描述:首先通过第三方爬虫软件结合Python 语言获取小米社区→小米圈子→小米手机论坛和小米游戏论坛自2020 年1 月1 日截止至2021年1 月8 日的帖子数据共30 425 条,其中每行包括用户昵称、头像、帖子标题、摘要、评论等信息,还包括每位用户的具体评论内容和评论日期。经过整理发现127 条无效数据和重复数据并予以剔除,剩余数据30 298 条中最短为2 个汉字,最长为572 个汉字;以每条帖子为单位,最多有39 条评论回复,最少为0 条。

(2)中文文本聚类:借鉴了NLP 比较流行的算法—基于TF-IDF 和TextRank 的中文文本K-means 聚类。首先使用jieba 分词,发现存在大量无用词和对句意贡献率低的词,使用停用词表剔除此部分无效词。规定聚类簇数,一般NLP 过程取2~8 簇为宜,本文对文本的聚类簇的选择采取多次聚类比较的方式,依次遍历2~8 簇聚类结果,重复遍历30 次直至收敛。使用轮廓系数对聚类结果进行评估,轮廓系数公式为:

注:A 是簇内样本间距,用来衡量簇内紧密程度,即相似程度;B 是簇间样本间距,用来衡量不同簇之间的距离,即相异程度。

结果表明,聚类结果中取5 簇时轮廓系数S 最大,S=0.553,此时聚类效果最好(图2)。

图2 K-means 聚类结果Fig.2 K-means clustering results

(3)关键词和标签提取:对聚类结果的每一簇使用两种关键词提取方式TF-IDF 和TextRank,比较两者提取结果综合实现关键词的提取,关键词提取详见表1(节选全部数据提取大的关键词前20)。整理不同簇的关键词(图3),转换成特征标签。

图3 关键词抽取结果Fig.3 Keyword extraction results

表1 关键词及其权重Table1 Keywords and theeir weights

(4)用户画像构建:使用聚类结果的特征标签,排除不同簇之间的共有标签,即排除簇之间的标签交集或类似的标签,留下每类用户的独特标签,分别构建5 类用户画像,对用户群特征进行描述。

4 情感分析过程及结果

本文借助Python 语言编写程序,结合第三方软件——后羿采集器,爬取了小米虚拟社区部分用户的30 298 条信息,但是有两方面问题需要注意:一方面,本文研究的不是用户的基础特征或基础属性,而是用户的信息交流和知识分享方式,即知识行为;另一方面,由于小米社区的建站限制,无法获取用户的基础信息,比如性别、年龄、地址、职业等,甚至无法从留言跳转至用户信息页,也无法统计每位用户的停留时间。因此,本文主要从用户知识行为出发,从用户的发帖内容、留言及回复内容对用户标签体系进行构建。

图4 是针对爬取的30 298 条用户评论所做的词云图,可以看到出现频率较高的有效词有“小米”“米10”“版本”“手机”这些产品相关信息,经过Jieba文本分词、部分数据人工打标、剩余数据使用有监督的文本分类,发现大约有3/5 的词汇在描述问题和故障,说明小米社区作为产品的售后答疑区的功能行使的非常好,因为主要的话题与产品相关,围绕产品展开。另外,通过文本情感分析发现,在30 298 条评论中有10 346 条负面评价,7 855 条正面评价,12 097 条中性评价。由于机器对情感打标的准确度不是很高,因此打标为负面评价和正面评价的基本上都是正确的,但是中性评价中掺杂着机器难以识别的正面评价和负面评价,需要人工对这部分词汇打标。经过手工标注,12 097 条中性评价中有1 273 条正面评价,4 083 条负面评价,6 741 条中性。与上述机器分析结果汇总后,有9 128 条正面评价,14 429 条负面评价,以及6 741条中性评价。从评价情感分布上来看,负面评价最多,正面评价其次,中性评价最少(表2)。

图4 词云图Fig.4 Cloud of words

表2 情感分析结果 单位:条Table 2 Results of emotion analysis

5 用户画像构建

根据上述文本聚类结果及关键词抽取结果,本文将用户划分为5 类用户,并分别刻画用户画像,从行为特征、需求标签、价值属性、用户场景、心理特征、流失风险6 个部分描述用户群体。

5.1 故障反馈用户

故障反馈用户的概括特征为“吐槽”。因为他们是含有复合特征的一类用户,发帖一方面是抱怨产品故障或使用不便之处,表达自己的愤怒情感,还有寻求网友帮助,寻找拥有同样或类似经历的用户抱团取暖的行为取向。

(1)行为特征。发帖率和互动频率最高;用户群体最为庞大。故障反馈用户的发帖以负面评价、负面词汇、多使用感叹号、连续问号和句号为标志,常见关键词“故障、打不开、解决、修复、Bug、版本、耗电、情况、充电、电池、显示、只能、求助、有问题、闪退、断流、异常”;作为表达情绪的辅助,偶有用户使用反讽语气,较难识别。

(2)需求标签。故障尽快解决,希望能有切实可行的解决方案解决当下问题。

(3)价值属性。活跃度高;新老用户都较多;忠诚度一般。该类用户是社区最应该关注的一类,新用户尚未建立忠诚度,故障不迅速解决容易导致产品体验感差,用户流失,口碑下降;老用户故障不及时解决,容易导致失望情绪的产生,信任度下降。因此该类用户需要建立及时响应机制帮助其解决问题。

(4)用户场景。使用过程中遇到产品Bug、系统故障严重影响用户体验时,用户一方面会到产品社区寻求帮助,尝试自行解决,得不到解决或回应时会联系售后,因此应尽可能在社区内就使用户的问题得到解决。

(5)心理特征。负面情绪明显,十分急迫,期待问题能够得到最快解决和回应,对于反应速度要求较高,希望官方回复及时,也希望能在社区寻求到有相似经历用户的帮助。

(6)流失风险。流失风险高,用户忠诚度降低,亟需维护。

5.2 评论解答用户

该类用户主要指在评论区提供解答和帮助的用户。

(1)行为特征。分享产品使用过程中的经历和经验,常用关键词“重启、更新、内测、设置、升级、系统、关机、一样、情况、试试、正常、打开、关闭、售后”;为发帖用户遇到的问题提供一些有意义的建议,他们可以理解上述故障反馈用户的问题和感受,并主动提供解决方案;是故障反馈用户最愿意遇到的用户;当评论解答用户也不确定自己的回答是否有效时,他们会在评论区与发帖的故障反馈用户展开讨论,共同商议有效的解决方法,他们较多使用动词“试试”以及语气词“吧”。

(2)需求标签。知识分享行为激励。在评论解答用户的分享过程中,他们得到的只有帮助他人而产生的愉悦情绪价值,社区并没有给予他们任何额外的奖励,无法刺激和加速知识的分享,这一点社区管理需要做出改变。

(3)价值属性。活跃度较高;老用户较多;忠诚度高;最有价值。评论解答用户的信息行为尤为值得研究,因为他们可以提供社区及其他用户最需要的信息,充当售后的角色,他们拥有“第二客服”“线上客服”的特质。研究他们的知识分享行为和知识创新行为非常有价值。

(4)用户场景。当其他用户遇到故障发帖求助时,建议用户会在评论区回应,对故障用户进行指导,或者共同商讨解决方案。

(5)心理特征。希望官方能认可其对于社区其他用户的帮助。拥有较强共情能力,在解答他人问题时也可以使他们获得帮助他人而产生的愉悦情绪。

(6)流失风险。流失风险低,需要激励其知识共享行为,一方面可以增加用户黏性,另一方面帮助建设互动性更强的社区。

5.3 社交用户

社交用户主要出现在游戏圈和某种兴趣爱好圈,因为兴趣和设备的双重交叉,使这部分用户之间产生一种更加亲密的纽带。

(1)行为特征。回帖率和互动频率更高;热衷于分享自己的生活以及使用产品的心得体会;90%以上的用户会在发帖时配图,整体氛围轻松愉悦。

(2)需求标签。社交。社交用户的需求分为两类,一类是发布感想,分享生活,属于输出型社交用户;一类是为了寻找有相同兴趣爱好的朋友,属于互动型社交用户。

(3)价值属性。活跃度高;老用户多;忠诚度高。但是,社交用户的目的是社交,是丰富自身生活,并不是围绕产品展开的,产品的社区只是提供一个交流平台,因此这部分用户对产品的知识建构行为的帮助十分有限。

(4)用户场景。使用小米产品过程中有较好体验,多分享小米设备的拍照功能;游戏时需要找“队友”,相对于游戏上的陌生合作队友,更加信赖同为小米用户的“队友”。

(5)心理特征。期待社交关系的产生。

(6)流失风险。流失风险低,单独维护需求低,但需注意维持社区交友文明秩序,树立良好品牌形象。

5.4 咨询用户

咨询用户是单纯寻求信息、客观询问关于产品的使用方法的用户,多为新用户或使用产品频率不高的用户。

(1)行为特征。多咨询新产品使用方法,出现频率较高的关键词为“拍照、开机、启动、解锁、声音、打开、怎么、在哪、解答、使用”,多询问新机启动相关问题。

(2)需求标签。需要详细、耐心、易懂的使用指导。该类用户可能在网上或产品说明书上获取不到产品的具体使用方法,因此来社区寻求帮助。针对该类用户的问题,企业应当思考是否需要将用户类似的问题在说明书里加以解释和说明,最好附上产品使用视频或步骤图片。

(3)价值属性。活跃度较低;新用户较多;忠诚度低。

(4)用户场景。当其他用户遇到故障发帖求助时,建议用户会在评论区回应,对故障用户进行指导,或者共同商讨解决方案。

(5)心理特征。与故障反馈用户的心理特征相似,都处于比较急迫、焦虑状态,用户体验感差,但是相较于故障反馈用户,他们的情绪更为平和,从文本分析结果来看,多为中性评价,负面评价很少。

(6)流失风险。流失风险高,由于该类用户一般为品牌新用户或某一产品新用户,体验感差容易导致顾客流失,口碑下降。

5.5 建议用户

此类用户倾向于根据自身使用需求和习惯提出建议,多为向品牌建议开发新功能。

(1)行为特征。他们使用比较多的关键词有“可以”“希望”“没有”“缺乏”“建议”,约有1/2 的用户使用问句提出建议,比如“小米穿戴可以把跑步数据同步到支付宝吗?”。

建议的表达方式多为中立的态度;直接在社区发帖,而不是评论;发帖后评论区很少有用户评论;针对新机的建议较多。

(2)需求标签。系统优化;功能优化;个性化需求;开发新功能;解决Bug。建议用户的需求可以划分为两类,一类是个性化需求,满足的是用户个人的使用习惯;另一类是普遍需求,或者说是通用需求。这部分建议人群的需求一般不太急迫,在处理的时间上相对宽松。如果多人提出了同一种个性化建议,企业就需要考虑这是否已成为用户的普遍需求。

(3)价值属性。活跃度不高;老用户较多;忠诚度高。

(4)用户场景。某一功能不能满足用户需求,用户在使用过程中发现,购买前不知道该功能不够完善;有些需求是使用一段时间后发现的,有些是用户更换新设备后的适应期提出的,是对比几款产品之后的需求。

(5)心理特征。期待需求得到满足,期待官方回应。

(6)流失风险。流失风险低,但需求长期得不到满足和回应易流失,需要社区维护。

6 结论与展望

通过对小米社区用户画像的构建,以及用户之间互动模型的建立和分析,可以发现故障反馈用户和评论解答用户的知识分享过程和知识创新过程对于小米社区是至关重要的。作为以产品为导向,以售后为目的的小米社区应当根据用户的特征、需求转变自身定位,因此,本文提出以下建议。

(1)依据用户画像标签建立分享奖励机制,使社区用户保持知识分享活跃状态。现有的小米社区机制没有对分享知识、提供建议的用户进行奖励,部分用户会因为分享对自己没有实质性的收益而不分享或减少分享,不利于社区内部知识流动。因此社区应建立完善的奖励机制,努力调动用户积极性,促进社区内部知识共享,实现社区内部知识的高速增长。

(2)建立有用知识认证体系,从知识获取角度为用户节省时间。将用户间分享的有用的知识,或者用户创造出来的解决方案,认证为有用建议,在其他用户搜索时优先显示,加快用户有针对性的筛选过程。此外,考虑到工作人员工作量的原因,可以运用大数据设置自动分类标签,对社区新创知识自动分类管理,也可加快社区知识流动进程。

(3)建立及时、有效的反馈机制,鼓励用户知识贡献行为。将建议用户的建议科学评估后给予回应。企业的反馈一方面要考虑及时性问题,另一方面要采取合适的反馈方式。除了社区官方在线反馈,也可以同时采取其他反馈方式。当用户格外关注某个问题时,可以采用更为迅速、便捷的方式响应,对提高社区服务质量,鼓励用户知识贡献起到较好的促进作用。

(4)建立基于用户画像的情感评价体系,在激励知识行为的同时兼顾人文关怀。社区应重视用户评价,开发可以自动识别评价中用户感情倾向的分析工具,对那些负面情感强烈的用户及时安抚,主动提供帮助;对那些正面情感强烈的用户给予感谢和肯定,凸显社区对用户评价的重视。知识行为促进和情感维护双管齐下,才能充分发挥品牌线上社区的强大功能。

本文对小米社区的5 类用户进行了特征提取和打标,为用户体系建立了用户画像分类,为用户虚拟社区提出了一些切实可行的建议。但是本文的研究也存在一定的局限性,在构建用户画像时只截取了用户部分评论信息,且用户基础属性信息并未涉及。在接下来的研究中,将以用户基础属性为维度,比如用户年龄段,职业类别,收入范围,分析用户的标签与用户行为之间的关系。

猜你喜欢
画像小米标签
威猛的画像
传递
“00后”画像
画像
杜小米的夏天
无惧标签 Alfa Romeo Giulia 200HP
车迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉标签的人,都活出了真正的漂亮
海峡姐妹(2018年3期)2018-05-09 08:21:02
读《幸福的小米啦:小米啦发脾气》有感
可爱的小米
标签化伤害了谁