何奕 韩雨桐 白瑶 周世杰 施泽仁 王江盼
[摘 要]随着国内房租越来越贵,很多人为了减少生活开销而选择合租,然而在这一过程中,随机匹配的室友往往不尽如人意。在基于智能匹配算法TF-IDF的基础上,结合区块链技术,不仅能够有效地提升室友匹配的满意程度,而且由于区块链不可篡改的特性,也减少了双方之间信用违约风险。文章基于此核心技术,推出了新型智能匹配合租APP,为合租群体节约了寻找理想室友的时间,提升了生活幸福感,并将所收集到的数据用以在未来构建健全的合租信用体系,最终推进我国合租产业的绿色发展。
[关键词]智能匹配;TF-IDF;区块链;合租
[DOI]10.13939/j.cnki.zgsc.2021.27.185
1 引言
中国迅速扩张的城市化建设使得房价越来越高,越来越多的人由于没钱买房而加入租房的行列,租房趋势由单租转为合租。而在合租中往往由于性格不合、生活习惯、公共用品放置、水电分摊不均等问题而产生矛盾。文章将智能匹配与区块链技术应用到合租概念上,打造一个真实、可信、高效、良性循环的合租系统,利用机器学习构筑便利合租,匹配心仪室友,减少因合租引起的矛盾。
2 系统简介
基于机器学习的智能匹配合租室友系统应运而生,使有合租需求的用户匹配到自己理想的室友,获得更好的合租生活体验。
租客只需在平台上填写自己的性别、目标房源区域、生活作息时间、爱好,并且描述理想室友的条件要求等信息,系统便会运用机器学习算法进行智能匹配,筛选过后将比较符合的目标室友推荐给租客。租客与租客便可以在平台上进一步沟通,一旦确认成为合租室友,可商量一同选择房屋。
具体现状如表1所示。
3 系统设计构思
3.1 核心技术
3.1.1 TF-IDF算法
TF-IDF技术用于评估词语对于文档集或语料库中文本的重要程度。[1] TF-IDF值较高的词项对文本的语义贡献较大,重要程度较高,能最大程度代表当前的文本。[2]
本平台使用TF-IDF算法提取用户个人和理想室友信息的关键词,形成用户画像。在平台上注册的用户,根据提示填写自己的目标地点区域、生活作息时间、兴趣爱好,用几句话来形容自己的性格,以及描述期望的室友的特征和要求。在获取用户信息后,将这些信息放入数据库中,并对数据库进行加密。进一步对输入信息进行自然语言处理,接着使用TF-IDF算法计算用户相似度,再定义阈值形成用户目标群反馈给相应的用户。
3.1.2 区块链智能合约系统
本平台将利用智能合约系统,将用户同意本平台协定这一指令纳入合约当中,当指令触发后,系统将自动弹出剩余佣金的支付界面。在用户完成剩余佣金支付后,方可与匹配成功的室友进行后续合租签约,否则系统将不会提供所匹配室友的信息。运用此技术可以避免因用户自身隐瞒信息导致合租双方产生矛盾,或由于其他无关本平台责任的纠纷产生。
3.2 操作流程
(1)有合租意向的用戶点击找室友功能后,在认证界面实名注册, 系统会将信息上传到公安系统中来核实用户的实名信息。
(2)实名验证后,系统会弹出信息界面。信息界面要求填写用户的姓名、性别、联系方式、目标区域、作息时间、兴趣爱好、性格描述和想要的室友类型。此信息页面连接数据库,用户所填写的信息全部录入一个加密数据库中,保障用户信息安全。接着利用机器学习的相关算法,对用户提供的信息进行处理。
具体操作如下:第一步,筛选目标地点区域,保留具有相同目标地点区域的用户群。第二步,对具有相同目标地点区域的用户群进行生活作息时间的相似度计算,给定相似度阈值,大于阈值的保留。第三步,将用户群中的每一个用户期望的室友特征和要求与用户群中的其他用户的性格、兴趣爱好做相似度计算,给定阈值,大于阈值的保留。第四步,形成符合用户要求的匹配用户群。
(3)用户群找到后,系统会提示用户支付部分报酬。
(4)支付成功后,系统将匹配出的符合的用户群的姓名、性别等相关信息反馈给用户。
(5)用户与用户群中的用户通过匿名的方式在本系统提供的界面来进行相互沟通了解,整个过程将在聊天机器人的监管之下进行。为避免私下交易,禁止用户聊天时向对方提供联系方式。
(6)用户通过沟通确定理想室友后,须同意本系统通过智能合约设立的协定(所有个人信息必须绝对属实、凡是双方在合租期间发生的无关本平台的纠纷,例如房源或者个人信息隐瞒谎报、合租中发生的问题等均与本平台无关)。在同意后双方可进一步对合租问题进行沟通,平台服务基本完成。
(7)双方合租一段时间后,对合租室友进行回访打分。若对室友不满意,在打分的同时,需要填写一些私密信息,描述对室友不满的地方,系统会根据获得的信息对用户添加缺点标签,方便下次的室友匹配。
4 结论
智能合租平台系统利用机器学习技术实现找室友服务,能够智能匹配与用户生活作息、爱好更为相似的室友,并且按照用户所期望的室友特征进行筛选,优化算法使匹配更精准。对比现有的租房平台上的找室友功能,本平台的服务更加高效,能够解决用户找不到合适室友的痛点。在为用户匹配合适的合租室友的这一过程中,为用户提供在平台上与其他用户私聊的功能,便于合租双方更好地对彼此进行了解。同时为了防止相关违背法律的事情发生,平台在每个聊天室设置机器人,监控双方的谈话内容,减少本平台的运营风险。在用户双方选择成为合租室友相处一段时间后,系统会为用户提供回访打分服务。在此环节,用户双方互相评价,平台系统会将这些评价进行分词选择,记录在每个用户的个人标签中,优化合租室友的再次匹配选择。
参考文献:
[1]武永亮,赵书良,李长镜,等.基于TF-IDF和余弦相似度的文本分类方法[J].中文信息学报,2017,31(5):138-145.
[2]赵士杰,陈秋. 基于语义和TF-IDF的项目相似度计算方法[J]. 计算机时代,2015,29(5):1-6.
[3]刘薇.区块链智能合约的法律性质[J].法治论坛,2020(2):69-81.
[基金项目]2020年度上海立信会计金融学院大学生创新创业训练计划(项目编号:S202011047099X)。
[作者简介]何奕,女,汉族,江苏连云港人,上海立信会计金融学院大学本科在读,研究方向:金融科技;韩雨桐,女,汉族,天津人,上海立信会计金融学院大学本科在读,研究方向:金融科技;白瑶,女,汉族,甘肃平凉人,上海立信会计金融学院大学本科在读,研究方向:金融科技;周世杰,男,汉族,四川雅安人,上海立信会计金融学院大学本科在读,研究方向:金融工程、金融科技;施泽仁,男,汉族,宁夏银川人,上海立信会计金融学院大学本科在读,研究方向:金融工程、金融科技、金融数学;王江盼,女,汉族,河北石家庄人,博士,讲师,上海立信会计金融学院金融科技学院,研究方向:信用评价、金融科技。