基于多源数据融合的档案情景化推荐服务研究

2021-01-11 23:17
数字通信世界 2021年10期
关键词:使用者情景模块

王 静

(云南省地方病防治所,云南 大理 671000)

在信息时代,考虑到海量的数据和信息归档服务,“4V+1C”的特性呈现:数据量大(volumes)、数据类型多样(diversity)、数据密度低值(values)、高速的计算速度(speeds)、复杂(complex)的数据结构,使得文件管理员难以在复杂多样的数据环境中聚合高质量的信息数据,数据处理变得困难,并影响文件资源利用效率。因此,对各类档案数据进行高效的处理和分析,提取不同类型、不同结构、复杂多样的数据的有价值信息,是档案管理提升服务功能的重要保障。80年代中国学者开始关注情景化推荐模型,在政府、大学和科研院所的支持下,情景化推荐被作为计算机科学领域的重要工程项目。计算机科学、信息科学和数学领域的科学家已经开始研究和实践整合多源数据的技术。

1 情景的含义及分类

1.1 情景的含义

把面向文件的业务场景,界定为影响用户实时数据需要的时刻、场所和环境,例如使用文件数据资源的用户环境,按照文件数据资源的特性和用户需要来做。涉及的内容包含了知识偏好、阅读习惯和文件资源使用、学习时间安排等。

1.2 情景分类

(1)用户情景。用户情景是指有关用户在使用文件资源,或者通过数字系统搜索资料时的状态或者行为所设置的场景信息。因此,假设用户正在学习并利用文件中的资源,他们是否想要自信地锻炼或玩耍,如何在训练或玩耍期间作出决定等。任何这些场景元素,都会影响用户的注意力。时间分配和行动决策是影响归档服务情景推荐的重要变量。

(2)位置情景。位置情景是用户在检索文件资源时所在的位置,进行用户位置场景描述,生成的场景信息与用户位置相关。例如,如果用户在学校或在家使用文件功能和位置,则它包括用户所在的城市、位置类型(家、学校、社交聚会等)以及等待的人的状态。

(3)时间情景。主要代表用户花在文件上的时间和他们花在文件上的时间,时间情景用来描述用户的习惯和行为偏好(比如晚上),用户在不同的时间是数字的,需要信息。他们更注重休息时间的休闲娱乐,更注重工作时间与工作相关的档案信息。

(4)环境情景

环境情景是用户需要通过场景选择系统运行的场景。描述了使用者的生活环境信息,如气温、自然景观、气候和湿度。用户通常处在不同的工作环境中。在设计情景化的推荐系统时,必须从多种视角考虑环境因素,才能掌握采用数字推荐系统的使用者的实际状况,及其对收集与更新文件资料的需要。

(5)设备情景

设备情景描述了供用户接收文件资源的数字移动互联网技术设备,如手机、智能平板计算机以及移动互联网阅读器。设备情景图描述了以下二个主要方面。一是硬件设施信号方面,如数字装置的信号显示方式、设备形状等。另一种则是设备的网络应用信息,包含了设备的硬件上网模式、网络显卡、上网传输效率、网络型号等信息,它精确定位了应用需求,以数字信息的形式识别情景信息设备,与设备共享。

1.3 用户个性化情景的确定

目前对用户定制情景的科学研究涵盖了整个图书馆使用情景作为研究课题,而对用户定制情景的研究不足,因此情景推荐和用户定制需求与结果存在一定的不一致。在数字信息推荐过程中,应根据用户所处的时间、环境和位置来确定情景信息推荐。有些科学家认为这些因素很重要,有些用户认为它们不重要,有些用户认为时间、地点和其他因素很重要。

2 多源数据融合的理论基础

2.1 多源数据融合的内涵

多源数据融合是指运用各种计算工具和大数据技术,对相关数据类型、结构和值进行收集、分类、研究和分析。对类型数据作出科学、客观地评价与分类,以最终获取更高质量的信息资料。多源数据合并的主要目的,是对不同类别、不同结构、不同内容的数据进行更广泛的优化,以吸收不同源数据的好处,作为个体更可靠、评价低的规模数据符合决策管理要求,使面向用户的数据服务更科学、更有价值、更科学的数据。

2.2 多源数据融合技术与多源数据融合系统

根据当前的科学研究,多源数据融合技术是一门对多源数据进行综合分类、运算、提取与管理的数据处理技术。对数据资源的深入发掘、分析与总结,使数据相互互斥,连接的有机整体让信息分析师更加方便地全面掌握数据。采用了多源数据融合技术的多源数据融合管理系统主要应用于政府信息情报服务。该系统主要由二部分构成:分布式的信息处理模块和数据识别模块。分布式数据处理模块功能对各种数据结构和类型实现分布式数据处理和融合重构,以及使用算法工具对各种数据类型实现深度分析,是一种客观、准确的决策服务,创造了科学、有效、高质量的信息数据。

2.3 多源数据融合的实践意义

多源数据融合技术,反映了人类对多渠道、多用途数据采集的需要,是计算机技术发展实践的重要成果。经过不断的科学研究与信息实践,图书馆与政府信息部门都已证实了多源数据融合技术的高安全性与有用的应用能力,以及多源数据融合作为一种新兴信息技术的高可用性。这些数据融合技术和传统的数据应用有着根本性的差异。通过分布式数据处理与数据识别系统,人们能够准确鉴别多种数据源,并对各种数据源的数据结构和类型进行分析和评估。融合技术在社会实践中,多源数据融合技术有助于人类探索数据的价值,发现数据规律的变化,从而认识数据的内在关系。

3 基于多源数据融合的档案情景化推荐模型构建

目前,大部分场景化推荐系统都是通过对应用场景的一般感知的信息推送活动,而绕过了对应用个性化场景信息的解析。所以,场景化推荐文件中需要通过对用户个性化场景的详细分析,来建立场景化推荐模式。

3.1 自定义情景分析模块

本模型的首要功能是从各种应用情景信息中,寻找对于用户数字阅读能力影响较大的应用场景元素。即对具体的个性化情景作出有针对性的分析,以找到实际需要。把当前场景的节点和实际自定义场景加以对比,从而整理信息并准确判断使用者的喜好。通过文件系统中的传感器,以及RFID技术可以达到对用户当前情况的感知。多源数据融合系统从不同角度整合用户信息,并使用数据库记录实际的系统使用情况并评估具体的行为和情景信息。数据评估模式最初基于用户、数字和情景信息。从各个角度寻找信息的共性,结合存储的用户语境数据,形成多维语境历史评估数据链接,获得对用户需求的准确洞察和分析,并从不同角度的用户确定自己的阅读行为偏好和习惯。该模块是用户情景识别的基础,需要分析文件的情景推荐模型。它也是融合多源数据的重要数据源,是建立情景推荐模型的基础。

3.2 多源数据合并推荐模块

多源数据推荐模块是情景推荐模型中最重要的部分。该模块首先准确识别用户的个人资料,从各种情景信息中分析用户的自定义场景,根据用户的个性化场景接收各种来源的数据,并使用算法工具,精准匹配具体的定制化需求分析。根据实际的情景需求从多个来源发送数据。这些来自多个来源的数据包括基于用户自定义情景的天气、位置和环境信息,以及基于用户情景对用户的推荐,例如文件日志记录和常用词汇信息、个性化数据资源等最新信息,获取合并不同来源数据的建议,尽可能满足用户需求。

3.3 用户与多源数据推荐系统交互模块

用户交互模型和多源数据推介管理系统都属于场景化推介模式的一部分,而文件使用就是多数据推介管理系统业务的主要目标,使用者在整个文件使用流程中指挥着多数据推介管理系统。操作系统根据使用者的状态信息,从多种来源准确地向使用者发送业务数据,而使用者目前正在接受他们对业务图和操作系统的建议结果。多源评分以及上传数据仓库,动态更新情况,并归档为用户服务评分。在由多个来源与配置用户和数据提供服务系统的模块互动时,文件及时掌握用户需求动向,准确分析使用者需求,并时刻看到服务质量评价体系的成果,助一臂之力。

4 结束语

档案情景化推荐模式大大提高了文档服务的有效性,解决了使用者的各种业务需要,也增强了文档服务系统的准确性与科学性,为使用者提供基于其认知需要的基于文档内容的服务,也十分重要。用户通过智能大数据技术的档案数字全景归档服务在构建推荐模式的基础上,按照用户行为偏好运行智能归档服务,有效定制多源数据,服务档案管理有助于提升归档效果。

猜你喜欢
使用者情景模块
28通道收发处理模块设计
情景交际
“选修3—3”模块的复习备考
设计让您在喜爱的虚拟世界中自由奔跑
石化企业情景构建的应用
新型拼插休闲椅,让人与人的距离更近
楼梯间 要小心
抓拍神器
把美留在心里
集成水空中冷器的进气模块