基于Web 3.0的医学资源库构建研究

2011-01-26 09:49许东民
中国医学教育技术 2011年4期
关键词:配置文件资源库个性化

陈 俊,许东民,蒲 实

成都医学院教育技术中心,成都 610083

随着高校网络教学快速、深入地发展,构建教学资源库成为网络教学的首要基础任务,也成为教育技术网络应用的重要课题。虽然各高校都进行了不同程度的资源库建设,但存在的问题不少,主要表现在:资源结构单一、查询不便、利用率低、动态性与共享性差,以及未实现个性化与智能化服务几个方面。

基于这些问题,该文借鉴Web 3.0的网络理念提出构建智能化医学资源库的设想。智能化资源库对学习者来说应该是一个开放的、动态的平台。资源库的内容不仅包括教师所提供的资源,还应包括学习者在学习过程中所产生的显性和隐性知识,如学习经验、常见问题以及潜在的智力资源等[1]。在内容的添加和查询方面,智能化资源库对不同用户提供的信息推荐和搜索过滤都是不同的,以真正体现网络的个性化智能服务。

1 Web 3.0的理念

互联网专家认为,对于普通用户而言,Web 3.0带来的最大好处就是让你拥有了一个贴身的私人助理。根据专家们的观点,Web 3.0时代网络对你无所不知,可以自主地在互联网上查询所有信息来回答任何问题[2]。许多专家把Web 3.0比做为庞大的数据库,如果说Web 2.0应用于互联网是为了把人与之间联系起来,而Web 3.0应用于互联网则是为了把信息与信息联系起来。Web 3.0的最大价值不是提供信息,而是提供基于不同需求的过滤器,每一种过滤器都是基于一个市场需求[3]。

今天,当用户使用互联网搜索引擎时,搜索引擎其实并不真正理解用户要搜索的东西。它只是简单地、机械地查找与搜索框中的关键字相关联的众多网页,而无法告诉某网页是不是真与你搜索的东西相关。换句话说,它只能告诉你关键字出现在该网页上,至于是否是用户所希望查找的东西则与我无关。Web 3.0时代是把整个互联网视为一个庞大的信息数据库,可以满足任何查询要求。用户只要发出一个很简单的指令,剩下的事情则交给互联网处理,互联网完全可以替用户做所有工作:它会根据用户的爱好确定搜索参数,以缩小搜索服务的范围;然后,浏览器程序会收集、分析数据并提供给用户,便于用户进行比较。浏览器之所以有这个本领,是因为Web 3.0能够“理解”网上的信息[2]。

借助Web 3.0,每个用户会有一个独有的互联网配置文件,该配置文件基于该用户的用户信息以及浏览历史记录所形成。Web 3.0会使用该配置文件为每个用户提供独特的浏览体验。这意味着,如果两个不同的人使用相同的服务,用相同的关键字在网上搜索,他们会得到由各自配置文件决定的不同搜索结果[2]。

Web 3.0采用智能整合的方式为用户提供一种方便管理资源和有效查找信息的全新服务模式,开启了高效、鲜活而且个性化的网络新时代[4]。那么,我们就可以利用Web 3.0的理念来构建智能化的资源库。将用户的爱好和资源本身的相关性作为设计的主要考虑因素,构建完备的内容聚合与应用聚合平台,创造出更加个性化、智能化、搜索反应迅速而又准确的资源库。

2 智能数据库应具备的特点

资源建设要以学习者为中心,能满足学习者个性化学习需要,使其成为开放的、动态的资源库,以促进知识的共享、交流与创新。Web 3.0的理念与服务对个性化资源库的建设有着非常重要的启发和指导意义。在传统的数据库基础上,我们可以加入更多智能化、个性化的元素[5],具体可以体现在以下几个方面:

2.1 书签资料库

系统根据用户个人资料及浏览历史可自动为每位用户创建个人书签,用户也可自行查看并管理。书签资料库通常按照“自定义书签”、“我的浏览历史记录”、“我的收藏”、“我的资源传递”等文件夹进行分类[6]。点击书签栏的条目名称即可访问与资料库相对应资源。

2.2 资源推荐

基于医学知识的相关性,系统在资源查询的同时,会提供给用户相关知识点的资源情况或关注情况,将原本相对独立的资源建立起关联,提高资源利用率。即,由原来资源“点”的关系变成了“面”的关系。

Web 3.0的核心软件技术是人工智能,它可以模仿、补充人类思维行为。因此,它具备较强的学习能力[5]。当用户浏览资源时,系统会根据该用户访问各类资源的次数和周期来判断其最感兴趣的资源。当再次访问资源库时,资源库就可以自动识别用户最喜爱的资源科目及类别,并结合用户自身信息、其他用户的信息使用情况将其显示为效果令人惊叹的图形预览墙,即资源浏览首选推荐[2]。这样,用户可高效地找到自己关心的资源并进行访问。随着访问次数的增加,系统会更了解用户,并为用户列出的资源目录中首选资源推荐会随之改变,以精确定位用户的兴趣并适应用户日益提升的品位。

2.3 资源防重复措施

在用户上传资料的同时,提供资源库里相关资料的存在情况和使用情况明细,这样可以防止资源的重复,节约资源库空间。同时,用户可以清晰地看见该类资源的库存情况,便于补缺,在不断完善中构建多元化资源库。目前,对于信息的相似度比较只能借鉴关键字的描述,未来信息的比较不仅限于此,而是可以对图形像素、视频截图进行比对,给出信息重复的建议就会更加精确。

2.4 语意搜索及可视化建议

对于搜索引擎来说,Web 3.0的到来就是智能语意搜索的到来[2]。智能搜索具有比较复杂的逻辑判断能力,能针对搜索人不同身份、不同要求而调整搜索结果及信息排列顺序,使搜索更加人性化和智能化。Web 3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的平台,用户可以透过Web 3.0的技术,非常高效地获取所需要的知识,“拼凑”出自己所需要的信息和电子服务平台[5]。当用户输入比较模糊的问题时,如“检验系大一本科的妇产基础”,搜索引擎立即返回给用户有关检验系大一本科学生应该学习的妇产科学中的检验科目相关内容。完全抛弃了现在网络的关键词搜索,实现真正的智能。另一方面,搜索引擎具有超强的纠错能力。对错别字、地方口语、模糊概念等都能够理解并给出用户想要的结果。如“上半身平片图”这样的搜索问题,引擎也能给出正确的胸部X光片资料图。

智能库下一步要解决的重点问题是可视化搜索。在搜索建议中应加入更加丰富多彩的内容,不仅仅是文字条目,而且应加入图片或视频性质的信息。这让我们可以有的放矢,从而能更加准确地查找出想要获得的内容。

3 构建智能数据库的思路、关键技术

3.1 构建智能化数据库的思路

智能化服务虽然是全球研究的热点,但在网上目前很难找到国内外关于智能化服务模型构建的相关报道,在仅有的一些报道中主要做法是提供个性化的服务和基于不同需求的过滤服务来构建智能化服务模型。其较成熟的过滤模型主要有布尔模型、向量空间模型和概率模型三种。无论是哪种模型都涉及到4个基本问题:用户兴趣如何表示,信息特征如何选择,如何计算信息和用户兴趣的相似程度,如何根据用户的反馈信息自动更新用户兴趣[7]。

图1 智能化服务操作模式框图

针对以上4个问题,并接合医学院校的实际情况,在充分分析各知识点间密切相关性的基础上,我们可以通过以下几个步骤来实现(如图1所示)。在用户个人信息录入的时候,先对其专业需求和所关注信息进行收集,以便构建一个用户基本信息模块。另一方面对用户的一些个性信息,比如用户经常访问的栏目、感兴趣的信息内容、网页停留时间、访问的频率等相关信息进行采集,构建一个用户个性信息模块。然后将两模块的数据进行统计、比较、分析,得出该用户独有的配置文件。根据此配置文件,结合Web 3.0的智能核心部分即信息集合体,系统就能够轻松地从数据资源库里选择适合的信息资料反馈给该用户,这种搜索结果将更加契合用户自身的需求。用户配置文件是动态更新的,随着个性信息的不断采集,分析次数的不断增加,配置文件会越来越迎合用户的心意,变得“聪明又贴心”。

3.2 关键技术

3.2.1 分析引擎 有相当多的用户提供的初始信息量明显不足,这是造成容易产生过滤结果偏差的主要原因。因此,系统必须根据各种方式补足用户信息,进行用户需求的扩展。用户需求扩展的方法很多,可分为基于语义的方法和基于统计的方法[7]。基于语义的方法是分析用户需求的含义,寻找语义上最相似的信息进行扩展,如同义词、近义词等。基于统计的方法由用户个性信息模块来完成,即对用户常访问的栏目、信息内容,某主题网页的停留时间、访问的频率等相关信息进行采集。在分析引擎中根据采样的统计结果对不同的信息乘以不同的权重,再配合用户基本信息需求就能计算出贴合心意的用户配置文件。某类信息访问次数越多,访问时间越长,则权重值越大,在配置文件中就越能被体现出来。

3.2.2 信息集合体 如何把数据库的资源联系在一起?系统如何知道每位用户应具备的知识结构,每个知识点是基于哪些基础知识点构成?显然,这些问题的解决完全取决于数据库的理解能力,它应该如同一本词典一样,定义了所有医学知识之间的联系,定义了很多词语之间的语义关联。我们将此模块称为信息的集合体,也叫做本体(ontology)。本体会以元数据(元数据是指网页代码中所含的人类看不见而计算机能读取的信息)的形式存在[1]。本体其实是一个文件,包含了很多的解释性信息。比如:“检验医学这个词语是对来自人体的材料进行生物学、微生物学、血清学、化学、血液免疫学、生物物理学、细胞学、病理学等检验[8]”。这样一句话就在这些学科之间建立了联系,一个检验系的用户在查看资源库时就可能得到许多生物学、病理学等方面的信息提示和搜索建议。又比如“X光片俗称平片”。当用户在输入“平片”时,资源库可以立刻理解为X光片。多个这样的元数据汇聚到一起就把整个医学之间的牵连勾画出来了。数据库实际上就会变成一个巨大的大脑组织,能够分析数据,并根据这些信息得出新想法。以至于当用户输入比较模糊的问题,如“检验系大一本科的妇产基础”时,搜索引擎也能立即明白并给出搜索结果。

3.3 难点

数据库搜索引擎要成为善解人意的帮手,本体内容就必须详细而全面。但构建本体需要大量的工作。实际上这也是智能化服务的重大障碍之一。医学发展到今天,各学科之间充斥着千丝万缕的联系,我们要把这一切知识点的解释和互相之间的联系都录入到本体不是短时间能够完成的,更不是几个人就能够做到的。本体的创建、维护和更新需要大量医学工作者长期不懈努力、积累才能逐步完善起来。

4 理论意义与应用价值

Web 3.0的提出迫使我们转变思想观念,从个性化服务、智能化管理的角度来构建网站。该文仅对Web 3.0的医学资源库系统进行了初步探讨,该系统的建设可解决当前教学资源在教学实践中普遍存在的诸如资源结构单一,资源库利用率低,动态性、共享性差,隐性知识缺乏[9]等问题。即,建立一个个性化、功能强大的师生共建、共享平台,更好地为用户提供丰富的、易获取的、确实需要的信息资源,实现教学资源的交互性及动态性增长。智能化资源库在医学中应用意义显著,它将医学各门类的信息联系起来,形成一个巨大的医学信息网,使医学真正成为一个整体。下一步我们研究重点是如何提高系统的理解能力和学习能力,如何自动生成资源的特征描述,尤其是如何对手术、病例等图像及视频信息特征的提取,使用户从手动输入资源特征信息中解放出来,实现进一步的智能化。

[1]百度文库.网上医学搜索引擎与网上医学数据库简介[EB/OL].http://wenku.baidu.com/view/1c4c324cf7ec4afe04a1 df8c.html,2010-09-18

[2]PHP100中文网.Web 3.0时代:网络对你无所不知[EB/OL].http://www.php100.com/html/phpnews/PHPxinwen/2010/0528/4607.html,2010-05-28

[3]中文业界咨询网.拥抱Web 3.0[EB/OL].http://www.cnbeta.com/articles/62523.htm,2008-08-17

[4]百度百科.Web 3.0[EB/OL].http://baike.baidu.com/view/269113.h tm,2010-10-19

[5]邢方,张林.Web 3.0技术发展对网络学习的启示[J].科技信息:学术研究,2008,25(16):7-8

[6]孙毅,王子鹏.从Web 3.0的角度畅想档案网络服务的未来[J].云南档案,2009,27(7):14-16

[7]于满泉,许洪波,赵章界,等.基于内容的个性化信息过滤系统的研究与设计[J].计算机工程,2005,31(12):78-80

[8]百度百科.医学检验学[EB/OL].http://baike.baidu.com/view/2557661.htm,2010-07-01

[9]臧玉春,刘春宇.高校校园网应用现状的分析与探讨[J].长春工业大学学报:高教研究版,2004,24(3):34-34

猜你喜欢
配置文件资源库个性化
从Windows 10中删除所有网络配置文件
健身气功开放课程资源库建设研究
用软件处理Windows沙盒配置文件
坚持个性化的写作
互不干涉混用Chromium Edge
基于Zookeeper的配置管理中心设计与实现
数控加工专业资源库建设中存在问题及对策
基于共享资源库的混合式教学考核模式研究
上汽大通:C2B个性化定制未来
高中历史信息化教育资源库应用探索