基于前后端分离的医学论文热词管理系统设计

2022-05-30 10:48王涛春梅晔陈建
电脑知识与技术 2022年21期
关键词:医学论文热词

王涛春 梅晔 陈建

摘要:论文中的热词能够反映当前的研究热点和方向,以医学论文为背景,设计了基于前后端分离的医学论文热词管理系统,实现获取论文热词并显示和统计学科领域热词等功能。使用Vue、SpringBoot、SpringCloud和微服务架构等搭建系统并实现前后端分离。设计了论文热词管理系统的业务流程及热词搭配算法,应用结果表明:该系统达到了设计目标,助力科研人员研究工作。

关键词:医学论文;热词;前后端分离

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2022)21-0011-04

开放科学(资源服务)标识码(OSID):

1 引言

随着社会知识快速更新迭代,从事科研工作的人员日益增多,学术论文数量急速增长。科研人员想了解某领域的研究热点或发展方向,需要花费大量的精力和时间去阅读相关论文,且有可能效果不佳,而通过了解某研究领域现有热词能够更加快速知道该领域的研究热点。此外,科研人员通过获取某篇论文中热词能够更快速了解该论文主要研究内容,从而能够更准确判断该论文是否值得阅读,提高文献阅读的效率。基于此,本文以医学研究论文为应用背景,结合Vue、SpringBoot和SpringCloud等技术,设计并实现了具有用户管理、论文上传、论文引用、热词管理和学科领域管理等功能的医学论文热词管理系统。

2 相关工作

现有的相关科技论文管理系统主要包含的功能模块为:论文管理、论文引用地址管理、论文学科管理、论文上传管理、用户管理模块、论文分析、其他系统接口等。对于系统的架构而言,目前主要采用传统的C/S模式,具有响应速度快等特点,部分采用B/S模式,开发成本较低,部署简单。但普遍具有如下局限性[1-2]:

1)现有基于C/S模式的论文管理系统维护困难,当需要对客户端进行功能完善或系统升级时需要对所有客户端用户重新下载并安装。同时,系统的并发连接数有限,限制了系统的广泛推广。

2)现有基于B/S模式的论文管理系统主要采用单一架构或者是垂直架构,当系统某个环节出现问题,可能导致论文管理系统整体瘫痪,甚至存在部分数据丢失等情况,且系统也存在并发连接数有限等情况。

3)数据利用效率不高,现有相关管理系统主要提供简单论文分类、上传下载和查询等功能,论文内容数据挖掘和分析有待进一步研究。

4)分工不明确,现有系统常采用前后端嵌套模式,开发人员需要同时负责前端和后端开发,开发效率相对较低,且系统合并相对困难。

本文采用的前后端分离技术,用户通过浏览器对医学论文热词管理系统浏览和操作,当系统升级更新后,用户只需进行页面刷新操作即可。同时,前后端分离使得每个开发人员任务明确,开发效率高。该系统后端采用微服务架构,系统中的不同功能模块划分为不同的微服务,且每个微服务模块可以独立运行,因此,该系统具有较好的健壮性。由于微服务架构支持的并发连接数和同时运行的用户的数是单体架构的数倍,所以该系统更适合大范围推广。此外,医学论文热词管理系统还具有对论文内容中的热词提取和统计分析功能,使得科研人员利用该系统能够更快速获得医学学科领域的研究热点以及相关论文的匹配度,从而更快获取需要的科技论文,助力科学研究。

3 系统业务流程

基于前后端分离的医学论文热词管理系统主要包括以下功能模块:1)用户管理模块:该功能模块实现用户管理,包括用户注册、信息更新等功能。为了保证系统中的数据安全,用户管理模块设计了3种类型的用户,每种类型用户具有不同的访问和操作权限;2)论文收集模块:该功能模板不仅保存论文资源本身,还收集论文其他信息,如论文的题目、论文作者、作者单位、期刊或会议名称、日期等信息。此外,该模块提供了对已上传成功的论文进行地址管理,从而保证了论文的上传下载功能;3)引用管理模块:论文引用是科学研究中的重要部分,所以本系统中的用户不仅可查看论文的基础信息,还可以对论文的引用信息进行导入导出操作,从而方便研究人员对相关论文进行引用等活动;4)热词管理模块:该功能模块能够对医学论文中的热词进行提取和分析,且能够将论文中的热词显示出来。为了方便研究人员的操作,系统提供了热词以表格形式导出的功能。5)医学学科领域管理模块:科学技术的发展,热点的学科领域随着时间的推移会有相应的变化,所以该功能模块提供了医学学科及研究领域管理的功能,使得论文上传用户能够快速找到论文所属的医学学科,保证了系统的易用性和实用性。系统功能模块如图1所示。

医学论文热词管理系统信息流来分析系统的业务流程,具体为:已注册用户或管理员上传医学论文,如果上传不成功则重新上传,上传成功后,用户完善医学论文引用及所属学科研究领域。上述操作完成后,用户可以再次确认论文文档是否上传成功,以及论文基本信息、引用信息和所属学科领域等信息是否完整。在此基础上,用户可通过论文所属分类信息对该论文中的热词进行提取和分析。如果不成功,则需要重新进行上述操作。图2所示为论文分析的一般的流程。

4 系统设计

医学论文热词管理系统采用前后端分离模式来构建系统,利用平均互信息的方法来判断单词之间是否有关联来确定热词。在此基础上,给出各功能模块的。

4.1 系统架构

医学论文热词管理系统采用前后端分离模式来构建,前端使用Vue构建,后端使用SpringBoot和SpringCloud的微服务模型架构。在分析业务流程的基础上,将不同的功能模块应用逻辑分布在不同的微服務模块中。前后端架构能够根据它们所属业务将它们安装在不同的平台上[3],从而使得前后端数据响应速度更好,维护人员只需负责其管理业务所属平台安全即可。如图3所示,一个前后端应用架构图主要包括客户端、页面层、交互层、后端及数据库层。

客户端层主要确定用户能够访问系统的设备种类,本系统可以使用PC或智能手机访问系统;前端UI层为呈现给用户的界面,用户可以通过界面进行交互式操作,如添加、修改或查询等操作;交互层主要是用来接收用户的操作请求并返回响应的回答,通过引入Ajax/Axios工具包实现Get或Post等发送给后端的操作请求,Vue-router进行路由页面的跳转;后端层负责处理某一特定领域的业务逻辑,它从交互层接收数据,经过适当处理后存储到数据存储设备中,或者从数据存储设备中读取数据,经过处理反馈到客户端,通过日志服务能够查询用户请求和操作;数据库层主要是负责将后端发送过来的数据进行查询或者存储,以防数据丢失,后端数据库为MySQL,系统通过Redis将一些查询频繁的数据放入到缓存中以提高查询速度。

医学论文热词管理系统采用前后端分离模式,在该开发模式中,后端开发人员专注业务逻辑,如添加、修改和删除等操作;前端开发人员专注页面设计和渲染[3]。Vue是一个轻量级的前端框架,能够快速地构建前端项目[4],且容易掌握,所以本系统利用Vue来构建。利用SpringBoot和SpringCloud来搭建微服务架构可以对不同业务逻辑功能进行划分和构建,同时每个微服务模块都可以独立运行[5],并且可以通过微服务架构中的自动化机制实现服务的独立部署。所以本系统后端采用此技术构建,其中SpringBoot框架设置多个自动配置类,后端开发人员通过开启配置使用相关功能类,从而使得开发人员不再需要进行样板化的配置,更加快速地实现项目框架的搭建,SpringBoot框架可以实现HTTP+JSON的轻量级传输,同时编写微服务接口[6];Spring Cloud提供一套完整的微服务解决方案,它是一个非常大的容器,能够将常用的微服务框架集成进来,从而能够有效地减少开发人员的工作量,Spring Cloud提供了一系列开发组件,即提供了中间件服务、服务发现和服务注册等,帮助开发人员快速搭建起一个分布式微服务系统[7]。

4.2 热词识别

医学论文中的词组搭配方法是热词提取和分析的关键技术。为了检测词组之间是否搭配,本文采用一种平均互信息(Mutual Information,MI)的方法来判断单词之间是否有关联的,互信息能够很好地反映词语之间的关联度量[8-9]。当词组之间的互信息值越大,说明这词组之间的相关性越大,反之则相关性越小。后端通过计算词组之间的互信息以确定其相关性,并通过比较相关性和系统阈值的关系来判断词组之间是否搭配。热词识别主要包括以下3个处理过程:

1)文本预处理:系统首先对上传的医学论文中的内容进行预处理,即将论文正文中的标点符号、公式和页眉页脚等字符去除。

2)重复词统计:利用平均互信息计算得出处理后文本中搭配的词组,并统计每种词组在论文中出现的频率。

3)热词识别:将统计后的候选热词词组与已经训练过的语料库进行对比,得到热词及热词个数[10]。

在热词识别基础上,系统基于时间和热词出现的频率得出一段时间内热词的热度值,再根据热度值对热词进行排序,从而实现热词排名功能,该功能为科研人员提供各学科领域的研究热点信息列表,从而助力科研人员的研究工作,提高工作效率。医学论文热词管理系统设计了多种热词组成:最小由1个单词组成的热词,最多由5个单词组成的热词,从而能够使得用户能够选择不同词组数量组成的热词。此外,系统的下一个版本将进一步优化算法,自动识别出不同单词数组成的热词排名,更加方便用户使用,智能化程度更高。系统按照该论文或学科领域中词组出现的频率进行排序,并将排序后的结果显示出来,同时,系统提供了热词导出功能,方便用户进行进一步处理。

4.3 功能模块

医学论文热词管理系统功能模块主要有:用户管理模块、论文收集模块、热词管理模块、论文引用模块和医学学科管理模块,如图5所示,其中论文收集模块和热词管理模块主要实现医学论文热词管理及分析功能。

用户管理模块该模块主要完成了用户注册及登录功能,更新用户信息或修改密码等功能,同时提供了用户信息显示功能。考虑到系统的安全性,不同类型用户具有不同的权限,为了方便用户使用,所有用户登录界面相同,系统自动识别用户类别,并根据用户类别显示相应的页面选项和功能模块。例如超级管理员具有所有操作权限,即各个模块的删除操作;一般用户除了具有上传和查看功能外,可以删除或修改用户自身上传的论文及相关信息,对其他用户提供的列表不能进行修改和删除操作。而未登录的游客没有访问系统及相关操作权限,系统自动跳转到登录页面,以供用户登录或注册,图6为用户登录界面。医学论文热词管理系统采用注册审核制,防止恶意用户注册,保证系统安全。

论文收集模块主要完成论文上传以及地址管理功能。用户通过系统上传医学论文文件,论文上传成功后,用户补充论文的题目、作者和期刊会议名等基本信息,以及论文引用等信息。此外,用户可以查看自己上传的论文及相应地址,并能够对论文文件及相应的信息记录进行修改和删除等操作,实现对论文管理。同时,系统提供论文文档和引用的下载功能,方便用户使用查看相关论文文档,且通过系统提供的引用信息实现论文的引用工作。此外,为了用户快速找到相关论文,系统提供了论文检索功能,用户通过关键词对论文进行检索,系统根据关键词显示查询结果,图7给出已上传论文列表及相应地址。此外,为了保证论文和相应信息的一致性,系统对论文文档及相应的信息进行关联,当用户删除某论文后,则与该论文关联的相关信息将自动被系统删除,反之亦然。

热词管理模块主要是对论文中的热词进行提取、显示、统计和下载。用户可以选择学科领域列表中某个研究领域的热词列表并进行查看,为了给用户提供更直觀统计结果,该模块以柱状图方式显示热词列表,如图8所示。此外,为了给用户提供更完整的热词信息,系统提供了热词下载功能,当用户选择某学科领域后,系统获取该学科领域的热词列表并以表格形式供用户下载,图8为由2个单词组成的热词统计结果界面。

随着时间的推移和技术的进步,学科领域是动态变化的,所以医学论文管理系统提供了学科领域动态管理模块,即系统提供了学科领域的显示、添加、删除和修改功能。此外为了保证论文所属学科领域的一致性,当删除某学科领域,则该领域的所有论文及相关信息自动被删除,当修改更新某学科领域,该学科领域内所有论文所属的学科领域名称信息自动更新,保证系统的正确性,图9为学科领域管理界面。

5 结束语

现有论文管理系统主要采用单体架构或垂直架构,普遍存在系统并发率不高,分工不明确等。基于上述问题,本文提出了一种基于前后端分离的医学论文热词管理系统。系统使用Vue、SpringBoot、SpringCloud和微服务架构实现前后端分离,提高了系统开发效率,且系统的可扩展性、可护性及可重用性等方面都有较好的结果。系统提供的热词管理功能能够辅助科研人员更加便捷快速获取学科领域中的研究热点和发展趋势,助力科学研究。

参考文献:

[1] 高华花.基于J2EE技术的毕业论文管理系统设计与实现[D].大连:大连理工大学,2016.

[2] 孙翱,赵锋,马丽,等.C/S架构下普通高校毕业生论文答辩随机抽取系统[J].今日科苑,2006(8):89-90.

[3] 王建,罗政,张希,等.Web项目前后端分离的设计与实现[J].软件工程,2020,23(4):22-24.

[4] 方生.基于“Vue.js”前端框架技术的研究[J].电脑知识与技术,2021,17(19):59-60,64.

[5] 张晶,王琰洁,黄小锋.一种微服务框架的实现[J].计算机系统應用,2017,26(4):82-86.

[6] 张峰.应用SpringBoot改变web应用开发模式[J].科技创新与应用,2017(23):193-194.

[7] 王方旭.基于Spring Cloud实现业务系统微服务化的设计与实现[J].电子技术与软件工程,2018(8):60-61.

[8] Kolesnikova O.Survey of word co-occurrence measures for collocation detection[J].Computación y Sistemas,2016,20(3).

[9] Han S Z,Shirai K.Unsupervised word sense disambiguation based on word embedding and collocation[C]//ICAART,2021(2):1218-1225.

[10] 耿升华.新词识别和热词排名方法研究[D].重庆:重庆大学,2013.

【通联编辑:谢媛媛】

猜你喜欢
医学论文热词
医学论文中引言的写法
医学论文中引言的写法
热词
热词
医学论文中引言的写法
热词
热词
热词
医学论文中引言的写法
医学论文实用性的判断