基于机器学习的公文通推荐系统

2020-10-30 01:58唐怡然陈沿黄思行
科学导报·学术 2020年46期
关键词:推荐系统机器学习

唐怡然 陈沿 黄思行

摘  要:近年来,人们生活节奏的加快,人工智能领域发展迅速,机器学习逐渐受到大众的青睐,尤其是深度学习在图像、声音、自然语言处理等领域取得卓越成效。机器学习算法的表示能力大幅度提高。互联网时代逐渐崛起,尤其是随着信息传递的迅速,实时新闻的建设如火如荼,公文通的推荐更显得重要。一直被公认为信息量大、重要性难以判别的公文通自然也在改革的范畴。这既是一次难得的机遇,更是一场挑战。

关键词:机器学习;公文通;推荐系统

一、引言

机器学习算法能够处理高维和多变量数据,并在复杂和动态环境中提取数据中的隐藏关系。通过机器学习的算法能够实现在数据量和信息量庞大的公文通中筛选出更加精辟以及重要性更高的优质公文,并用一个推荐系统将优质的公文通展现给大众,更加方便了大众。

二、机器学习的简介

机器学习,通过自主学习大量数据中存在的规律,获得新经验和知识从而提高计算机智能,使得计算机拥有类似人类的决策能力。基于学习形式的不同通常可将机器学习算法分为监督学习、无监督学习以及强化学习三类:

(一)监督学习

给学习算法提供标记的数据和所需的输出,对于每一个输入,学习者都被提供了一个回应的目标。监督学习被用于解决分类和回归的问题。常见的算法有:决策树、人工神经网络算法、支持向量机、朴素贝叶斯、随机森林等。

(二)无监督学习

给学习算法提供的数据是未标记的,并且要求算法识别输入数据中的模式,主要是建立一个模型,对输入的数据进行解释,并用于下次输入。主要用于解决聚类和降维问题,常见的算法有:聚类算法、降维算法。

(三)强化学习

该算法与动态环境相互作用,把环境的反馈作为输入,通过学习选择能达到其目标的最优动作。强化学习这一方法背后的数学原理与监督、非监督学习略有差异。监督、非监督学习更多地应用了统计学,而强化学习更多地结合了离散数学、随机过程这些数学方法[2]。常见的算法有:马尔可夫决策过程等[3]。

机器学习作为人工智能发展最快的分支之一,其理论和方法已被广泛应用于各领域[4]。它是一门多领域交叉学科,学习算法多而抽象,不易理解掌握,容易导致教学理论与实践脱节。

作为人工智能的核心,机器学习的主要功能是使得计算机模拟或实现人类的学习行为,通过获取新的信息,不断对模型进行训练以提高模型的泛化能力[3]。由于机器学习具有强大的数据处理能力,该方法广泛应用于数据挖掘、语音识别、计算机视觉、信息推荐等领域。

三、基于机器学习的公文通推荐系统的重要意义

公文通是国家机关、社会团体、企事业单位处理工作,具有特定格式的文件.它是传达、贯彻党和国家的方针、政策,发布法规、请示和答复问题、指导和商洽工作,报告情况、交流经验的重要工具.国家行政机关的公文通是政令的基本载体,也是文书档案的母体.公文通处理工作,是机关文书档案工作的基础,档案的形式过程也就是公文处理的全过程.机关文书档案工作,是机关工作的组成部分,是维护机关历史真实面貌的重要工作,是提高机关工作效率和工作质量的必要条件.公文通质量如何,关系到机关工作的全局,也直接关系到公文下一步转化为文书档案的质量。[5]对此,基于机器学习的公文通处理工作起着至关重要的作用.机器学习的算法可以从信息量巨大的公文里面将重要性强的公文筛选出来,并通过一些渠道和方法将公文通推荐出来,这样就能够让人们在这快节奏的生活中,显得更加的便捷和消息获得的精确。对保证政府机关工作的正常有序运转,保证政令畅通发挥了重要作用。

四、基于機器学习的公文通推荐系统的问题

(一)公文通办理程序不熟

近来,办公室存在收到部门传真或呈报公文后,收文者不明处置程序,到处寻找受文对象,影响公文办结时限和机关形象。

(二)公文通审核把关不严

部分文秘人员只顾接收呈报公文,不审核公文内容、行文方式和是否确需政府办公室受理,[6]虽然机器学习可以进行推荐公文通,可是毕竟是选择的一些关键词或者句子,并不是进行全文的一个阅览和推荐,致使公文入口把关不严,影响办理质量。

(三)草拟公文内容不精

部分草拟公文存在情况不够清楚,观点不够鲜明,结构不够严谨,即使基于机器学习可以推荐优质的公文通,但是,有的公文,整体的内容和框架非常好,可是条理不够清楚,表述拐弯抹角,字词搭配不当,标点运用不妥等问题,对公文整体质量带来影响。

(四)校对公文细节掌握不到位

机器学习的算法会对筛选出来的文稿进行关键字词或者大体内容的提取,可只粗略阅读或而且不再进行校对,忽略发文校对关,致使发文日期、版面格式等细节出现错误。

(五)处理公文时限不清

受文办理都有时限要求,部分公文通超出办文时限,影响效率[7]。

五、结语

近年来人工智能方面受到了越来越多的关注。鉴于机器学习领域不断进行创新。

在自然语言理解领域,如何更好地利用知识和常识成为一个重要的研究课题。很多情况下,只有具备一定常识的情况下,才便于对机器做出更深入的解释和理解。在人机交互系统中需要相关领域知识,从而能更加准确地完成用户查询理解、对话管理和回复生成等任务,受益于类似人机交互系统通常需要相关的领域知识这一特点[8],提高了达到最终目的的可能性。

多数学者将领域知识引入到机器学习中,主要出于处理小数据场景或者提高性能的考虑。Rueden等人[9]首次提出知情机器学习(informed ML),对知识的类型、知识表示、知识转换以及知识与机器学习的方法的融合做出详细的分类说明.譬 如知识类型可分为:自然科学、处理流程、世界知识和专家直觉。在该框架指导下,用户可以逐步选择合适的知识类型、信息表示和融合算法实现对机器学习模型的传递信息,人机交互的表达方式,这样就可以更好的便于人们对公文通信息的了解和掌握,以便于更好的推荐出更加可靠和重要的信息。

除此之外,知识图谱具有海量规模、结构良好、语义丰富等优点,使其成为机器学习理解语言的重要背景知识成为可能。肖仰华团队针对词袋、概念、实体集和链接实体做出一系列的解释工作,探索性地帮助机器理解和解释概念。然而,大规模的常识获取以及将符号化知识植入到数值化表示的神经网路都缺乏有效手段,这些问题将得到普遍的关注和研究。如果当机器学习成为人机交互的一部分时,这必然是一个社会发生巨大发展和进步的一方面。总之,基于机器学习的公文通推荐系统的解决方案源于实用性的需求。

参考文献

[1]  Susto,G.A.,Schirru,A.,Pampuri,S.,McLoone,S.&Beghi,A.(2015).Machinelearningforpredictivemaintenance:Amultipleclassifierapproach.IEEETransactionsonIndustrialInformatics,2015,11:812-820.

[2]  郭一帆,唐家銀.基于机器学习算法的寿命预测与故障诊断技术的发展综述[J].计算机测量与控制,2019,27(3).

[3]  李勇.本科机器学习课程教改实践与探索[J].计算机教育,2015(13):63-66.

[4]  闵锋,鲁统伟《机器学习》课程教学探索与实践[J].教育教学论坛,2014(53):158-159.

[5]  赵萌欣,公文处理工作的意义和要求,1997年01期第111-67页.

[6]  陈齐慧,当前公文处理工作中存在的主要问题和对策[J].

[7]  李杰其,基于机器学习的设备预测性维护方法综述[J].

[8]  陈珂锐,孟小峰,机器学习的可解释性[J].

[9]  Rueden V L,Mayer s,Beckh K,et a1.Informed machine 1earning—towards a tax.nomy of exphcit integration of knowledge into machine learning[J].arxiv preprint,arxiV:1903.12394,2019.

猜你喜欢
推荐系统机器学习
数据挖掘在选课推荐中的研究
基于用户偏好的信任网络随机游走推荐模型
基于词典与机器学习的中文微博情感分析
基于个性化的协同过滤图书推荐算法研究
个性化推荐系统关键算法探讨
基于网络搜索数据的平遥旅游客流量预测分析
浅谈Mahout在个性化推荐系统中的应用
前缀字母为特征在维吾尔语文本情感分类中的研究
关于协同过滤推荐算法的研究文献综述
基于支持向量机的金融数据分析研究