融合多重特征词嵌入的农业实体命名识别研究

2023-11-15 05:56丁浩孔令圆刘清胡广伟
现代情报 2023年11期
关键词:自然语言处理

丁浩 孔令圆 刘清 胡广伟

摘 要: [目的/ 意义] 本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/ 过程] 通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层, 充分考虑字符的位置信息和上下文语义信息, 并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征, 同时采用双向长短时记忆网络BiLSTM 和多头注意力机制来学习文本的长距离依賴信息, 再利用条件随机场CRF 获得全局最优标注序列。[结果/ 结论] 本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验, 模型的Precision 为92 2%, Recall 为92 0%, F1 值为92 11%, 均优于其他基线模型, 说明本文模型对于中文农业命名实体识别更精确。

关键词: 自然语言处理; 命名实体识别; 农业文本; 信息抽取; BiLSTM; CRF

DOI:10.3969 / j.issn.1008-0821.2023.11.011

〔中图分类号〕TP391 1 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 11-0135-11

猜你喜欢
自然语言处理
基于LSTM自动编码机的短文本聚类方法
自然语言处理与司法案例
国外基于知识库的问答系统相关研究进展及其启示
基于依存句法的实体关系抽取
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
词向量的语义学规范化
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析