基于知识图谱的包装产业大数据智能问答系统研究

2019-08-12 02:35黄贤明
现代电子技术 2019年14期
关键词:知识图谱大数据

黄贤明

摘  要: 為了提高包装产业大数据分析和信息化管理能力,提出一种基于知识图谱的包装产业大数据智能问答系统设计方法,结合大数据挖掘技术和知识图谱特征提取技术,实现包装产业大数据智能融合和优化问答检索。构建包装产业大数据分布结构模型,采用关联规则调度方法进行大数据自适应融合调度,实现包装产业大数据的分块区域匹配,提取包装产业大数据的知识图谱集,对提取的包装产业大数据知识图谱采用子空间融合技术进行信息聚类处理,实现包装产业大数据的智能问答和检索设计。采用程序加载控制方法,将算法加载到DSP集成信息处理器中,实现包装产业大数据智能问答系统的集成开发。测试结果表明,该系统能有效实现包装产业大数据智能问答,大数据图谱的特征表达能力较强。

关键词: 知识图谱; 包装产业; 大数据; 智能问答系统; 分块区域匹配; 信息聚类处理; 集成开发

中图分类号: TN919?34; TP399                 文献标识码: A                    文章编号: 1004?373X(2019)14?0148?04

Research on big data intelligent question answering system based on

knowledge map for packaging industry

HUANG Xianming

(College of Computer, Hunan University of Technology, Zhuzhou 412007, China)

Abstract: A design method of the big data intelligent question answering system based on the knowledge map for the packaging industry is proposed to improve the big data analysis and informatization management abilities of the packaging industry. The big data mining technology and knowledge map feature extraction technology are combined to realize big data intelligent integration and question answering retrieval optimization of the packaging industry. The big data distribution structure model of the packaging industry is constructed. The big data adaptive fusion scheduling is conducted by adopting the association rule scheduling method, so as to realize partition region matching of the packaging industry big data, and extract the knowledge map set of the packaging industry big data. The information clustering processing is conducted by using the subspace fusion technology for the extracted big data knowledge map of the packaging industry, so as to realize big data intelligent question answering and retrieval design of the packaging industry. The algorithm is loaded into the DSP integrated information processor by using the program loading control method, so as to realize the integrated development of the big data intelligent question answering system for the packaging industry. The test results show that the system can effectively realize big data intelligent question answering for the packaging industry, and has a strong feature expression ability of the big data map.

Keywords: knowledge map; packaging industry; big data; intelligent question answering system; blocking area matching; information clustering processing; integrated development

0  引  言

随着包装产业的快速发展,大量的包装产业大数据通过知识图谱的形式存储于网络空间中,为包装的设计和信息资源调度提供参考。因此,需要对包装产业大数据进行智能问答和优化调度,挖掘包装产业大数据的知识图谱特征;并结合云计算技术进行包装产业大数据的自适应调度和优化挖掘,提取包装产业大数据的关联规则特征量,以提高包装产业大数据的智能调度和问答检索能力。对包装产业大数据智能系统设计的关键是进行包装产业大数据的知识图谱挖掘和信息重构,提取包装产业大数据的图谱特征,采用大数据信息融合技术实现包装产业大数据图谱挖掘,并对提取的包装产业大数据知识图谱采用子空间融合技术进行信息聚类处理,实现包装产业大数据的智能问答和检索设计[1]。根据上述分析,本文提出一种基于知识图谱的包装产业大数据智能问答系统。最后通过仿真实验进行性能测试。

1  包装产业大数据结构分析和特征重组

1.1  包装产业大数据结构分析

为了实现对包装产业大数据智能问答的优化设计和知识图谱提取,采用样本均值检验进行包装产业大数据深度挖掘和稳定特征[2],构建一个模糊约束状态方程表达包装产业大数据的信息流模型为:

[xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn]        (1)

式中:[h(·)]为包装产业大数据分布式知识图谱特征序列;[ωn]为包装产业大数据的量化融合误差。

构建包装产业大数据的关联规则知识库[3],采用分组样本检测和回归分析方法,进行包装产业大数据的非线性序列重组,得到一个包装产业大数据的统计分析线性组合模型为:

[xk=n=0N/2-12ancos2πknN-bnsin2πknN        k=0,1,2,…,N-1]    (2)

式中,[an]表示包装产业大数据线性规划特征集。

1.2  数据特征提取

设有m个包装产业大数据节点[A1],[A2],…,[An],结合线性规划模型进行大数据图谱特征挖掘的全局寻优[4],构造包装产业大数据知识图谱提取的模糊学习数学表达如下:

[min f=i=1mj=1nCijXij]          (3)

假定当前包装产业大数据的知识图谱关联规则项挖掘节点的数目为[n],[N1,…,Nn],采用多元线性回归分析方法,结合匹配相关检测方法进行包装产业大数据的信息融合处理[5],输出挖掘规则向量集表示为:

[ρIt=1NIs(i,t)V=NIV,ρRt=1NRs(i,t)V=NRV] (4)

式中,[NI],[NR]分别表示包装产业大数据的平均互信息特征量和状态分布集。

2  包装产业大数据智能问答优化的知识图谱提取

2.1  大数据的分块区域匹配

采用样本均值检验进行包装产业大数据的知识图谱提取[6],输出知识图谱提取的雅可比矩阵[J(x)]:

[J(x)=?v1(x)?x1?v1(x)?x2…?v1(x)?xn?v2(x)?x1?v2(x)?x2…?v2(x)?xn?????vN(x)?x1?vN(x)?x2…?vN(x)?xn]    (5)

在有限论域内实现包装产业大数据挖掘,大数据的分块区域匹配值为:

[wji(k+1)=wji(k)-α?F?wji] (6)

根据大数据的分块区域匹配结果,进行包装产业大数据的谱特征提取,提高包装产业大数据的智能问答和检索能力[7]。

2.2  包装产业大数据的智能问答

包装产业大数据智能问答和均衡调度的边界收敛条件为:

1) [limn→∞supfn(x)-fn(y)>0],[?x,y∈S,x≠y];

2) [limn→∞inffn(x)-fn(y)=0],[?x,y∈S];

3) [limn→∞supfn(x)-fn(y)<0],[?x∈S,][?y∈P(f)]。

当[?ε>0,?N>0],得到知识图谱的统计特征量解析的优化解为:

[min0≤αi≤cW=12i,j=1lyiyjαiαjK(xi,xj)-i=1lαi+bi=1lyjα]        (7)

式中,[(xi,xj)]表示多元线性回归统计特征。通过线性凸函数控制,对提取的包装产业大数据知识图谱采用子空间融合技术进行信息聚类处理,实现包装产业大数据的智能问答和检索设计[8]。

3  系统设计与实现

平台采用LabWindows/CVI进行代码资源开发,在嵌入式Linux环境中进行包装产业大数据智能问答系统开发[9]。采用ADSP?BF537设计内部时钟振荡器,进行包装产业大数据智能问答系统的时钟采样,通过JTAG调试接口进行包装产业大数据智能问答系统的实时性程序讀写和A/D转换控制,得到系统的实现流程如图1所示。采用ADSP?BF537BBC?5A实现包装产业大数据智能问答系统原始信息采集,选择ADI公司的A/D和D/A实现上位机通信和总线控制,得到系统的硬件实现如图2所示。

4  实验测试分析

对包装产业大数据智能问答系统的实验采用Web协议设计规范进行,结合Matlab设计进行算法处理,对包装产业大数据采样的数据样本集为1 024,数据的长度为2 000,数据采样的时间间隔为0.65 s,知识图谱采样的频率为10 kHz。根据上述仿真环境和参数设定,进行包装产业大数据的知识图谱挖掘,得到原始数据如图3所示。

分析4得知,采用本文方法进行包装产业大数据挖掘,能有效实现包装产业大数据知识图谱提取。测试智能问答的准确性,得到均方根误差对比见表1。

5  结  语

本文提出一种基于知识图谱的包装产业大数据智能问答系统设计方法,结合大数据挖掘技术和知识图谱特征提取技术,实现包装产业大数据智能融合和优化问答检索。构建包装产业大数据分布结构模型,采用关联规则调度方法进行大数据自适应融合调度,实现包装产业大数据的分块区域匹配,提取包装产业大数据的知识图谱集,实现包装产业大数据的智能问答和检索设计。研究得知,本文设计系统能有效实现包装产业大数据智能问答,大数据图谱的特征表达能力较强,挖掘效果较好。

参考文献

[1] 李涛,王次臣,李华康.知识图谱的发展与构建[J].南京理工大学学报(自然科学版),2017,41(1):22?34.

LI Tao, WANG Cichen, LI Huakang. Development and construction of knowledge graph [J]. Journal of Nanjing University of Science and Technology, 2017, 41(1): 22?34.

[2] 刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582?600.

LIU Qiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques [J]. Journal of computer research and development, 2016, 53(3): 582?600.

[3] 毛文涛,田杨阳,王金婉,等.面向贯序不均衡分类的粒度极限学习机[J].控制与决策,2016,31(12):2147?2154.

MAO Wentao, TIAN Yangyang, WANG Jinwan, et al. Granular extreme learning machine for sequential imbalanced data [J]. Control and decision, 2016, 31(12): 2147?2154.

[4] 李永刚,张治中,李龙江.一种WLAN与eHRPD系统间负载均衡算法[J].微电子学与计算机,2017,34(1):44?47.

LI Yonggang, ZHANG Zhizhong, LI Longjiang. A load?balancing algorithm in the WLAN and eHRPD hybrid system [J]. Microelectronics & computer, 2017, 34(1): 44?47.

[5] 李建勋,佟瑞,张永进,等.基于趋势面与SSIM的时空数据相似度算法[J].计算机工程,2018,44(9):52?58.

LI Jianxun, TONG Rui, ZHANG Yongjin, et al. Similarity algorithm of spatio?temporal data based on trend surface and SSIM [J]. Computer engineering, 2018, 44(9): 52?58.

[6] 卢凤,李海荣,韩艳.基于时空相似度感知的Web服务QoS协同过滤推荐[J].计算机工程,2017,43(4):28?33.

LU Feng, LI Hairong, HAN Yan. QoS collaborative filtering recommendation of web service based on spatial and temporal similarity sensing [J]. Computer engineering, 2017, 43(4): 28?33.

[7] 张景祥,王士同,邓赵红,等.融合异构特征的子空间迁移学习算法[J].自动化学报,2014,40(2):236?246.

ZHANG Jingxiang, WANG Shitong, DENG Zhaohong, et al. A subspace transfer learning algorithm integrating heterogeneous features [J]. Acta automatica sinica, 2014, 40(2): 236?246.

[8] 唐万明,范朝元.基于Cadence的DDR源同步时序仿真研究[J].现代电子技术,2014,37(8):75?78.

TANG Wanming, FAN Chaoyuan. Research of DDR source synchronization time?sequence simulation based on Cadence [J]. Modern electronics technique, 2014, 37(8): 75?78.

[9] 刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582?600.

LIU Qiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques [J]. Journal of computer research and development, 2016, 53(3): 582?600.

[10] 高妮,贺毅岳,高岭.海量数据环境下用于入侵检测的深度学习方法[J].计算机应用研究,2018,35(4):1197?1200.

GAO Ni, HE Yiyue, GAO Ling. Deep learning method for intrusion detection in massive data [J]. Application research of computers, 2018, 35(4): 1197?1200.

猜你喜欢
知识图谱大数据
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索