大数据时代的到来,标志着信息技术已经跨越了数字化与网络化阶段,进入智能化处理阶段.由此引发的一个新的挑战就是知识的碎片化问题,表现为与特定主题相关的知识以文本、图像、视频、音频、图、网页等多模态跨模态的形式分散在多个数据源中,呈现出位置分散、模态多样、结构无序、内容片面、动态依赖的特点,由此造成日趋严重的“学习迷航、认知过载”和“只见树木、不见森林”等问题,成为构建智慧化知识密集型应用的一个瓶颈问题.因此,如何从多源、异质、时变的大数据中分析挖掘碎片化知识并融合成为知识图谱,是提升知识可用性和系统性的基础性关键问题,也是大数据、人工智能、知识自动化等领域面临的共性难题.
为此,《计算机研究与发展》推出“碎片化知识融合与应用”专题,介绍在此新领域中的实际案例,交流学术思想和研究成果,促进碎片化知识融合与应用的研究与发展.本期专题得到同行的广泛关注,通过公开征文收到15篇高质量投稿稿件,这些论文围绕不同应用领域阐述了碎片化知识融合与应用的研究成果,展现出大数据挖掘、机器学习、深度学习、知识图谱等方法在破解碎片化知识融合与应用难题方面取得的最新进展和前沿趋势.
本专题的审稿严格按照期刊审稿的要求进行,特邀编委先后邀请了二十余位相关领域的专家参与评审,历经初审、复审、终审等阶段,最终遴选出3篇高质量的论文入选本专题.内容涵盖了医疗知识图谱、视觉问答系统等应用,在一定程度上反映了当前国内学者在碎片化知识融合的代表性应用.
随着医疗大数据时代的到来,知识互联受到了广泛的关注.如何从海量的数据中提取有用的医学知识,是医疗大数据分析的关键.知识图谱技术提供了一种从海量文本和图像中抽取结构化知识的手段,知识图谱技术在医疗领域拥有广阔的应用前景.侯梦薇等作者的“知识图谱研究综述及其在医疗领域的应用”一文针对医疗领域大数据专业性强、结构复杂等特点,对医学知识图谱架构和构建技术进行了剖析;并分别针对医学知识图谱中知识表示、知识抽取、知识融合和知识推理这4个模块的关键技术和研究进展进行综述.此外,介绍了医学知识图谱在临床决策支持、医疗智能语义检索、医疗问答等医疗服务中的应用现状以及发展前景的展望.
结构无序、内容片面的碎片化信息以文本、图像、视频、网页等不同模态的形式,高度分散存储在不同数据源中,通过构建视觉问答系统实现对多模态碎片化信息的提取、表达和理解.王一蕾等作者的“基于深度神经网络的图像碎片化信息问答算法”一文研究包括图像特征提取、问题文本特征提取、多模态特征融合和答案推理各个流程的模型与算法.构建深度神经网络模型提取用于表示图像与问题信息的特征,结合注意力机制与变分推断方法关联图像与问题两种模态特征并推理答案.
利用群体智慧原理,将多个相互独立的聚类方法的结果进行聚合,可提高聚类结果的准确性.张恒山等作者的“基于群体智慧的簇连接聚类集成方法”一文提出基于群体智慧的簇连接聚类集成方法,首先使用群体智慧理论的独立性、分散性、多样性原则引导个体聚类结果的生成,然后提出基于连接三元组的聚类集成方法对个体聚类结果进行分组聚合,将分组聚合的结果再次进行聚合得到最终的聚类结果.实验结果表明,该方法可以提高集成聚类结果的准确性.
碎片化知识融合应用的领域非常多,本专题仅仅选择3个有代表性的应用进行尝试性的报道,以飨读者.最后,衷心感谢各位作者、审稿专家和编辑部的全力支持和辛勤工作,使得本专题得以顺利出版!