集成学习

  • 访问控制日志驱动的ABAC策略自动提取与优化增强
    。首先,构建集成学习模型,将用户行为和权限分配映射为策略逻辑树,识别访问授权决策的关联性及潜在规律,初步生成策略;其次,通過单属性优化和规则二元约简两种方法深度优化策略,简化策略结构并压缩策略规模;最后,提出基于误差度量的规则冲突解决方法,以增强互斥、完备的ABAC策略,并进一步基于多目标优化的策略性能平衡算法实现不同场景需求的最优模型选择。分别在平衡数据集和稀疏数据集上进行测试和验证,实验结果表明,该方法在平衡数据集上的准确性最高可达96.69%,可将策

    计算机应用研究 2024年2期2024-03-05

  • 基于自蒸馏与自集成的问答模型
    ;知识蒸馏;集成学习;BERT中图分类号:TP391.1   文献标志码:A   文章编号:1001-3695(2024)01-032-0212-05doi:10.19734/j.issn.1001-3695.2023.05.0281Question answering model based on self-distillation and self-ensembleAbstract:Knowledge distillation combined wit

    计算机应用研究 2024年1期2024-02-18

  • 基于机器学习的儿童颅骨畸形分类研究
    :颅骨畸形;集成学习;图像处理;分类预测0 引言(Introduction)颅骨畸形[1]并不仅仅是外观问题,更是影响儿童健康发育的重要因素。颅骨畸形会改变婴幼儿面部形态,严重的畸形可能影响大脑发育,造成发育滞后的问题。颅缝早闭[2]是导致颅骨变形的常见原因,全球每10 000名新生儿中就有3.1~6.4人患病。目前,我国对儿童颅骨畸形的诊断和治疗未有统一标准,诊断方法包括手工测量和CT临床检测以及近期出现的光学三维建模技术,手工测量和临床检测存在速度慢、

    软件工程 2024年1期2024-01-29

  • 基于集成学习的井漏智能预警模型及智能推理方法
    庆庆. 基于集成学习的井漏智能预警模型及智能推理方法[J]. 石油钻采工艺,2023,45(1):47-54.摘要:水平井优快钻井技术加快了长庆油田致密油气大规模开发速度,但由于部分区域地层孔隙和微裂缝发育,承压能力低,极易发生井漏风险,严重制約了水平井提速提效。为进一步降低井漏风险,提高漏失预警的时效性和准确率,提出了一种因果关系约束下的井漏智能预警及漏失原因推理方法。基于漏失产生机理,分析了漏失风险的表征参数及其变化规律,将其作为输入参数约束条件,利用

    石油钻采工艺 2023年1期2023-12-22

  • Correlation between travel experiences and post-COVID outbound tourism intention: a case study from China
    ;新冠肺炎;集成学习https://doi.org/10.1631/jzus.A2300057https://doi.org/10.1631/jzus.A2300057Yinan DONG, https://orcid.org/0000-0002-6275-6175Apr. 28, 2023;June 17, 2023© Zhejiang University Press 2023Feb. 1, 2023;Mar. 19, 2023;

    Journal of Zhejiang University-Science A(Applied Physics & Engineering) 2023年11期2023-11-18

  • 基于集成学习数据挖掘的离合器换挡控制研究
    艳摘要:通过集成学习算法全面学习双离合器变速箱(dual clutch transmission,DCT)換挡数据,并建立模型预测换挡控制器,以补偿转矩保障真实转速,可以实现对参考转速的精准追踪,进而实现DCT 换挡的智能控制。研究结果表明:在0.29 s 时DCT 出现降挡惯性相,稳定跟随目标转速,车辆冲击度的最大值是7.2 m/s3,符合设计需求。随着油门开度的不断增加,相较于其他控制策略,基于集成学习数据挖掘的模型预测换挡控制策略表现出很好的平顺性,

    电子产品世界 2023年9期2023-10-28

  • 基于迁移模型集成的马铃薯叶片病害识别方法
    迁移方式进行集成学习以快速识别马铃薯叶片病害图像的方法。首先,利用多种迁移方式(全部参数迁移、特征提取、微调及全新训练4种训练方法),通过调整超参数,使模型快速收敛达到全局最优点。其次,使用混淆矩阵对多种迁移方式的训练模型结果进行对比分析,微调模型识别准确率达到95.45%。最后,利用集成学习将3种训练较优的模型进行集成并与微调模型进行对比。通过试验建立了1个马铃薯叶片病害图像数据集,结果表明,相比现有热门神经网络模型,该数据集无论是识别准确率还是识别效率

    江苏农业科学 2023年15期2023-09-11

  • 基于 BO-XGBoost与集成学习方法的供应链金融信用评价研究
    ost算法的集成学习模型 BO-XGBoost-Bagging(BXB)。首先,基于XGBoost特征重要度进行特征筛选,建立供应链金融信用评价指标体系。其次,通过贝叶斯优化获得XGBoost的最优超参数,并结合 Bagging 算法得到集成模型 BXB。最后,在中小企业数据集上进行预测,通过实证研究验证信用评价模型的有效性。实证结果表明,BXB 模型相比其他模型具有更好的预测效果,能够更加准确、全面地对中小企业的信用风险进行评估,更好地区分风险企业和正常

    上海理工大学学报 2023年1期2023-06-30

  • 用于不平衡节点分类的集成图神经网络模型
    衡节点分类;集成学习中图分类号:TP183    文献标识码:A    文章編号:2096-4706(2023)03-0029-04Ensemble Graph Neural Network Model for Imbalanced Node ClassificationGUO Mengxin(Taiyuan Normal University, Jinzhong  030619, China)Abstract: To solve the classifi

    现代信息科技 2023年3期2023-06-22

  • 上市公司股价崩盘预警模型研究
    Cox模型与集成学习模型相结合,发现模型的预测性能显著提升。研究发现了股价崩盘在时序上的变化规律及风险预期,为企业持续经营与风险防范提供参考借鉴,有助于促进资本市场的平稳运行;风险预警模型的建立有助于利益相关者有效识别股价崩盘风险,在一定程度上保护股东和投资者的权益。关键词:Cox模型;股价崩盘;集成学习;风险预警中图分类号:F832.5        文献标识码:A        文章编号:1007-0753(2023)03-0070-09一、引言近年来

    金融经济 2023年3期2023-05-30

  • 基于机器学习模型的公司债券违约预警研究
    acking集成学习方法融合XGBoost、GBDT、随机森林模三種基本算法构建预测模型,对企业债券是否违约进行预测。实验结果表明:融合模型的预测精准率、召回率和F1度量指标的可靠性明显高于单一模型;各基学习器的学习能力越强,关联程度越低,模型融合后的预测效果越好。此外,净资产收益率ROE、资产负债率、票面利率、流动比率、资产净利率ROA是影响企业是否违约的重要关注指标。关键词:债券违约;预警模型;集成学习;重要指标中图分类号:F830.91       

    经济研究导刊 2023年1期2023-05-30

  • 基于随机森林的集成学习入侵检测方法
    于随机森林的集成学习入侵检测方法。通过K-means和SMOTE处理数据集获得相关度高的平衡数据子集,随机森林选择出最优的特征子集,基于树的集成学习方法分类结果。本文采用CICIDS2017数据集进行本文方法可行性的研究,结果表明本文提出的方法相比传统的单一机器学习方法具备更高的检测精度和更低的时间开销。关键词:随机森林;集成学习;入侵检测;机器学习中图分类号:TP18      文献标识码:A文章编号:1009-3044(2022)19-0087-021

    电脑知识与技术 2022年19期2022-08-31

  • 基于混合采样与Stacking集成的半潜式平台警报预测模型
    ;混合采样;集成学习中图分类号:TP18;U661             文献标识码:A文章编号:2096-4706(2022)06-0079-03Alarm Prediction Model of Semi Submersible Platform Based on Composite Sampling and Stacking IntegrationLI Zhili1, LIU Xinghui1, LI Yuan1, LU Xudi2(1.Shand

    现代信息科技 2022年6期2022-07-06

  • 基于集成学习的大学生心理健康服务系统的设计与实现
    预警中,采用集成学习算法的随机森林模型进行数据分析,为高校心理辅导老师提供辅助,进行智能预警。系统采用SSM框架、MySQL数据库等主流的开发工具与技术,界面简洁友好,性能良好。关键词:集成学习;心理健康;随机森林;学习策略中图分类号:TP311      文献标识码:A文章编号:1009-3044(2022)12-0046-02开放科学(资源服务)标识码(OSID):近年来,当代大学生的心理障碍问题日益突出,采用人工智能算法提前预判学生心理健康并及时疏导

    电脑知识与技术 2022年12期2022-05-29

  • 基于自动标签的城市信用画像系统的设计与实现
    基于标签结合集成学习算法实现了信用风险的自动预警,有效提升了信用监管工作的效率。关键词:自动标签;信用画像;集成学习;风险预警;系统中图分类号:TP391      文献标识码:A文章编号:1009-3044(2022)06-0001-03开放科学(资源服务)标识码(OSID):1 概述近年来,多地以信用信息平台为支撑,以推进诚信文化建设、建立守信激励和失信惩戒机制为重点,以联合奖惩、信用服务为主要手段,全面推进社会信用体系建设工作[1]。在大数据时代,汇

    电脑知识与技术 2022年6期2022-04-09

  • 一种基于高斯混合模型的不均衡分类方法
    集,最后利用集成学习进一步提升模型的泛化性能。实验结果表明,相比已有的一些处理方法,GMHSE可以提升不均衡数据的分类性能。关键词: 不均衡分类; 高斯混合模型;集成学习;混合采样中图分类号:TP3      文献标识码:A 文章编号:1009-3044(2022)02-0028-031 概述在数据挖掘的许多应用,例如医疗诊断[1]、欺诈识别[2]等,都存在着类别不均衡问题。当数据集中来自不同类的实例数量差距较大时,则该数据集存在类别不均衡问题,会限制学习

    电脑知识与技术 2022年2期2022-03-19

  • 基于特征选择集成学习的军事体育训练成绩分析
    结合特征选择集成学习模型一般步骤,建立基于特征选择集成学习的军事体育训练成绩分析模型。模型按照军事体育训练成绩的数据规范化准备,按照身体素质建立特征子集和基学习器,按动态权值构建集成学习模型三步完成模型构建。通过试点应用,在历史训练数据发现集成学习模型具有更高的预测效能和更好的可解释性。关键词:军事体育训练;特征选择;集成学习;数据预处理中图分类号:TP 181      文献标识码:A文章编号:1009-3044(2022)03-0081-03开放科学(

    电脑知识与技术 2022年3期2022-03-12

  • 基于集成学习的肺癌存活性预测分析
    型。关键词:集成学习;随机森林;十折交叉验证;癌症预后中图分类号:TP311     文献标识码:A文章编号:2096-1472(2022)-01-41-06Abstract: In China, lung cancer has the highest mortality rates among all of the malignant tumors. In order to improve the accuracy of lung cancer surv

    软件工程 2022年1期2022-01-04

  • 基于集成学习的乳腺癌生存预测研究
    库;乳腺癌;集成学习;预后预测中图分类号:TP181;R737.9             DOI:10.16375/j.cnki.cn45-1395/t.2022.01.0150    引言乳腺癌是女性中最常见的肿瘤之一,也是人类第二大致死癌症[1]。据2018年国际癌症研究机构调查的数据显示,全球女性乳腺癌的发病率为24.2%,位居女性恶性肿瘤首位,严重威胁着女性的身心健康[2]。对癌症患者生存数据的分析一直备受国内外学者的广泛关注。目前多数研究都是通

    广西科技大学学报 2022年1期2022-01-01

  • 推荐系统综述
    于记忆网络和集成学习的推荐系统为用户精确地推荐物品。本文将对基于矩阵分解、基于深度学习、基于记忆网络和基于集成学习的推荐系统进行分析和总结,展望未来的研究方向。關键词: 推荐系统; 矩阵分解; 神经网络; 记忆网络; 集成学习文章编号: 2095-2163(2021)07-0228-06中图分类号:TP393.01文献标志码: AA survey on recommender systemsZHAO Yan, LIU Hongwei(School of C

    智能计算机与应用 2021年7期2021-12-07

  • 基于集成学习的业务网络时延模拟
    提出一种基于集成学习的业务网络时延模拟算法。该方法首先采集业务服务所在局域网内的网络流量和时延信息,经数据预处理后,得到数据集。其次,基于Stacking集成学习方法,以随机森林为元学习器,将Boosting簇三种模型作为初级学习器进行预测,预测结果经融合后作为时延预测的基准值。接着,以分段回归树为模型预测时延抖动特征。最后,将时延基准和抖动特征叠加,得到符合局域网时延抖动特性的综合时延模型,基于该模型实现蜜网系统时延模拟,从而降低被攻击者识别概率。最终实

    软件工程 2021年11期2021-11-09

  • 基于组合模型的城市住房租金预测研究
    绩效,并采用集成学习理论对模型有效性进行了增强,同时从机器学习的角度对住房租金影响因素进行了分析。结果显示:随机森林和XGBoost在住房租金预测问题上的预测性能优于其他机器学习模型,而基于集成学习理论构建的组合预测模型则优于个体机器学习模型。进一步地,基于树集成方法的特征重要性分析发现,交通、教育以及区位条件是影响住房租金的关键影响要素。关键词:互联网数据;住房租金预测;机器学习;集成学习;组合模型中图分类号:F293 文献标识码:A文章编号:1001-

    中国房地产·综合版 2021年9期2021-11-02

  • 基于随机森林的光谱分类模型研究
    点。关键词:集成学习;Bagging;随机森林中图分类号:TP273.4 文献标识码:A  文章编号:2096-4706(2021)07-0081-04Study on Spectral Classification Model Based on Random ForestYUAN Zhengxi(South China Normal University,Guangzhou  510631,China)Abstract:In this paper,the

    现代信息科技 2021年7期2021-10-16

  • 基于集成卷积神经网络的LiDAR数据分类
    随机子空间的集成学习框架。通过有放回的随机抽取LiDAR训练集构成子集,以深度卷积神经网络模型为单个子分类器,最后采用多数投票法确定最终样本的类别,以获得更好的分类精度。实验结果表明,所提方法在Bayview Park和Houston两个数据集上分别取得了93.31%和80.95%的总体分类精度,与其他3种分类算法相比具有更好的分类效果,由此证明该网络在拥有较高分类精度的同时还具有良好的泛化能力。关键词:LiDAR;图像分类;深度学习;卷积神经网络;集成学

    哈尔滨理工大学学报 2021年4期2021-10-07

  • 基于增量集成学习的动态自适应SDN入侵检测
    ,提出了增量集成学习算法,并用该算法解决SDN入侵检测问题。该算法利用滑动窗口法获得数据块,对新的数据块进行训练获得子分类器,然后依据在历史数据块和当前数据块的分类结果筛选子分类器进行集成,使得分类模型不断完善从而能够自适应的识别未知攻击行为。通过在NSL-KDD数据集上的实验结果可以看到,该算法可以提高未知攻击的识别率。关键词:增量学习;集成学习;入侵检测;软件定义网络Abstract:With the popularization of SDN net

    计算技术与自动化 2021年3期2021-10-01

  • 基于集成学习算法的返贫人口识别模型
    征,构建基于集成学习算法的返贫人口识别模型进行贫困人口分类。结果表明,经调优的XGBoost算法模型取得最优结果,对已脱贫、未脱贫及返贫3类人员分别达97.43%、92.44%、97.04%的识别准确率,总体达到96.81%的准确率,能够较好识别出贫困人口贫困类别。为帮扶工作人员的防返贫动态监测和帮扶工作提供技术支持。关键词:建档立卡;集成学习;返贫识别;动态监测中图分类号: F323.8;TP181  文献标志码: A文章编号:1002-1302(202

    江苏农业科学 2021年17期2021-09-26

  • 基于集成学习技术的隧道围岩智能分级方法研究
    acking集成学习模型,增加了模型分类的稳定性,提高了模型预测准确度。该方法解决了传统隧道围岩分级方法存在评价方法单一、评价不及时、主观误差大等问题。【关键词】隧道工程; 集成学习; 围岩分级【中国分类号】U451+.2【文献标志码】A隧道围岩级别是制定岩变我变、因岩施策的设计施工参数的主要依据。当前,研究隧道围岩分级方法主要分为间接方法和直接方法。其中,间接方法主要包括RQD方法、RMR方法、BQ方法。间接方法缺点是围岩信息采集往往需要地质人员到现场掌

    四川建筑 2021年4期2021-09-15

  • 海洋温差能发电系统最优化控制
    网络模型以及集成学习等方法构建了ORC海洋发电系统的仿真模型,其可以实现使用者输入相应的温度,模型自动返回所需要的变化的工质流量以及具体需要变大还是变小,我们也基于单片机实现了同样的功能。关键词:多元线性回归;集成学习 ;神经网络 ;单片机1基于机器学习的海洋温差能发电系统的优化1.1不同温度下的最佳工质流量最初,我们首先测量了ORC实验仪器的在不同温度下对应不同工质流量所产生的发电功率,发现ORC实验装置在某一固定温度下随着冷媒质量流量增大,发电功率先增

    国际商业技术 2021年10期2021-09-10

  • 随机卷积神经网络的内燃机健康监测方法研究
    神经网络; 集成学习1  概  述内燃机作为一种重要的动力机械,广泛应用于各个领域,对其系统健康状况的监测不仅能够保证设备平稳高效的运行,而且能够及时发现出现的故障状况,有效防止重大事故的发生[1]。基于振动信号的分析是对内燃机健康状态监测的重要途径。这是由于振动信号采集方便,并且采集的振动信号包含了往复运动、旋转运动、机械冲击和气体的高速流动等丰富的信息。但是,内燃机系统的振动激励源多,其振动信号具有强耦合、弱故障特征的特点[2],因此如何准确地提取振动

    振动工程学报 2021年4期2021-09-08

  • 基于lightGBM的联通话费购推荐系统研究
    工程    集成学习一、项目背景联通话费购商城是中国联通提供的新型通信账户消费业务,是联通用户购买多种会员权益的专属商城。为用户提供话费计费和第三方支付等多种支付方式。实现用户一站式购买音乐、视频、小说、教育、娱乐等众多互联网会员权益及知识付费类数字商品,现有自营会员产品话费购、尊享黄金会员以及自营虚拟货币话费券。目前,话费购商城涵盖影视会员、出行、音乐、知识付费、社交、工具等八大产品类80款会员权益,近400余款商品。本文通过为话费购搭建推荐系统,智能化

    中国新通信 2021年12期2021-08-27

  • 基于CRT-EL的海洋环境数据综合预测方法
    选择结果作为集成学习模型的输入,进一步对海洋生态环境状态进行预测。仿真结果证明,该模型具有较高的准确率,可以应用到实际工程中。关键词:海洋生态环境;数据分析;交叉递归理论;海洋序列预测;集成学习中图分类号:TP391        文献标识码:A文章编号:1009-3044(2021)17-0004-03开放科学(资源服务)标识码(OSID):Comprehensive Prediction for Marine Environment Data base

    电脑知识与技术 2021年17期2021-08-03

  • 集成学习算法之随机森林与梯度提升决策树的分析比较
    理极为重要。集成学习算法中的随机森林和梯度提升决策树是近些年来常被用于处理数据分类与回归的方法,决策树则是随机森林和梯度提升决策树算法组成的基础。本文首先对决策树进行了介绍,然后分别对随机森林和梯度提升决策树进行了分析,叙述了两种算法的优缺点以及近几年来在生活生产中的应用,并对两种算法进行了比较。关键词:决策树;随机森林;梯度提升决策树;集成学习中图分类号:TP311      文献标识码:A文章编号:1009-3044(2021)15-0032-03随着

    电脑知识与技术 2021年15期2021-07-19

  • 基于支持向量回归集成学习的新能源汽车销量预测
    agging集成学习方法,对我国新能源汽车的销量进行预测和分析。首先,选取影响消费者购买意愿的公共充电桩数量和决定消费者购买能力的居民可支配收入作为模型的自变量,并收集相关数据;其次,从原始样本中随机抽取样本量为20的5个相互独立的样本集,并使用6个训练数据对这5个样本集进行训练,得到5个支持向量回归模型;然后,平均5个模型的结果,减少模型噪声,优化最终预测效果;最后,分析所得的预测新能源汽车销量模型的准确性及不足之处。关键词:支持向量回归 集成学习 新能

    时代汽车 2021年10期2021-07-16

  • 基于集成学习的煤和矸石图像识别技术研究与实现
    定性,并采用集成学习的方法将多个深度计算模型的预测结果进行融合,以此提升整个识别方法的性能。经过实验研究结果发现,通过以上方法可以在小型数量级上较快得到一个具有较高识别精度和召回率识别模型,并且模型的预测结果更能够反映模型在实际生产环境中的真实表现。综上可以得知,本文所实现的模型方法更能够适应煤和矸石的识别研究领域的需求,对未来深度学习方法在煤矸识别的研究具有较高的实际应用价值和意义。关键词:煤矸识别;集成学习;人工噪声;交叉验证;TTA中图分类号:TP3

    电脑知识与技术 2021年10期2021-06-28

  • 基于LightGBM算法的中小上市公司财务困境预测研究
    ghtGBM集成学习模型对中小企业财务困境预测准确率高达0.950 877、AUC值为0.975 8远远高于基于其他算法的预测模型。这对金融企业精准评价中小企业的财务风险以及政府实施中小企业政策扶持提供决策参考。关键词:财务困境预测;集成学习;LightGBM;特征选择中图分类号:F275;TP311.1      文献标志码:A      文章编号:1008-4657(2021)03-0057-17引言我国中小企业是在经济运行中发挥关键作用的社会主义经济

    荆楚理工学院学报 2021年3期2021-03-29

  • 一种混合的信用卡欺诈检测模型
    ,通过半监督集成学习的方法,利用异常数据进一步扩充集成模型的多样性,并将异常检测和集成模型融合。实验结果表明,比起一些传统的机器学习方法,AWFD可以提高整体的信用卡欺诈检测的识别率。关键词:信用卡欺诈检测;异常检测;半监督;集成学习;多样性中图分类号: TP311        文献标识码:A文章编号:1009-3044(2021)02-0194-03Abstract:Credit card fraud detection is a serious pr

    电脑知识与技术 2021年2期2021-03-24

  • 基于深度神经网络的行为识别算法
    为识别算法;集成学习中图分类号:TP393      文献标识码:A文章编号:1009-3044(2021)03-0017-02随着科技的发展,日常生活中的行为会被摄像头记录下来,大量视频网站纷纷涌现。近年来,随着智能手机的普及,人们会将日常生活中所拍摄的视频发送到网上,这些视频为计算机技术带来了新的发展机遇。而在密集场所中,摄像设备安装数量也越来越多,其中记录了大量视频资料,包含各种人体行为。这些功能都需要行为识别算法才能够实现,这对计算机视觉技术提出了

    电脑知识与技术 2021年3期2021-03-15

  • 基于集成学习的全云化健康大数据整合系统设计
    : 设计基于集成学习的全云化健康大数据整合系统,实现健康大数据的高效率、高精度整合。管理员操作管理操作层实现系统控制、调控以及应用;大数据分析层通过ELM预测模型的参数单步预测方法获取融合多维参数信息的健康数据预测结果,并采用Bagging集成学习方法融合ELM预测模型获取高精度的强学习模型,实现差异多维全云化健康大数据的有效判读;通过全云化健康大数据整合层中的整合管理器以及整合运行引擎整合健康大数据,并通过调控层将整合后的健康大数据反馈到大数据资源层中,

    现代电子技术 2020年22期2020-12-07

  • 基于YOLO v3级联网络和集成学习的高铁接触网开口销缺失识别
    3级联网络和集成学习的故障识别方法。首先利用YOLO v3级联网络对接触网支持装置和定位装置中开口销进行精确定位,然后集成多个弱分类器,实现对开口销缺失情况的识别。实验结果表明,本文方法能准确高效地识别接触网开口销的缺失故障。关键词:YOLO v3; 高铁接触网; 开口销钉缺失; 集成学习引言开口销是接触网最重要的连接零件之一[1]。由于服役于露天环境,且长期处于弓网作用中,开口销容易发生脱落等故障,进而使受流质量劣化,甚至出现打弓等事故[2]。因此,定期

    装备维修技术 2020年10期2020-11-19

  • 基于Stacking的钢板表面颜色预测
    颜色;分类;集成学习;Stacking方法中图分类号:TP181 文献标识码:A 文章编号:1006-8228(2020)08-65-040 引言钢板表面颜色是判定钢板表面耐蚀性能一种重要指标,普通热轧钢板最常见的颜色有红褐色和青黑色两种,颜色的不同对钢板耐锈蚀能力有很大影响,红褐色主要是结构疏松的Fe2O3,容易吸收水分和盐分加速锈蚀,而青黑色主要是结构致密的Fe3O4,可以有效延缓钢板的锈蚀,对于钢板下线后的保存、运输、加工和使用等过程比较有利[1-2

    计算机时代 2020年8期2020-09-15

  • 基于XGBoost的无线传播预测模型
    义。关键词:集成学习;无线传播模型;数据分析;特征工程DOI:10. 11907/rjdk. 192477 开放科学(资源服务)标识码(OSID):中图分类号:TP301文献标识码:A 文章编号:1672-7800(2020)008-0035-05Abstract:Traditional wireless propagation models usually need to divide propagation scenarios based on emp

    软件导刊 2020年8期2020-09-02

  • 集成学习之随机森林分类算法的研究与应用
    邢海花摘要:集成学习是多分类器学习系统。而随机森林是一个包含多个决策树的分類器,是一种基于Bagging的集成学习方法。随机森林具有预测准确率、不容易出现过拟合的特点,在很多领域都有所应用。本文主要利用随机森林算法对心脏病数据集建立了分类预测模型,实验结果表明,随机森林算法在预测性能上超过了决策树和逻辑回归分类算法,并通过绘制ROC曲线对四种模型进行了对比。关键词:集成学习;随机森林;预测中图分类号:TP181 文献标识码:A文章编号:1009-3044(

    电脑知识与技术 2020年21期2020-08-21

  • 基于MDM的KELM学习器选择性集成网络入侵检测
    要: 采用集成学习模式进行入侵检测时,可以获得比单个学习器更高效的网络攻击识别过程,并能显著提高识别准确率。設计的SN通过MDM对各KELM子学习器计算得到集成增益度,从中选出具有较高增益度的KELM子学习器再实施集成。选择Bagging方式完成抽样集成过程,同时以Hadoop分布式结构对算法实施训练,通过并发方式完成各子KELM的检测,使算法达到更高的效率。通过测试发现,不管对于公共KDD99数据集还是以手工方式建立的网络物理仿真系统,SN都可以高效发

    微型电脑应用 2020年7期2020-07-29

  • Stacking算法在医疗健康数据中的应用研究
    cking的集成学习算法,在两种疾病数据集上,实验结果表明,该方法性能良好。关键词:集成学习;随机森林;堆栈1    分类挖掘技术在疾病辅助诊断上的应用近年来,越来越多的学者将分类挖掘技术应用于疾病的輔助诊断上,如刘文博等[1]提出了一种迭代随机森林算法,对糖尿病数据进行预测。金强等[2]提出,应用改进的BP神经网络算法,提高乳腺癌诊断准确率。本文提出了一种基于堆栈的集成学习算法,应用于肝脏疾病和皮肤疾病数据的分类预测,为临床诊断、个人健康提供有效的决策依

    科学大众 2020年5期2020-07-18

  • 集成学习算法在疾病预测中的应用研究
    章分析了3种集成学习框架,在3个疾病数据集上对3种典型的集成学习算法进行比较,结果表明:基于Stacking的集成算法在疾病预测方面表现良好。关键词:集成学习;随机森林;堆栈近年来,众多学者将集成学习应用到医疗诊断中,以提高疾病预测的准确率,如苗丰顺等[1]提出了一种新型的Boosting算法,预测糖尿病患者。王荣政等[2]应用集成学习,识别血糖异常个体。本文应用3种不同的集成学习算法,对3种疾病机型进行分类预测,以比较3种算法在疾病预测方面的性能。1  

    科学大众 2020年5期2020-07-18

  • 基于集成学习的测井岩性识别模型的构建
    acking集成学习的测井岩性识别方法。该方法建立了一种以朴素贝叶斯、随机森林、支持向量机三种模型作为初级训练器,逻辑回归模型作为次级训练器的融合模型。该融合模型提高了测井岩性识别效率,实现了测井数据自动化处理,提高了地质勘察人员的工作效率。文中以鄂尔多斯盆地的钻孔测井数据为训练样本,通过与其他机器学习模型的结果比较,该模型的预测结果与实际结果相比具有较好的一致性,识别率优于其他学习模型。关键词: 岩性识别; 集成学习; 融合模型; Stacking【Ab

    智能计算机与应用 2020年3期2020-07-04

  • 基于集成学习方法的PPP项目结果预测
    est算法的集成学习分类模型,该模型可帮助研究人员预测PPP项目实施结果的成败。通过与其他十个基线分类器进行对比实验,可以证明SMOTE过采样技术对PPP项目数据集中不平衡数据的处理是有效的。研究结果表明所提模型在Presicion、F-measure和ROC Area三个指标上比基线分类器具有更好的性能表现。关键词:政府和社会资本合作(PPP);数据挖掘;集成学习;预测0引言基础设施建设作为影响国家产品服务的质量和效率的重要因素,对经济发展具有深远的影响

    大众科学·上旬 2020年7期2020-06-29

  • 基于改进权值更新和选择性集成的AdaBoost算法
    :入侵检测;集成学习;AdaBoost;权值更新;选择性集成DOI: 10. 11907/rjdk.191736开放科学(资源服务)标识码(OSID):中图分类号:TP312文献标识码:A文章编号:1672-7800( 2020)004-0257-060 引言入侵检测可从网络系统若干关键点收集信息,并分析网络是否存在入侵行为及迹象[1,2]。入侵检测可看作一个数据分类过程,从收集的信息中识别出正常操作和入侵行为。当前,入侵检测分类算法主要有决策树[3]、神

    软件导刊 2020年4期2020-06-19

  • 基于RUSBoost算法的违约风险预测模型构建与应用
    型。作为一种集成学习方法,RUSBoost算法利用欠采样实现了训练集的类别均衡,同时又通过对基学习器的独立采样有效克服了因欠采样而造成的信息丢失问题,从而实现了对类别不平衡数据的较强适应能力。基于某网络借贷平台的金融大数据,首次将RUSBoost算法应用于违约风险预测,同时也将随机森林、决策树以及支持向量机等数据挖掘方法分别应用于违约风险预测问题,并与传统的Logistic回归方法和最小二乘模型进行对比分析。从实验结果来看,绝大部分数据挖掘模型的预测性能要

    财会月刊·下半月 2020年5期2020-06-03

  • 基于Spark大数据平台的老年病风险预警模型
    7%。此外,集成学习规模对于模型预测的精度影响较小,决策树的剪枝可在不损失预测精度的前提下降低模型的复杂度。关键词: 决策树; 集成学习; Spark; 疾病预测中图分类号: TP311      文献标志码: ARisk Early Warning Model of Geriatric Disease Based onSpark Big Data PlatformTAN Xiao(School of Economics and Management, S

    微型电脑应用 2020年2期2020-05-11

  • 基于机器学习的金融消费场景预测探索
    索。最后采用集成学习方法对最终结果进行融合。本文采用了上述几种算法模型进行预测,对模型原理进行了分析,并在多个评价指标上衡量各个模型的表现,横向对比了不同模型的优缺点,并对造成结果差异的原因进行了总结。关键词:金融科技;逻辑回归;集成学习;随机森林;Xgboost;lightGBM;分类中图分类号:F126.1 文献识别码:A文章编号:2096-3157(2020)05-0153-03一、引言随着近年来互联网的迅猛发展,数据不断累积,计算机算力不断提高,如

    全国流通经济 2020年5期2020-04-20

  • 基于词向量的SVM集成学习社交网络抑郁倾向检测方法
    向量的SVM集成学习社交网络抑郁倾向检测方法。人工标注和专家校验获得训练数据,使用词向量进行文本向量化。以SVM为基分类器进行Boosting集成学习。实验结果表明,文章提出的模型可以用于抑郁倾向的检测。关键词:抑郁检测;微博;支持向量机;词向量;集成学习目前,国内外基于社交媒体文本内容的抑郁倾向检测主要分成两类,一类是基于统计的数据挖掘方法,另一类是基于机器学习模型的检测方法。(1)基于统计的数据挖掘方法,主要是通过统计微博文本内容的高频词、构建情感词典

    无线互联科技 2020年3期2020-04-09

  • 基于集成学习的金融反欺诈模型
    一种新的基于集成学习的数据挖掘技术。集成模型包括一组单独的分类器,它们的预测被组合以预测新的传入实例。我们主要考虑了三个最新的单个组件分类器:随机森林,XGBoost和CNN卷积神经网络。提出了一种创新的集成学习方法,通过多个模型的集成,并考虑了数据本身的特征,来提升模型的性能。实证结果表明,与单个组件分类器相比,这种集成学习的方法在真实的金融欺诈数据上具有优越的性能。关键词:金融反欺诈;集成学习;机器学习中图分类号:TP311 文献标识码:A文章编号:1

    电脑知识与技术 2020年1期2020-03-30

  • 基于互信息加权集成迁移学习的入侵检测方法
    习;互信息;集成学习;加权集成中图分类号:TP393.08文献标志码:AIntrusion detection method based onensemble transfer learning via weighted mutual informationHU Jian1*, SU Yongdong1, HUANG Wenzai1, XIAO Peng1, LIU Yuting1, YANG Benfu21.Information Center, Yun

    计算机应用 2019年11期2019-12-23

  • 基于机器学习的冠心病住院费用预测研究
    ;住院费用;集成学习;随机森林;极端梯度提升【Abstract】 Coronary heart disease is a common cardiovascular disease characterized by high morbidity. Therefore, the prediction of hospitalization expenses for coronary heart disease is of great significance

    智能计算机与应用 2019年5期2019-12-05

  • 集成学习在糖尿病预测中的应用
    、随机森林、集成学习五种方法对糖尿病数据进行预测,分别取得了71.86%,72.29%,74.46%,71.87%,76.62%的准确率。结果表明,集成学习预测效果最佳,验证了其优异性。关键词: 集成学习;糖尿病;预测;机器学习【Abstract】 Diabetes, hypertension and cardiovascular and cerebrovascular diseases are called three killers of human

    智能计算机与应用 2019年5期2019-12-05

  • 基于改进的代价敏感决策树的网络贷款分类
    ;网络贷款;集成学习;决策树中图分类号:TP181文獻标志码:AAbstract:  In the online loan user data set, there is a serious imbalance between the number of successful and failed loan users. The traditional machine learning algorithm pays attention to the ove

    计算机应用 2019年10期2019-11-15

  • 基于贝叶斯集成神经网络的上证50指数的研究
    来的数据进行集成学习预测。结果证明贝叶斯集成长短记忆神经网络要优于集成循环神经网络与集成长短记忆神经网络。为了使贝叶斯集成神经网络更好的运用到时间序列预测上,本文提出一种贝叶斯集成长短记忆神经网络来进行金融时间序列学习。关键词:贝叶斯  集成学习  神经网络中图分类号:TP183                                 文献标识码:A                       文章编号:1674-098X(2019)06(b)-0

    科技创新导报 2019年17期2019-11-13

  • 一种基于集成学习的指纹锁拉链产品需求预测方法
    定位。现采用集成学习的思想,将两个基础预测模型,集成成一个较强的预测、分类模型,能够为数据集建立一个较为出色的分类模型和预测模型,能够用于预测一个新的案例是否对指纹锁拉链产品有需求。关键词:需求预测;集成学习;指纹锁拉链中图分类号:TN919.5 文献标识码:A 文章编号:1007-9416(2019)07-0050-020 引言日常生活中人们使用的背包上的拉链基本上都是没有加锁的,或者是旅行箱上使用的密码锁,但是这种密码锁有两个明显的缺点,其一是经常会出

    数字技术与应用 2019年7期2019-11-01

  • 伪标签置信选择的半监督集成学习视频语义检测
    噪声也会导致集成学习基分类器性能提升不足。为此,提出一种伪标签置信选择的半监督集成学习算法。首先,在三个不同的特征空间上训练出三个基分类器,得到基分类器的标签矢量;然后,引入加权融合样本所属某个类别的最大概率与次大概率的误差和样本所属某个类别的最大概率与样本所属其他各类别的平均概率的误差,作为基分类器的标签置信度,并融合标签矢量和标签置信度得到样本的伪标签和集成置信度;接着,选择集成置信度高的样本加入到有标签的样本集,迭代训练基分类器;最后,采用训练好的基

    计算机应用 2019年8期2019-10-23