means算法

  • 一种基于GDK-means的高校贫困生信息隐私保护方法研究
    DK-means算法,在保证数据可用性的前提下,可实现数据发布中较好的隐私保护性。关键词:贫困生资助;分布式聚类;隐私保护;K-means算法中图分类号:TP311.13;G647  文献标识码:A  文章编号:2096-4706(2023)11-0030-04Research on a College Information Privacy-Protection Method for Poor StudentsBased on GDK-meansLIU

    现代信息科技 2023年11期2023-08-01

  • 基于YOLOv5算法的足球训练识别系统
    过K-means算法进行二次算法模型分析,对图像聚类分析改进算法对图像特征。在算法训练结束后,文章对此目标检测算法模型进行测试,测试结果表明:聚类分析后的目标算法模型对足球漏检的情况显著变少,而且对足球的实时检测效果表现良好,提升了算法识别速度和识别准确度;其mAP平均精度达到了98.6%,与原改进前提升了1%。关键词:足球识别;YOLOv5算法;K-means算法;目标识别算法中圖分类号:TP391.41  文献标志码:A0 引言随着人们生活质量的日渐提

    无线互联科技 2023年8期2023-06-26

  • 对K-means聚类算法初始值的研究
    的K-means算法中随机选取初始值改进,对样本值增加进行预处理,首先对样本值多次取数,对采样数据集进行初次K-means运算后获得聚类结果,从聚类结果中取距离最大的[k]个聚类中心作为初始值。通过Iris数据集对改进算法进行验证,聚类效果有较好的提高。关键词:聚类分析;K-means算法;初始值优化中图分类号:TP391      文献标识码:A文章编号:1009-3044(2022)11-0095-03随着人工智能的发展,海量数据的涌现,如何从大量样本

    电脑知识与技术 2022年11期2022-05-31

  • 基于K-means聚类的居民用电行为分析
    ,K-means算法在对居民用电负荷曲线聚类时具有较高的准确度,电网企业能够据此分析居民用电行为,提供用电个性化服务。关键词:K-means算法;用电行为分析;智能用电中图分类号:TP18      文献标识码:A文章编号:1009-3044(2022)07-0026-031 概述随着智能电表的普及,仪器中产生和传输的数据正以指数增长,在当今智能互联网背景下,使用人工智能技术挖掘这些海量数据,分析其中隐藏的用户用电行为,有利于电网企业根据分析结果精确地为不

    电脑知识与技术 2022年7期2022-05-09

  • 基于机器学习的白洋淀生态数据的异常检测
    ;K-means算法;DBSCAN算法中图分类号:TP181        文献标识码:A文章编号:1009-3044(2022)35-0007-031 概述白洋淀是华北地区最大的湿地生态系统被称为“华北之肾”,多年来由于上游生活污水和工业污水的排放、机械船只增多等因素,白洋淀水质不断恶化。自2017年4月1日起,白洋淀生态环境治理和保护攻坚战打响。修复白洋淀生态的关键在于水域环境,改善水域内水体环境才能保障和恢复生物的多样性。白洋淀的生态数据通过物联网传

    电脑知识与技术 2022年35期2022-02-17

  • 改进PSO-K-means算法在汽车行驶工况估计中的应用
    -K-means算法构建车辆行驶工况,并从10个主要特征参数角度与实际工况进行对比,结果表明所构建工况能够准确反映车辆在实际道路上的行驶特征,说明使用改进PSO-K-means算法构建轻型车行驶工况的合理性和有效性。关键词: PCA分析; 数据清洗; 改进PSO-K-means算法; 行駛工况文章编号: 2095-2163(2021)07-0080-07中图分类号:TP391文献标志码: AApplication of improved PSO-K-mea

    智能计算机与应用 2021年7期2021-12-07

  • K-means算法及其应用实践
    。K-means算法是被广泛应用的一种聚类算法,K-means算法的关键是选择合适的k值,文章通过鸢尾花聚类展示K-means算法应用。关键词:K-means算法;聚类;无监督学习;机器学习一、何为聚类聚类(Clustering)是一种典型的“无监督学习”。聚类算法是对大量未知标记的数据集,根据数据之间的距离或者说是相似性(亲疏性)将数据集划分为多个簇(Cluster),使簇内的数据相似度尽可能大,而簇间的数据相似度尽可能小。聚类的目的是把数据分类,但是事

    科学与生活 2021年23期2021-12-06

  • 多点种子预划分的二阶段社区发现算法
    用K-means算法将高影响力节点加以聚合,得到高影响力社区簇。然后提出一种吸引力度量函数,选择性的将网络中的剩余节点合并到社区簇以完成社区识别任务。实验结果表明,二阶段社区发现方法能够发现尺寸较大,个数较少的社区结构,进而在中观层面捕捉群组之间的关联性。关键词:复杂网络;局部社区发现;种子扩张;节点影响力;K-means算法DOI:10.15938/j.jhust.2021.04.011中图分类号:TP391.4文献标志码:A文章编号:1007-2683

    哈尔滨理工大学学报 2021年4期2021-10-07

  • 基于众包配送模式的超市订单分配与路径规划研究
    的K-means算法进行聚类,再将聚类完成的订单用蚁群算法进行路径优化。最后验证了所使用的方法在解决超市订单分配和路径优化问题方面的可行性和有效性。关键词:众包配送;车辆路径优化;K-means算法;蚁群算法中图分类号:F252.14    文献标识码:AAbstract: With the rapid development of internet, O2O business model has become a trend. As a terminal

    物流科技 2021年7期2021-09-18

  • 基于K-means算法的企业信用无监督分类研究
    于K-means算法的企业信用无监督分类方法,通过对企业信息进行大数据分析,提取企业信用相关的内容,再使用K-means算法对企业数据进行聚类,对目标企业根据其聚类所在簇来评估信用等级,以此对企业的信用进行分类。关键词:企业信用;信贷风险;K-means算法;分类;特征选择Abstract: The application of corporate credit classification can reduce the risk of credit bu

    电脑知识与技术 2021年22期2021-09-14

  • 基于企业应用的K-means算法的实现与改进
    ;K-means算法中图分类号:TP311      文献标识码:A文章编号:1009-3044(2021)18-0029-03开放科学(资源服务)标识码(OSID):当今关于大数据、云的研究愈发深入,可是如何用好这些数据,发现这些数据背后隐藏的信息却成为更具实际价值的工作,这也就是数据挖掘的概念。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐藏其中人们事先不知道的、但又是潜在有用的信息和知识的过程。其与数据分析最大的区别在于未知性

    电脑知识与技术 2021年18期2021-08-18

  • 基于机器视觉的智慧城市路面裂缝检测关键技术研究
    ,K-means算法,路面裂缝参数计算。本文重点阐述了基于机器视觉的智慧城市路面裂缝检测关键技术研究。关键词:路面裂缝检测;图像灰度化;迭代阈值分割;K-means算法中图分类号:TP391;U41    文献标识码:A文章编号:1009-3044(2021)11-0174-02Crack Detection of Smart City Pavement Based on Machine Vision Research on Key Technologie

    电脑知识与技术 2021年11期2021-05-23

  • 基于改进YOLOv4算法的铝材表面缺陷识别方法研究
    ;K-means算法中图分类号:TP391.4             文献标识码:A文章编号:2096-4706(2021)23-0096-05Research on Aluminum Surface Defect Identification Methods Based on Improved YOLOv4 AlgorithmLUAN Minghui, LI Songsong, LI Chen, WANG Yuheng, GUO Zhongyu(Sch

    现代信息科技 2021年23期2021-05-07

  • 融合了K近邻与密度峰值算法的K-means算法
    - means算法。为了攻克以上问题,改进算法采用峰值法以及融合了K近邻算法的密度峰值算法逐一调整。通过在UCI数据集上测试及与原始K - means算法、最大最小距离距离算法在准确率、稳定性和处理数据速率方面的比较,其中最为突出的是,改进算法的准确率达到了96%以上。关键词:K-means算法;PCA降维;峰值法;KDPC算法中图分类号:TP301.6      文献标识码:A文章编号:1009-3044(2021)08-0182-03Abstract

    电脑知识与技术 2021年8期2021-04-22

  • K-means聚类算法研究现状
    K-means算法是聚类算法中基于划分的一种典型算法,是数据挖掘的一种常用的数据挖掘方法。该聚类算法容易实现,应用广泛。但是也有一定的缺点,就是均值不好把握,K的取值很难确定,数据集比较难收敛,隐含类别的数据不平衡等,因此该算法有很多变体,从而很多人对其进行各种改进优化。对此,本文从多个方面阐述K-means算法的改进优化方法,并进行概括其优缺点,分析问题。从而对该方法的发展进行展望。关键词: K-means算法;数据挖掘;变体;改进优化方法1 前言 随

    成功营销 2021年10期2021-03-23

  • 基于K-means算法实现电商企业ERP系统的大客户跟踪分析
    ;K-means算法中图分类号:TP18;TP391       文献标识码:A文章编号:2096-4706(2021)13-0173-03To Achieve Key Customer Tracking Analysis of E-commerce Enterprise ERP System Based on K-means AlgorithmDAI Yuanquan(School of Information Engineering, Hubei Li

    现代信息科技 2021年13期2021-02-19

  • 基于K-means算法的Co-trainning的研究
    。K-means算法是一种聚类算法,在对K-means算法研究和实现时,设计并实验将K-means算法思想运用到Co-trainning算法特征集选取上,效果较好。关键词:K-means算法;Co-trainning算法中图分类号:TP311      文献标识码:A文章编号:1009-3044(2020)32-0216-021 引言早在1998年,Blum于“Combining labeled and unlabeled data with co-tra

    电脑知识与技术 2020年32期2020-12-29

  • 结合Harris和改进K-means的遥感图像配准算法
    进K-means算法进行区域划分,进行特征点匹配;最后,区域间利用RANSAC方法剔除错误匹配点,得到精确匹配点对。该算法减少了特征点数目,提高配准精确度。实验结果表明了算法的有效性。关键词:Harris;图像配准;K-means算法;随机抽样一致(RANSAC)中图分类号:TP751     文献标识码:A    文章编号:1007-9416(2020)10-0000-00现今,随着社会需求不断增加,人们已经不再满足从单一图像中获取信息,多幅图像的叠加融

    数字技术与应用 2020年10期2020-12-09

  • 基于改进k-means算法的猕猴桃叶部病斑分割方法
    经k-means算法RGB(Red Green Blue) 颜色分量高度线性相关以及欧氏距离的尺度相关性对图像分割结果产生的影响,并克服RGB空间色彩分布不匀的缺陷,提出了一种基于Lab颜色空间的改进 k-means的猕猴桃叶部病害图像分割方法。首先改变颜色空间,将RGB转换为Lab空间,由 L、a、b3分量组合表示每个像素点。其次,将马氏距离代替欧氏距离进行改进,用改进后的k-means算法对图像进行聚类。利用该方法对三种猕猴桃病害图像进行测试,实验结果

    电脑知识与技术 2020年25期2020-11-02

  • 基于目标检测网络的交通标志识别
    用K-means算法对实验数据进行聚类分析,确定适合LISA数据集的先验框大小,实验结果表明改进后的框架对比原始的yolov4框架和YOLOv3框架,其mAP值分别提高了0.37%和1.04%,说明改进后的YOLOv4框架在交通标志识别方面具有较高的实用价值。关键词:目标检测;交通标志识别;K-means算法;LISA数据集中图分类号:TP311.5     文献标识码:ATraffic Sign Recognition based on Target D

    软件工程 2020年10期2020-10-23

  • 基于无线红外热成像仪的变电设备识别和检测
    k-means算法中图分类号: TP 399      文献标志码: AAbstract: The analysis of the massive infrared images collected by the wireless infrared thermal imager requires a lot of time and effort, and the diagnostic results are not correct. In order t

    微型电脑应用 2020年9期2020-10-13

  • 基于K-Means和Logistic的寿险客户流失预测模型研究
    张馨予 门玉杰 孙晓红摘 要:为了帮助寿险行业从海量业务交易中提取有效客户信息并进行客户保留,本文首先用K-Means算法进行寿险客户的价值细分,初步判断哪类客户最有可能流失,并针对不同价值群体的客户给予公司不同的建议;其次对细分后的客户群体建立Logistic二分类回归预测模型,比较与细分前的预测精度差异。实验结果中,细分后客户群对应Logistic模型的准确率、召回率和F1值较细分前均有提升,这说明客户细分能为其流失预测提供有价值的信息,有助于寿险

    中国商论 2020年17期2020-09-24

  • 一种优化初始聚类中心的自适应聚类算法
    的X-means算法,采用贝叶斯信息准则(BIC)计算得分,利用K-Means算法二分相应的簇,以此确定最优类簇个数;文献[14]利用期望最大化算法理论,提出似然函数的碎石图方法,对于不规则数据集的聚类结果比利用BIC方法更加可靠;文献[15]利用最小方差与密度之间的关系,提出一种利用最小方差优化初始聚类中心的方法,该方法在方差计算与比较上时间复杂度过高,且对于存在孤立点的数据不能获得较好的聚类结果;文献[16]采用最大最小距离方法,通过两阶段搜索获取最佳

    软件导刊 2020年7期2020-07-26

  • 最小局部方差优化初始聚类中心的K-means算法
    统K-means算法随机选取初始聚类中心导致聚类结果随机性大、优劣不定的缺点,通过定义局部方差,利用方差反映数据密集程度的特性,提出一种基于最小局部方差优化初始聚类中心的K-means算法。该算法选取数据集中局部方差最小的点作为一个初始聚类中心,并利用数据信息更新数据集,直到选到k个初始聚类中心,实现初始聚类中心优化。基于UCI数据集与人工数据集进行实验,与传统K-means算法及最小方差优化初始聚类中心的K-means算法进行性能比较。实验结果表明,基于

    软件导刊 2020年6期2020-07-24

  • 基于K-means的政府公文聚类方法
    用K-means算法对公文进行分类。首先对政府公文进行分词及去停用词等数据预处理操作,再通过词频一逆文档频率(TF-IDF)权值计算方法,将处理后的政府文本信息转换成二维矩阵,然后采用K-means算法进行聚类。使用清华大学THUCTC文本分类系统对公文聚类结果进行测试。实验结果表明,采用K-means算法对公文进行聚类,准确率达到82.93%,远高于政府网站公文分类准确率。关键词:文本聚类;词频一逆文档频率;K-means算法DOI:10.11907/r

    软件导刊 2020年6期2020-07-24

  • 基于改进K-Means算法的图书馆读者阅读需求实证研究
    权K-means算法[J].计算机应用研究,2018,35(2):466-470.周本金,陶以政,纪斌,等.最小化误差平方和K-Means初始聚类中心优化方法[J].计算机工程与应用,2018,54(15):48-52.何云斌,刘雪娇,王知强,等.基于全局中心的高密度不唯一的K-means算法研究[J].计算机工程与应用,2016,52(1):48-54.蒋丽,薛善良.优化初始聚类中心及确定K值的K-means算法[J].计算机与数字工程, 2018,46

    新世纪图书馆 2020年5期2020-07-14

  • 数据挖掘中三种典型聚类算法的分析比较
    —K-means算法、AGNES算法、DBSCAN算法,进行可视化聚类结果和FMI值比较分析,归纳出DBSCAN算法可以发现任意形状的簇类,AGNES算法和K-Means算法在中小型数据集中挖掘得到球形簇的效果较好。關键词:聚类;K-means算法;AGNES算法;DBSCAN算法中图分类号:TP301 文献标识码:A文章编号:1009-3044(2020)15-0052-051引言聚类是通过发现数据集中数据之间的相关关系,将数据分类到不同的类或簇的过程。

    电脑知识与技术 2020年15期2020-07-04

  • 基于机器学习的航空客户价值分析
    1)Kmeans算法先要假设将数据分成多少类,我认为航空客户群体可以分为5类。2)随机选取k个目标点,它们作为聚类中心3)计算数据集中每个点到K个聚类中心的距离,然后将它们分配到距离它们最近的聚类中心,这样就能形成5个簇。4)因为本案例的数据量比较大,所以以上步骤得到簇是比较散的,而我们要的结果是要相似的越接近,不相似的越远,所以算法会重复上面的步骤,直到得到合适的客户群。总体来说,K-Means算法的结果符合我的预期想法,我们可以从下图中详细地看出各类人

    电脑知识与技术 2020年14期2020-07-04

  • 基于k-means算法实现商品的聚类研究
    ;k-means算法;Python中图分类号:TP311.13      文献标识码:A     文章编号:1007-9416(2020)04-0000-000引言如今网站的快速发展,人们的生活和工作都离不开网络。人们的生活节奏也在逐渐加快,工作越来越忙了。网购网站吸纳了众多的群众的参与,积累了大量的用户资源。而且我国广大的女性群体为网购网站提供了良好的用户基础[1]。一个好的网购网站可以带运输等多种产业的发展,但是目前的网购网站对用户的数据处理有时候不够

    数字技术与应用 2020年4期2020-06-22

  • Faster RCNN的交通场景下行人检测方法
    ;K-means算法;区域建议网络DOI: 10. 11907/rjdk.192692开放科学(资源服务)标识码(OSID):中图分类号:TP306文献标识码:A文章编号:1672-7800( 2020)004-0067-04Pedestrian Detection Method in Traffic Scene Based on Faster RCNNXU Xiang-qian, SUN Tao(kSchool of Mech.an ical Engi,

    软件导刊 2020年4期2020-06-19

  • K均值优化算法综述
    k-means算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。在数据挖掘技术中常常使用聚类方法,而k-means算法作为最典型、最常见、实用度最广的一种聚类算法,具有简单易操作等优点。但此算法需要人工设定聚类中心的数量,初始聚类中心,容易陷入局部最优,使得算法的时间复杂度变得较大,得到的聚类结果易受到k值与设定的初始聚类中心的影响,针对这些问题,本文介绍了k-means算法的改进方法,分析其优缺点并提出了优化算法

    软件 2020年2期2020-06-09

  • 引入全局算法的小批量K-Means
    ;K-means算法;小批量[中图分类号]TP301.6 [文献标志码]AMini Batch K-Means with Global AlgorithmWANG Ying,WU Guanmao(Department of Computer Science and Engineering,Anhui University of Scienceand Technology,Huainan  232001,China)Abstract:A small batc

    牡丹江师范学院学报(自然科学版) 2020年2期2020-05-28

  • 基于Word2Vec模型和K-Means算法的信息技术文档聚类研究?
    与K-means算法融合的文本聚类研究[J].情报理论与实践,2017(11):135-138.[3]周练.Word2vec的工作原理及应用探究[J].图书情报导刊,2015(02):145-148.[4]Chandrashekar G,Sahin F. A survey on feature selection methods[J].Computers & Electrical Engineering,2014(01):16-28.[5]Salton G

    中国信息技术教育 2020年8期2020-04-27

  • 机器学习的分类、聚类研究
    ;k-means算法中图分类号:TP181文献标识码:A文章编号:1009-3044(2020)04-0161-02收稿日期:2019-10-151 概述大数据时代的来临使得数据量迅速膨胀,也为机器学习提供了更广阔的舞台。本文将对机器学习中分类和聚类及其常见算法进行论述。相信机器学习未来必将大放异彩。2 机器学习2.1 机器学习的定义,相较于依托专业公式进行纯粹计算,机器学习通过模仿人类学习的过程,使计算机通过算法分析数据、从中学习、生成并優化模型,以此得

    电脑知识与技术 2020年4期2020-04-14

  • 基于局部熵的点云精简算法
    K?means算法; 特征区域区分; 点云数据; 曲率估计中图分类号: TN911?34; TP391.9                   文献标识码: A                    文章编号: 1004?373X(2020)01?0020?04A point cloud reduction algorithm based on local entropyDONG Jiamin, TIAN HuaAbstract: A point clo

    现代电子技术 2020年1期2020-03-03

  • 基于改进K-Means聚类算法的互联网涉烟违法犯罪区域划分研究
    典K-means算法。1.4   最优k值的确定k值的设定直接决定了K-Means算法的聚类簇个数,如果设置不当将直接影响聚类结果。以图1样本数据集为例,将k值分别设置为2和4时,聚类结果如图2和图3所示。由图2和图3可以得知,若k值设置不当,聚类结果明显不符常理。其实很多情况下,对数据集进行簇劃分本身并没有绝对清晰和正确的结论,这取决于人们对数据集本身意义的个体认知。因此,研究能够自动求解正确k值的算法是非常困难的,只能从多个角度对k取值进行评估。本文采

    中国管理信息化 2019年22期2019-12-16

  • 基于K—means算法对轨道结构状态变化的评估研究
    于K-means算法对检测数据进行聚类挖掘对铁路轨道质量进行预测和评判,为线路日常维修提供依据。关键词:数据挖掘;K-means算法;聚类挖掘我国既有铁路营业线总里程不断增加,安全风险也随之增加,维修天窗时间短,检测任务繁重。针对铁路轨道设备病害的实时监控主要依靠车载信息、人工添乘信息以及轨检车数据信息。月度轨检车检测数据、便携式添乘仪和车载信息,以及日常人工巡检数据汇集成了一个多层次,多架构的轨道检测数据体系。每月数次的轨检车数据,也仅仅作为日常查寻病害

    科学与财富 2019年19期2019-12-11

  • 一种基于K-means算法的网络流量异常检测模型研究
    于K-means算法的网络流量异常检测模型。该方法首先将网络流量特征属性量化为熵值进行分类,然后将K-means聚类分析算法运用在网络流量异常检测中,提高了检测准确率,从而实现安全监测预警。该模型与传统的一些网络流量异常检测模型相比,具有更高的准确率。关键词:流量异常检测;K-means算法;流量特征随着互联网的快速发展,网络数据不断扩大,网络威胁问题也越来越突出。各种异常事件与正常的业务流量混合在一起,特别是一些僵尸网络、木马病毒、拒绝服务、跨站脚本攻击

    无线互联科技 2019年18期2019-12-05

  • 高校学生评教系统中存在的若干问题及对策研究
    ;k-means算法中图分类号:G645     文献标志码:A     文章编号:1674-9324(2019)44-0239-02高校课堂教学的质量是大学教育质量的重要体现。目前国内绝大部分高校教务处选择高校学生评教系统作为高校教学质量监控的重要方式之一,把教师的评教得分作为教师工资、职称评定、聘期考核等的重要依据。高校学生评教系统的使用对大范围收集学生对教学的反馈信息、提高教师教学积极性和大学生学习的主动性有着重要作用。然而,在该系统实际的运行过程中

    教育教学论坛 2019年44期2019-11-11

  • 考虑流量均衡的多配送中心选址优化方法
    ;K-means算法;整数规划中图分类号:F252.14文献标识码:A0引言随着我国物流业务量的逐年增长,配送中心作为物流网络中的基础节点,扮演着越来越重要的角色。关于配送中心的选址问题,除了需要考虑距离的因素外,其他复杂因素例如当地交通情况,经济发展因素,服务范围等也需要纳入考量。本文研究了考虑物流流量均衡的多配送中心选址问题,即为了服务若干客户点,除了考虑与客户点之间的距离,还应保证各个配送中心所服务的客户的物流流量需求差异较小,使得每个配送中心的利用

    物流科技 2019年10期2019-11-07

  • 基于大数据的客户细分方法研究
    ;k-means算法随着经济的不断发展,市场中的大量产品供大于需,不同企业生产的同类同质产品不免会产生激烈的竞争。在这种市场环境下,企业若想提升产品竞争力,就需要施行有针对性的营销策略,将客户分而治之,将重点逐渐从产品质量的竞争向不同客户满意度的竞争进行转变。在大数据时代的当下,数据不断反映着我们在日常生活的各种信息。通过对大量数据的分析与处理,对数据进行统一标准、属性筛选从而获取有用的信息。在如今的电子商务中,使用聚类的分析方法可以将客户进行细分,企业则

    科技风 2019年20期2019-10-21

  • 改进K-means算法在高校舆情中的应用
    的K-means算法对高校舆情进行聚类,获取舆情热点。通过聚类算法获取热点话题,进而对热点舆情话题进行引导,对改进高校学生思想政治工作作用显著。对改进算法进行实验,结果表明该算法准确率达到75%,比传统算法高出8%,改善了传统算法的聚类效果。关键词:高校舆情;聚类;K-means算法DOI:10. 11907/rjdk. 191734 開放科学(资源服务)标识码(OSID):中图分类号:TP319文献标识码:A 文章编号:1672-7800(2019)00

    软件导刊 2019年7期2019-10-11

  • K-means算法中文文献聚类的Python实现
    。K-means算法是非常典型的基于距离的聚类算法,将其用于中文文献聚类,按照内容相似性把一组文献分成几个类并发现其中的隐形知识。本文通过实例,总结了基于Python语言的K-means算法用于中文文献聚类过程,通过CH指标、轮廓系数指标和SSE指标这三个评价指标选取K-means算法的初始聚类簇数,即最优k值的取值范围,然后分别按照基于关键词和基于摘要对文献进行聚类,并对聚类结果进行比较分析,从而得出基于摘要对中文文献进行聚类可以得到更好结果的结论,同一

    软件 2019年8期2019-10-08

  • 基于K-means的手肘法自动获取K值方法研究
    的K-means算法利用手肘法选择合适的K值在实际项目中应用的较多,但是手肘法获取K值自动性低,以及面对海量数据的处理,效率上也有待提高。提出利用手肘法关系图初始点和末尾点连接的关系直线,求K值范围下直线y值与误差平方和的最大差值的方法,最大差值对应的K值为手肘法的最优肘点,由于手肘法需要多次迭代以及数据集稠密度对关系图的影响较小,提出利用数据集预抽样并且将程序部署在spark平台之上的方式自动获取手肘法的肘点K值,这样不仅根据此方法自动获取K-means

    软件 2019年5期2019-10-08

  • 结合优化支持向量机与K-means++的工控系统入侵检测方法
    进K-means算法与优化后的支持向量机组合成入侵检测模型,从而实现工业控制系统的异常检测。实验结果表明,所提方法在检测速度和对各类攻击的检测率上得到明显提升。关键词:工业控制系统;主成分分析;粒子群优化算法;支持向量机;密度中心法;K-means算法中图分类号:TP393.08文献标志码:A文章编号:1001-9081(2019)04-1089-06Abstract: Aiming at the problem that traditional sing

    计算机应用 2019年4期2019-08-01

  • 基于k-means算法的保险业数字化变革
    ;K-means算法;R语言中图分类号:F842.6 文献标识码:A 文章编号:1007-9416(2019)04-0121-021 我国车辆保险业现状1.1 我国车辆保险业现状中国目前的车险费率制度,大多数符合“从车主义”。即车险保费多少,主要取决于这辆车本身的各项情况,如车的购置价、座位数、排量、购车年限等,根据这些数据计算出一个基本的车险保费价格,再根据这辆车的上年理赔次数来打不同的折扣。这就导致了中国的车险定价模式非常的单调,相似情况的车型,保费也

    数字技术与应用 2019年4期2019-08-01

  • 改进的k-means聚类算法在公交IC卡数据分析中的应用研究
    统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法。首先,定义变量权值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定聚类中心的不稳定性。然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化。最后以南通公交IC刷卡记录为例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析。实验表明,在Hadoop平台下改进k-means算法运行稳定、可靠,具有很好的聚类效

    软件工程 2019年5期2019-07-03

  • 智能教学系统中动态学生模型构建
    王贺 张秀梅摘  要:随着科技的发展,各个高校网络教学模式日渐增加,而网络教学是在一定教学理论和思想指导下,应用多媒体和网络技术,通过师、生、媒体等,多边、多向互动和对多种媒体教学信息的收集、传输、处理、共享来实现教学目标的一种教学模式。该课题采用Clementine12.0数据挖掘环境中的K-Means方法,分析已有的一定数量的学习行为与效果之间的关联,建立“什么样的学习行为能获得什么效果”的规则,实现了对其学习效果的聚类分析。最终能根据所构建的模型对学

    科技资讯 2019年9期2019-06-27

  • 基于布谷鸟搜索的聚类推荐算法研究综述
    ;K-means算法;智能优化算法DOI:10. 11907/rjdk. 182830中图分类号:TP312文献标识码:A文章编号:1672-7800(2019)004-0091-040 引言推荐系统已成为电子商务应用中不可或缺的组成部分。推荐算法作为推荐系统的核心内容,算法性能优劣直接影响系统推荐的信息准确性。因此,各学者提出了许多性能优越的推荐算法,为用户提供更准确、更高效的推荐服务,协同过滤算法是推荐系统领域应用最广泛也是最成功的推荐算法,但是仍然存

    软件导刊 2019年4期2019-06-09

  • 基于异常检测的K-means改进算法研究
    :K-means算法作为较为普遍的聚类算法,聚类效果受孤立点、噪声点和初始聚类中心影响较大。结合Isolation Forest算法计算数据中每个样本的异常度系数,根据离群值过滤比例计算得到异常度系数阈值,对高度异常值加以隔离,并对隔离后的数据集使用平均插值法求得初始聚类中心。运用改进K-means算法对真实数据集进行聚类分析,与此同时,通过比较多个离群值过滤比例下的聚类结果,找到离群值过滤比例的最优取值。仿真结果表明,相比于原始算法,新算法显著提升了聚类

    软件导刊 2019年4期2019-06-09

  • 基于密度标准差优化初始聚类中心的k_means改进算法
    统k_means算法采用随机法选择初始聚类中心,易造成聚类结果陷入局部最优解和聚类精度低的问题,而且易受孤立点的影响。为了解决这一问题,提出了一种基于密度标准差优化初始聚类中心的改进算法。该算法先计算数据集样本的平均值和标准差,接着计算每个数据点的密度分布函数值,然后计算样本的平均密度和密度标准差,若小于密度标准差,则划分为孤立点;搜索密度分布函数值数组中的最大值,那么最大值对应的样本点即为初始聚类中心,并将以初始聚类中心为原点,以样本平均值为半径的圆内各

    电脑知识与技术 2019年6期2019-05-22

  • 基于MB—K—Means的网络模型参数压缩
    k-means算法进行权重聚类,然后权重量化共享。利用算法能够增加网络的训练速度,在深度卷积神经网络上进行参数压缩,减少网络模型大小。实验表明,在ImageNet-1000数据集上,AlexNet模型缩小了31倍,VGG模型的缩小了45倍。关键词:网络参数;MB-K-Means算法;卷积网络;参数压缩中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2019)06-0157-021引言近几年来,随着技术的发展,深度神经网络所代表的AI

    电脑知识与技术 2019年6期2019-05-22

  • 基于k-means算法的网络数据库入侵检测技术
    于k-means算法的网络数据库入侵检测技术为目标,从现阶段入侵检查技术与传统聚类算法存在的问题入手,通过实验反映改进进K-means算法,旨在为现阶段网络入侵提供新的研究反向与视角。关键词:k-means算法;网络数据库;入侵检测技术中图分类号:TP393      文献标识码:A      文章编号:1009-3044(2019)01-0034-021 入侵检测技术现状与数据挖掘网络技术的飞速发展既为人们生活带来了便利,也出现了安全问题,目前入侵检测与

    电脑知识与技术 2019年1期2019-03-14

  • 聚类分析在内部审计中的应用研究
    ;k-means算法;疑点数据;内部审计doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 01. 001[中图分类号] F239.45 [文献标识码] A [文章编号] 1673 - 0194(2019)01- 0004- 030 引 言聚类分析应用于医学、市场分析、信息安全、金融等多个领域。目前,在内部审计中的应用主要是在企业和同业间的差距分析,很少针对业务数据存在的问题进行分析,传统的内部审计限于单一的看

    中国管理信息化 2019年1期2019-02-16

  • 改进K-means算法的馈线线损计算
    进K-means算法的馈线线损计算方法。充分利用线损信号中的时域信息,获取线损信号中的平均线损率、线损率变异系数、线损率变化趋势等表征线损信号的非平稳特征。使用该算法对区域889条馈线线损进行计算分析,取轮廓系数最大时对应的k值进行聚类分析,经过65次迭代得到8个聚类结果,其中第7类平均线损率高达33.5%,第5类线损率为17.8%,但线损率变化趋势达308。可以进一步对该类馈线上的用电客户负荷曲线进行跟踪分析,确定是否存在窃漏电行为。关键词:馈线线损;改

    软件导刊 2019年12期2019-02-07

  • 基于差分隐私的RDPk—means聚类方法
    :k-means算法;差分隐私;隐私保护DOIDOI:10.11907/rjdk.181386中图分类号:TP309文献标识码:A 文章编号:1672-7800(2018)008-0205-03英文摘要Abstract:In order to solve the risk of privacy leakage in the clustering process of k-means clustering algorithm,under the premis

    软件导刊 2018年8期2018-10-29

  • 基于高中信息技术考试成绩挖掘的精准化教学辅导初探
    敖培摘要:本文首先分析了信息技术考试成绩分析的必要性。在此基础上,以我校高一某班级第一学期信息技术期末考试成绩为研究对象,采用K-Means聚类算法对学生群体分类,针对不同分类学生的特点提出了相应的差异化教学辅导策略;采用Apriori关联规则算法对学生知识点掌握情况进行了关联分析,针对分析结果提出了相应的精细化教学辅导策略,为教师精准化教学辅导提供有益的指导。关键词:考试成绩挖掘;K-Means算法;Apriori算法;教学辅导策略中图分类号:G642.

    教育教学论坛 2018年44期2018-10-13

  • 基于多线激光雷达的道边检测算法
    ;K-means算法;直线拟合DOI:10.11907/rjdk.173108中图分类号:TP306文献标识码:A文章编号:1672-7800(2018)007-0023-04Abstract:Asthepreconditionofautonomousdriving,roadedgedetectionwascrucialforintelligentvehiclestorecognizethefreedrivingspace.Byanalyzingplent

    软件导刊 2018年7期2018-09-26