张会广
(郑州宇通客车股份有限公司,河南 郑州 450000)
在具体的发展过程中,相关企业应该根据当前企业的具体发展情况,建立一个全面且高效的数据系统。并且提出公交车辆维修保养数据挖掘模型,根据当前的具体发展情况对数据挖掘模型进行不断优化和完善。从而不断提高公交车辆维修保养的质量。同时还能有效降低企业的投入成本。这在一定程度上能够促进我国交通行业得到更好的发展,人们的日常出行也能得到有效的保证。
序列模式,最早是由国外的相关技术人员提出的,所谓序列模式是指在一组有序的序列组成的数据集中经常出现的一些数据组合构成模式。序列模式与关联规则挖掘有着本质上的区别,序列模式挖掘的对象以及结果都是有序排列的,因此数据具有极强的有序性,每个序列的条目无论是在时间上还是空间上都是有序进行排列的,输出结果也十分有序,序列模式挖掘的出现在一定程度上改变了相关行业的发展。最初采用序列挖掘模式的动机是对带有事件发生时间属性的事物数据库进行更加高效的管理,最开始序列模式挖掘被广泛的应用在商品购买中,商家可以采用具有针对性的促销方式来增加顾客购买商品的数量,这样能够给商场带来更多的经济收入。当前序列挖掘模式已经成为数据挖掘的一个重要组成部分,序列模式挖掘的算法和研究应用在不断扩大,从当前的具体发展情况来看,序列模式挖掘已经被广泛的应用在医学交通以及多个领域。相关研究人员在提出了序列模式挖掘的相关理念后也提出了三种不同的序列模式挖掘算法,这三种不同的算法为序列模式挖掘的发展奠定了良好的基础。
apriori 算法是数据挖掘中序列模式挖掘中最为简单且直观的一个算法。该种算法具有十分明显的特效,采用apriori 算法的基本思想可以概括为,在前期要对相应的数据进行采集,并且找出所有的频集,对于出现的一些频集进行相应的技术处理,在处理过后,频集必须要满足最小支持度和最小可信度两个要求,这样才能更加科学有效的开展后续的工作。每一条规则的右部只有一项,在采用定义的过程中都是采用中规则的定义,规则在具体的计算过程中一旦生成,只有大于用户给定的最小可信度的规则才能够被有效的保留下来,因此这也可以算是apriori 算法的一个缺点,因此在具体的操作过程中,可以根据实际情况进行选择。
apriori2 算法是在apriori 算法中演变而来的,从本质上来说它仍然具备apriori 算法的主要思想,但是apriori2 算法融入了大量先进的思想元素,先进思想元素的运用,能够使频率的高低进行有效的排序,使用频次高的会排在前面,而使用频次低的将会排在后面,在使用有序规则的过程中,将大大降低挖掘数据集的数据量。从而有效减少相应工作的复杂性。
除了以上涉及到的2 种算法以外,gsp 也是十分有效的一种算法,gsp 算法早在1996 年就被提出,该算法虽然与apriori 算法不同,但是性质却与apriori 的性质极为相似,在引进条约约束的过程中,gsp 算法有着固有的特征,可以分层次的对不同时间间隔的约束条件进行有效引入,可以有效减少候选序列模式的数量,并且加快整个工作的执行效率。该优势是前2 种算法所不具备的优势。因此当前gsp 算法是被应用最为广泛的一种算法。但是gsp 算法也存在一定的缺点,gsp 算法并不适用于数据量比较大的数据挖掘类型,因为数据量比较大的数据挖掘类型在运行的过程中会产生大量的候选序列模型,此时就需要对原始库的数据进行多次反复的扫描,这样就会增加产生长序列的情况,而gsp 算法对于长序列无法进行有效的计算。因此gsp 算法并不适用于数据量较大的数据挖掘类型。在选择具体算法的过程中,相关技术人员可以根据当前的具体发展情况进行选择,选择最为科学有效的算法才能为后续的工作奠定良好的基础。
公交车辆的日常维修和保养,对于公交车辆的正常运行显得十分重要,日常的维修和保养可以分为常规保养和突发性的维修,这对于公交车辆的正常行驶有着极为重要的作用,如果相关企业没有建立科学有效的常规保养和维修管理制度,将会导致公交车辆在运行过程中突发一些安全事故,这会对人们的生命和财产造成极为严重的影响。在具体的发展过程中,常规保养是车辆行驶一段时间以后,在一定里程内要进行强制性的常规检查,而突发性的维修则是指车辆在运行过程中出现了一些故障而进行临时性的维修。当前在一些大型的车辆维修企业中,从车辆发生故障到故障被排除需要经过多个环节的处理,每一个处理环节都十分重要,任何一个环节出现问题,都会影响最终的问题处理效率,而且在每个处理环节过程中都会产生大量的数据信息,相关技术人员需要对这些信息进行有效的保存,将数据保存到数据库中,这样才能为后续的维修和检查提供有力的数据支持。公交车辆在维修保养的过程中会产生大量的数据,这些数据包括常规的保养数据以及车辆进行维修的数据,在维修和保养的过程中,车辆可能会存在一系列的问题,需要对这些问题进行科学有效的归纳,对于更换的配件以及保养的材料都需要进行数据记录。
根据当前的具体发展情况来看,公交车辆维修保养数据包括车辆报修的内容,车辆维修内容以及车辆保修材料3种主要的数据类型共同组成。其中车辆的维修质量以及维修效率都可以通过相应的数据进行计算。在一般情况下公交车辆从开始投入使用以后,就会开始计算相应的里程数和运营时间,在相应的里程数内需要进行多次的常规检查,如果在运行过程中发生一些突发性的障碍也需要对该种情况进行相应的数据保存,公交车辆维修保养数据适合序列模式数据挖掘的两个基本特征,因此在维修和保养的过程中,可以充分利用序列模式挖掘的模式,这样能够有效提高维修和保养的效率。
虽然在当前的发展过程中,相关部门十分重视公交车辆维修数据挖掘模型的建立,但是在建立模型的过程中仍然存在一些问题,如何提高车辆维修的质量,并且节省维修时所用的材料成本是相关维修企业应该重点研究的问题。在维修和保养的过程中,要根据当前车辆的具体情况选择不同的维修和保养方式,这样才能有效提高车辆维修和保养的效率。最大程度的发挥出车辆的使用价值,同时还能有效节约车辆的维修成本。在建立模型的过程中,应该结合公交车辆维修保养的历史数据。对于可能会出现故障的部件,进行及时的保养和更换,从而防止一些突发性安全事故的出现。
在建立公交车辆维修数据挖掘模型的过程中,要充分考虑到公交车辆维修保养数据挖掘的需求,结合当前维修的具体数据构成来建立模型。公交车辆维修保养数据挖掘模型的建立应该分为3 个不同的层次,分别为数据储存层、数据挖掘层以及用户交互层。在具体的建立过程中,只有保证这3个层次的科学和理性才能构建一个完整的数据挖掘模型。数据挖掘层是整个模型的核心,因此相关部门应该重点对数据挖掘层进行科学有效的建立,数据挖掘层在建立的过程中涉及到多方面的内容。其中包括待挖掘的数据库和数据挖掘引擎以及核心挖掘算法等等,这些内容都对整个模型的构建有着十分重要的影响。整个数据模型的挖掘数据库主要是对数据集进行科学有效的处理,数据挖掘引擎是根据数据集的特点进行建立的,在实现核心功能的过程中,需要采用数据挖掘算法。
综上所述,随着时代的不断发展,当前公交车已经成为人们日常生活中必不可少的交通工具,如何才能更好的对公交车进行维修和保养,成为了当前相关企业应该重点研究的问题。在对公交车进行维修和保养的过程中,应该充分运用序列模式挖掘的方式,建立科学有效的数据模型。这样不仅能够有效提高维修和保养效率,同时还能降低在维修和保养过程中投入的成本,使得公交企业在激烈的市场竞争下能够脱颖而出。将数据挖掘技术及其算法与城市公交车辆的维修和保养进行充分的融合,开创了一个全新的领域。虽然当前技术还不是十分成熟,在建设模型的过程中也存在一些问题,但是发展前景十分良好,相关部门应该对此进行深入的分析和研究。