早期时间序列分类方法研究综述

2021-03-14 06:56杨梦晨陈旭栋蔡鹏倪葬
关键词:分类器样本分类

杨梦晨 陈旭栋 蔡鹏 倪葬

摘要:传感器技术的普及使得时间序列数据受到人们越来越多的关注.早期时间序列分类(Early Time Series Classification, ETSC)希望通过观测尽可能短的时序数据而对其做出尽可能准确的分类,已在科技 金融领域发挥着重要的作用.首先概述了常见的时间序列分类器,并综述了基于最小预测长度、基于最大 区分子序列和基于模型的3类早期时间序列分类框架的最新研究进展.然后在每类方法中,分析了具有代 表性的早期时间序列分类模型的关键技术及其优缺点;整理了科技金融领域的公开数据集和常见的评价 指标.最后对未来的发展趋势做了展望.

关键词:早期时间序列分类;时间序列分类器;最小预测长度;最大区分子序列;机器学习 中图分类号:TP391     文献标志码:A DOI: 10.3969/j.issn.1000-5641.2021.05.011

Survey of early time series classification methods

YANG Mengchen, CHEN Xudong, CAI Peng, NI Lyu

(School of Data Science and Engineering, East China Normal University, Shanghai 200062, China)

Abstract: With the increasing popularity of sensors, time-series data have attracted significant attention. Early time series classification (ETSC) aims to classify time-series data with the highest level of accuracy and smallest possible size. ETSC, in particular, plays a critical role in fintech. First, this paper summarizes the common classifiers for time-series data and reviews the current research progress on minimum prediction length-based, shapelet-based, and model-based ETSC frameworks. There are pivotal technologies, advantages, and disadvantages of the representative ETSC methods in separate frameworks. Next, we review public time-series datasets in fintech and commonly used performance evaluation criteria. Lastly, we explore future research directions pertinent to ETSC.

Keywords: early time series classification; time series classifier; minimum prediction length; shapelet; machine learning

0引 言

時间序列数据是一组按照时间先后顺序进行排列的观测序列.时间序列数据分析是数据挖掘 领域的热点之一,也在科技金融领域中发挥着重要的作用.随着科技的进步,智能算法的成熟促使了 金融从业者有更多、更加精准的方式获取数据和用户需求.在金融市场中,深度挖掘金融产品历史 价格数据对政府和投资者有着重要的意义[1-21.以证券价格为例,精确预判证券价格对政府而言,有利 于政府加强对证券市场的把控,做出及时有效的行政干预,正确推动证券市场的健康发展;对企业或 个人投资者来说,及时感知证券价格的变化,有效规避造成巨大损失的投资风险,优化金融产品的投资组合,以此实现投资收益最大化.因此,早期时间序列分类是科技金融领域内亟待解决且具有应用 价值的问题[3],而早期时间序列分类应用广泛,如医学检测、智能交通、行为识别等领域,具有深远且 重要的研究意义.

近年来,早期时间序列分类方法受到国内外研究者的热切关注,有些学者对已有的早期时间序列 分类模型进行了系统整理,其中不乏一些优秀的综述论文[4-6].马超红等⑷于2016年对基于原始数据、 基于特征的时间序列早期分类进行了总结;同年,Santos等[5]归纳了当前已实现的主要的早期分类框 架,如ECTS、RelClass、ECDIRE,但其论文发表时间较早.随后,Gupta等[6]在早期时间序列分类领 域相关研究进展的基础上,对其方法进行了比较和归类,将其归为基于前缀、基于特征、基于模型和 其他方法等4类,但未聚焦于科技金融领域.本文与已有的综述文献不同,在总结已有方法的基础上, 更新了早期时间序列分类方法的最新进展,且侧重于分类时间点的确定策略.

本文的主要贡献:概述了时间序列分类器的构造方法;从决策时刻的角度总结并综述了以最小预 测长度(Minimum Prediction Length,MPL)、最大区分子序列(Shapelet)和模型这3类的时间序列分 类时间点的确定方法;系统性梳理了未来的研究方向,这将有助于学者后续的研究和探索.

本文的结构:第1章介绍时间序列领域的基础知识;第2章对时间序列分类器的构造方法进行阐 述,如图1(a)所示;第3章主要围绕时间序列分类时间点的确定方法进行阐述,其框架如图1(b)所示; 第4章整理早期时间序列分类问题的应用领域、数据集及评价指标;第5章讨论早期时间序列分类的 未来研究方向,并对全文进行总结.

1基础知识

本章主要介绍时间序列领域的相关定义、主要的研究问题.

1.1相关定义

(1)单变量时间序列(Univariate Time Series,UTS): —组按时间顺序排列的反映某一变量的随机 数列,又称为时间序列(Time Series,TS).令

X = (Xi ,X2, ··· ,Xt, ··· ,XT)

表示时间序列数据,其中,下标变量〖表示间隔的时刻,变量T表示结束时刻,xt表示在t时刻的观测 值,1 ? t ? T.假定每组时间序列仅有唯一可识别的样本标签c,令C表示样本标签集合.

(2)多变量时间序列(Multivariate Time Series,MTS):在同一个时间点上有多个观测数据,可表示为

X = (Xi, X2, ··· , Xt, ··· , Xt ),

xt = (xt,l, xt,2, ' ' ' , xt,j, ' ' ' , xt,K),

其中,变量K表示时间序列向量的维度,xtj表示在^时刻第j个变量的观测值,1 ? t ? T, 1 ? j ? K.

⑶最大区分子序列(Shapelet):用于刻画时间序列数据的某些属性,可作为判断依据用于预测过 程.最大区分子序列^通常定义为1个四元组

S = {s, l, S, c}.

如图2所示,在标签为c的时间序列x上,提取时间长度为l ,代表标签为c的子集s C x , J为距离阈值.

(4)准确率(Accuracy ,A):定义为正确分类样本数占总样本数#的比率,&是标记为^的第i个时 间序列样本的预测标记.准确率(A)的计算公式为

(5)早期性(Earliness ,五):定义为总时间T和时间序列的分类时间T的差值与总时间T的比率. 早期性(妁的计算公式为

1.2问题描述

早期时间序列分类(ETSC)希望能够通过尽可能少的时序数据的观测做出尽可能准确的分类.与 传统的时间序列分类不同之处在于,传统时间序列分类是在观测了所有的时序数据后做出的准确分 类判断;而早期时间序列分类不仅关注分类结果的准确率,同样也关注能够近实时地产生分类结果, 这通常被称为分类早期性.分类早期性可以让人们及时地进行应对处理,降低总体损失,如图3所示. 早期时间序列分类过程的核心在于构建时间序列分类器和确定决策时间点这两个阶段,从而达到使 用较少数据获得较大可靠性的权衡过程.

2时间序列分类器的构造方法

在早期时间序列分类的问题中,因为分类结果的准确性是一个较为重要的考量指标,所以构建适 合时间序列的分类器是一个基本问题.现有已不少应用于时间序列分类的分类器.本节将已有文献根 据分类器进行了归纳和总结,并强调了一些基于时间序列分类器而提出有针对性的早期时间序列分 类的方法.

2.1基于A;-NN分类器

念近邻(A;-Nearest Neighbors, A;-NN)是一种基于实例的学习算法:计算与已知类别样本的相似度, 从而评估未知类别样本可能的分类.由于时间序列数据的有序性、纬度高、噪声大以及序列不等长, 在以相似度作为衡量指标的时间序列分类中,选择合适的距离度量是一个关键问题.

以欧氏距离(Euclidean Distance,ED)为代表的锁步测量方法[7],是将2条时间序列的第i个时间 点进行一对一比较,如在样本少量标记的情况下,使用欧氏距离提高1-NN分类器的性能[8].另一类是 弹性测量方法,如动态时间规整(Dynamic Time Warping,DTW),其关注于创建非线性映射以对齐序 列并允许一对多点的比较.原继东等[9]为解决同类复杂时间序列存在不同的全局特性这一问题,提出 了基于局部加权DTW方法的A;-NN分类器;该分类器可以挖掘出同类复杂时间序列中的共同点以及 异类序列之间的异同点;并且由于分类器具有可解释性和有效性,他们也将其应用到多变量时间序列 分类问题中.Jeong等[1°]考虑到由于相位差引起形状相似对比时的误分类问题,提出了一种加权 DTW進行时间序列分类.Berndt等[11]将应用在语音识别领域的DTW方法成功地应用在时间序列的 模式识别中.Chen等[12]以使用欧氏距离的1-NN算法作为基准,与具有不同变形窗口的DTW方法进 行比较.锁步测量方法对有噪声、有相位差的数据较为敏感,而弹性测量方法能较好地处理时间维度 上数据的变形.实验证明,平均而言,基于DTW的距离度量方法似乎很难被击败[13-19].

2.2基于SVM分类器

支持向量机(Support Vector Machine,SVM)理论是20世纪90年代Vapnik在统计学习理论的 框架下提出的一种新型的学习机器[20],其学习策略是求解能够正确划分训练数据集,并且使得几何间 隔为最大的分离超平面.当输入空间是非线性数据集时,可以将此问题通过非线性变换转化为某个维 度特征空间中的线性分类问题,且在此特征空间中学习线性SVM分类器.SVM采用结构风险最小化, 能够较好地解决小样本、非线性和高维数问题,具有较好的泛化能力[21].

Tay等[22]通过修改SVM的正则化风险函数,提出了 “C-ascending”支持向量机模型,并基于非平 稳金融时间序列的输入变量和输出变量之间的依存关系随时间逐渐变化这一先验知识,对近期& 敏感度样本的错误,设定了一个要比远期s-敏感度样本的错误进行更严厉的惩罚.也有一些学者并非 将原生时间序列作为SVM模型的输入,如李翔宇等[23]提出了一种基于改进核函数的支持向量机算 法,即将样本与空间基的时间序列的互相关距离作为新样本映射到新的特征空间中,实现对线性核函 数改进;Jalalian等[24]引入两步走的DTW-SVM分类器,即先使用DTW方法将原生时间序列转换为 特征向量DFdtw,再将其作为SVM模型的输入;Kate[25]在DTW-SVM分类器的基础上,提出了受限 DTW窗口大小的特征向量DFdtw-r和欧氏距离提取的特征向量D^ed,依据特征向量对样本数据进 行分类.

2.3基于决策树分类器

决策树是基于树结构进行分类的成熟的机器学习算法之一,对噪声的干扰具有较好的鲁棒性,且 决策树一旦建立,未知样本的分类速度较快.基于决策树模型的特性,数据挖掘领域衍生出许多改进 算法适用于线性和非线性数据集的趋势预测[26].

在时间序列分类问题中,最早采用决策树思想的是Yamada等提出的二叉分类树,即通过穷举 搜索得到信息增益最大的1条或1对时间序列将其作为分裂节点的两种不同策略,且策略均采用 DTW方法来度量时间序列的相似性.Douzal等[28]引入一种基于时间序列邻近度的新划分准则,该准 则综合考虑了趋势相似与数值相似的自适应性的度量指标,并采用此度量指标建立能够处理时 间序列的决策树.施沫寒等[29]将基于子序列和基于决策树的分类模型进行融合,提出了组合Shapelets 森林(Random Pairwise Shapelets Forest, RPSF)模型,该模型主要应用于生物特征识别领域中,模型 不仅保留了原算法良好可解释性的优点,又降低了训练模型的开销.徐雷等在多变量时间序列数据 中考虑数据间的自相关性,引入了序列熵的概念来代替决策树中的信息熵,并提出了序列对信息增益 的新概念,以此构建时间序列决策树(Time Series Decision Tree, TSDT). XGBoost算法是基于梯度 提升决策树的改进算法[31],优化了算法本身和算法运行效率,包括回归树和分类树[32-331.

2.4基于神经网络分类器

在理论上,神经网络能映射十分复杂的非线性关系,使其具备强大的非线性泛化能力.同时,自学 习、自适应和大规模并行处理能力也是神经网络模型的优点.因此,神经网络模型广泛应用于金融[34]、 自然语言处理岡、图像识别[36]等领域.

Cui等最早在时间序列分类任务中引入神经网络模型,为解决时间序列具有不同时间尺度特 征这一问题,作者提出了一种新颖的端到端神经网络模型,即多尺度卷积神经网络(Multiscale Convolutional Neural Networks, MCNN).该模型将特征提取和分类合并在一个框架中,借助新颖的多 分支层和可学习的卷积层,自动提取不同比例和频率的特征,从而实现出色的特征表示.与基于特征 的分类模型不同,卷积神经网络(Convolutional Neural Networks, CNN)可以发现并提取合适的内部 结构,以通过使用卷积和池化操作自动生成输入时间序列的深层特征.实验结果[38]表明,CNN在分类 精度和噪声容忍度方面均优于SVM、1-NN时间序列分类模型.Wang等[39]提出的无须对原始数据或 特征进行任何预处理的端到端的基准模型,具有ResNet结构超深层神经网络的完全卷积网络(Fully Convolutional Network, FCN).相对于 MCNN、COTE (Collective of Transform-Based Ensembles)、 SE1 (Shapelet Ensemble)、BOSS (Bag-of-SFA-Symbols)等方法,FCN 具有更出色的性能.为帮助网络 快速融合,Ulyanov等[40]提出了实例归一化的思想,通过梯度下降学习每个训练实例每层的均值和标 准差.

另一种较为流行的深度学习框架是循环神经网络(Recurrent Neural Network, RNN).文献[41-43] 设计了 RNN自动编码器,基于学习到的潜在特征训练分类器,以预测给定输入时间序列的类别.长短 期记忆模型(Long Short-Term Memory, LSTM)是RNN模型的一种特殊结构类型,特点是能够学习 长距离依赖关系,解决了 RNN处理较长时间序列信息时容易出现梯度消失的问题.包振山等[44]针对 LSTM网络预测收盘价时预测能力不佳这一问题,在LSTM的模块中引入遗传算法,保证了模型预测 的平衡性.

2.5 基于HMM分类器

隐马尔可夫模型(Hidden Markov Model, HMM)是由马尔可夫模型发展而来的一种统计模型,在 此基础上增加了多个隐藏状态,可用于捕捉时间序列数据变量间的依赖关系和相关性,因而能够较好 地起到预测作用.1个HMM A可用1个三元组表示,即

Λ = (A, B, Π),

其中,义为状态转移概率矩阵,b为观测概率矩阵,n为初始状态概率向量.

Gupta等将HMM应用在交通系统识别室外环境领域的多变量时间序列中,根据不同 标记的MPL训练该变量的HMM:状态对应时间序列样本标签,维度为/的状态集合S = {S1, S2, · · · , Sl},状态转移矩阵A = (aij )l×l,其中,

aij = P (state Sj at t + 1|state Si at t).

因而得到輸入样本最有可能隐藏的状态序列,接着再使用MPL思想进行分类过程.Xing等[46]提出了 一种基于生成式模型和判别式模型的混合模型思想,即生成式模型选择HMM模型,提取长度不等且 不相交的子序列作为HMM的输入,其输出再作为判别式模型的输入,从而训练模型,一定程度上达 到了数据降维的效果.

随后,有些研究者从分类器实现的角度出发,设置激励时间序列早期分类的策略,探索基于分类 器的实现早期时间序列分类目标,如Antonucci等[47]提出的基于HMM的不精确模型(iHMM),在计 算状态概率时增加了约束条件.

3时间序列分类时间点的确定方法

早期时间序列分类的任务是在保证分类准确率的前提下,也关注于是否能够较早地获得分类结 果,即在分类准确率和时间早期性这两个评测指标中进行相互调节和权衡,从而降低数据收集的时间 成本和减小数据存储的空间成本,特别是在对时间较为敏感的应用领域.本章主要从确定时间序列分 类时间点的角度,对可适用于不同类型分类器的早期时间序列分类框架进行描述,并比较不同方法之 间的差异和优缺点.

3.1基于MPL的确定方法

基于MPL的确定方法在原生前缀空间中,使用训练集样本学习具有稳定性的时间序列的MPL, 并以学习好的MPL作为决策规则进行分类过程.Xing等[48]于2008年较早地将基于前缀的思想应用 在符号序列数据的早期分类问题中,并提出了 2种策略:序列分类规则(Sequential Classification Rule, SCR)和广义序列决策树(Generalized Sequential Decision Tree, GSDT). SCR通过提取不同前缀空间 的不同特征,再依据特征的信息增益和早期性的效用指标选择前Z个特征作为特征集,并提出最佳搜 索策略修建特征枚举树,达到最小化预测代价的目的.而GSDT将特征集看作属性,保证每个序列至 少有一个可以匹配的特征集,以此实现更早期的分类过程.

现有研究中,MPL的计算方法可以分为两类:以反向最近邻(Reverse Nearest Neighbors, RNNS) 为依据和借助标记的后验概率而构造的决策规则.一旦测试样本满足MPL条件,那么早期分类模型 在分类时间点上有能力实现对该样本的分类.

3.1.1 借助RNNS状态

首先,先引入时间序列的RNNS定义.令P是包含W个时间序列样本的有标签数据集,时间长度 为T ,在前缀空间记下,任一时间序列zG P *的RNNS定义为

RNNSt (x) = {x′ ∈ D|x ∈ NNSt (x′)}.

这里给出一个简单的例子来加以说明.给定1个训练集D, T = 3, W = 4, “和句是标签,训练 集内容如表1所示.

可以计算得出

RNNS1 (x) = RNNS2 (x) = RNNS3 (x) = {y} ,

RNNS1 (y) = RNNS2 (y) = RNNS3 (y) = {x} .

1-NN-Early框架[49]给出了时间序列;r的MPL计算方法,在T个前缀空间下,将第一个稳定且与之 后时刻的RNNS状态始终保持一致的时刻作为此时间序列的MPL值,在测试过程中,测试样本心先 在训练集P中找到最近邻,若满足当前时刻t不小于最近邻的MPL值时,即可早期地分类测试样本.

但上述MPL定义过于严苛,必须与某时刻及以后的RNNS保持一致,并且当数据集样本量过大 时,易存在过拟合现象,因此ECTS方法剛针对1-NN-Early的局限进行改进.为了实现时间序列分类 的早期性以此放松MPL定义,ECTS先求解训练集分簇后每簇的MPL值,再得到时间序列的MPL (r). 但在簇^的MPL (5O求解时,ECTS要求簇5*从前缀空间开始RNNS需满足完全稳定,也即

MPL (S) = k,

RNNSr (S) = RNNSt (S) ,k < r < T.

随之而后,又提出了 Relaxed ECTS模型[46],即修改MPL (S)的计算方法,仅要求簇S的RNNS的子序 列保持稳定即可.这样就降低了簇的最小预测长度,提高了早期预测的时间.

Ma 等[50]提出的多变量早期时间序列分类模型(Multivariate Time Series Early Classification Based on PAA, MTSECP),基于中心序列(Center Sequence)和 PAA (Piecewise Aggregate Approximation) 的方法,将MTS转换为UTS;再使用自下而上的单连接层次聚簇算法进行聚簇过程,并更新簇内时间 序列MPL值,直至簇S内所有序列MPL值不大于MPL (S)时,便停止迭代.

3.1.2借助后验概率

除使用RNNS计算MPL外,一些研究人员还通过概率模型得到的后验概率构造多样的决策规 则.这类方法的共同点是,先确定时间序列的MPL值,再确定变量的类判别性MPL.

有些决策规则仅依靠准确度阈值《151-53]和当前时刻与T时刻的后验概率比值进行比较,从而确定 时间序列的MPL值.Gupta等[52]采用高斯过程(Gaussian Process, GP)分类器,在定义时间序列 MPL(r)=t时,需满足规则

ρt,c ? α · ρT ,c,

其中,Pt,c是t时刻真实标签为C的训练样本的后验概率值,且以“游戏比赛”的形象化方式,将准确度 和早期性作为运动员,生动刻画了两者的权衡或收益.ECDIRE (Early Classification Framework for Time Series Based on Class Discriminativeness and Reliability of Predictions)1511 以時间线的想法刻 画每个标签c的“安全时刻”,这里的“安全时刻”可以理解为标签的最小预测长度或分类时间点,通过公式

AEa,c = α · AT ,c,

tc = min {ti ∈ e|?j > i, Atj ,c ? AEa,c}, e = {1, 2, · · · , T}

进行计算.公式中,为T时刻标签为c的准确率,AEa,c为预想达到的准确度水平,tc是所学习到的 标签为C的安全点,由此可以看出,使用训练样本得到的^时刻后的准确率均高于AEa,c .—旦测试样 本达到预测标签的“安全时刻”和满足训练的可靠性阈值,该样本便可以被分配标签.Gupta团队有仅 依靠准确度阈值a的早期策略[53],也有将后验概率的最大值maxi (内)与第二大值max2 (内)的差值考虑 在内通过以下不等式

max1 (ρt) ? α · max1 (ρT ),

max1 (ρt) ? max2 (ρt) ? max1 (ρT ) ? max2 (ρT )

确定MPL值.这表明t时刻的特征差异更明显,且预测正确的概率要达到一定的准确率时,方可确定 时间序列的MPL值.特别地,文献[53]和文献[54]依据在交通领域存在数据采集速率不一致这一现 象所提出的框架和方法.

随后,Gupta团队也尝试将早期时间序列分类应用于人类行为识别领域.由于人类行为数据变量 之间存在高度相关性和依赖性,因此,依据相关性分数将变量重新按序排列[55],借用偏序集的想法,选 择相关变量的集合.训练过程中,FECM (Fault-Tolerant Early Classification of MTS)引入效应函数, 此效应函数以优化准确度和早期性二者为权衡.效应函数通过公式为

其中,At表示前缀空间记时训练集样本上使用GP分类器和fc-means聚簇算法获得的准确率,E表 示分类的早期性.效应值越高则代表当前时刻能够达到最佳的早期性与准确率之间的权衡.因此,时 间序列x的MPL定义为

MPL (x) = argmin{U (x [1, t])} .

1?t?T

选取最高效应值所对应的时刻代表时间序列x的MPL值.

在多变量时间序列早期分类问题中,确定好时间序列MPL(x)值后,接下来进行基于变量的类判 别性MPL学习,如使用异常值检验算法后再取最大值记为类判别性MPL[52],使用聚簇算法后取均 值[53]、取最大值[54],也有选取最大的后验概率比值和[45]等规则.表2总结了基于MPL的分类时间点确 定方法的特点.

基于MPL的方法思想简单、易于理解,直接将原生时间序列数据作为输入,但存储和搜索整个数 据集使其具有较高的时空复杂度,这导致算法效率受限.如何更好地优化时空复杂度,提高适用性还 有待进一步研究.

3.2基于Shapelet的确定方法

Gupta等和Douzal等成功地将时间序列特征思想应用在时间序列分类领域,这便为许多学者研 究早期分类问题提供了崭新的思路.由于Shapelet的想法简单,在之后的一段时间里,它都是早期时 间序列分类领域的主流方法.其主要思想在于创建特征集(Bag of Features),作为早期预测的判断标 准.早些时候,研究者试图挖掘完美的特征集[56],致力于判别所有的时间序列,但事实证明这一想法是 不实际的;紧接着,研究者将注意力转到挖掘有效的特征集.

在这里,特征S = {M,^c},在学习距离阈值时,计算s和标记为c的时间序列z的距离,相应公式为

当测试样本到达时,计算特征^和测试样本的距离d,若d不大于<5则分配特征^的标签c.此类早期 分类方法,对于给定的数据集,先提取所有可能的不同长度的特征序列,再进行优质特征的选择.在进 行特征选择时,主要归纳总结为两种策略:借助效应函数和聚簇算法.

3.2.1借助效应函数

效应函数可以作为衡量特征质量的一种指标,构造不同表现形式的效应函数,能够体现特征本身 所隐含的价值信息.

文献[57-58]使用相同的效应函数,将其定义为关于特征S的精确度P (5O和加权召回率flw (5O的 调和平均数,通过进行计算,其中,P(S)代表特征S捕获类别的判别能力.尤为注意的是,Rw(S)衡量了特征S的早期性和出现频率.EDSC (Early Distinctive Shapelet Classification)[5M+算特征S的效应值后,进行降序排 序,从高到低依次判别特征是否可以覆盖训练集所有剩余的时间序列,直至覆盖完毕后,停止特征集 的构造过程,从而达到修剪特征集的目标.可以发现,EDSC通过特征选择和满足匹配的特征距离阈 值后,便可分配标签,但却未考虑分类结果的可靠性或置信度.因此,Ghalwash等[58]提出带有不确定 性估计的EDSC模型(MEDSC-U). MEDSC-U与EDSC有两点不同,一是在修剪特征集合的過程中, MEDSC-U不仅将当前效应值较高的特征加入特征集,而且把当前相同效应值的特征也加入进来,从 而增加选取特征的个数,丰富模型使得提高分类准确率;二是在分类过程中,MEDSC-U遵循的规则 也大不相同,首先测试样本与所有选择出的特征进行距离计算,再计算满足要求且匹配特征的分类可 靠性,最终选取最大可靠性或最小不确定性的特征所对应的标记作为预测标记.

一些学者[59-60]借助信息增益来完成有效特征集的选择.REACT (Reliable EArly ClassificaTion)[59] 定义效应函数为其中,F(办)代表包含特征5·的训练集样本的信息增益,^―⑶和^以⑶含义相似,参数^控制特 征的早期性和信息增益的相对重要性.为了避免挑选过多的冗余特征,特提出“等价类挖掘”思想,此 模型也适用于同时具有离散型变量和连续型变量的数据集.MSD (Multivariate Shapelets Detection)16。1 将基于特征的思想应用在多变量时间序列早期分类中,先提取有相同起点维度和终点维度的多个多 变量特征,再为每个特征计算基于距离阈值的信息增益,最终以加权信息增益进行修剪和挑选必要的 特征.

指标GEFM (Generalized Extended F-Measure)1611借鉴指标巧分数的思想来构建核心的特征集, 它是精确率、召回率和早期性的调和平均数,具体定义为其中,ω1 + ω2 + ω3 = 1. GEFM取值越大,代表特征5具有越优质的辨别特性.

3.2.2借助聚簇算法

在计算衡量特征质量的指标前,由于考虑到特征对分类过程的贡献差异,因此一些学者借助聚簇 算法162-63],过滤或修剪贡献度较小的特征,使得在分类时特征更具有高效性和解释性.IPED (Interpretable Patterns for Early Diagnostics)1621为了发现MTS中具有关联性的变量,构造优化问题 进行求解,再对每个关联变量的特征候选者聚簇为Z个组G为标签总数),在每组中选择唯一的特征代 表,为分类阶段提供特征依据.MEShapelet (Multivariate Early Shapelet)1631计算每个特征候选者的时 间容忍度阈值,用于限制多变量特征的维度偏差,再使用聚簇算法后计算信息增益进而选择最佳的特 征,使用决策树进行分类过程,此框架适用于采样速度不同的时间序列数据集中.

He等1641为MTS提出了一·个带有可解释性规则的早期分类框架(Confident Early Classification on Multivariate Time Series with Interpretable Rules,CECMR),这 一·规则使用局部极值和转折点的 思想,类似于通过聚簇算法找到具有核心且关键的时刻:若时间序列$的局部极值点为z W,则需满足 条件若时间序列X的转折点为X [t],可通过条件来确定.挖掘出解释性规则后,估计每个规则的置信度从而构造特征集.

同是应用在 MTS 领域中,与 EPIMTS (Early Prediction on Imbalanced Multivariate Time Series)1611、 MSD、IPED 不同的是,MCFEC (Mining Core Feature for Early Classification)1651 考虑了不同变量特 征间的相关性,增加特征的可解释性,但却未考虑分类早期性的实现.可以看出,基于Shapelet的时间 点确定方法主要围绕特征提取和选择的策略,有些方法并未涉及分类器的实现.因此,表3仍按照分 类器实现进行简要分类.

此类方法通过对原生时间序列进行特征提取和选择,使得早期分类过程具有较强的可解释性,相 比基于MPL的方法,减小了数据存储的空间成本,但在特征选择过程中,这类方法的计算成本较高.

3.3基于模型的确定方法

与基于MPL、基于Shapelet的方法不同,基于模型的确定方法主要思想可归结为“两步走”策略.

第一步使用判别式、生成式模型计算得到给定观测下不同标记所对应的后验概率,即得到后验概率的 合理估计;第二步基于上述的后验概率值,通过异常值检测算法,停止规则等早期决策策略进行样本 可靠性的核对和筛选.接下来,将从机器学习和深度学习领域的角度,主要阐述基于模型的早期分类 方法如何确定分类时间点.

3.3.1基于机器学习

在现有研究中,多数通过选取合适的数理模型,得到给定样本下不同标记的条件概率,分类器试 图学习类别之间的决策边界从而设计不同的决策规则或停止规则,以优化预测的早期性和可靠性 之间的权衡.此外,一些现存方法167-681虽未将可靠性参数纳入模型中,但仍提供了明显的早期性.

Mori等[_]引人形式多样的“停止规则”(Stopping Rule, SR),并构造关于准确度和早期性的代价 函数(Cost Function, CF),以此训练时间序列的最优预测时刻.他们根据分类器输出的/个标记对应 的后验概率值,构造和当前时刻i、最大后验概率值maxi(pt)、最大与第二大后验概率max2Oot)差值 有关的停止规则,定义为

其中,参数γ1 γ2 γ3 γ4 ∈ [?1, 1],可通过优化代价函数进而确定,且代价函数是早期性和准确度代价 的线性组合,具体形式为

CF1 = ∑x∈D(CF1 (x, SR1)) =x∑∈D(αCa (x, SR1) + (1 ? α) Ce (x, SR1))

其中,Ca代表使用O?1损失函数的准确度代价,Ce代表早期性代价,参数a G [0,1]调节准确度和早 期性代价的权重.随后,又提出停止规则SR2,将/个后验概率均考虑入内.SR2表示为

并且,将模型复杂度也作为代价函数CF2和CF3的影响因素,具体为

CF2 = ∑x∈D(αCa (x, SR1) + (1 ? α) Ce (x, SR1)) ? λ||γ||0,

CF3 = ∑x∈D(αCa (x, SR1) + (1 ? α) Ce (x, SR1)) ? λ||γ||xEV

一些学者在实现分类早期性时,提出新颖的“未来决策”观点171-721,以长远的眼光判断当前观测序 列在未来是否会存在最佳预测时刻.两者不同的是,Dachraoui等[71]寻找最佳时刻的代价函数时,采用 训练集聚簇后误分类样本A的期望损失加权和屄(x丄具体定义为

Et (xt) = ∑bk P (bk|xt)∑c ∑c? P (c|bk) Pt+τ (?c|c, bk) C (?c|c) + C (t + τ ),

其中,bkGB, B是簇的集合;参数TG(0,T-t),表示未来时刻和当前时刻t的时间间隔;C(咏)表示 误分类样本的代价函数;C(t + r)代表未来时刻预测时所消耗的时间等待成本.而Tavenard等[72]为降 低时空复杂度,舍弃聚类步骤,直接计算训练样本的期望损失加权和,具体形式是

Et (xt) = ∑c P (c|xt)∑c? Pt (?c|c, xt) C(?c, c) + C (t).

并且框架依旧具有适应性和决策的未来性,提高了算法性能.

为提高分类准确率,提出了分类器“集成”思想[73-76],并精心设计了分类器聚合过程.Ando等叫提 出并实现了由不同响应间隔时间的SVM分类器组成的集成模型(Chronological Ensemble, CE),将构 造集成分类器问题转化为二次规划问题,具体形式为

所需满足的条件是其中,$表示所有训练数据上的平均松弛因子;是矩阵z在第〖时刻第&个取值,矩阵^表示预测 时间的0-1矩阵;心表示第个分类器的置信度阈值;惩罚参数Pk表示分类器fc的正则化因子,并使 用基于约束的cutting-plane迭代算法进行求解.集成分类器[74]根据前弱分类器的学习误差率更新训 练样本权重,希望误差率高的样本在后弱分类器中得到更多重视,如此反复进行,将多个弱分类器进 行整合得到最终的强学习器.为了实现早期预测的效果,在当前迭代时刻的最终分类结果由有结果的 弱分类器的线性组合而确定,而无结果的弱分类器则被抛弃或不给予考虑.Hatami等在每个时刻 下构建一对准确率最高且DF值最小的SVM分类器,其中DF值是两个SVM分类器同时误分类样本 占总样本数的比例,DF值越小,代表分类器间越具有丰富的多样性,包含更多可识别特征进而体现分 类的早期性.与文献[67]相同的是,TEASER (Two-tier Early and Accurate Series classifiER)[76]每隔 固定窗口大小也建立成对分类器(从分类器和主分类器),分别负责保证准确度和提高早期性,是“两 步走”策略的经典模型之一.在主分类器中,介于不平衡样本可能导致模型的表现能力不佳这一担忧, 因此使用单分类SVM模型.单分类SVM模型为正確分类的样本构造超球体,超球体的半径越小即越 好,使得假阳性的样本被划分到超球体之外,优化方程是

需满足的条件为

|xi ? O| ? R + ξi, ξi > 0,

其中,超球体的球心为O,半径为R, Xi是第i个时间序列样本.在测试阶段,从分类器的输出作为主 分类器的输入,判断测试样本是否落在超球体内,进而给出决策.

也有其他机器学习模型应用到早期分类问题中.当输入序列具有不确定性和不稳定性时,使得在 估计模型参数时准确度有一定影响.Antonucci等|47]提出的基于HMM的不精确模型(iHMM)与HMM 模型的不同之处在于,计算状态概率时设置了约束条件,使得状态变量个数缩减.借用fc-NN算法的思 想,成功应用于工厂故障检测和定位[77],但本质上却没有考虑准确率和早期性之间的权衡.Li等[68]使 用泊松点过程模型(Dynamic Marked Point, DMP)[56]对时间动态变化这一特性进行建模,将连续空间 通过切片而离散化.由于人类行为[56]在时间上具有很大的相关性或依赖性,因此在文献[68]基础上, 增加使用部分观测预测(Prediction of Partial Match, PPM)[56]的想法,在特征集中找到具有依赖性的 特征,从而避免等待无效特征的时间耗费,提高行为识别的早期性.

3.3.2基于深度学习

伴随深度学习技术的快速发展,早期时间序列分类问题取得了突破性的进展,尤其在具有非平 稳、非线性的金融时间序列中得以展现,它能够挖掘出一些隐藏在数据中很难被发现的内在规律,促 进了一些学者将深度学习框架应用在早期分类领域中.

Martinez等[78]提出了一个端到端的强化学习智能体       深度Q网络(Deep Q-Network, DQN),

在此定义权衡准确性和早期性的奖励函数,并适用于多种类型的时间序列,包括一元时间序列、多元 时间序列、符号时间序列.

文献[79-80]均采用LSTM和CNN的混合模型:Huang等[79]应用在MTS中,为实现较早地分配标 签,在全连接层将时域和频域所提取的LSTM序列进行整合,再使用激活函数ReLU提取隐藏信息; 在最小化损失函数时[80],特地将早期性考虑入内,相应公式为

La = 1 ? c?+, Le = tT ,

Lt = αLa + (1 ? α)Le.

在实验中,设置较低的权重适用于低延迟项的惩罚.

Cheng等[67]使用深度神经网络,分别为人类复杂活动(Complex Activity, CA)和动作序列(Action Sequence, AS)构建两个独立模型ASM (AS Model)和CAM (CA Model).在真实数据集CA上,实验结 果表明,与 LSTM、1-NN+DTW 和 MD+MPP (Multilevel-Discretized Marked Point-Process)方法相比, 他们提出的 SimRAD (Simultaneous Complex Activities Recognition and Action Sequence Discovering) 在预测准确度指标上平均高出了 7.2%.表4为基于模型的分类时间点确定方法的总结.

基于模型的方法具有较高的结构化程度,相比于前两类方法,应用不同类型的分类时间点确定策 略使得早期性有所提升.但由于深度学习模型的“黑盒”特性,希望可以融合机器学习模型,增加分类 解释性,以此推动早期时间序列分类领域的深度研究,也是未来重要的研究方向之一.表5是对上述 3类方法的总结和对比.

4应用领域、数据集及评测指标

近年来,早期时间序列分类在不同领域都受到了广泛关注.与此同时,在该领域的研究活动中,高 质量的公开数据集和统一的评价指标至关重要,使得学者在相同数据集上进行不同模型的性能比较, 为进一步研究打下铺垫.

4.1应用领域

金融领域:以金融时间序列数据为载体的早期分类方法可用于解决诸多问题,例如,通过收集消 费者对多类金融产品的投诉声音,以此改善金融市场的运作状态;预测企业在将来是否会出现财务困 境,判断年度财务状况是否健康,有利于帮助企业调整未来工作结构;根据真实成交量信息,预估该企 业是否存在财务欺诈行为等[81].

其他领域也有广泛的应用性.

(1)医学检测:心电图时间序列是由心脏活动产生的电信号的时间序列,对重症患者的心电图数 据进行研究,从而降低心力衰竭和突发心脏病的发病概率[61,65,71];研究患者的病毒感染、对疾病的药物 反应和患者从疾病中的恢复状况,达到降低疾病对患者损害的目的16°,62,821.

(2)智能交通:随着交通设施的不断完善和无人驾驶技术的成熟,早期分类问题对智能交通技术 的研究显得尤为重要.研究人员通过在车辆内外安装传感器来观测驾驶员行为和外部路面环境,在恶 劣的天气情况下,做出明智且及时的决策,增加驾车安全性[33,45,53—541.

(3)行为识别:分析由传感器收集的人类行为数据,一方面有助于人们进一步了解自己的身体状 态,促进培养健康的生活作息规律;另一方面能够分析一些以用户为中心的应用识别不同的人类行为, 这些应用包括手语研究[68]、身体姿态[56]、行为状态[55]等.

4.2数据集

Kaggle是当下所青睐的数据建模和数据分析竞赛平台,该平台收集了用于企业和研究者的数据, 为统计学者和数据挖掘专家产生更好的模型.特别地,表6展示了 Kaggle金融领域热度前五的数据集 信息,为研究者提供对比数据集.

但现有的早期时间序列分类文献中采用科技金融领域中案例或数据较少.本文整理发现约八成 的参考文献使用来自UCR数据库的现有公开数据集,并统计了最为常见的五个公开数据集及其使用 的比例,如图4所示.此外,在现有的早期时间序列分类模型的研究中,有些研究者从诸如无人驾驶、 基因检测等实际应用领域的問题出发而提出了具有创新性的方法与模型.由于隐私保护的原因,这部 分数据集未得到公开.

4.3评价指标

由于时间序列早期分类本身是双目标问题,需要在准确率和早期性二者之间进行权衡.该领域常 用的评价指标为巧分数、覆盖率、平均FAvg分数等.

(1)巧分数(巧-score,巧):该指标将早期性(功和准确率(⑷的调和平均数用于度量,并且取值 越高,说明模型的表现能力越优,具体形式为

(2)覆盖率(Coverage Ratio, CCR):定义为已分类样本数占总样本数#的比率,可表示为

其中,当预测标记为NA时,表明该样本未被模型所识别或分类.

(3)平均4vg分数(Avg F-score, 4vg):该指标将所有标签的精确率(Precision,巧和召回率 (Recall,均的调和平均数的平均值作为评价指标之一,同时结合早期性、覆盖率进行综合考量.具体 形式分别为

其中,c代表标签集.

5总结与展望

本文对时间序列分类时间点的确定方法进行了系统的分类和总结,并详细介绍了每类中常被使 用的方法,对该领域近几年出现的基于深度学习框架的早期分类方法进行了调研与总结.除了对各类 方法的介绍外,也针对每类方法存在的问题进行了分析与评述.纵览早期时间序列分类模型的发展历 程,本文总结了一些未来可能的研究方向,具体如下.

(1)基于MPL的方法具有较高的时空复杂度,未来可结合解释性,进而提升时间序列的空间利用率.

(2)特征选择阶段消耗了大量时间,提高算法效率是基于Shapelet的早期时间序列分类方法中值 得研究的方向之一.

(3)由于深度学习领域的快速发展,很多学者忽略了一些较为传统的方法,导致深度学习框架和 传统方法的割裂.希望未来将二者进行深度融合,在提高准确率和早期性的同时,也增加分类的可解 释性.

在这项早期时间序列分类方法的研究工作中,我们期待有更多学者参与其中;也希望本文能够对 国内基于时间序列的早期分類方法和科技金融领域的时间序列分析方法的研究提供一些启发与帮助.

[参考文献]

[1]KAO L J, CHIU C C, LU C J, et al. A hybrid approach by integrating wavelet-based feature extraction with MARS and SVR for stock index forecasting [J]. Decision Support Systems, 2013, 54(3): 1228-1244.

[2]LEUNG M T, DAOUK H, CHEN A S, et al. Forecasting stock indices: A comparison of classification and level estimation models [J]. International Journal of Forecasting, 2000, 16(2): 173-190.

[3 ] MORI U, MENDIBURU A, MIRANDA I M, et al. Early classification of time series using multi-objective optimization techniques [J]. Information Sciences, 2019, 492(3): 204-218.

[4]马超红,翁小清.时间序列早期分类综述[J].微型机与应用,2016, 35(16): 13-15.

[5]SANTOS T, KERN R. A literature survey of early time series classification and deep learning [C/OL]// SamI40 Workshop at i-KNOW'IG. [2021-07-02]. http://ceur-ws.org/Vol-1793/paper4.pdf.

[6]GUPTA A, GUPTA H P, BISWAS B, et al. Approaches and applications of early classification of time series: A review [J]. IEEE Transactions on Artificial Intelligence, 2020, 1(1): 47-61.

[7]ABANDA A, MORI U, LOZANO J A. A review on distance based time series classification [J]. Data Mining and Knowledge Discovery, 2018, 33: 378-412.

[8]WEI L, KEOGH E. Semi-supervised time series classication [C]// Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2006: 748-753.

[9]原继东,王志海,孙艳歌,等.面向复杂时间序列的近邻分类器[J].软件学报,2017, 28(1(1): 3002-3017.

[10]JEONG Y S, JEONG M K, OMITAOMU O A. Weighted dynamic time warping for time series classification [J]. Pattern Recognition, 2011, 44(9): 2231-2240.

[11]BERNDT D J, CLIFFORD J. Using dynamic time warping to find patterns in time series [C]// Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining. AAAI, 1994: 359-370.

[12]CHEN Y P, KEOGH E, HU B, et al. The UCR time series classication archive [EB/OL] .(2015-07-1(5) [2021-07-21]. https://www.cs.ucr.edu/~eamonn/time_series_data/.

[13]LINES J, BAGNALL A. Time series classification with ensembles of elastic distance measures [J] . Data Mining and Knowledge Discovery, 2015, 29(3): 565-592.

[14]XI X P, KEOGH E, SHELTON C, et al. Fast time series classification using numerosity reduction [C] // Proceedings of the 23rd International Conference on Machine Learning. 2006: 1033-1040.

[15]ESLING P, AGON C. Time-series data mining [J]. ACM Computing Surveys, 2012, 45(1): 1-34.

[16]XING Z Z, PEI J, KEOGH E. A brief survey on sequence classification [J]. ACM SIGKDD Explorations Newsletter, 2010, 12(1): 4048.

[17]WANG X Y, MUEEN A, DING H, et al. Experimental comparison of representation methods and distance measures for time series data [J]. Data Mining and Knowledge Discovery, 2013, 26(2): 275-309.

[18]CHEN Y P, HU B, KEOGH E, et al. DTW-D: Time series semi-supervised learning from a single example [C] // Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2013: 383-391.

[19]DING H, TRAJCEVSKI G, SCHEUERMANN P, et al. Querying and mining of time series data: Experimental comparison of representations and distance measures [J]. VLDB Endowment, 2008, 1(2): 1542-1552.

[20]胡蓉.多輸出支持向量回归及其在股指预测中的应用[J].计算机技术与发展,2007(10): 226-229.

[21]张倩倩,林天华,祁旭阳,等.基于机器学习的股票预测研究综述[J].河北省科学院学报,2020, 37(4): 15-21.

[22]TAY F E H, CAO L J. Modified support vector machines in financial time series forecasting [J]. Neurocomputing, 2002, 48(1/2/3/(4): 847-861.

[23]李翔宇,李瑞兴,曾燕清.基于改进核函数的支持向量机时间序列数据分类[J].信阳农林学院学报,2021, 31(1): 121-126.

[24]JALALIAN A, CHALUP S K. GDTW-P-SVMs: Variable-length time series analysis using support vector machines [J]. Neurocomputing, 2013, 99(1): 270-282.

[25]KATE R J. Using dynamic time warping distances as features for improved time series classification [J] . Data Mining and Knowledge Discovery, 2015, 30(2): 283-312.

[26]PANIGRAHI S S, MANTRI J K. A text based Decision Tree model for stock market forecasting [C]// Proceedings of the 2015 International Conference on Green Computing and Internet of Things (ICGCIoT). 2015: 405-411.

[27]YAMADA Y, SUZUKI E, YOKOI H, et al. Decision-tree induction from time-series data based on a standard-example split test [C]// Proceedings of the 20th International Conference on International Conference on Machine Learning. 2003: 840-847.

[28]DOUZAL A, AMBLARD C. Classification trees for time series [J]. Pattern Recognition, 2012, 45(3): 1076-1091.

[29]施沫寒,王志海.一种基于时间序列特征的可解释步态识别方法[J].中国科学:信息科学,2020, 50(3): 438-460.

[30]徐雷,WEBB G I, PETITJEAN F,等.基于動态集成决策树的多类别时间序列分类模型[J].计算机应用研究,2018, 35(6): 1712-1715.

[31]王燕,郭元凯.改进的XGBoost模型在股票预测中的应用[J].计算机工程与应用,2019, 55(20): 202-207.

[32]ANDERSSON J O. The new foundations of evolution: on the tree of life [J]. Systematic Biology, 2010, 60(1): 114-115.

[33]HENDRIK J, MURPHY M, ONSLOW T. Classification trees as a tool for operational avalanche forecasting on the Seward Highway, Alaska [J]. Cold Regions Science and Technology, 2014, 97: 113-120.

[34]LIU G, WANG X J, LI R F. Multi-scale RCNN model for financial time-series classication [EB/OL]. (2019-11-2(1) [2021-07-02]. https://arxiv.org/pdf/1911.09359.pdf.

[35]SUTSKEVER I, VINYALS O, LE Q V. Sequence to sequence learning with neural networks [C]// Proceedings of the 27th International Conference on Neural Information Processing Systems - Volume 2. 2014: 3104-3112.

[36]SZEGEDY C, LIU W, JIA Y Q, et al. Going deeper with convolutions [C] // 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2015: 1-9. DOI: 10.1109/CVPR.2015.7298594.

[37]CUI Z C, CHEN W L, CHEN Y X. Multi-scale convolutional neural networks for time series classification [EB/OL]. (2016-032(2) [2021-07-02]. https://arxiv.org/pdf/1603.06995v4.pdf.

[38]Z^BIK M, KORYTKOWSKI M, ANGRYK R, et al. Convolutional neural networks for time series classification [J]. Journal of Systems Engineering and Electronics, 2017, 28(1): 162-169.

[39]WANG Z G, YAN W Z, OATES T. Time series classification from scratch with deep neural networks: A strong baseline [C]// 2017 International Joint Conference on Neural Networks (IJCNN) . IEEE, 2017: 1578-1585.

[40]ULYANOV D, VEDALDI A, LEMPITSKY V. Instance normalization: The missing ingredient for fast stylization [EB/OL]. (2016-0727) [2021-07-02]. https://arxiv.org/pdf/1607.08022v3.pdf.

[41]MEHDIYEV N, LAHANN J, EMRICH A, et al. Time series classification using deep learning for process planning: A case from the process industry [J]. Procedia Computer Science, 2017, 114: 242-249.

[42]MALHOTRA P, TV V, VIG L, et al. TimeNet: Pre-trained deep recurrent neural network for time series classification [C]// 25th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. 2018: 607-612.

[43]RAJAN D, THIAGARAJAN J. A generative modeling approach to limited channel ECG classification [C]// 2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC). IEEE, 2018: 2571-2574.

[44]包振山,郭俊南,謝源,等.基于LSTMG-GA的股票价格涨跌预测模型[J].计算机科学,2020, 47(1): 467-473.

[45]GUPTA A, GUPTA H P, BISWAS B, et al. An early classification approach for multivariate time series of on-vehicle sensors in transportation [J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(1(2): 5316-5327.

[46]XING Z Z, PEI J, PHILIP S Y. Early classification on time series [J]. Knowledge and Information Systems, 2012, 31(1): 105-127.

[47]ANTONUCCI A, SCANAGATTA M, MAUA D D, et al. Early classification of time series by hidden Markov models with set-valued parameters [C] // Proceedings of the NIPS Time Series Workshop. 2015: pp 1-5.

[48]XING Z Z, PEI J, DONG G Z, et al. Mining sequence classifiers for early prediction [C] // SIAM International Conference on Data Mining. 2008: 644-655.

[49]XING Z Z, PEI J, YU P S. Early prediction on time series: A nearest neighbor approach [C]// Proceedings of the 21st International Jont Conference on Artifical Intelligence. 2009: 1297-1302.

[50]MA C H, WENG X Q, SHAN Z N. Early classification of multivariate time series based on piecewise aggregate approximation [C]// International Conference on Health Information Science, HIS 2017, Lecture Notes in Computer Science, vol 10594. Cham: Springer, 2017: 81-88.

[51]MORI U, MENDIBURU A, KEOGH E, et al. Reliable early classification of time series based on discriminating the classes over time [J]. Data Mining and Knowledge Discovery, 2017, 31(1): 233-263.

[52]GUPTA A, PAL R, MISHRA R, et al. Game theory based early classification of rivers using time series data [C]// 2019 IEEE 5th World Forum on Internet of Things (WF-IoT). IEEE, 2019: 686-691.

[53]GUPTA A, GUPTA H P, DUTTA T. Early classification approach for multivariate time series using sensors of different sampling rate [C]// 2019 16th Annual IEEE International Conference on Sensing, Communication, and Networking (SECON). IEEE, 2019: 1-2. DOI: 10.1109/SAHCN.2019.8824960.

[54]GUPTA A, GUPTA H P, BISWAS B, et al. A divide-and conquer -based early classification approach for multivariate       time series with

different sampling rate components in IoT [J] . ACM Transactions on Internet of Things, 2020, 1(2): 1-21.

[55]GUPTA A, GUPTA H P, BISWAS B, et al. A fault-tolerant early classification approach for human activities using multivariate time series [J]. A fault-tolerant early classification approach for human activities using multivariate time series, 2021, 20(5): 1747-1760.

[56]LI S, LI K, FU Y. Early recognition of 3D human actions [J] . ACM Transactions on Multimedia Computing, Communications, and Applications, 2018, 14(1): 1-20.

[57]XING Z Z, PEI J, YU P S, et al. Extracting interpretable features for early classification on time series [C]// Proceedings of the 2011 SIAM International Conference on Data Mining (SDM). SIAM, 2011: 247-258.

[58]GHALWASH M F, RADOSAVLJEVIC V, OBRADOVIC Z. Utilizing temporal patterns for estimating uncertainty in interpretable early decision making [C] //Proc SIGKDD, 2014: 402-411.

[59]LIN Y F, CHEN H H, TSENG V S, et al. Reliable early classification on multivariate time series with numerical        and categorical attributes [C] // Advances in Knowledge Discovery and Data Mining, PAKDD 2015, Lecture Notes in Computer Science,  vol 9077. Cham: Springer, 2015: 199-211.

[60]GHALWASH M F, OBRADOVIC Z. Early classification of multivariate temporal observations by extraction of interpretable shapelets [J]. BMC Bioinformatics, 2012, 13: Article number 195.

[61]HE G L, DUAN Y, QIAN T Y, et al. Early prediction on imbalanced multivariate time series [C]// Proceedings of the 22nd ACM International Conference on Information & Knowledge Management. ACM, 2013: 1889-1892.

[62]GHALWASH M F, RADOSAVLJEVIC V, OBRADOVIC Z. Extraction of interpretable multivariate patterns for early diagnostics [C]// 2013 IEEE 13th International Conference on Data Mining. IEEE, 2013: 201-210.

[63]ZHAO L, LIANG H Y, YU D M, et al. Asynchronous multivariate time series early prediction for ICU transfer [C]// Proceedings of the 2019 International Conference on Intelligent Medicine and Health. ACM, 2019: 17-22.

[64]HE G L, ZHAO W, XIA X W. Confidence-based early classification of multivariate time series with multiple interpretable rules [J] . Pattern Analysis and Applications, 2020, 23: 567-580.

[65]HE G L, DUAN Y, ZHOU G F, et al. Early classification on multivariate time series with core features [C]// Database and Expert Systems Applications, DEXA 2014, Lecture Notes in Computer Science, vol 8644. Cham: Springer, 2014: 410-422.

[66]NG A Y, JORDAN M I. On discriminative vs. generative classifiers: A comparison of logistic regression and naive bayes [C]// NIPS, 2002: 841-848.

[67]CHENG W H, ERFANI S M, ZHANG R, et al. Predicting complex activities from ongoing multivariate time series [C] // Proceedings of the 27th International Joint Conference on Artificial Intelligence. ACM, 2018: 3322-3328.

[68]LI K, LI S, FU Y. Early classification of ongoing observation [C] // 2014 IEEE International Conference on Data Mining. IEEE, 2014: 310-319.

[69]MORI U, MENDIBURU A, DASGUPTA S, et al. Early classification of time series by simultaneously optimizing the accuracy and earliness [J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 29(10): 4569-4578.

[70]MORI U, MENDIBURU A, DASGUPTA S, et al. Early classification of time series from a cost minimization point of view [C]// Proceedings of the NIPS Time Series Workshop. 2015: 1-5.

[71]DACHRAOUI A, BONDU A, CORNU'EJOLS A. Early classification of time series as a non myopic sequential decision making problem [C] // Machine Learning and Knowledge Discovery in Databases, ECML PKDD 2015, Lecture Notes in Computer Science, vol 9284. Cham: Springer, 2015: 433-447.

[72]TAVENARD R, MALINOWSKI S. Cost-aware early classification of time series [C]// Machine Learning and Knowledge Discovery in Databases, ECML PKDD 2016, Lecture Notes in Computer Science, vol 9851. Cham: Springer, 2016: 632-647.

[73]ANDO S, SUZUKI E. Minimizing response time in time series classification [J]. Knowledge and Information Systems, 2016, 46(2): 449-476.

[74]GONZALEZ C J A, DIEZ J J R. Boosting interval-based literals: Variable length and early classification [C]// Series in Machine Perception and Artificial Intelligence: Volume 83, Data Mining in Time Series and Streaming Databases. Singapore: World Scientific Publishing Co Pte Ltd, 2004: 149-171.

[75]HATAMI N, CHIRA C. Classifiers with a reject option for early time-series classification [C]//2013 IEEE Symposium on Computational Intelligence and Ensemble Learning (CIEL). IEEE, 2013: 9-16.

[76]SCHAFER P, LESER U. Teaser: Early and accurate time series classification [J]. Data Mining and Knowledge Discovery, 2020, 34: 1336-1362.

[77]BREGON A, SIMON M A, RODRIGUEZ J J, et al. Early fault classification in dynamic systems using case-based reasoning [C]// Current Topics in Artificial Intelligence, CAEPIA 2005, Lecture Notes in Computer Science, vol 4177. Berlin: Springer, 2006: 211-220.

[78]MARTINEZ C, PERRIN G, RAMASSO E, et al. A deep reinforcement learning approach for early classification of time series [C]// 2018 26th European Signal Processing Conference (EUSIPCO). IEEE, 2018: 2030-2034.

[79]HUANG H S, LIU C L, TSENG V S. Multivariate time series early classification using multi-domain deep neural network [C]// 2018 IEEE 5th International Conference on Data Science and Advanced Analytics (DSAA). IEEE, 2018: 90-98.

[80]RU6WURM M, LEFEVRE S,COURTY N, et al. End-to-end learning for early classification of time series [EB/OL]. (2019-0130) [2021-07-02]. https://arxiv.org/pdf/1901.10681.pdf.

[81]Kaggle Datssets [EB/OL]. [2021-07-02]. https://www.kaggle.com/datasets.

[82]GHALWASH M F, RAMLJAK D, OBRADOVIC Z. Early classification of multivariate time series using a hybrid hmm/svm model [C] // 2012 IEEE International Conference on Bioinformatics and Biomedicine. IEEE, 2012: 1-6. DOI: 10.1109/BIBM.2012.6392654.

(責任编辑:李艺)

猜你喜欢
分类器样本分类
分类器集成综述
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
按需分类
教你一招:数的分类
说说分类那些事
基于AdaBoost算法的在线连续极限学习机集成算法
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
给塑料分分类吧