蒲倩
【摘要】函数性数据分析(FDA)是一种新型数据分析方法,该种分析方法是建立在函数角度基础上,强调将函数数据作为整体进行分析,函数性数据有效丰富了数据分析领域,为解决数据问题提供了强有力的支撑,该种技术属于探索性技术,对函数通特征描述与特征提取到起到了理想的成效,数性数据分析有着很大的优越性,能够通过微分曲线与导数曲线来处理信息,本文主要讨论函数性数据分析中的主成分分析.
【关键词】函数性数据分析;主成分分析;讨论
在人们的日常生活中,常常需要处理各种各样的数据,其中很多数据是有函数特征的,如气象数据、证券交易数据等等,函数性数据分析(FDA)是一种新型数据分析方法,该种分析方法是建立在函数角度基础上,强调将函数数据作为整体进行分析.
与传统数据分析方法相比而言,函数性数据分析有着很大的优越性,能够通过微分曲线与导数曲线来处理信息,截至目前为止,各界的专家学者已经针对函数性数据进行了深入的分析,下面就针对函数性数据分析的主成分进行相应的介绍.
一、传统主成分分析
主成分分析在1901年开始在正交回归分析中得到了应用,在1933年,主成分分析法得到了一定的发展,该种分析方式能够将高维空间问题变成低维空间问题,这样即可将问题直观化、简单化,虽然该种分析法会损失部分数据,但是却抓住了主要问题,对问题的分析十分有益.在技术水平的发展之下,主分析法十分的重要,从几何角度进行分析,该种分析方式能够将原始变量组合成新坐标,新指标伸缩情况主要由样本协方差矩阵进行表示,新变量之间并无密切的关系,可以看出,使用主成分分析法能够很好地避免多重共线问题的发生.
从本质上而言,主成分分析是线性映射法,该种方法是不适宜应用在非线性问题处理中的,在这一背景下,一些学者提出主曲线方法、核主成分分析法、主曲面方法、多层感知器方法等多种主成分分析法,该种这些数据分析法的应用还存在一些弊端,因此,就需要使用新型主成分分析法,函数性数据分析法正是在这一基础上产生.
二、函数性数据主成分分析
1.函数性数据的特征
顾名思义,函数性数据就是一种采用函数来表现的数据,具有函数性的特征,在分析数据时,若观测点过于密集,那么数据则会表现出函数性特征,采用该种分析法时,需要将数据作为独立项进行分析,不能将其看作数据点序列.该种分析方式最早由一位加拿大学者提出,在提出伊始,强调采用现代紧密数据系统来获取数据,在获取数据时,需要将其作为动态概念,并不能将其作为静态概念,如果采用传统分析法就难以提升分析的准确性,因此,就需要进一步来扩展分析方法.近年来,很多学者开始对函数性数据进行了深入的分析,但是,这一技术依然处在初级发展阶段,还需要进行深入的研究.
关于函数性数据x函数形式,需要将数据假定为是一种连续产生的过程,但是在实际观测过程中,很难得到离散性数据,实际观测的数据也常常含有噪声,因此,在接收到观测数据之后,需要对样本开展函数拟合,这种拟合方式是多种多样的,常用的有插值法与平滑法.若接收到的观测数据没有误差,即可使用插值法进行拟合;如果接收的数据存在误差,就需要使用平滑法进行拟合.
2.函数性数据主成分分析
在实际应用过程中,观测数据常常存在着比样本量大的情况,如果未进行处理就直接分析,那么是无法得出理想的分析解决的.为了解决这一问题,可以使用两种方法,即将观测时间区域减少或者偏最小二乘,如果变量多重共线性严重,使用该种分析法虽然能够有效解决问题,但是却存在很多噪声.在遇到该种情况时,即可使用偏最小二乘法来进行回归建模.
函数性数据样本协方差矩阵是一种函数模式,常常会产生高维协方差矩阵,该种矩阵表示对变量实施了重复性检测,且每次得到的数据都生成了函数数据.在特征方程上,可以使用如下的表达方式:
三、函数性共同主成分
共同主成分已经在形态进化工作中得到了广泛的应用,分析共同主成分能够有效解决共同主成分结构与协方差矩阵比例等问题,一般情况下,在建立好矩阵之后需要使用KL展开式进行分析,为了得到函数结构与动态特征,可以使用函数主成分与因子荷载分布来进行确定.在应用KL展开式时,需要应用到相互正交函数,KL展开式有着理想的收敛性,在展开其他类型时,也可以得出很好的效果.采用该种方法之后,即可将问题简单化,但是由于因子载荷之间存在一定的差异,就需要对函数性数据主成分进行相应的验证.
四、结 语
综上所述,函数性数据有效丰富了数据分析领域,为解决数据问题提供了强有力的支撑.该种技术属于探索性技术,对函数通特征描述与特征提取到起到了理想的成效,但是,由于各种因素的影响,函数性数据主成分分析只能够解决单样本问题,难以解决两样本以上的问题,因此,在使用该种问题进行分析时,还需要综合各类因素解决推断与检验的难题.