利用小行星色指数区分S/C型小行星的方法∗

2015-06-27 02:09叶嘉晖12赵海斌13李彬13
天文学报 2015年3期
关键词:巡天区分小行星

叶嘉晖12赵海斌13李 彬13

(1中国科学院紫金山天文台南京210008)

(2中国科学院大学北京100049)

(3中国科学院行星科学重点实验室南京210008)

利用小行星色指数区分S/C型小行星的方法∗

叶嘉晖1,2†赵海斌1,3‡李 彬1,3

(1中国科学院紫金山天文台南京210008)

(2中国科学院大学北京100049)

(3中国科学院行星科学重点实验室南京210008)

利用多色测光得到的色指数在区分S/C型小行星过程中具有重要的参考意义,由色指数空间主成分分析到的颜色参数a区分S/C类型是一种有效的方法.采用a=0分划的硬分割方法和对a作聚类分析法分别对SDSSMOC4和XSTPS-GAC的小行星多色数据样本进行分类,结果表明:两种方法对较完备的数据样本无明显差别,且都与Carvano的S/C分类结果相符;a=0分划方法对样本空间变化敏感,而a聚类分析方法更为稳定.

小行星:普通,方法:数据分析

1 引言

小行星是围绕太阳运动的岩石或者金属天体,它们是太阳系形成早期未能发生吸积的遗留物质,因此仍然蕴含着太阳系原始星云的信息.S型和C型是最常见的小行星类型,分别代表了小行星两种不同的光谱特征,与它们的物质成分相关.S型常见于小行星主带内侧,主要成分是硅酸盐岩石;C型常见于小行星主带中部和外侧,主要成分是碳类物质.物质成分的差异导致两类小行星的反照率不一样,S型小行星通常比同距离的相同大小的C型小行星亮.从反射光谱的形状能够明显地区分两类小行星,如图1所示.S型小行星光谱在小于0.7µm的部分有很陡的上升斜率,大于0.75µm部分有中等至较强的吸收,峰值在0.73µm附近达到1.2左右.C型小行星光谱在小于0.55µm部分有较弱至中等的紫外吸收,大于0.55µm部分平缓无特征.其他类型的小行星光谱与S或C型小行星的光谱相似,区别在于反照率大小和吸收带的强弱[1].

小行星光谱观测耗费大量观测资源,因此获得大样本连续光谱数据难度大,而获得大样本多色测光数据则更可行[2−3].利用多色测光数据得到小行星的色指数,进一步对多个色指数开展主成分分析研究成为初步区分小行星类型的重要方法.1984年Tholen使用主成分分析法研究了8色小行星巡天的结果,从而总结出最早的被广泛使用的小行星分类方法[4].2006年Roig和Gil-Hutton使用了主成分分析法在斯隆巡天的小行星中寻找候选V型小行星[5].主成分分析法也能作为区分S/C型小行星的手段,通过色指数构建出第1主成分,定义为小行星的颜色参数a,它反映了光谱颜色偏红/蓝的特征,a=0是划分S和C型小行星的界线.Ivezi´c等[6]和Roig等[5]曾对斯隆巡天发布的不同批次数据作了同样的处理.

图1 典型S型和C型小行星在0.4∼1.0µm内的反射光谱.左图是S型,右图是C型.数值已归一到0.55µm处[1].Fig.1 The re fl ectance spectra of S type and C type asteroids within 0.4∼1.0µm,normalized to unity at 0.55µm.The left one is S type,and the right one is C type[1].

以a=0分划的区分方式对完备样本的分析结果与已有分类结果相符,但是对有偏的样本数据库会得到不一致的结果,对样本数量的敏感依赖性是该方法的固有缺点.聚类分析法由于考虑了样本存在S/C类型的特征聚集现象,其结果对样本数量的依赖性更小,比a=0分划的方式更合理,其中K平均算法在已知分类的聚类分析法中是快速而有效的.

使用主成分分析和聚类分析,目的是利用色指数区分S和C型小行星,对继续区分小行星亚类有重要的参考意义.本文应用这两种方法处理斯隆巡天中MOC4小行星数据和近地天体望远镜反银心方向小行星多色巡天的数据,给出了有效的S/C分类,并对结果进行了分析和讨论.

2 数据分析处理方法

2.1 主成分分析(Principal Component Analysis,PCA)

主成分分析是一种数学变换方法,通过把一组相关的变量变换成另一组互不相关的变量,新的变量按照方差大小排列,第1变量具有最大的方差,称为第1主成分,方差次大的变量称为第2主成分,以此类推.变量的方差越大包含越多的信息,因此第1主成分包含了原变量组的主要信息,通过分析第1主成分来达到多维变量分析的降维目的.在色指数研究中,第1主成分反映了光谱的颜色特征.

通过多色巡天观测获取小行星色指数.不同的观测项目使用数目不同的滤光片,如8色小行星巡天使用了8个滤光片,斯隆数字巡天使用了5个滤光片.每个色指数在不同程度上反映了小行星的光谱信息,相互之间有信息的重叠,符合使用主成分分析的条件.

计算主成分的变换式为:

其中PC为所求的主成分,F为色指数,B为色指数的均值,E为色指数协方差矩阵的特征向量.

2.2 K平均算法(K-means algorithm)

K平均算法属于硬聚类算法,在已知类个数的前提下,根据特征相似性划分数据子集(类簇).首先选择K个簇的初始平均值或中心,对剩余的每个对象根据其与各个簇中心的距离,将它赋给最近的簇,然后重新计算每个簇的平均值.这个过程不断迭代直至准则函数收敛.

使用K平均算法可以根据第1主成分PC1把小行星分成S类和C类.S型和C型小行星是两类的主要成员,聚集在两中心附近,其他类型小行星也会被划分到特征相近的一类中.由于类簇中心密集,我们假定数据呈正态分布,均值为µ,标准差为σ,区分依据是到两均值点的概率距离d:

当µ和σ不再变化时,所有小行星都能够唯一地划分到S或C类.这里选择概率距离优于欧氏距离,因为概率距离考虑了数据的聚集程度,体现在标准差σ上.

2.3 星等归算

绝对星等计算采用Bowell等人在1985年提出的HG星等系统[7],可以表示为:

其中H是小行星的绝对星等;α是小行星的太阳相位角;H(α)是一个与α有关的函数,称为相位函数.G值表征相位函数的斜率,称为斜率参数.不同的小行星有不同的G值,反照率大的G较大,反照率小的G较小.对于未知G值的小行星,通常取G=0.15.函数Φ表示为:

其中A1=3.332,B1=0.631,C1=0.986,A2=1.862,B2=1.218,C2=0.238.

3 结果与分析

3.1 斯隆数字巡天数据处理

斯隆巡天的移动天体数据星表(Sloan Digital Sky Survey Moving Object Catalog, SDSSMOC)中提供了小行星可见光波段高精度的色指数信息,最新发布的是第4版数据,观测历元至2007年3月.SDSSMOC4共计包含了104 539个小行星的220 101次观测1http://sbn.psi.edu/pds/resource/sdssmoc.html.

图2为斯隆巡天g、r、i滤光片的响应曲线.结合图1可见小行星的反射光谱特征区域落在g、r、i覆盖范围内.为了与前人的工作结果保持一致,我们使用g、r、i表示小行星在g、r、i波段内的绝对星等,并省略单位mag.根据Ivezi´c等[6]的研究,我们在选取小行星样本时选择色指数范围:g-r:0∼1.2;r-i:−0.2∼0.6,共计选取103 641个小行星.

图2 斯隆巡天g、r、i滤光片的响应曲线Fig.2 The fi lter pro fi les of SDSS g,r,and i wavebands

图3 为SDSSMOC4的(g-r)-(r-i)色指数分布,从图中可以看出明显的双峰结构.双峰结构主要由两大类型小行星的分布造成,如图4所示.S型和C型的聚集区域分别对应图3中的右上峰和左下峰.小行星光谱在0.3∼1µm内有两个主要吸收特征:一个小于0.55µm,另一个大于0.7µm.r波段处于两个吸收带之间,所以小行星的g-r和r-i色指数能够反映光谱的变化情况,S型和C型小行星色指数的差异是造成双峰分布的原因.

根据(1)式得到的小行星颜色参数a为:

实际上a是色指数在特征向量方向上的投影,如图3中虚线所示,根据主成分分析的原理,数据的方差在该方向上最大.a反映了小行星的光谱形态或颜色信息,a越大表示光谱颜色偏红,a越小表示光谱颜色偏蓝.Ivezi´c等[6]在2001年分析了最早发布的斯隆数据,根据6 150个小行星得到的a值为:

2006年Roig和Gil-Hutton根据SDSSMOC3中17 957个小行星得到的a值为[5]:

可见不同版本斯隆数据的a值随着小行星样本数量的增加而变化,g-r系数会变大而r-i系数则变小.

图3 SDSSMOC4小行星的(g-r)-(r-i)色指数分布Fig.3 The distributions of SDSSMOC4 asteroids’(g-r)-(r-i)color indexes

为了比较两种分类方式的效果,我们用Carvano等[8]的分类结果作了对比2http://sbn.psi.edu/pds/resource/sdsstax.html.Carvano分类是最新的使用广泛的小行星分类系统.表1是两种分类结果与Carvano系统S/C型小行星数目的比较.由比较结果可见两种分类方式对S和C型小行星的区分非常符合已知的分类结果.对于数据较完备的样本,如SDSSMOC4,以a=0和聚类划分的结果没有明显差别.

图4 S型和C型小行星的(g-r)-(r-i)色指数分布Fig.4 The distributions of S type and C type asteroids’(g-r)-(r-i)color indexes

图5 SDSSMOC4小行星a参数高斯分布.左右两个分布分别对应C型和S型小行星.Fig.5The Gaussian distributions of“a”derived from the SDSSMOC4 data.The left and right distributions correspond to C type and S type asteroids,respectively.

表1 SDSSMOC4两种分类结果与Carvano S/C型小行星的数目比较Table 1 The comparison of our results of SDSSMOC4 derived by PCA and cluster analysis methods respectively with those of the Carvano’s method

主成分分析的a值依赖于样本,由图4可见两类小行星的分布有交集,以数据均值a=0作为划分界线属于硬分割,这种划分方式没有考虑交集部分.聚类分析考虑了数据有聚集和交集现象,以两个正态分布模拟双峰分布,所以更符合实际情况.当样本包含的S型和C型小行星数目有很大差别时,a=0不能准确区分两种类型,但是聚类分析依然有效.我们随机选择了Carvano分类中不同数量的S和C型小行星组成新样本作分类处理.结果表明以a=0划分的结果对不同的样本空间有波动,而聚类分析的划分结果相对稳定,聚类分析更适合有选择性样本的数据处理.因此为了都能够使用两种分类方法,我们应该选择数据完备的样本.表2和表3是两种不同情况的对比结果.

表27 000个S型、3 000个C型小行星使用两种划分方法与Carvano分类的数目对比Table 2 The comparison of the results of 7000 S type and 3000 C type asteroids derived by PCA and cluster analysis methods respectively with those of the Carvano’s method

表38 000个S型、2 000个C型小行星使用两种划分方法与Carvano分类的数目对比Table 3 The comparison of the results of 8000 S type and 2000 C type asteroids derived by PCA and cluster analysis methods respectively with those of the Carvano’s method

3.2 盱眙近地天体望远镜反银心方向测光巡天数据处理

盱眙近地天体望远镜反银心方向测光巡天(Xuyi Schmidt Telescope Photometric Survey of the Galactic Anti-center,XSTPS-GAC)由北京大学科维理天文与天体物理研究所和紫金山天文台合作完成,观测历元为2009年10月至2010年3月、2010年9月至2011年3月,历时2 yr共13个月.在以银河系反银心方向为中心、赤经3h∼9h、赤纬−10°∼+60°约6 000平方度的天区以及覆盖仙女座大星云、三角座风车星云约600平方度的扩展天区开展了CCD成像测光观测.观测使用了斯隆巡天g、r、i滤光片,每个观测夜只在一个波段观测,其中g波段观测42 d(2009年10月至2011年3月),r波段观测37 d(2010年9月至2011年3月),i波段观测47 d(2009年10月至2011年3月).有关XSTPS-GAC的数据处理流程,在Zhang等的研究中有详细介绍[9−10].

因为各小行星的g、r、i波段的观测数据是在2 yr内的不同观测历元获取的,小行星的相位角变化、小行星的自转效应均会引起小行星光度的变化,这些原因最终造成了色指数的弥散.图6为XSTPS-GAC的1 173个小行星的(g-r)-(r-i)色指数分布,其中实心圆和空心圆分别表示S型和C型小行星.从图中无法识别色指数的双峰结构,S型和C型小行星的聚集区域没有分离.

图6 XSTPS-GAC小行星的(g-r)-(r-i)色指数分布Fig.6 The distributions of XSTPS-GAC asteroids’(g-r)-(r-i)color indexes

尽管色指数没有明显的聚集分布,但仍然能够使用主成分分析和聚类分析.主成分分析得到的a值为:

聚类分析的结果为:µS=0.1468、σS=0.1497和µC=−0.1837、σC=0.1117.XSTPSGAC色指数的方差比SDSSMOC4大.图7为拟合的S和C型小行星a参数的分布曲线.

根据图6,对于XSTPS-GAC数据未能明确地区分出S/C两类小行星,主要是由于观测数据的方差大所致.表4为两种分类结果与Carvano系统S/C型小行星数目的比较.

表4 XSTPS-GAC两种分类结果与Carvano S/C型小行星的数目比较Table 4 The comparison of our results of XSTPS-GAC derived by PCA and cluster analysis methods respectively with those of the Carvano’s method

4 结论和讨论

研究色指数分类方法的目的是对已有多色测光观测的但无光谱观测的小行星作初步类型判定,以及为确定小行星亚类提供参考信息.本文通过对小行星色指数使用主成分分析法构建颜色参数a,并利用a=0分划和a聚类分析来区分S/C型小行星,得到结论如下:

(1)分析得到了SDSSMOC4的g-r、r-i色指数的双峰分布,S/C型分类结果表明a=0分划和a聚类分析方法对数据较完备的样本的区分无明显差别,与Carvano的分类结果相符合.

图7 XSTPS-GAC小行星a参数高斯分布.左右两个分布分别对应C型和S型小行星.Fig.7The Gaussian distributions of“a”derived from the XSTPS-GAC data.The left and right distributions correspond to C type and S type asteroids,respectively.

(2)由于a值的大小依赖于样本空间,而聚类分析考虑了数据的聚集分布和交集情况,所以a=0分划的结果对样本数量敏感,而聚类分析的结果则更稳定.

(3)对XSTPS-GAC的小行星测光数据分析表明,对于小行星的色指数方差大的情况,仍然可以使用两种区分方法,只是数据弥散会弱化区分结果,甚至导致无法区分.

a=0分划和a聚类分析法的有效性得益于g、r、i波段覆盖了小行星光谱最重要的两个吸收特征,所以即使只有两个色指数,仍然能够与S/C类型有很强的相关性,从而达到区分的目的.该方法在具有较完备的SDSSMOC4样本中的应用得到了证实,而XSTPSGAC的数据由于观测方式决定了色指数弥散大,因此未来需要获取多波段同时观测的数据.

致谢衷心感谢紫金山天文台王歆研究员为本文的研究方法和结果提出的宝贵意见.

[1]Bus S J,Binzel R P.Icar,2002,158:146

[2]李雪婧.天文学报,2010,51:384

[3]Li X J.ChA&A,2010,35:117

[4]Tholen D J.Asteroid Taxonomy from Cluster Analysis of Photometry.Tucson:University of Arizona, 1984

[5]Roig F,Gil-Hutton R.Icar,2006,183:411

[6]Ivezi´cˇZ,Tabachnik S,Ra fi kov R,et al.AJ,2001,122:2749

[7]Lagerkvist C I,Williams I P.A&AS,1987,68:295

[8]Carvano J M,Hasselmann P H,Lazzaro D,et al.A&A,2010,510:A43

[9]Zhang H H,Liu X W,Yuan H B,et al.RAA,2013,13:490

[10]Zhang H H,Liu X W,Yuan H B,et al.RAA,2014,14:456

Methods of Asteroid S/C Type Classi fi cation Using Color Index

YE Jia-hui1,2ZHAO Hai-bin1,3LI Bin1,3
(1 Purple Mountain Observatory,Chinese Academy of Sciences,Nanjing 210008)
(2 University of Chinese Academy of Sciences,Beijing 100049)
(3 Key Laboratory of Planetary Sciences,Chinese Academy of Sciences,Nanjing 210008)

Color indexes are important to classify the S/C type asteroids.The asteroids’color parameterareduced from principal component analysis of color indexes is a key parameter of classi fi cation.Two methods,dividing by the parameteradirectly and the cluster analysis by parametera,are applied in asteroids’S/C classi fi cation of Sloan Digital Sky Survey(SDSS)and Xuyi Schmidt Telescope Photometric Survey of the Galactic Anti-center.The SDSSMOC4 shows a bimodal distribution in theg-rvsr-idiagram.The results show that these two methods are e ff ective and consistent in the case of large samples,well in accordance with the Carvano’s consequences.But the result divided by parameteradirectly is unstable for di ff erent subsets,while the cluster analysis is more stable.Both methods still can be used even the variances of the color indexes are large,but the results of classi fi cation are not obvious.

asteroids:general,methods:data analysis

P185;

A

10.15940/j.cnki.0001-5245.2015.03.005

2014-10-14收到原稿,2014-11-14收到修改稿

∗国家自然科学基金项目(11273067,11178025)、小行星基金会、澳门科学技术发展基金项目(095/2013/A3)及江苏省自然科学基金项目(BK2011890)资助

†yejiahui@pmo.ac.cn

‡meteorzh@pmo.ac.cn

猜你喜欢
巡天区分小行星
NASA宣布成功撞击小行星
我国发现2022年首颗近地小行星
怎么区分天空中的“彩虹”
区分“我”和“找”
巡天计划
怎祥区分天空中的“彩虹”(一)
嫦娥三号进入第33月夜“测月、巡天、观地”成果丰硕
小行星:往左走
罪数区分的实践判定
“隼鸟”2再探小行星