基于T90分布的BeppoSAX卫星伽玛暴分类研究

2016-07-21 08:59杨恩波

河南科技 2016年3期

关键词：数据分析持续时间

杨恩波

（贵州大学理学院，贵州　贵阳　550025）

基于T90分布的BeppoSAX卫星伽玛暴分类研究

杨恩波

（贵州大学理学院，贵州贵阳550025）

摘要：伽玛暴的分类是伽玛暴相关研究中的热点问题之一，目前被广泛接受的方法是基于伽玛暴持续时间的分类方法。本文采用高斯混合模型和最大期望算法对BeppoSAX卫星轨运行期间所探测到的694个伽玛暴持续时间的概率密度分布进行了研究，同时利用贝叶斯信息准则对不同的模型进行了比较。分析结果支持双高斯成分的模型比其他模型更好地描述了BeppoSAX卫星所探测到的伽玛暴持续时间的分布，同时这一结论与其他卫星数据的分析结果一致，均支持存在两种类型的伽玛暴。

关键词：伽玛暴；持续时间；数据分析

伽玛射线暴(Gamma Ray Burst,GRB)，又称伽玛暴，是来自天空中某一方向的伽玛射线强度在短时间内突然增强，随后又迅速减弱的现象。伽玛暴是当今天文学上最活跃的前沿领域之一。

宇宙中充满着各种强烈的爆发现象，如超新星爆炸等，伽玛暴是其中一种极其强烈的恒星级的爆发现象，最初由美国的Vela军事卫星在1967年探测到。初期由于缺乏足够的观测数据，相关的研究工作进展缓慢。1991年，美国成功发射康普顿天文台，其在随后接近10年的成功运行中取得了大量伽玛暴观测数据，为研究人员对伽玛暴展开各方面研究提供了充足的观测依据，如何对伽玛暴进行分类是伽玛暴研究热点之一。目前被广泛接受的分类法是基于持续时间T90（探测器探测到的辐射本底以上光子积分流量从5%增长到95%所用时间）的长短进行的，这一方法由Kouveliotou等在1993年首次提出［1］，他们统计了BATSE样本库中的222个伽玛暴持续时间T90的分布，发现logT90的分布中存在两个峰，基于这一发现，他们提出长短暴的分类方法，即以T90= 2.0s为界限，可以分为两类，长暴（LGRBs）和短暴（SGRBs），其中长暴约占75%，短暴约占25%。这两类伽玛暴被认为具有不同的物理起源。短暴被认为是双致密星互相缠绕后的产物［2］，如双中子星系统或者一颗中子星伴随一颗黑洞，而长暴则被认为与大质量恒星的爆炸有着密切的联系［3］。

Horváth［4］通过分析BATSE样本库中的797个伽玛暴的logT90分布发现了第三种伽玛暴存在的证据，类似的证据同样在BeppoSAX卫星数据［5］、Swift卫星数据［6］及Fermi卫星数据［7］中被发现。需要注意的是，类似的工作在进行数据分析时所采用的方法通常是对logT90做直方图，然后对直方图进行高斯拟合并利用卡方检验判断拟合结果优劣。这一方法的结果不可避免地会受到直方图的bin过程影响，不同大小的bin最终会导致不同的分析结果。在该文中，将采用高斯混合模型（Gaussian Mixture Model，GMM）和最大期望算法（Expectation and Maximization Algorithm）重新对BeppoSAX卫星探测到的伽玛暴的持续时间分布进行研究，从而避免受bin大小的影响。

1　样本选取及分析方法

1.1样本选取

BeppoSAX卫星由意大利和荷兰共同研发，其搭载的宽视场相机（Wide Field Camera，WFC）和Phoswich探测器（Phoswich Detector System，PDS）联合工作可以有效地对伽玛暴进行探测并确定其位置。BeppoSAX在伽玛暴研究领域的最突出贡献是确认了伽玛暴的河外起源［8］。为了对BeppoSAX卫星所探测到的伽玛暴进行logT90的概率密度分析，从BeppoSAX卫星伽玛暴样本库（http:// heasarc.gsfc.nasa.gov/W3Browse/gamma-ray-bursts/saxgrb⁃mgrb.html）中的1 082个伽玛暴中选取了694个具有代表性的伽玛暴作为样本，它们均拥有有效的持续时间信息和能谱参数信息。

1.2分析方法

GMM是参数化的概率方程，通过不同权重的高斯成分叠加组成，在进行一维数据的概率密度分析时，样本整体的似然值可以表示为：

其中，N代表样本的个体总数；X代表所选取的样本集合；ωi、μi、Σi分别代表第i个高斯成分的权重，中心值和相关矩阵；N(xj|μi,Σi)代表第i个高斯成分的概率密度，其计算方法为：

在指定高斯成分个数k后，最佳的模型参数将通过EM算法获得。EM算法将通过不断的在（a）和（b）之间进行迭代，获得最P（X∣ω、μ、Σ）值的参数便是最佳参数，相应的模型便是k个高斯成分下的最佳模型。

（a）估计未知参数ωi、μi、Σi的期望值，给出其参数估计。

（b）重新估计分布参数，以使得数据的P（X∣ω、μ、Σ）最大，给出ωi、μi、Σi的期望估计。

贝叶斯信息准则（Bayesian Information Criterion，BIC）可用于比较不同高斯成分个数下最佳模型的对待分析样本的适应程度，即决定高斯成分的个数［9，10］。BIC的计算方法为：

其中，N代表样本中个体数目，p和Pmax分别代表待考察模型的参数个数及该模型的最大似然值。BIC值最小的模型便是最适应样本的模型。对于其他模型，如果其BIC值超过最小值0～2，则其同样可适应样本；如果超过最小值2～6，则其对样本的适应度将变弱；若超过最值6以上，则其对样本的适应度明显下降，可以被排斥掉［11］。

2　结果分析

具有2个高斯成分的GMM模型（2-G）和3个高斯成分的GMM模型（3-G）分别被用于分析BeppoSAX卫星伽玛暴持续时间的概率密度分布，具体分析结果见图1和图2，两图中均加入背景直方图方便比较GMM模型输出结果，直方图的bin符合Knuth规则［12］。各自最佳的参数见表1。

从图1和图2、表1中可以看出，2-G模型的表现要好于3-G模型，二者的BIC值分别为1 255.351和1 274.951，3-G模型的BIC值已经超过2-G模型的数值接近20，远大于足以导致其被排斥的6，这说明对于Bep⁃poSAX卫星伽玛暴持续时间的分布，2-G模型的适应程度要更好，3-G模型的表象远不如2-G模型，是被强烈排斥的，这一结果与Yang等［13］利用相同方法分析的Fermi卫星数据结论一致，与Zhang和Choi对Swift卫星数据的分析也是一致的。

对于最佳的2-G模型，两个高斯成分的比例为0.253∶0.747，与Kouveliotou等［1］得到的0.250∶0.750的比例十分接近。但是由图1可见，两个高斯成分的则大于2.0s，同时两个高斯成分相互交错的区域较大，考虑到该文选取的是BeppoSAX卫星探测到的伽玛暴，Kouveliotou等［1］分析的样本来自BATSE，两种样本可能会受到探测器选择效应影响，导致最终的结果存在差异［2］。

为了确定是否更多高斯成分的模型比2-G模型表现更好，利用相同的方法，对高斯成分个数从1到9共9个模型均做了进一步分析，相应的BIC值比较如图3所示，可见2-G模型的BIC值位于最低点，其余模型对于Bep⁃poSAX卫星伽玛暴持续时间概率密度分布的适应程度都要差于2-G模型。

图1 2-G模型输出结果

图2 3-G模型输出结果

表1 2-G模型和3-G模型的输出参数及BIC值

图3 不同高斯成分个数的模型BIC值比较

3　小结

持续时间的分布是对伽玛暴进行分类的依据之一，该文利用高斯混合模型及最大期望算法，对BeppoSAX卫星探测到的694个伽玛暴持续时间进行了概率密度分布研究，避免了常用的拟合直方图方法受bin过程影响。分析结果显示，BeppoSAX卫星伽玛暴的持续时间仍然服从双模分布，2个高斯成分组成模型能够更好地描述该分布，这一结论支持已经被广泛接受的长短暴分类方法，同时与其他卫星数据的分析结果一致。

参考文献：

［1］Kouveliotou C，Meegan C A，Fishman G J，et al.Iden⁃tification of Two Classes of Gamma-Ray Bursts［J］.The Astro⁃physical Journal，1993（413）：L101-L104.

［2］Nakar E.Short-Hard Gamma-Ray Bursts［J］.Physics Reports，2007（1）：166-236.

［3］WoosleyS，BloomJ.TheSupernova-Gamma-Ray BurstConnection［J］.Annu.Rev.Astron.Astrophys.，2006 （44）：507-556.

［4］Horváth I.A Third Class of Gamma-Ray Bursts?［J］. The Astrophysical Journal，1998（2）：757.

［5］Horváth I.Classification of BeppoSAX’s Gamma-Ray Bursts［J］.Astrophysics and Space Science，2009（1）：83-86.

［6］Horváth I，Balázs L G，Bagoly Z，et al.Classification of Swift’s Gamma-Ray Bursts［J］.Astronomy&Astrophysics，2008（1）：L1–L4.

［7］Tarnopolski M.Analysis of Fermi Gamma-Ray Burst DurationDistribution［J］.Astronomy&Astrophysics，2015 （581）：A29.

［8］Metzger M，Djorgovski S，Kulkarni S，et al.Spectral Constraints on the Redshift of the Optical Counterpart to the Gamma-Ray Burst of 8 May 1997［J］.Nature，1997（387）：878-880.

［9］Schwarz G.Estimating the Dimension of a Model［J］. The annals of statistics，1978（2）：461.

［10］Liddle A R.Information Criteria for Astrophysical Model Selection［J］.Monthly Notices of the Royal Astronomi⁃cal Society：Letters，2007（1）：L74–L78.

［11］Burnham K P，Anderson D R.Multimodel Inference Understanding AIC and BIC in Model Selection［J］.Sociologi⁃cal methods&research，2004（2）：261-304.

［12］Knuth K H.Optimal Data-Based Binning for Histo⁃grams［J］.arXiv preprint physics，2006.

［13］Yang E B，Zhang Z B，Choi C S，et al.Classifying Gamma-Ray Bursts with Gaussian Mixture Model［J］.arXiv preprint arXiv，2016.

中图分类号：P172.3

文献标识码：A

文章编号：1003-5168（2016）02-0155-03

收稿日期：2016-01-28

作者简介：杨恩波（1990-），男，硕士，研究方向：理论物理。

Classification of BeppoSAX Satellite Gamma Bursts Based on T90 Distribution

Yang Enbo
（College of Science，Guizhou University，Guiyang Guizhou 550025）

Abstract:Classification of Gamma-ray Bursts(GRB)is very important in GRB studies,the commonly accept⁃ed method is duration-based method.This paper has done a density probability distribution analysis of 694 GRBs detected by BeppoSAX during it’s operation by using Gaussian Mixture Model and Expectation Maxi⁃mization Algorithm.Bayesian Information Criterion has been used to compare between different GMM mod⁃els.The analysis supported that two Gaussian components model performs was better than other models in describing the duration distribution of BeppoSAX GRBs,which was consistent with the results of other satel⁃lites’data,they all supported the 2-type classification of GRBs.

Keywords:Gamma-ray Burst；duration；data analysis

基于T90分布的BeppoSAX卫星伽玛暴分类研究

1 样本选取及分析方法

2 结果分析

3 小结

1　样本选取及分析方法

2　结果分析

3　小结