张志嵩,张海燕,朱 岩,金乘进,张同杰,李 菂,朱丽春
(1. 中国科学院 国家天文台,北京 100011;2. 中国科学院大学,北京 100049;3. 北京师范大学 天文系 100875)
在过去的50年里,越来越多的证据表明,我们认为生命必需的成分和条件在宇宙的任何地方都是普遍存在的,也许在我们的星系和附近的星系中就是普遍存在的。在分子云中发现了大量的前生物分子,包括酸、糖和亚胺。这些发现是大型复杂的有机结构所必需的反应物很容易在原行星环境中形成的迹象。系外行星本身,虽然一度被归为猜测的领域,但现在似乎是更加确信,那里可能存在生命或智能生命的基本形式,这使得寻找地外生命体不再是无稽之谈。
从1895年俄国物理学家A.C.波波夫和意大利物理学家G.马可尼,分别成功地进行了无线电通信试验之后,人类已经制造产生出了人造无线电辐射。如果以足够的能量从另一颗恒星发射到地球上,很容易被认为是来自未知的自然源。这些辐射包括频谱窄带信号,例如与调频(FM)或调幅(AM)电信有关的正弦载波,以及用于雷达的时间窄无线电脉冲。自然天体物理电磁辐射本质上是由自然辐射物理下的随机过程扩宽光谱的,已知光谱最窄的自然源的最小频率宽度为500 Hz[1]。不超过几个Hz光谱宽度的发射是智能文明工程活动的一个明确标志。闪烁效应可以使本质上幅度稳定的窄带信号间歇出现,但窄带信号很容易与背景辐射源区分开来,而且几乎不受天体物理色散的影响。
星际介质在射电波长上是相对透明的,特别是cm波段,这使得射电传输非常适合星际间的通信。500 MHz~10 GHz之间的频段是一个相对安静的无线电窗口,对地球上接收和发射无线电信号尤其有吸引力。
虽然与来自地球的工程无线电发射相关的技术是由人类开发的,但类似的信号类型也可能被外星智能文明所使用。地外技术的电磁发射的具体性质很难预测,但如果外星文明有意通过这种发射来表明其存在,那么使信号具有可识别性对他们是有益的。在可分辨性方面,脉冲和窄带无线电信号都有优点,可谨慎地同时进行搜索。这两个潜在的信号将是目前SETI的主要观测目标。
寻找地外文明已经有很长时间的历史,最早的SETI项目是Ozma项目[2],利用美国国家射电天文台(National Radio Astronomy Observatory,NRAO)26 m望远镜对近邻的恒星进行信号搜索。射电SETI搜寻值得一提的是美国加州大学伯克利分校的SETI团队。该团队搜寻来自地外文明的窄带信号已经超过40年[3]。从第一代寻找近邻智能生命体地外无线电信号系统(SERENDIP),只有100个频谱通道,到现在发展到SERENDIP VI[4]的4亿个频谱通道,设备的升级使得可探索的频域和频谱分辨率都有了显著的提升[5]。该团队已经在美国阿雷西博(Arecibo) 300 m望远镜[6],绿岸(Green Bank)100 m望远镜,澳大利亚帕克斯(Parkes)64 m望远镜[7]观测超过百万行星,上千个星系[8]。
FAST作为目前世界上最大的单口径望远镜[9-10],在SETI观测中具有得天独厚的优势。和之前的世界最大单口径望远镜Arecibo相比,FAST由于地理位置的不同和主动反射面设计可以观测的天区范围是赤纬–14.3°~ 65.7°,而Arecibo观测天区范围是赤纬–1.5°~38.5°。所以FAST比Arecibo可以观测到更广的天区。除此以外,FAST灵敏度达到 1 600~2 000 m2/K,而作为曾经灵敏度最高的Arecibo只有约1 100 m2/K。这使得FAST可以探测到更暗弱的天体;FAST19波束接收机相比于Arecibo的7波束可以在一次观测得到更多的天空像素点,相同时间可以接收到更多来自不同天空位置的信号。FAST的这3个优势使得SETI观测到地外信号的可能性得到显著提升。
射电天文学是依赖于观测的学科,然而大型望远镜的观测时间非常宝贵,通常一段时间内,只能对某一种源进行观测。这种排他性,使得一段观测时间内所得到的观测数据只能为一种科学目标所用。为了提高数据的使用效率,在观测时同时记录分析用于不同科学目标的数据的技术手段的共时观测[11],得到了越来越多的人的关注。在进行共时观测的时候,望远镜指向由其主要观测目标决定,此时,二级观测同样可以接收到数据,从而提高了观测效率。
共时观测这一概念,正是由早期从事SETI工作的科学家们提出,并在美国加州哈特克里克天文台(Hat Creek Radio Observatory)、绿岸望远镜以及Arecibo望远镜上进行了尝试。在搜寻系外智慧生命的研究中,科学家们需要尽可能多的观测时间和观测尽可能大的天区。近年来,随着高性能计算机的普及,利用高性能计算机对射电望远镜的观测数据进行分布式计算,使得大量数据能够同时被处理。
用于SETI研究的后端接收系统安装在望远镜接收机的后端,在使用这一接收机进行观测的时候,接收机接收到的数据会分别发送至不同的后端设备,有用于SETI实验的后端设备,同时还有用于观测脉冲星、中性氢、快速射电暴等不同科学目标的后端设备。其基本工作原理是:记录功率谱平均值20倍以上的信号,每个这样的信号被称为一个信号点(hit),这些hits数据会通过数据采集系统(hashpipe)存储到缓存中,进而传递给图形处理器(GPU)计算出斯托克斯参量,输出用于科学计算的FITS格式的文件,包含着时间、频率和坐标等信息。图1为FAST多波束数字后端组成。
图1 多波束数字后端Fig. 1 Multibeam digital backend
基于FAST多波束接收机和并行终端,中国天文届已经规划了覆盖整个北天的漂移扫描共时观测:Commensal Radio Astronomy FAST Survey(CRAFTS)[12]利用超过5 000 h的观测,覆盖57%的天空。SETI观测将可以与CRAFTS及其它FAST巡天项目实现共时观测,这使得长时间观测成为可能。我们计划用3年的时间进行巡天观测,来找到可能的候选目标,然后后续对候选目标进行追踪观测。
共时观测的优点是不占用望远镜时间,但是产生的数据量非常大。如果采用19波束接收机,每个波束的采样率为1 Gsps,每秒钟产生的数据将达到
这样的数据量是存储系统无法承受的。所以我们采用一套实时的数据处理系统SERENDIP VI,和数据分析程序星云(nebula)来对数据进行分析和提取。图2是整个数据处理流程框架。第2节和第3节将分别介绍SERENDIP和nebula系统。
图2 数据处理流程框架Fig. 2 Data processing framework
SERENDIP VI[13]系统是一个400 M通道的频谱分析仪,覆盖频段从1 025~1 475 MHz,频谱分辨率达到2 Hz。系统由基于现场可编程门阵列(FPGA)板的前端和基于GPU的后端组成,并通过10 Gbps以太网交换机连接。前端对信号进行数模转换,将模拟信号转换成8 bits数字信号。这些信号被打包送到后端。GPU通过交换机接收数据,通过高速并行运算提取信号,写入FITS格式文件中,并包含望远镜的指向等信息。
GPU处理流程包括:
1)将得到的时序电压信号数据分配到GPU显存上,通过统一计算设备架构(CUDA)做快速傅里叶变换,积分时间为0.537 s,长度为256 M频道,频段从1 025 ~1 475 MHz的频域信号。
2)通过公式
对频域信号的实部和虚部分别平方求和,得到信号的功率谱。
3)通过对局部取均值的方法计算得到功率谱的基线。
4)最后通过设置的阈值对比信号与基线的强度差,超过阈值的以hit的形式记录在FITS文件中,包括信号的时间、频率、强度、望远镜转角等信息。
射电噪声干扰一直是射电天文研究的重要部分,只有将射电噪声去除,天文学家才能更好地研究来自宇宙的微弱信号。到目前为止,尽管去除噪声的方法很多,但是并没有一种算法可以将噪声干扰完全去除[14-15]。Nebula对3种主要的干扰噪声进行去除。
持续窄带干扰是最主要的干扰噪声之一。干扰的来源有很多,包括近地雷达信号、电视广播信号和卫星信号等。如图3所示,和希望看到的hits分布相比,持续窄带干扰噪声明显分布更集中,成竖状窄带。这种干扰的存在严重影响到候选目标的提取。一种有效的去除方法是调查这些信号是否持续在多个天区出现,真正来自地外的窄带信号应该只在天空的固定区域出现,同时在很多天区出现很大概率是来自地球上的干扰信号。所以在处理中,任何有很多hits信号并且同时存在于多个天区的频道将被去除。
图3 持续窄带干扰Fig. 3 Persistent narrowband interference
尽管寻找的是来自地外的窄带信号,但是也会遇到很多宽带信号干扰。主要来自于自然界的闪电、火花或者地球表面的电力传输电缆等。图4展示了宽带信号干扰,图中横条为宽带信号干扰。为了去除宽带信号干扰,首先将所有的hits按时间进行排序,然后计算每个时间点光谱的谱熵
图4 宽带信号Fig. 4 Broadband interference
其中:k为时间序列;i为固定时间点的频率通道编号;N为每个时间点所包含的hits数量;H为每个hit所在频率通道数字。先计算全部谱熵的平均值和标准差,并设置阈值,低于阈值的信号将被标记为宽带干扰。值得注意的是,一个很强的SETI信号,可能会同时出现在多个相邻频道中,这也会使得谱熵值较低。为了防止这些信号被去除,把小于1 024个频道的事件当成一个hit来计算谱熵。
漂移信号干扰,频率随时间持续变化,主要来源于手机等移动设备的信号。这类信号干扰最难去除,因为来自地外的信号由于多普勒效应也会产生频率漂移。
由公式(4)可以估算地外信号因多普勒产生的频率漂移,其中: dvr是地球自转和公转速度以及目标天体的自转和公转速度的总和;frest为信号的当前频率;c是光速。在此规定频率漂移超过200 nHz(该结论由伯克利突破聆听计划提供)的信号为漂移干扰信号。
这里首先做假设:预搜寻的地外文明信号是带宽小于500 Hz的窄带信号。所以在望远镜进行漂移扫描的过程中,假想的SETI信号应为一些致密的小团组。为了筛选出这些小团组,选用了一种无监督密度聚类的方法DBSCAN,并对筛选出来的团组增加了两个规则限制。团组所有信号需来自于天空相同位置;团组信号带宽小于500 Hz,持续时间小于100 s。
对2019年7月的5 h漂移扫描数据进行了处理来验证数据处理流程的有效性,详细的实验过程及结果已刊登在《美国天体物理杂志》(The Astrophysical Journal)[16]。
为了验证数据处理流程的有效性,向数据中加入了20组人工假想信号,即带宽为频谱分辨率的窄带信号,并只在天空一点存在随望远镜的移动而消失。实验结果表明,5 h的数据量大概80 G的数据,经过我们的数据处理流程筛选出83组候选目标团组和19组假想信号。
可以看出我们的数据处理流程筛选出了20组假想信号中的19组,只有一组信号因被大量RFI覆盖被抛弃。通过分析83组候选团组,虽然它们仍然来自于RFI的一部分,但是它们的特征和人工假想信号相吻合。之所以被筛选出来,主要因为RFI去除算法仍然会残留小部分RFI。
83组候选团组中有两组候选目标无法从数据中判断为RFI,即使在原始数据中,这两个团组周围均无RFI信号。但是经过后期分析,并未在该信号所在天区找到潜在的类地行星,初步判断依然为RFI。在后续的研究中将会对该天区做更多的观测以进一步分析。
虽然对FAST的5 h漂移扫描数据的处理并未发现可疑的地外文明信号,但是实验结果已经很好的证明了所提数据处理流程能够高效的完成RFI去除以及候选目标筛选任务。这将为未来的SETI观测打下坚实的基础。
FAST是目前世界上最大的单口径望远镜,具有高灵敏度和大观测区域的特点,独特的悬停式馈源仓设计更是一大创新,使得望远镜被遮挡的面积大大缩小,新安装的19波束接收机使得望远镜在同一时间可以观测到更多的天区。FAST这些技术创新和优势非常契合SETI观测的要求。目前用于SETI共时观测的自动、实时和多科学目标后端已经顺利安装,并测试顺利。因此对于用FAST的SETI观测提出有以下四点目标和展望:
1)可以通过更多的共时观测来测试我们的数据处理系统性能,以及通过人工添加窄带信号来测试去噪效果。
2)通过1~2年时间的巡天观测,再经过数据分析系统进行分析,望可获得一些好的候选目标。并对候选目标进行后续观测进一步检验候选目标的可信度与可重复性。
3)除此之外,还可挑选距离太阳50 pc以内的银河系内恒星和临近的星系作为目标观测,参见表1~2[17]。
表1 恒星目标Table 1 Star target
表2 星系目标Table 2 Galaxies
4)还可和伯克利SETI团队合作,观测其在阿雷西博巡天观测得到的候选目标。这样既节省我方的观测时间,又可以与Arecibo巡天进行校对。
SETI科学观测是一项长期的科学探索,希望通过FAST望远镜找寻到地外文明的证据,与此同时,长期的共时观测非常有利于了解FAST周围的电磁干扰环境,优化现有的去干扰分析系统,也为FAST的其它科学目标观测提供便利。