李永鑫 诺桑 措加旺姆
摘要:最大熵原理起源于信息论和统计力学,是基于有限的已知信息对未知分布进行无偏推断的一种数学方法。文章通过对拉萨红斑紫外辐射数据的分析,探讨了借助最大熵原理实现红斑紫外辐射预测的可能性,结果表明,通过最大熵方法得出的理论概率与实测概率符合程度良好。
关键词:最大熵原理;太阳红斑紫外辐射;拉萨;辐射数据;辐射观测 文献标识码:A
中图分类号:P182 文章编号:1009-2374(2016)09-0045-02 DOI:10.13535/j.cnki.11-4406/n.2016.09.021
近年来,有越来越多的人把信息论中的熵的概念及其性质运用于测量数据处理中,特别是运用最大熵原理来解释不同专业领域的各种不适定(即有多种可能解)的问题,其中也有将其运用于求解数据分布的概率密度函数的问题。运用最大熵原理求解得到的概率分布优势在于不添加任何主观因素,客观地反映了事物本身的概率密度分布。张学文等人将最大熵原理用来解释空间气象现象,用最大熵原理得出气象现象的概率分布函数很好地符合实际状况;王蕾等人进一步将最大熵方法用于气象雨量预测;邵昀泓等人的工作展现出最大熵原理在公共交通需求预测中的巨大应用前景。随着臭氧层空洞的发现,太阳紫外辐射与人类生存环境和自身健康安全间的关系日益引起人们重视,太阳辐射观测站点陆续在世界各地建立起来。青藏高原是世界上海拔最高的高原,平均海拔4500米,该地区特殊的地理和气候条件使其成为全球太阳紫外辐射最强的地区之一,紫外线指数可达20以上。因此,如能实现对太阳紫外辐射的预报,将有益于当地居民的紫外防护和健康生活。本文通过最大熵原理对青藏高原地区紫外辐射数据进行分析,并以此为基础探索实现紫外线指数预报的途径。
1 最大熵原理
熵的概念最初来源于热力学,用以表征分子混乱度。1865年克劳修斯最早在热力学中引入这一概念,其目的是为了宏观过程的不可逆性。熵代表一个与过程无关的状态函数,与系统状态参量之间有一一映射的函数关系。依据分子运动论的观点对熵所做的微观解释,使得熵与概率间建立起了联系,可以用熵的概念研究和描述“不确定性”。1948年申农提出了信息熵的概念,他将离散无记忆信源X的信息量定义为n维概率矢量=(p1,p2,…,pn)的函数:
式中:称为信息熵的熵函数。信息熵函数具有熵的全部基本性质(非负性、对称性、扩展性、可加性等)。在此基础上,1957年杰尼斯进一步提出了最大熵原理:当根据部分信息进行推理时,必须选择这样的概率分布,它应满足在一切已知信息之下具有最大的熵。本文仅涉及最大熵原理在连续型随机变量中的应用,其论证过程如下:
若连续型随机变量X的分布密度函数是,其满足:
则当X服从指数分布exp()时熵H(X)达到最大,且为ln(μe)。
考虑条件泛函:
作辅助函数:
得泛函的驻点方程:
整理得:
卒现:
以及:
2 最大熵原理与太阳红斑紫外辐射的观测和预报
人的皮肤经适度紫外线照射后,经过一定时间,可出现刚可辨别的红斑,不同波长紫外线产生红斑所需剂量不同。1987年McKinlay和Diffey根据不同波长紫外辐射引发红斑能力的强弱编制了红斑作用谱。世界气象组织(WMO)依据此作用谱,定义了紫外线指数。本文所述红斑紫外辐射就是依据此作用谱,使用挪威产NILU-UV太阳紫外辐射测量仪测得,该仪器每分钟可记录一条太阳紫外辐射数据xi。若将一天中红斑紫外辐射强度看成是上述连续型随机变量X,则其概率分布应为密度函数为的指数分布,μ即为一天中记录到的太阳红斑紫外辐射的期望值。
X为时间t的函数X(t),X与xi关系为:
则:
影响到达地面太阳紫外辐射强度的因素有很多。整体来说,除太阳本身的辐射强度和太阳高度角变化外,地表反照率和臭氧、气溶胶、云层等大气成分的变化也会对辐射强度产生快速直接的影响。图1给出了在不同地表和气象条件下,拉萨地表接收紫外辐射强度随时间的变化情况。气象资料表明,2014.1.10、2014.1.11、2014.1.30和2014.1.31这四天的天气状况分别为晴、阴、多云和晴。显然,云层的出现可以削弱到达地表的太阳紫外辐射强度。另外,像积雪等地表状况,则会起到加强太阳紫外辐射的作用。
图1 2014年1月10日、11日、30日和31日拉萨市红斑紫外辐射强度变化情况
在整个太阳紫外辐射强度的预测工作中,晴日的太阳紫外辐射强度的变化情况具有基准参照的作用。对晴日一天中太阳紫外辐射变化情况分析,可以帮我们更好地认识和掌握它们的变化规律。鉴于最大熵方法求解在概率分布中表现出的优良特性,我们亦采用此方法来分析数据。以拉萨市2014年1月31日的太阳红斑紫外辐射数据为例,当日天气晴朗,共测得638个有效数据,经计算该日太阳红斑紫外辐射期望值为0.07W/m2。根据最大熵原理,我们分别计算了辐射强度在各强度区间的实测概率和理论概率。结果表明,依据最大熵原理得出的辐射强度的概率分布是比较贴近实际情况的。
表1 2014年1月31日拉萨红斑紫外辐射强度概率分布表
辐射强度区间W/m2 0.00~
0.02 0.02~
0.04 0.04~
0.06 0.06~
0.08 0.08~
0.10 0.10~
0.12 0.12~
0.14 0.14~
∞
实测概率 0.2759 0.1113 0.0909 0.0893 0.0799 0.0846 0.1097 0.1583
理论概率 0.2485 0.1868 0.1403 0.1055 0.0792 0.0596 0.0448 0.1353
对太阳红斑紫外辐射的预测工作有重要参照作用,还有另一个重要方面,那就是太阳紫外辐射的年际变化规律。长期的观测结果表明,太阳红斑紫外辐射强度变化具有整体周期性。太阳紫外辐射强度随着地球绕太阳公转引起的地球上太阳直射点纬度的变化而呈现出近似正弦波动性变化,冬季辐射强度低,夏季辐射强度高。图2给出了2008年7月至2014年10月间拉萨红斑紫外辐射强度日均值变化情况,从中我们可以明显地看出这一变化规律。
图2 2008年7月至2014年10月间拉萨红斑紫外辐射强度日均值变化情况
同时,臭氧量、云量、地表反照率等大气和地表状况也会对紫外辐射强度产生影响,这些因素的综合作用使太阳红斑紫外辐射强度日均值呈现出长时间范围内的周期性和短时间内的波动性。基于上述对太阳红斑紫外辐射的认识,我们可以展开对该类型紫外辐射的预测工作。已知某日的红斑紫外辐射均值μ1时,结合对大气、地面状况的预测和红斑紫外辐射整体的年际变化趋势,可以预测第二日的红斑紫外辐射均值μ2。再根据最大熵原理,便可预测第二日红斑紫外辐射强度的概率分布趋势。
3 结语
运用最大熵方法求解得到的概率密度分布是不添加任何主观因素,不偏不倚地反映客观事实的概率密度分布。从该方法的这一特性出发,我们的工作得出如下两个结论:(1)最大熵原理可以被应用到诸如太阳红斑紫外辐射之类的时域内的数据分析。对拉萨市晴日太阳红斑紫外辐射数据的分析表明,通过最大熵方法得出的理论概率与实测概率符合程度良好,具有很强的实用价值;(2)结合大气和地表状况,可以通过此方法对太阳红斑紫外辐射强度做出可靠预测。太阳红斑紫外辐射强度日均值呈现出长时间范围内的周期性和短时间内的波动性,通过最大熵方法的引入,可以实现对该类型太阳紫外辐射的预测。
参考文献
[1] 张学文,马力.熵气象学简介[J].气象,1995,(1).
[2] 王蕾,曹长虹.基于最大熵算法在气象雨量预测中应用研究[J].计算机仿真,2011,(10).
[3] 邵昀泓,赵阳.基于最大熵的公共交通需求预测[J].中南公路工程,2006,31(2).
[4] Gelsor Norsang,Yi-Chun Chen,etc.Comparison of ground-based measurements of solar UV radiation at four sites on the Tibetan Plateau[J].APPLIED OPTICS,2014,53(4).
[5] Jaynes E.T.Information theory and statistical mechanics
[J].Physical Review,1957,106(4).
[6] 何书元.概率论[M].北京:北京大学出版社,2006.
基金项目:西藏大学珠峰学者计划(2015);国家自然基金面上项目“西藏太阳紫外线及其影响因子的观测研究,批准号:41475139”。
作者简介:李永鑫(1988-),男,山东潍坊人,西藏大学硕士,研究方向:太阳能;诺桑(1962-),男(藏族),西藏日喀则人,西藏大学教授,博士,研究方向:太阳能;措加旺姆(1972-),女(藏族),西藏那曲人,西藏大学副教授,硕士,研究方向:太阳能。
(责任编辑:蒋建华)