尤尔基于社会统计的实证研究及其影响

2018-04-18 11:00聂淑媛
统计与信息论坛 2018年4期
关键词:布斯救助分析

聂淑媛

(洛阳师范学院 数学科学学院,河南 洛阳 471934)

作为世界上著名的统计学会和英国唯一的专业统计学术团体,英国皇家统计学会RSS历来高度重视基础理论和创新实践的同步发展,尤其推崇理论方法新颖、技术水平高超的实证研究。统计学家尤尔(George Udny Yule,1871—1951)1895年即成为皇家统计学会的会员,自1907年起担任学会秘书达12年之久,并于1924—1926年任学会主席,他虔诚地参加学会会议,热衷于学会活动——论文宣读后的讨论交流。学会期刊JRSS是尤尔学术交流的主阵地,他一生发表的80多篇论文中,有30多篇都发表在JRSS上,因此尤尔的统计研究受到皇家统计学会的深刻影响。尤尔和学会成员社会统计学家吉芬(Robert Giffen,1837—1910)、经济统计学家鲍利(Arthur Lyon Bowley,1869—1957)等,致力于开发利用各类统计方法去调查、搜集、分析居民收入和消费等经济数据,此谓尤尔从事社会统计学研究的根本缘由和学术背景。

一、尤尔的研究始终以社会统计为中心

纵观尤尔的研究方向,1895年尤尔首次涉足统计学领域,起因是社会学家、慈善家布斯(Charles James Booth,1840—1916)和慈善组织协会秘书劳池(Charles Stewart Loch,1849—1923)关于贫穷制度的争议:1900年,尤尔以天花发病率和接种疫苗的关联性、高尔顿关于自然遗传、达尔文关于个体受精的各种案例以及儿童和成人缺陷的分布等社会问题为研究对象,解释了2×2维列联表等随机分布理论;1906年,尤尔调查了英国婚姻率和出生率的变化缘由;1909年前后,尤尔陆续研究了价格、贸易等诸多社会现象,系统探讨了相关、回归方法在社会和经济统计学中的应用;1924年,尤尔就职皇家统计学会主席,其演讲主题是“以逻辑斯蒂曲线预测未来的人口增长态势”;1921—1927年,也正是为了探究太阳黑子序列的周期,尤尔才提出“伪相关”和“自回归”等概念;尤尔晚年利用句子长度进行作者身份识别研究、利用尤尔图研究单词频率,对计量风格学大有启迪。概言之,尤尔涉足多元回归和相关、随机分布、人口统计和时间序列分析等诸领域,基本上都是基于社会统计学的独特视角,是一位真正融理论研究和实际应用为一体的社会统计学家。

二、尤尔利用回归、相关等统计工具实证研究贫穷问题

(一)注重陈述资料来源,并对原始数据进行适当的预处理

数据的可靠性和真实性是实证分析的基础和前提,与现代实证研究文献类似,尤尔在1895—1899年研究贫穷问题的6篇论文中,不仅详细说明了所用数据的来源,而且尽可能列出真实数据,明确解释统计变量的含义,表1归纳总结了尤尔研究贫穷问题的过程中,对所用资料的细致陈述。

表1 尤尔研究贫穷问题中对原始数据的陈述和解释归纳表

无论是国家发布的最新材料还是借助统计学家的第二手资料,尤尔首先检验数据的稳定性和异常情况。比如,当计算贫穷率和户外救助的相关系数时,威尔士区域出现了两例户外救助对户内救助的数量比高达100∶1的情形,远远大于一般案例中二者的比例,尤尔将其视为异常值单独进行讨论,以减小变量相关表的整体误差;同时,尤尔特别强调对原始数据的预处理,以形成可供实证分析的数据序列。例如,当讨论65岁以上男性救助人口的百分比时,可用数据包括每日数据和年度数据两类情形,但前者仅列出了全部穷人的救助信息,于是尤尔根据65岁以上男性占全部人口的比例,对每日数据序列进行转换,再与相应的年度数据进行对比分析。类似的技术处理在尤尔的研究中很常见,与现代实证研究中数据预处理的思路和方式高度吻合,确保了数据序列的规范性和完备性。

(二)以严密系统的实证分析为基础,科学推断结论

为探究贫穷率和户外救助是否相关,尤尔深度剖析了布斯的统计推断:根据工业特征指标,布斯将全国的500个区域分成20个组,每个组的样本或者集中于农村和农业,或者偏重于城市;布斯单独分析每个小组,在组内按照整体贫穷率对区域进行排序,通过比较排在顶部和底部区域的平均水平,布斯认定贫穷率和户外救助无关。尤尔指出,布斯以两个极端情形为研究对象,样本分类不具有普遍性和代表性。尤尔重新计算了布斯表格中顶部和底部一半数据的平均值,结果表明底部的一半有较低的平均贫穷率,也正对应着较低的平均户外救助比例。为驳斥尤尔,1896年布斯进一步细致分析了自己的分组,对包含50个较多农村区域的第1组按照贫穷程度进行降序排列,并在同一个表格中列出了贫穷率和户外救助比例两列数据,显示二者没有对应关系。对此,尤尔深入挖掘到:这50个区域中,前25个几乎完全来自于南方和西方,后25个几乎全部来自于北方,而前者农村劳动力的周工资是10~13先令,后者是16~17先令,正是这种巨大的财富差异掩盖了管理效果。

正是通过与布斯的严格辩论和实证研究,尤尔逐渐认识到分析贫穷率的变化需要考虑“其他因素”,这正是尤尔创建多元相关、偏相关的实践基础。尤尔的数据分析非常全面、详尽,对不同类型的区域对应的小组,他分别计算贫穷和户外救助的二元相关系数,利用实际数据诠释两个变量的正相关性[6]。同时,通过对大量案例的剖析,尤尔最终得到下述5类变量是影响贫穷率变化的直接原因:(1)政策或管理方式;(2)经济状况(包括工资、交易水平、失业情况等);(3)社会或工业特征(包括人口密度);(4)道德水平(如犯罪、教育程度、非婚生育等);(5)年龄分布,并列出多元回归方程:

尤尔使用户外救助变化率、老龄人口变化率、整体人口变化率3个解释变量,分别把1871—1881年、1881—1891年的577和580个区域的数据,划分为农村、混合、城市和大主教教区4块,估算了各情形下贫穷变化率的多元回归方程,比较分析了8个方程中的所有系数,最终证实管理政策即户外救助比例是影响贫穷率的核心要素。

三、尤尔创建时间序列模型源于对太阳黑子周期的研究

时间序列分析包括时域分析和频域分析两大类,早期重点关注平稳时间序列的自相关和随机序列的周期问题,任务之一是探寻隐周期和显周期的准确结合,在几乎同步进行的两条主线中,尤尔都是核心人物。

不带壳烘焙种籽衣的制备:将松籽去壳,在130 ℃条件下烘焙,取出冷却至室温。手工从松仁表面剥离种籽衣,密封,避光保存备用。

第一条线索的研究思路是,在处理社会数据和经济序列时,尤尔等统计学家经常会得到一些奇怪的相关——根据一般的统计检验,两个变量是高度相关的,但实际上完全不符合逻辑关系,尤尔称之为“伪相关”或无意义相关。基于对该问题的困惑,1921年尤尔立足于对变量差分相关方法的讨论,阐述时间相关的含义。1926年以在英国国教会结婚的人数占全部结婚人数的比例与每千人标准死亡率之间的相关关系为例,尤尔进一步探究无意义相关的本质,并对时间序列进行分类。通过实证分析著名的贝弗里奇小麦价格指数序列和格林威治降雨量序列,尤尔证实:正是第三类序列——序列自身和一阶差分都是正相关但二阶差分是随机序列,特别容易产生虚假相关。至此,尤尔断言:不是所有的时间序列都可以看作是时间的函数,与其滞后变量相关的经济时间序列是大量存在的,“回归”概念拓展到序列的“自回归”是精确反映变量关系的客观需求[7-8]。1927年尤尔运用序列相关和自回归的创新技术,以受扰动的单摆运动类比于太阳黑子序列,证明振荡时间序列的周期ux与其滞后项ux-1、ux-2满足关系式[9]:

ux=(2-μ)ux-1-ux-2+ε

其中μ为常数,ε是扰动项。

需要说明,这是平稳时间序列线性自回归的第一个完整公式,是被奉为现代时间序列分析基础与起源的经典AR(2)模型。更值得强调的是,1931年英国统计学家沃克(Gilbert Thomas Walker,1868—1958)给出的一般化自回归AR(s)模型,完全建立在上述模型的基础上,只是把滞后项从2期扩充到了s期。

另一条线索是,1921年和1926年尤尔研究发现,掷骰子等得到的纯随机序列,进行数次差分之后所形成的序列将趋向于规则性波动。以此为基础,1927年斯卢茨基(Evgeny Evgenievich Slutzky,1880—1948)系统探讨了随机扰动叠加后的模型及其性质,创建了移动求和MA(n)模型。斯卢茨基特别说明自己引用了尤尔的研究,和尤尔共同开始关注扰动因素。也就是说,对随机成分的认识,由原来的观察误差转变为扰动项,并且扰动也是数据产生过程中的一个重要组成部分。因此,在频域分析领域的周期图方法过渡到时域分析领域的线性自回归模型时,尤尔的社会统计研究发挥着不容忽视的理论铺垫作用,从而亦开启了现代时间序列分析之学科方向。

四、尤尔社会统计研究的学术影响及评价

利用统计思想分析社会经济现象的历史源远流长,至少要追溯到17世纪威廉·配第(William Petty,1623—1687)的政治算术以及19世纪初以凯特勒(Lambert Adolphe Jacques Quetelet,1796—1874)为首的经济统计学研究,但学界通常认为严格的定量社会科学源于回归、相关的应用,故尤尔是现代统计理论融入社会科学和经济领域的真正先驱[10]。尤尔研究贫穷问题的思路和方法,当前在公共政策决策、管理制度修订等方面仍不失其指导性地位,很多国家仍然利用以多元回归为基础的统计模型评价国民需求、分配政府供给、度量政策影响等[11]。

从技术层面而言,尤尔的社会统计研究不是用统计技术去适应社会科学,而是尤尔的根本兴趣集中于社会问题,这一方面说明了基于生物学、优生学背景创建的新理论和新方法可以有更广泛的应用,同时也迅速开发和引领了社会统计学的发展:1901年鲍利出版教科书《统计学原理》,具体讲解了统计理论分析实际问题的案例;1901—1905年,库克(Reginald Hawthorn Hooker,1867—1944)向皇家统计学会提交3篇论文,系统研究价格、婚姻率和贸易的时间序列数据;诺顿(John Norton,1858—1916)利用相关和一阶差分研究纽约钱币市场的结余、储蓄和贷款;法国的马驰(Lucien March,1859—1933)讨论了银行金银和储蓄等经济序列以及婚姻率、出生率的相关性等。通过尤尔本人的直接影响,结合1909年在法国巴黎举办的国际统计学会的会议传播以及皇家统计学会的学术扩散等,到20世纪初,回归相关理论已在社会科学领域建立了坚实的应用基础,到了20世纪20年代,则转向了以时间序列分析方法为主体的统计应用。继尤尔实证分析推出AR(2)模型后,斯卢茨基通过分析苏维埃彩票抽奖数字,创建了MA模型;沃克在研究世界天气时,探讨了印度达尔文港口的压力问题而扩建了AR模型;1938年计量经济学家沃尔德(Herman Wold,1908—1992)研究离散平稳时间序列时,讨论了贝弗里奇小麦年价格指数序列、维纳恩湖水位量和降雨量序列、瑞典生活费用指数序列等,最终创建了ARMA模型;到20世纪七八十年代,博克斯(George Edward Pelham Box,1919—2013)和詹金斯(Gwilym Meirion Jenkins,1933—1982)讨论ARIMA模型、恩格尔(Robert Fry Engle,1942—)提出ARCH模型以及众多统计学家衍生GARCH族模型时,更是以大量具体的实际的社会经济序列为本,因此当前才有社会统计学和金融时间序列分析等学科分支。

综上所述,尤尔以回归、相关等统计学的基本概念为出发点,通过对社会问题的批判与探讨、对数值数据的谨慎应用与理性解释,一方面逐步扩展、延伸、开拓到自回归等时间序列新理论,同时也极大地促进了统计技术在社会、经济、金融等领域的创新应用,可谓是社会统计学的先锋和枢纽。

参考文献:

[1]Yule G U.On the Correlation of Total Pauperism with Proportion of Out-Relief I [J].The Economic Journal,1895(5).

[2]Yule G U.On the Correlation of Total Pauperism with Proportion of Out-Relief II [J].The Economic Journal,1896(6).

[3]Yule G U.Notes on the History of Pauperism in England and Wales from 1850,Treated by the Method of Frequency-Curves,with an Introduction on the Method [J].Journal of the Royal Statistical Society,1896,59(2).

[4]Yule G U.On the Theory of Correlation [J].Journal of the Royal Statistical Society,1897,60(4).

[5]Yule G U.An Investigation into the Causes of Changes in Pauperism in England,Chiefly During the Last Two Intercensal Decades (Part I) [J].Journal of the Royal Statistical Society,1899,62(2).

[6]Yule G U.On the Significance of Bravais' Formulae for Regression,&c.,in the Case of Skew Correlation [C].Proceedings of the Royal Society of London,1896-1897.

[7]Yule G U.On the Time-Correlation Problem,with Especial Reference to the Variate-Difference Correlation Method[J].Journal of the Royal Statistical,1921,84(4).

[8]Yule G U.Why Do We Sometimes Get Nonsense-Correlations between Time-Series?-A Study in Sampling and the Nature of Time-Series[J].Journal of the Royal Statistical,1926,89(1).

[9]Yule G U.On a Method of Investigating Periodicities in Disturbed Series,with Special Reference to Wolfer's Sunspot Numbers[J].Philosophical Transactions of the Royal Society of London,Series A,1927,226.

[10] Hepple L W.Multiple Regression and Spatial Policy Analysis:George Udny Yule and the Origins of Statistical Social Science[J].Environment and Planning D:Society and Space,2001,19(4).

[11] 张迎春.社会统计学30年发展与若干前沿问题[J].统计与信息论坛,2011,26(11).

猜你喜欢
布斯救助分析
由“中华富强”轮失火救助引发的思考
隐蔽失效适航要求符合性验证分析
水下救助抢险
电力系统不平衡分析
救助小猫
天生不凡
电力系统及其自动化发展趋势分析
蒙药希和日额布斯-6对功能性消化不良患者胃动力的影响
临时救助 “善政”还需“善为”