李 勇,张琴芳,张 敏
第十次全国生存分析和应用统计研讨会学术简述
李勇,张琴芳,张敏
第十届全国生存分析和应用统计研讨会于2016年3月25-27日在重庆召开。本届会议由中国现场统计研究会生存分析分会主办,重庆工商大学、香港浸会大学数学系、重庆誉锋宸数据信息技术有限公司和重庆允升科技大数据研究中心联合承办,主题为“共享数据时代生存分析领域的最新动态和应用统计研究”。来自企事业单位的80多位专家学者参会。会议入选论文36篇,以大数据与高维数据、生存分析模型理论与应用等专题进行了交流讨论。
一、高维数据统计推断与大数据内涵研究
香港浸会大学朱力行教授针对大数据共享时代,阐述了生存分析领域的未来发展与应用拓展。南开大学王兆军教授在《高维数据的统计推断与在线监控》报告中,将质量控制图推广到高维数据,研究其统计推断:高维单样本方差检验、高维两样本均值检验、高维数据异常点检验、多变点非参数诊断,以及高维数据和多数据流在线监控等。重庆工商大学李勇在《Big Data:Concept, Technology and Application》报告中,从历史起源和现实价值角度指出:大数据的本质内涵,应从大数据来源、大数据特性、大数据技术和大数据思维四方面进行立体化阐释;大数据来源可分为:政企业务数据、个人制造数据和机器互联数据等;大数据时代指建立在互联网、移动互联网、物联网、云计算和社交网络等信息技术基础之上的数据驱动决策和具有互联网思维的信息时代;自然、社会与数据三位一体形成现实世界,数据空间是自然空间与社会空间的纽带。中国人民大学朱利平博士在《A Lack-of-fit Test for Quantile Regression with Ultrahigh Dimensional Covariates》中,针对超高维变量分位数回归模型的失拟(Lack-of-fit)检验问题展开研究。其他学者涉及超高维生存数据切片逆回归模型和相关秩筛检、高维分类判别分析的贝叶斯推断等问题研究。
二、生存分析模型偏差校正和统计理论方法研究
中国科学院数学与系统科学研究院王启华研究员在《A Bias Corrected Mean Score Estimator with Covariates Missing at Random》报告中,对协变量随机缺失模型的均值得分估计偏差校正进行了系统研究。他探讨了均值得分法的偏差校正,证明了估计量的一致性和渐近正态性;与AIPW(双稳健)方法进行对比研究,再通过模拟实验和实际数据的论证分析,提出了进一步的讨论。香港浸会大学的童铁军博士在《Bias and variance reduction in estimating the proportion of true null hypotheses》报告中,探讨了多样本假设检验中真正零假设下所对应的比例(pi0)的估计偏差降低问题,指出现有文献中pi0的估计方法大多趋于保守,在降低估计偏差处理上,要么偏差校正过度,要么出现无法接受的估计方差;将估计行为纳入研究范围,利用原假设不真的概率密度函数p值,提出了一个估计pi0值的新算法,证明该法能够同时降低估计的偏差和方差;通过模拟研究和真实数据的分析,可评估估计行为的性能和提高检验显著性。香港浸会大学彭衡博士和张爱军博士分别在《A data-driven clustering method for longitudinal data》和《Dual-time Data Modeling and Dynamic Prediction》中探讨了纵向数据的聚类分析和双时间数据的建模和预测问题。云南财经大学的喻达磊博士在《Conditional Akaike information criteria for a class of Poisson mixture models with random effects》中探讨了泊松混合模型中的条件Akaike信息准则问题。其他学者的研究涉及空间滞后模型的异常值检测、函数数据误差控制自动检测、二元缺失变量回归模型估计、联合模型结构发现、半参数随机波动模型估计和动态协方差模型等多个领域。
三、生存分析模型方法与统计应用
诺华制药生物统计总监唐德均在《Some Applications for Quantitative Clinical Trial Design》报告中,探讨了临床试验设计的定量研究,药物开发的关键点能对临床试验品质和时效产生显著影响,对决策标准利用建模与仿真等定量方法,可有效评估试验设计的操作特性和预测成功概率;通过真实案例展现定量临床试验的基本规则和应用。云南财经大学张敏在《Bayesian Inferences of Multilevel Statistical Model and its Application》报告中将多水平模型贝叶斯推断应用于农户收入增长影响因素研究。其他学者的研究还涉及治疗组生存数据平均剩余寿命时间的回归模型、基因组关联性数据快速检测算法、膳食营养与肠道微生物关联数据的Dirichlet树回归模型和职篮比赛得分差异数据建模等应用。
(李勇、张芳芹:重庆工商大学数学与统计学院;张敏:云南财经大学统计与数学学院)
(责任编辑:杜一哲)