米兰
在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有判断都是统计!
这段让人感触颇深的话是笔者从《SAS技术内幕》的扉页上读到的。
2019年初,清华大学出版社出版了一本数据分析著作《SAS技术内幕:从程序员到数据科学家》,作者为数据分析行业巨头SAS中国研发中心技术总监巫银良先生,作序者为北京大学信息科学技术学院博导张铭教授。
作为数据分析专业性的SAS著作,该书至今在当当网上依然显示为100%的好评,实属难能可贵。循序渐进掌握数据分析要义和精髓,从数据中获取洞见和智慧,应当是该书著作者的核心宗旨。
获得业内大咖联袂推荐的《SAS技术内幕》分上下两卷。上卷着重介绍SAS程序的语法与实践,下卷着眼于统计学以及数据分析相关内容的介绍以及在SAS程序上的应用。正如该书的副标题“从程序员到数据科学家”,它确实很好地为广大程序员和数据分析师架起了一座桥梁。
书中的知识点很好地兼顾了系统性、逻辑性和易读性:程序员需要了解的SAS编程知识,数据分析师需要了解的统计、数据分析相关理论,该书都有很全面的介绍。同时,知识的引入、切换也顺理成章,逻辑性很强。更妙的是,书中所带丰富的代碼示例,让读者可以轻松上手,自助学习、实践和调试。代码所用的数据大部分都源自系统自带,或通过简单几行代码创建,尽量照顾到读者使用该书进行练习的便捷性。
该书上卷第2章详细介绍了SAS传统的DATA步,并在第7章引入了SAS的第二代数据处理步DS2的介绍;在第12章到第17章,则分别介绍了不同数据结构在SAS编程中的应用。
下卷第18章在介绍统计学基础知识时,加入了详尽的SAS产品与过程步概览,涵盖了几乎所有的BASE SAS和SAS/STAT过程步。读者不仅能从书中学到相关的统计学知识,而且可以把它当成常备工具书使用。
作者在一些章节不时为读者对知识点进行总结,譬如第20章的附录 (P403:各统计分布之间的关系) 揭示了统计分布之间的简明清晰的逻辑关系,便于读者记忆和理解(如图2)。
该书最后一章详细论述了圆周率 的高精度求解方法与探索分析,令人叹为观止。该书附录提供了业界最精确完整的统计学查表及其制作方法,涵盖二项分布,泊松分布,标准正态分布的累积概率表以及 t 分布, 分布,F 分布不同显著性水平 α 下的临界值表。
该书涉及的知识内容全面,知识层次由浅入深,同时也涵盖技术和分析领域的前沿科技,无论是初学者,还是相关领域从业者,都会从本书中得到不同程度的收获。
责编/庞贝