为什么要学统计学?
在校园里,统计学课程确实不那么受欢迎,尽管教这门课的人(就是我们啦)不愿意承认。很大一部分学生选统计学课程,其实是因为他们的院系将其定为必修课。在这种情况下,学生有权问“为什么要学统计学?”在这里,我至少可以给出两个很好的答案。传统的答案是,我们希望学生学会一套特定的分析数据的技能(包括公式和程序),这样他们就能够读懂实验文献,并能够分析自己的数据。还有一个更加宽泛的、适用于更多学生的答案,那就是善于与数字和数据打交道,对于学生的终身职业发展非常重要。我们中的大多数人(不仅是那些从事实验工作的人)在工作中经常遇到数据,所以,对于数据处理方法的广博理解就成为一项重要的、可以待价而沽的技能。根据我的经验,那些修过统计学课程的学生即使觉得自己已经把学过的技能忘得一干二净,还是比他们的同事更善于解读数据。现在的世界越来越受定量数据的支配,也越来越强烈地需要统计学技术。统计学并不完全是关于数字的学问,它关系到我们如何理解世界。当然,对于统计学家来说,其重要工作之一就是回答诸如“在新环境中摄取的可卡因是否比在熟悉的环境中摄取的具有更强效力”这类问题。但是,我们不要忘记,这里谈论的话题是“药物成瘾”或“环境对学习和记忆的影响”。我们的实验结果已经超出了认知或行为科学家的有限视野。还要记住,大多数人看到的数字与严格控制的实验无关,而与以下研究有关:为了购物中心建设而开展的交通问题研究,住宅密度对当地学校预算的影响研究,以及针对新产品的营销研究。所有这些例子都要用到本书阐述的许多统计学的基本概念。
为什么需要本教材?
为了充分体现统计学课程的价值。教师看到本书之前想必就已经深信统计学的价值了,而我希望的是,学生们至少可以拓宽他们的思路。但是上面这个问题并没有得到回答——还有其他许多教材,为什么要用这一本?部分答案可以归结为写作风格:我特意将其设定为对学生和教师而言都既有趣又有用的一本书。它采用了一种比较轻松的文体,每个例子都以一个合理的研究作为背景,而且几乎所有的例子都源于已经发表的文献。如果要求人们学习一系列统计学技术,却不提供实际运用这些技术的情境作为例子,那这门课就没有多大意义了。
我为本书设计的目标是向心理学、教育学以及其他行为科学提供一本入门级统计学教材。本书对读者的数学背景要求不高,学过高中代数即可;这里强调的是统计程序的逻辑,而不是统计学公式的推导。
在过去的25年中,数据分析领域发生了天翻地覆的变化。过去,我们用计算器,坐在那里手动输入数据解方程,现在多半是在计算机上运行统计软件。事实上,为了某些目的,我们还可能运行一些从互联网上免费下载的用Java等语言编写的在线程序(我有时还会使用下载到智能手机里的应用程序)。随着统计方法的进步,相应的教学方法也必须改变。虽然我们现在不能也不应该完全摒弃对于公式和计算的重视,但确实是时候多考虑点别的方面了。我们可以将计算上省下来的时间用于更好地解读统计结果。这正是本书努力要做的事情。过去,我们只是简单地宣布样本间的差异是显著还是不显著,以后要过渡到能解释这些差异对于实验背后的目的意味着什么。在我看来,这是一个从分析数字到分析数据的转变。这意味着,两组之间是否存在差异已经不再那么重要,更重要的是理解这种差异的含义。
在从使用计算器转向使用计算机的过程中,我改变了对公式的看法。过去,我经常给出一个定义公式,接着立即跳到计算公式。但是,如果不用那么担心计算而应更多地关心理解,我就可以回过头去运用定义公式。我希望这也会让学生轻松一点。除此之外,在这个版本中,我还在计算机解决方案上额外花了相当多的时间,部分原因是,观察计算机解决问题的方式有助于理解统计学方法。尽管这种方式未必总是有效,但它已经足以让我强调,能够用计算机程序来求解是非常重要的。(求出解后还可以稍做改变,重新运行程序,看看会发生什么。)
独一无二的特色
本书有多项特色,使其有别于为同一读者群编写的其他书籍。特色之一就是刚刚提到的一个做法——从研究文献中寻找例子。我试图做到,让选来做例子的研究回答的是学生感兴趣的问题。在这些例子当中,有情境对过量吸食海洛因的影响,有日常压力与心理症状之间的关系,有影响课程评价的变量,有父母早逝对儿童敏感性的影响,还有影响记忆随年龄变化关系的变量。我想让学生对提出的问题产生一定的投入感,并且希望说明,统计分析并非仅仅是运用几个方程式那么简单。
在本书大多数章中都专门设置了一节内容用例子来讨论如何运用SPSS和R软件。读者建议我多关注R而不是SPSS。R正在成为计算的标准,并且它还是一个不断开发中的、免费的软件包。SPSS是一个商业软件包,许多学院和大学都购买了许可证。R稍微有点难学,但它确实正在成为未来的统计软件。至于免费软件,这绝非嘲笑R的理由。我的目的是让学?熟悉计算机输出的形式,以及其中包含的各种信息。我不是想让学生成为统计软件的专家,但我致力于向他们提供修改代码并完成自己的任务所需要的知识。此外,我特别需要用R来直观地阐明统计学中的概念。
但是,如果学生打算用这些计算机软件,我不会让他们仅仅为了作业而购买SPSS手册或R教材。我在网上放了两本SPSS手册,鼓励学生阅读。它们不像印刷品那么完整,但足以教会学生使用SPSS。我建议使用那个简明手册,而详细手册可以用于查阅其他的信息。我在每一章也都介绍了关于R用法的网络文档,学生应该能够照此进行统计分析;而要做自己的分析时,可以对代码进行相应的修改。
本教材所有例题和习题所用的数据文件都可以在我为本书维护的网站*上找到。通过网站中的链接,可以获得所有数据。这些数据文件都采用美国信息交换标准代码(American Standard Code for Information Interchange,ASCII)格式,因此几乎任何统计软件都可以读取。(我还提供了SPSS格式的数据文件副本。)文件的第一行都是变量名,可以直接导入软件。只需点击数据浏览器的“保存”选项,就可以将数据保存到你的计算机中。有了这些文件,师生就可以轻松地结合教材使用任何统计软件。
在前面提到的网站上还能找到一份学生手册。它给出了半数练习题的完整答案,本书最后对这些问题只做了简短解答,这份手册可以作为一个补充。但是,我只给出了奇数题的答案,因为许多教师更喜欢布置教材和学生答题手册上没有给出答案的习题(或考试题)。(我非常清楚这会得罪学生,有时还会收到他们表示不悦的邮件,但我还是要平衡一下学生的要求与教师的愿望。)我向教师提供所有习题的答案。这些答案还经常带有评语,例如,“在课堂上你可以指出……”或“我提出这个问题是为了……”我在编写这个新版本时也通读了这些评语,我觉得这些评论中有很多(尽管不是全部)对学生也相当有用,所以在学生手册中也加入了不少这样的内容。有的评语可能看上去没有帮助或不符合上下文,但是我认为大部分都值得一读。我的网页还包含了许多转向其他网站的链接,通过它们,你可以找到很好的例题、用于演示统计方法的程序、更详细的术语表等。既然人们花费了大量时间通过互联网提供可用的材料,就应该好好利用这些材料。
为什么需要这个新版本?
每当作者推出一个新版本时,我们自然会问:在二手图书市场广泛流通的旧版本是不是出了什么问题?通常来说,编写一个新版本是为了吸收本领域的新内容,并剔除不再需要的内容。而且,除了许多人都能想到的研究,还有许多新的研究工作尚在进行之中。但是,这个版本采用了与前一个版本不同的做法。在介绍新内容的时候,我把自己当成初学者去阅读,并花大力气找到阐述和复习概念的方法。例如,我知道Y轴是垂直轴,但大多数人不知道,那么只讲一次是不够的。所以,我经常这样写:“在Y(垂直)轴上……”如果你开始以这种方式看待本书,你会发现许多地方需要说明——特别是因为我有一位长期从事中学教育的妻子,她比我更了解教育学。(其实,她读了本书每一章内容,并提出了许多富有成效的建议。)在每一章的开头,我还列出了阅读本章所需的重要概念。我的希望是,如果你不清楚这些概念,就请复习一下。
在必要的地方,我利用专栏插入了一些重要的解释,这种专栏可以将多个要点综合在一起,以突出显示你真正需要理解的材料,或阐明难以理解的概念。书中还穿插了著名统计学家的小传。尤其是在20世纪上半叶,这个领域有许多有趣(而且脾气暴躁)的人,很值得了解一二。我还删除了原先每一章中非常简短且用处不大的总结,代之以更完整的各章总结。我的目标是将全章内容浓缩成几段,让你在其上花的时间更值得。前段时间,我在阅读关于Java的编程文本,发现有位作者在每一章的末尾都插入了一些简单的问题和答案。我发现,从这些简单的问题中可以学到很多东西,所以在这一版中,我将仿照他的做法。希望这些问题真的能够有效地将你的注意力集中到各章的诸多重点之上。
本书的一个重要特征就是更加重视效应量的计算。行为科学统计正在迅速摆脱只报告统计学上是否具有显著意义的局面,转而报告更能说明研究结果的效应程度和重要程度的数据指标。这方面的内容加入得比较晚,但是它们将体现在我对教材文本所做的持续改变中。这样做不仅符合这个领域的趋势,而且其重要性在于,这可以使学生和研究人员仔细思考研究结果的真正含义。在介绍效应量时,我试图传达这样一种观念:作者试图向读者说明研究发现了什么,而且有多种不同的方法可以实现这一目标。在某些情况下,只要考察平均数之差或比例之差就足够了。而在另一些情况下,标准化的数量指标,例如科恩氏d(Cohen’ s d),还是有帮助的。我还将尽可能避开基于相关的数量指标,因为我觉得它们提供的信息远远达不到读者的要求。
统计学领域发生的一个重要变化就是向所谓的“重抽样统计学”的转变。由于现在的计算机(即使是简单的台式机)能以极高的速度进行运算,我们已经有可能采用以前想过但从未用过的方式来审视统计结果。这些程序的优点之一,就是它们不再要求数据符合那么多假设。从某些方面看,它们就像我们多年来一直使用的比较传统的非参数统计学,而且它们更强大。我修改了传统的非参数统计的那一章,使其几乎完全避开手工计算,并用节省出来篇幅介绍重抽样方面的内容。这样做有一个好处,一旦我说明了某一种分析的重抽样技术,学生就很容易明白对其做出怎样的修改能适用于其他实验设计。
我还保留了早期版本中一部分叫作“直观的统计学”的内容。这些内容都是围绕着由科罗拉多大学的Gary McClelland编写的一组Java程序写成的。这些程序能让学生自己直观地看明白书中讨论的许多概念。学生可以打开这些程序,改变其中的参数,查看会产生什么结果。有一个很好的例子,是用一个程序说明异质子样本在相关分析中的影响,请参见第9章第9.16节。这些程序可以直接在我先前提到的网站上找到。
这一版有一个重要补充,就是增加了关于元分析的章节。元分析是同时对众多研究进行分析。例如,关于抑郁症治疗已经有了许多研究。对抑郁症的元分析就是将所有这些研究结合起来,并试图根据这些或相似、或不同的发现得出新的结论。目前对循证医学的重视就是一个很好的例子。例如,如果我要接受癌症治疗,我希望这种治疗依据的不仅仅是上周发表的最新研究,也不仅仅是我的肿瘤科医生最喜欢的研究。在这种情况下,我们真正需要的是,行为科学不仅限于判断统计学意义是否显著,更要重视效应量的大小。20年前的统计学导论教材是不会介绍对于众多研究的元分析方法的。
除了上面提到的特色,通过出版社网站(我的网站上有一个链接),你还可以找到本书的配套网址,其中包含了许多对学生有用的内容。其中包括一本统计学辅导书,这是一套多项选择题,内容涵盖各章的主要问题。每当学生做出错误选择时,就会出现一个解释问题材料、帮助学生了解正确答案的方框。这些测试题不是我编写的,但是我觉得这些题目已经足够好。网站上还有链接指向其他资源,包括对基础算术的复习,以及其他例子和补充材料。
内容的组织和覆盖范围
本节主要是给教师看的,因为这里提到的内容,学生应该还不很了解。如果你是学生,可以跳过这一节。
本书的前七章专门讲解标准的描述统计学,包括数据的呈现方式、集中量和差异量的计量、正态分布以及直接应用于后续内容的概率论。
第8章阐述假设检验和抽样分布,这是对推断统计学的通俗介绍。这一章经过专门设计,为了让学生绕过一大堆公式和纷繁复杂的统计检验方法,直接学习假设检验的基本逻辑。
第9章、第10章和第11章涉及相关和回归,包括多元回归。
第12—14章专门讲授了关于平均数的检验,主要是t检验。
第15章涉及统计功效及其计算方法,这是一种易于理解和应用的方法。
第16—18章讲方差分析。其中包括简单的重复测量设计,但没有涉及混合设计。这三章内容包括运用费舍保护性t检验进行基本多重比较,这个t不仅是一个易于理解的统计量,在某些限定条件下,其在统计功效和错误率方面也有很好的表现。应早期版本的部分读者的要求,新版本中加入了Bonferroni检验,它在控制错误率方面表现出色,而且只要使用得当,其功效也不会大幅下降。新版本还介绍了效应度和效应量,大大扩充了交互作用和简单效应检验的内容。特别是效应量方面的内容,远比早期版本丰富。
第19章介绍χ2检验。不过,如果需要提前了解这部分内容,其阅读难度也不大。
第20章介绍了最重要的自由分布检验,包括重抽样统计学。
在上一版中,第21章是全新的内容,介绍的是元分析技术。随着人们日益重视单个研究的效应量,元分析让人们得以运用效应量指标来综合许多相似的研究。该领域现在变得特别重要,正沿着所谓“循证医学”研究者开辟的道路前进。假定你需要接受癌症治疗,你一定希望医生的治疗基于对你所患癌症的所有文献的坚实可靠的分析。我们研究行为科学时,也有同样的希望。
并非每一门课程都要讲完所有这些章节,有些内容(最明显的是多元回归、统计功效和自由分布统计方法)即使略去或调整顺序,也不会破坏材料的流畅性。(我在自己的课程中很早就会讲到χ2检验,但是考虑到评论者的建议,本书将其挪到很后面的位置。)
对应本书的数字教育平台——MindTap
MindTap是一种个性化的教学体验,其中有可以引导学生进行分析、应用和改进思维的相关作业,可以便捷地衡量学生的技能和学习成果。
个性化教学:基于学习目标建立学习路径成为了教师的个性化教学方式。教师可以控制学生学习的内容和进度,可以直接使用原有内容,也可以将其与教学大纲精准匹配——你可以省略和重新排列原有内容,还可以添加和创建自己的内容。
学习指导:提供独一无二的学习路径,将重要的阅读内容、多媒体内容和活动组织起来,促使学生从初级学习(对基础知识的记忆和理解)上升到高级学习(分析和应用)。
促成更好的结果:作为对师生的激励,平台的分析和报表功能可以向师生提供课程进度、课程用时、参与率和完成率的快照记录。
补充材料
附有题库和电子讲义的在线教师手册包括练习的完整答案,还介绍了呈现材料和吸引学生注意的多种方法;其中可以找到适合各种教学目标的额外例子作为教?的补充,可以通过链接访问互联网上的其他资源,还可以看到本书作者选用的补充材料。补充材料中还包括可用作讲义或工作表的电子文件。
致谢
在本书的编写过程中,许多人发挥了重要作用。我的产品团队支持此次修订,团队中有产品经理Tim Matray、产品助理Adrienne McCrory、内容开发人员Tangelique Williams- Grayer和Lumina项目集经理Kailash Rawat。Diane Giombetti Clue是一位非常出色的编辑——当我偶尔不顾样式手册的要求,坚持古怪的拼写或将介词放在自认为更合适的位置时,她总是给予支持。我的女儿Lynda也做了大量工作,调整教师和学生手册的格式,以及检查偶然错误。
许多评论者对本书的早期版本提出了有益的建议,特别是Kevin J. Apple博士(俄亥俄大学)、Eryl Bassett(坎特伯雷肯特大学)、Drake Bradley(贝茨学院)、Deborah M. Clauson(美国天主教大学)、Jose M. Cortina(密歇根州立大学)、Gary B. Forbach(沃什伯恩大学)、Edward Johnson(北卡罗来纳大学)、Dennis Jowaisas(俄克拉何马城市大学)、David J. Mostofsky(波士顿大学)、Maureen Powers(范德比尔特大学)、David R. Owen(纽约城市大学布鲁克林学院)、Dennis Roberts(宾夕法尼亚州立大学)、Steven Rogelberg(鲍灵格林州立大学)、Deborah J. Runsey(堪萨斯州立大学)、Robert Schutz(不列颠哥伦比亚大学)、N. Clayton Silver(内华达大学)、Patrick A. Vitale(南达科他大学)、Bruce H. Wade(斯佩尔曼学院)、Robert Williams(加劳德特大学)、Eleanor Willemsen(圣克拉拉大学)、Pamela Zappardino(罗得岛大学)、Dominic Zerbolio(密苏里大学圣路易斯分校)。多年来,Karl Wuensch博士(东卡罗来纳大学)提出了许多建议、商榷意见和宝贵的忠告,他更应得到特别的感谢,Kathleen Bloom博士(滑铁卢大学)和Joan Foster(西蒙弗雷泽大学)也是如此。科罗拉多大学的Gary McClelland慷慨地准许我使用他的一些Java程序,并且愿意在必要时按照我的需求加以修改。
我要感谢所有提出建议或指出错误的读者(教师和学生)。我没有足够的篇幅来一一感谢他们,但是在标有“勘误表”的网页上,许多人的名字被列在了他们发现的错误的旁边。
我要感谢佛蒙特大学的老同事。我虽然于2002年5月退休,但是仍然认为佛蒙特大学是我的智力故乡。我更要感谢英国布里斯托尔大学的同事们,他们将学术假期的一部分用于完成本书的第一版。然而,最重要的是,我还要感谢所有学生——他们多年来帮助我了解问题所在,以及如何更好地接近他们。他们的鼓励更是无比珍贵。这其中包括从未谋面但通过互联网提出问题或评论的学生。(是的,我真的阅读了所有这些信息,希望能回应所有这些信息。)
David C. Howell
于美国犹他州圣乔治市
2015年12月