科技>计算机>计算机科学

白话统计"

作者：冯国双

ISBN:9787121335181

定价:￥69.0

字数:444千字

页数:296

出版时间:2018-01

开本:16开

版次:01-01

装帧:

出版社:电子工业出版社

简介

一本书如果没有作者自己的观点，而只是知识的堆叠，那么这类书是没有太大价值的。尤其在当前网络发达的时代，几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到，那就是统计分析的思路和观点。比如，你可以很容易地在网上查到什么是线性回归，但你却查不到怎么“做”线性回归分析，在你遇到实际数据时仍然不知道如何分析。在《白话统计》中，你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的，但根据笔者多年的分析经验，它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解，对各种方法的介绍采用全新的理念和思路，不再是介绍方法本身，而是试图将各种方法之间的联系阐述清楚；不再是介绍方法如何计算出结果，而是尽量说明方法背后的思想。当然，本书同时提供了如何实现结果的软件（涉及Excel、SAS、R、JMP、SPSS 等）操作。

前言

序宋代禅宗大师青原行思曾提出参禅的三重境界：参禅之初，看山是山，看水是水；禅有悟时，看山不是山，看水不是水；禅中彻悟，看山仍是山，看水仍是水。统计学的学习过程何尝不是这样：初学统计时，看到一种方法，觉得就是这种方法，如学到t检验，觉得t 检验就是用于两组均值比较的方法；经过一段时间的学习，突然发现原来看过的方法并不是所想的那样，如在线性回归中也看到了t 检验的身影，这时觉得t 检验不再是自己想象中的t 检验了；再经过一段时间的学习，就会明白方法还是原来的方法，所谓的疑惑只是自己心动而已，这时就真正理解了t 检验的含义，而不再把它当作一种固定于特定场合的检验方法。对于统计学初学者而言，通过课堂老师的讲授，不难达到第一种境界；然后通过接触各种资料，慢慢就会发现各种方法跟课堂上所讲可能有所不同，剪不断，理还乱，逐渐进入第二种境界；此时，如果不能厘清思路，则很容易陷入迷惑和混乱，想达到第三种境界就难上加难了。当然，你可以充分利用网络资源查找各种信息，从而为自己解惑。然而这种资源虽然多，但较为零散，而且可能会看到众说纷纭的情况，使得你更加凌乱。幸运的是，冯国双博士的这本《白话统计》以通俗、幽默的语言深入浅出地介绍了统计学中的各种概念和思想，为很多人消除了留在心中多年的存疑，可以在这一阶段帮助读者答疑解惑。其中有些内容曾经发布在微信公众号“小白学统计”中，也因此受到了很多网友的好评。目前，欧美有不少类似白话介绍统计方法之类的书籍，这类书的特点是：不像教材那样用沉重、拘谨的语言来介绍统计学方法，而是以风趣、浅显的话语来解释说明；内容不一定多，但尽量深入。相比之下，国内的这类书籍并不多见，在生物统计学领域尤其缺乏。这就导致很多非统计学专业人士觉得统计学“面目可憎”，始终无法真正喜欢上统计学。可喜的是，目前逐渐成长起来的年轻的统计学家已经意识到这一问题，冯博士的这本《白话统计》正是让统计学尽量接地气的一种有益尝试。《白话统计》凝结了作者十多年来对统计学的理解，采用别具一格的编写理念和思路，对各种方法的介绍不再是介绍方法本身，而是试图将各种方法之间的联系阐述清楚；不再是介绍方法如何计算出结果，而是尽量说明方法背后的思想。本书对基本概念和方法的介绍没有采用教材中非常严谨的语言，而是尽可能用白话来解释说明。例如，在介绍累积分布和概率密度时，用到了《神雕侠侣》中的情节；在介绍假设检验思想时，用到了“女士品茶”的故事；在介绍中心极限定理时，采用了里约奥运会期间的一则虚拟故事。这不仅使得抽象理论形象化、复杂问题简单化，也增加了本书的趣味性和可读性，体现了作者深厚的理论功底和丰富的实践经验。在此，我把《白话统计》这本著作推荐给各位读者，无论是初学者、统计学专业人士，还是统计学应用工作者，相信都能从中获益。陈峰南京医科大学教授

达儿文蕲艾浴包宝宝艾草泡澡药包婴幼儿中药洗澡艾叶儿童调理脾胃

优惠券：5元券

达儿文母婴店

券后价：24.00元

戴可思婴儿唇周霜口水膏唇周护理霜宝宝专用唇周膏乳液面霜疹

优惠券：20元券

戴可思旗舰店

券后价：79.00元

目录第 1 篇基础篇第1 章为什么要学统计 2 1.1 统计学有什么用 3 1.2 生活世事皆统计 4 1.3 如何学统计 4 第 2 章变异——统计学存在的基础 6 2.1 随机与变异 6 2.2 特朗普与罗斯福的胜出——抽样调查到底可不可靠 8 2.3 什么是抽样误差 9 第 3 章郭靖的内力能支撑多久——谈概率分布 11 3.1 累积分布与概率密度的通俗理解 12 3.2 是生存还是死亡？这是一个问题——用Weibull 分布寻找生存规律 16 3.3 2003 年的那场SARS——用Logistic 分布探索疾病流行规律 20 3.4 “普通”的正态分布 23 3.5 几个常用分布——t 分布、χ2 分布、F 分布 28 第 4 章关于统计资料类型的思考 35 4.1 计数资料等于分类资料吗 36 4.2 计数资料可否采用连续资料的方法进行分析 37 4.3 分类资料中的无序和有序是如何确定的 38 4.4 连续资料什么时候需要转换为分类资料 39 4.5 连续资料如何分组——寻找cut-off 值的多种方法 41 4.6 什么是虚拟变量/哑变量 47 第 5 章如何正确展示你的数据 52 5.1 均数和中位数——你被平均了吗 53 5.2 方差与标准差——变异的度量 54 5.3 自由度——你有多少自由活动的范围 56 5.4 百分位数——利用百分数度量相对位置 57 5.5 如何比较苹果和橘子——利用Z 值度量相对位置 59 5.6 某百岁老人调查报告说：少运动才能活得久——谈一下比例和率 61 5.7 在文章中如何正确展示百分比 63 第 6 章寻找失踪的运动员——中心极限定理 64 6.1 中心极限定理针对的是样本统计量而非原始数据 65 6.2 样本量大于30 就可以认为是正态分布了吗 67 第 7 章从“女士品茶”中领会假设检验的思想 70 7.1 女士品茶的故事 70 7.2 零假设和备择假设 . 72 7.3 假设检验中的两类错误 73 7.4 P 值的含义 76 7.5 为什么P 值小于0.05（而不是0.02）才算有统计学意义 78 7.6 为什么零假设要设定两组相等而不是两组不等 79 第 8 章参数估计——一叶落而知秋 81 8.1 点估计 .81 8.2 最小二乘估计 82 8.3 最大似然估计 84 8.4 贝叶斯估计 86 第 9 章置信区间估计——给估计留点余地 88 9.1 置信区间的理论与实际含义 88 9.2 置信区间与P 值的关系 90 9.3 利用标准误计算置信区间 91 9.4 利用Bootstrap 法估计置信区间 . 92 第 2 篇实用篇第10 章常用统计方法大串讲 98 10.1 一般线性模型——方差分析与线性回归的统一 99 10.2 广义线性模型——线性回归与Logistic 回归的统一 103 10.3 广义可加模型——脱离“线性”束缚 107 10.4 多水平模型——打破“独立”条件 112 10.5 结构方程模型——从单因单果到多因多果 119 第 11 章正态性与方差齐性 .127 11.1 用统计检验方法判断正态性 127 11.2 用描述的方法判断正态性 130 11.3 方差分析中的方差齐性判断 .133 11.4 理解线性回归中的方差齐性 135 第 12 章 t 检验——不仅是两组比较 .138 12.1 从另一个角度来理解t 检验 138 12.2 如何正确应用t 检验 140 12.3 t 检验用于回归系数的检验 141 12.4 t 检验的替代——Wilcoxon 秩和检验 142 第 13 章方差分析与变异分解 145 13.1 方差分析中变异分解的思想 145 13.2 为什么回归分析中也有方差分析 147 13.3 铁打的方差分析，流水的实验设计 148 13.4 方差分析后为什么要进行两两比较 152 13.5 多重比较方法的选择建议 154 13.6 所有的多组都需要做两两比较吗——兼谈固定效应和随机效应 164 13.7 重复测量方差分析详解 166 13.8 方差分析的替代——Kruskal-Wallis 秩和检验 176 13.9 多组秩和检验后的两两比较方法 178 第 14 章卡方检验——有“卡”未必走遍天下 181 14.1 卡方检验用于分类资料组间比较的思想 181 14.2 卡方用于拟合优度评价——从Hardy-Weinberg 定律谈起 184 14.3 似然比χ2、M-H χ2、校正χ2 与Fisher 精确检验 186 14.4 等级资料到底可不可以用卡方检验 191 14.5 卡方检验的两两比较 193 14.6 Cochran-Armitage 趋势检验 194 14.7 分类变量的赋值是如何影响分析结果的 196 第 15 章相关分析与一致性检验 200 15.1 从协方差到线性相关系数 200 15.2 线性相关系数及其置信区间 203 15.3 如何比较两个线性相关系数有无差异 206 15.4 分类资料的相关系数 207 15.5 基于秩次的相关系数 210 15.6 相关分析中的几个陷阱 213 15.7 用ICC 和CCC 指标判断一致性 215 15.8 用Bland-Altman 图判断一致性 218 15.9 Kappa 检验在一致性分析中的应用 219 第 16 章线性回归及其分析思路 .222 16.1 残差——识别回归模型好坏的关键 223 16.2 回归系数的正确理解 226 16.3 回归系数检验VS 模型检验 227 16.4 均值的置信区间VS 个体的预测区间 228 16.5 逐步回归筛选变量到底可不可靠——谈变量筛选策略 230 16.6 如何评价模型是好还是坏——交叉验证思路 237 16.7 线性回归的应用条件——你的数据能用线性回归吗 240 16.8 如何处理非正态——Box-Cox 变换 247 16.9 如何处理非线性——Box-Tidwell 变换 248 16.10 方差不齐怎么办——加权最小二乘法 250 16.11 当共线性导致结果异常时怎么办——岭回归、Lasso 回归 .254 16.12 发现异常值应该删除吗——谈几种处理异常值的方法 .260 16.13 如何处理缺失值——是删除还是填补 268 16.14 一个非教材的非典型案例——线性回归的综合分析 276

作者简介

冯国双，北京大学医学部博士，具有十多年的数据统计分析经验，知名统计学平台“小白学统计”的创始者与维护者。已主编多部统计学专著，同时兼任多个与统计有关的学术委员会委员。兴趣爱好：在热爱统计分析之余，还对古玩奇石、盆景制作和诗词鉴赏略有心得。

编辑推荐

作者寄语

电子资料