【知识点1】显著性水平
零假设究竟有多不合理才可以将其推翻?可以推翻零假设的门槛通常是5% , 用希腊字母
表示 , 意思是可以推翻一个成立的概率不足5%的零假设 。这就是0.05的显著性水平 。当然 , 这个门槛还可以设为0.01和0.1 。显然0.01的显著性水平比0.1的水平拒绝起来的难度更大 , 代表的统计学分量也更重 。
这里必须强调的是 , 这个显著性水平是事先给定的 。如果等数据出来再决定是用0.01,0.05还是0.1 , 就容易犯机会主义倾向的错误 。
案例1中Fisher给出的显著性水平是0.05 , 基于零假设为真的前提 , 如果依旧观测到这种结果的概率如果不到5% , 那么就可以拒绝零假设 , 即拒绝Bristol是瞎猜猜对倒奶的顺序 。
【知识点2】p值
p值是零假设为真时 , 得到样本所观测到的结果或者更极端结果出现的概率 。p值越小 , 由样本数据所提供的拒绝零假设的证据就越强 。
案例1中通过排列组合和试验设计的原理 , 计算出的p值是0.014 。案例2中的p值该如何计算呢?这里需要用到正态分布的理论 , 后面会详细解释 。
究竟p值多少才可以拒绝零假设呢?对于这个问题 , 没有个一个一成不变的标准 , 要看拒绝零假设的成本有多高 。如果这个成本很昂贵 , 就需要很强的证据支持才能够拒绝 。

文章插图
【知识点3】统计显著
当由样本中计算出来的p值小于事先设定的显著性水平 α时 , 就可以说样本数据在 α 的显著性水平下是统计显著的 。
这里必须强调的是 , 这个显著性水平一定是预先设定的 。为什么呢?比如 , 得到数据后计算出p值是0.03 , 再反过头来规定显著性水平是0.05 , 我们就可以理所应当地拒绝零假设 。但如果我们事先规定显著性水平是0.01 , 那么就不可以拒绝 。如果显著性水平是取得数据后再给定的 , 就能根据结果调整得到我们想要的结论 , 那么就存在一定投机的可能性 。
案例1中Fisher计算出的p值是0.014 , 小于预先设定的0.05的显著性水平 , 说明统计显著的结论 , 即根据样本得出的结论可以拒绝零假设 , 进而认为Bristol真的能够分辨出先倒奶还是先倒茶在味道上的区别 。
【知识点4】统计显著对比实际显著
“统计显著”是很多学术报告和商业报告中都会给出的结论 , 代表了从统计学的角度对事物的观点 。但事实上 , 存在一个误区 , 即认为统计显著的结果总是在总体中具有重大的实际意义 。这是对统计这门学科“迷信”的一种表现 。
当样本很大时 , 许多效应即使差异不大 , 也会产生统计显著的效果 。得到统计显著的结论其实不是一个终点 , 恰恰这是一个起点 , 它可以用来引发人们的思考 , 进而做深入的研究 , 即探寻事物的来龙去脉后再下定论 , 确定在实际中有没有显著效应 。
【知识点5】假设检验 对比置信区间
假设检验是一种科学研究的重要手段 , 是人们更好探寻世间规律的方法 。从某种程度上来说 , 假设检验不如置信区间提供的信息量大 。在假设检验中 , 关注的焦点是某个参数的一个值 , 例如 , 在案例2中所关注的是人们偏爱新鲜咖啡的比例是不是50% 。如果根据假设检验的结果拒绝了这个零假设 , 之后我们就不清楚它具体的值是多少了 。
很多统计学者更偏爱置信区间 。因为置信区间能够提供一个估计范围 , 而他们希望这个区间能够包含这个总体真实值 。
【知识点6】单侧检验 对比双侧检验
案例2的样本中偏爱新鲜咖啡的比例是

文章插图
有两种方法可以检验报道上的结论:总体中人们偏爱新鲜咖啡的比例究竟是不是50%?确切地说 , 有两种备择假设 。
第一种:

文章插图
第二种:
- 从“雪花为什么是六边形”到“美术、建筑和哲学中的图形”
- 柯洁也怕数学,为什么很多人焦虑数学?可能中了“假数学”的毒
- 【历史故事】如果有一天你没钱、没人脉了,快来看看犹太人“卖貂皮”的故事
- 出埃及记简介 出埃及记讲的是什么
- 【游戏迷】《巫师》要出4?回顾一下“波兰蠢驴”的巫师文化
- 自制肉脯 自制肉脯干
- 数学,美在哪里?
- 数学建模十三问
- 感受数学模型方法至高深层的美
- 【游戏迷】绝地求生:PCL全明星迎来最终战,4AM韦神与XDD讨论“集体退役”
