摘要:AP统计是一门套路很深的学科,因为即使你掌握了相关知识点,也有可能因为不懂考试的套路而挂掉。与国内大学的数理统计不同,它没有用到什么高深的数学知识,也不会出很考验智商的题目。
统计在近些年也成为越来越多同学AP考试的top choice,作为数学学科的一部分,天朝学子们全方位大展身手花式拿下5分,如果你还没有开始好好复习不要慌张,趁着这个周末再努力一把,说不定5分就到手了呢,再不济咱们也保4争5呀!
前方高能:这里是一份严肃的知识点与考试套路梳理!为了保持严谨,小编将不添加调侃气氛的表情包,大家可以尽情收藏,甚至打印下来好好复习!
AP统计是一门套路很深的学科,因为即使你掌握了相关知识点,也有可能因为不懂考试的套路而挂掉。与国内大学的数理统计不同,它没有用到什么高深的数学知识,也不会出很考验智商的题目。
相反,AP统计的难度主要在对题目的理解和答题方法上。统计火葬场在即,让我们一起走过AP统计的套路。
考试内容
AP考试大纲分为4个部分
1、数据分析,占考试的20-30%
套路:用图形计算器分析数据分布,包括单变量、双变量数据和分类数据;
2、实验设计,占考试的10-15%
套路:通过抽样或实验来进行数据收集,并从中得出结论
3、概率及分布,占考试的20-30%
套路:简单计算,复习高中课本内容即可
4、基于点估算的推论、置信区间、显著性水平等,占考试的30-40%
套路:背诵公式和答题格式
题型
AP统计分为选择题和自由问答题。
选择题共有40道,每道5个选项;问答题共6道,题目很长,分为几道小题。
大题的常考知识点有:最小二乘回归线、画图解释、实验设计、随机变量的概率分布、假设检验、参数估计。
容错率
满分100分,70分左右就可以得到5分,50多分就能得到4分,40分对应着3分。
大题
每一道大题由4-5个小题组成,每个小题都有三个等级的评分标准:correct, partially correct, incorrect,所以并不是求出正确答案就能得到满分,也并不是不会做就得不到分。
回答大题时要讲究格式:文字描述+列举公式+答案单位缺一不可
常考题和易错题
接下来到了放大招的时刻——下面这个cheat sheet总结了各个四个知识单元的常考题和易错题,每一道题都在真题中出现过5次以上,很有可能考到哦!
抽样分布及假设检验
抽样分布成立的3个条件
random sample
N≥10n
The population is normally distributed or large sample size
条件3的证明方法:
对normally distributed的证明:题目告知/画点图,无extreme skewness and outlier;
对large sample size的证明:mean问题满足条件n≥30,proportion问题满足条件np≥10
抽样分布公式汇总
区间估计答题步骤
判断类型+检验(用到1中的内容)
计算(计算器中pool选项保持默认值)
Interpret——包含3个要素:confidence level, parameter(抄题),interval(写单位)
置信区间通用公式:statistic ± critical value×stdev of statistic
Confidence Interval选择题常见错误
总体参数做主语时,不能用will(将来时)
不能删除mean,变为95%的个体
不能将population mean/proportion替换成sample mean/proportion
置信度confidence level的解释:重复多次创造置信区间,结果中能包含真正总体参数(结合上下文)的百分比
卡方检验条件:
Random sample
Each expected count is at least 5
假设检验答题步骤
设H0和Ha
判断检验类型,检验是否满足条件
计算统计量和p-value
答题:比较p-value和α,是否拒绝H0,是否充分证明Ha
数据分析常考题&易错题
题目:双变量数据的意义是什么?
套路:describe the relationship between variable A and B
题目:求变量大于等于X的个数:
套路:总数-上一个值的cumulative frequency
题目:用数值法描述数据
套路从3个角度来描述:
角度1:集中趋势(数据中心点),包括mean, median, mode
角度2:离散趋势(数据里中心点的紧密程度),包括range, variance, stdev
角度3:偏态(skew)
从几个特征值中选一个求(哪个都行,选求的),并结合上下文得出结论
题目:描述数据之间的关系,四要素:
强弱
正负
性质(是否线性)
变量分别是什么
Residual plot的三个性质:
no pattern
around the line of 0
不能看出关系的正负
题目:R方等于0.9的含义是什么?
套路:0.9 of the variation of Y can be explained by the linear relation between X and Y
直方图和条形图的区别
直方图Histogram X轴有刻度,仅适用于单变量的数值型数据,组距class interval必须相同;条形图Bar Graph X轴无刻度,对比Bar Graph记得画图例
Residual plot的横轴是y-hat,纵轴是residual=error=y减y-hat,作用是判断模型的好坏
双变量分类数据中,如果两个变量之间无关,则expected number = row*column total/total = observed number;否则认为二者有关系
Stem plot中注意标识leaves unit,没有叶子的枝干也要画
Right-skewed数据,median不变,mean增大;Light-skewed数据,median不变,mean减小
实验设计常考题&易错题
简单随机抽样SRS方法格式
Assign number 1-1000 to students;
Use a computer to generate 50 random integers between 1-1000;
Students whose numbers correspond to the random integers are selected to the sample.
Experiment和observation的区别
只有experiment可以证明cause and effect关系
Experiment有人为干预(答题关键词:random assign)
题目要求证明结论错误
证明结果由混淆变量造成
概率及分布常考题&易错题
1. P(A|B)的意思是:已知B发生,推测A发生的概率;而不是B发生之后A发生的概率(二者无先后关系)
2. P(A|B)=P(A∩B)/P(B)
3. 证明event A和event B独立的两种办法:
(A|B)=P(A), P(B|A)=P(B) (推荐)
P(A∩B)=P(A)×P(B)
8. Random variable变换解题步骤:
写出多个random variable的关系式
写出期望等式、方差等式
9. 随机变量X是一次掷骰子的结果,则两次掷骰子的和应表示为X1+X2,一次掷骰子的结果翻两倍应表示为2X(注意区分这两种情况)
10. Binominal distribution和Geometric distribution的区别:
二项分布取值从0开始,到n结束,应用案例:40道选择题里选对的次数满足B(40,0.2);几何分布取值从1开始,一直到无穷大,应用案例:次选对的题目的题号满足G(0.2)。
11. 根据分布算概率的题目的解题步骤:
(1) 定义变量Let X denotes that…
(2) 指出分布X satisfy B(n,p)…
(3) 计算(结果记得写单位)
12. 查表法解题关键:把正态分布X分布转化成标准正态分布。
免费领取最新剑桥雅思、TPO、SAT真题、百人留学备考群,名师答疑,助教监督,分享最新资讯,领取独家资料。
方法1:扫码添加新航道老师
微信号:shnc_2018
方法2:留下表单信息,老师会及时与您联系
免责声明
1、如转载本网原创文章,请表明出处;
2、本网转载媒体稿件旨在传播更多有益信息,并不代表同意该观点,本网不承担稿件侵权行为的连带责任;
3、如本网转载稿、资料分享涉及版权等问题,请作者见稿后速与新航道联系(电话:021-64380066),我们会第一时间删除。