第二课统计[核心速填]1.抽样方法(1)当总体容量较小,样本容量也较小时,可采用抽签法.(2)当总体容量较大,样本容量较小时,可用随机数表法.(3)当总体由差异明显的几部分组成时,可用分层抽样法.2.用样本估计总体(1)用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便.(2)样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.3.变量间的相关关系(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).(2)求回归方程的步骤:nn2;,∑,xyyx,∑①先把数据制成表,从表中计算出xiii1ii1==n?yy-nx∑x?ii^1i==b,n?^^22x-xn∑.公式为b②计算回归系数a,i1i=??^^abx.-=y^y=bx+a③写出回归方程.[体系构建][题型探究]抽样方法及应用页1第若第二10的样本.从n个个体中抽取一个容量为(1)利用简单随机抽样,1,则在整个抽样过程中,每个个体次抽取时,余下的每个个体被抽到的概率为3)被抽到的概率为(10151D.B.C.A.274143袋牛奶中抽取500(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从,…,000,001袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按60组数开57行第进行编号,使用随机数表中各个5位数组的后3位,选定第499袋牛奶的号码5),随后抽到的始,取出047作为抽取的代号(从左向右读取数字.行)________下面摘取了某随机数表第7行至第9分别是(2176344767506887704784421753315724556719169554785963016350258392120676332114439523879981050718512867358071928.=,解得[(1)根据题意,n=(1)C(2)025,016,105,185,39531-n510.故在整个抽样过程中每个个体被抽到的概率为=1428047.3位,第一个号码为行第5组数中的后7(2)由已知读取号码的初始值为第中的数跳过去不取,前面已经取过的也跳过去不取,从而随后499000凡不在~025,016,105,185,395.]袋牛奶的编号为抽到的5其共同点是在抽样过程.随机抽样有简单随机抽样和分层抽样两种[规律方法]常采用简单随机抽样;中每个个体被抽到的机会相等,当总体中的个体数较少时,其中简单随机抽样是当已知总体由差异明显的几部分组成时,常采用分层抽样...分层抽样时都要用到简单随机抽样最简单、最基本的抽样方法应用各种抽样方法抽样时要注意以下问题:利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;1???利用随机数表法时注意编号位数要一致;?2在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,??3.使抽取个体数为整数页2第[跟踪训练]1.某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代理商.公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记这项调查为①;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是________.分层抽样,简单随机抽样[由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差异,所以完成②宜采用简单随机抽样.]用样本的频率分布估计总体分布如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.[思路探究](1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134cm的频率.[解](1)样本的频率分布表:分组频数频率页3第0.04[122,126)50.078[126,130)0.08[130,134)100.1822[134,138)0.283...