考点十六:线性回归方程、独立性检验、正态分布16.1回归分析1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3、重要公式16.2独立性检验1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.2.了解回归分析的基本思想、方法及其简单应用.3、重要公式ab合计cd合计K2=16.3正态分布正态曲线的特征、正态分布的应用正态曲线f(x)=e,x∈R有以下性质:①曲线位于x轴上方,与x轴不相交;②曲线关于直线x=μ对称;③曲线只有一个最大值,在x=μ处达到最大值;④曲线与x轴之间的面积为1;高考真题示例一.选择题(共26小题)1.(2022•福建)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.87根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( ) A.11.4万元B.11.8万元C.12.0万元D.12.2万元 2.(2022•湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x﹣85.71,则下列结论中不正确的是( ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg 3.(2022•山东)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程=x+的为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.6万元B.65.5万元C.67.7万元D.72.0万元 4.(2022•湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由算得,.P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关” 5.(2022•山东)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机抽取一件,其长度误差落在区间(3,6)内的概率为( )(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ﹣σ<ξ<μ+σ)=68.26%,P(μ﹣2σ<ξ<μ+2σ)=95.44%)7 A.4.56%B.13.59%C.27.18%D.31.74% 6.(2022•湖北)设X~N(μ1,σ12),Y~N(μ2,σ22),这两个正态分布密度曲线如图所示.下列结论中正确的是( ) A.P(Y≥μ2)≥P(Y≥μ1)B.P(X≤σ2)≤P(X≤σ1) C.对任意正数t,P(X≤t)≥P(Y≤t)D.对任意正数t,P(X≥t)≥P(Y≥t) 7.(2022•山东)已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(﹣2≤ξ≤2)=( ) A.0.477B.0.625C.0.954D.0.977 8.(2022•安徽)设两个正态分布N(μ1,σ12)(σ1>0)和N(μ2,σ22)(σ2>0)曲线如图所示,则有( ) A.μ1<μ2,σ1>σ2B.μ1<μ2,σ1<σ2C.μ1>μ2,σ1>σ2D.μ1>μ2,σ1<σ2 9.(2022•重庆)已知随机变量ζ服从正态分布N(3,σ2),则P(ζ<3)=( ) A.B.C.D. 10.(2022•安徽)以Φ(x)表示标准正态总体在区间(﹣∞,x)内取值的概率,若随机变量ξ服从正态分布N(μ,σ2),则概率P(|ξ﹣μ|<σ)等于( ) A.Φ(μ+σ)﹣Φ(μ﹣σ)B.Φ(1)﹣Φ(﹣1)C.D.2Φ(μ+σ) 11.(2022•湖南)设随机变量ξ服从标准正态分布N(0,1).已知Φ(﹣1.96)=0.025,则P(|ξ|<1.96)=( ) A.0.025B.0.050C.0.950D.0.9757 12.(2022•浙江)已知随机变量ξ服从正态分布N(2,σ2),P(ξ≤4)=0.84,则P(ξ≤0)=( ) A.0.16B.0.32C.0.68D.0.84 13.(2022•黄山一模)已知三个正态分布密度函数(x∈R,i=1,2,3)的图象如图所示,则( ) A.μ1<μ2=μ3,σ1=σ2>σ3B.μ1>μ2=μ3,σ1=σ2<σ3 C.μ1=μ2<μ3,σ1<σ2=σ3D.μ1<μ2=μ3,σ1=σ2<σ3 14.(2022•山东模拟)设随机变量ξ服从正态分布N(1,σ2),若P(ξ<2)=0.8,则P(0<ξ<1)的值为( ) A.0.2B.0.3C.0.4D.0.6 15.(2022•衡水模拟)已知数据(x1,y1)、(x2,y2)…(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“”的( ) A.充分不必要条件B.必要不充分条件 C.充要条件D.既不充分也不必要条件 16.(2022•宁城县三模)一名小学生的年龄和身高(单位:cm)的数据如下表:年龄x6789身高y118126136144由散点图可知,身高y与年龄x之间的线性回归方程为=8.8x+,预测该学生10岁时的身高为( )7 A.154B.153C.152D.151 17.(2022•泰安一模)根据如下样本数据x34567y4.02.5﹣0.50.5﹣2.0得到的回归方程为.若a=7.9,则x每增加1个单位,y就( ) A.增加1.4个单位B.减少1.4个单位 C.增加1.2个单位D.减少1.2个单位 18.(2022•潍坊模拟)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015P(K2≥k)0.100.050.025k2.7063.8415.024附:参照附表,得到的正确结论是( ) A.在犯错误的概率不超过l%的前提下,认为“该市居民能否做到‘光盘’与性别有关” B.在犯错误的概率不超过l%的前提下,认为“该市居民能否做到‘光盘’与性别无关” C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关” D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 19.(2022•湖南校级模拟)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动有关系”.P(k2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828 A.0.1%B.1%C.99%D.99.9% 20.(2022•高安市校级一模)为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )7P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828 A.0.1%B.1%C.99%D.99.9% 21.(2022•潮南区模拟)通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由上表算得k≈7.8,因此得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关” 22.(2022春•重庆校级期末)某种产品的广告费支出x与销售额y(单位:万元)之间有如下一组数据:x24568y3040605070若y与x之间的关系符合回归直线方程,则a的值是( ) A.17.5B.27.5C.17D.14 23.(2022春•顺德区校级月考)某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏131023不喜欢玩电脑游戏72027总数203050则喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( ) A.99%B.97%C.95%D.无充分根据 24.(2022•大连学业考试)如表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是,则a等于( ) A.5.1B.5.2C.5.25D.5.4 25.(2022•福建二模)观察下列关于变量x和y的三个散点图,它们从左到右的对应关系依次是( )7 A.正相关、负相关、不相关B.负相关、不相关、正相关 C.负相关、正相关、不相关D.正相关、不相关、负相关 26.(2022•咸阳一模)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x16171819y50344131由上表,可得回归直线方程中的=﹣4,据此模型预计零售价定为15元时,每天的销售量为( ) A.48个B.49个C.50个D.51个7