- 集合与常用逻辑用语
- 函数与导数
- 三角函数与解三角形
- 平面向量
- 数列
- 不等式
- 空间向量与立体几何
- 平面解析几何
- 计数原理与概率统计
- 统计
- 统计案例
- 计数原理
- 概率
- 随机变量及其分布
- 推理与证明
- 算法与框图
- 复数
- 几何证明选讲
- 不等式选讲
- 矩阵与变换
- 初中衔接知识点
- 竞赛知识点
下列命题:
①若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;
②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③若两个变量间的线性相关关系越强,则相关系数
的值越接近于1;
④对分类变量
与
的随机变量
的观测值
来说,
越小,判断“
与
有关系”的把握越大.
其中正确的命题序号是( )
①若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;
②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③若两个变量间的线性相关关系越强,则相关系数

④对分类变量







其中正确的命题序号是( )
A.①②③ | B.①② | C.①③④ | D.②③④ |
某购物网站对在7座城市的线下体验店的广告费指出
万元和销售额
万元的数据统计如下表:
(1)若用线性回归模型拟合y与x关系,求y关于x的线性回归方程.
(2)若用对数函数回归模型拟合y与x的关系,可得回归方程
,经计算对数函数回归模型的相关指数约为0.95,请说明选择哪个回归模型更合适,并用此模型预测A城市的广告费用支出8万元时的销售额.
参考数据:
,
,
,
,
,
.
参考公式:
,
相关指数:
(注意:
与
公式中的相似之处)


城市 | A | B | C | D | E | F | G |
广告费支出![]() | 1 | 2 | 4 | 6 | 11 | 13 | 19 |
销售额![]() | 19 | 32 | 40 | 44 | 52 | 53 | 54 |
(1)若用线性回归模型拟合y与x关系,求y关于x的线性回归方程.
(2)若用对数函数回归模型拟合y与x的关系,可得回归方程

参考数据:






参考公式:


相关指数:







(1)已知某高中共有32名男体育特长生,其身高与



| 身高较矮 | 身高较高 | 合计 |
体重较轻 | | | |
体重较重 | | | |
合计 | | | |
(2)①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如下表所示:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高![]() ![]() | 166 | 167 | 160 | 173 | 178 | 169 | 158 | 173 |
体重![]() ![]() | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
根据最小二乘法的思想与公式求得线性回归方程为


编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
体重![]() ![]() | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
残差![]() | 0.1 | 0.3 | 0.9 | -1.5 | -0.5 | | | |
②通过残差分析,对于残差(绝对值)最大的那组数据,需要确认在样本点的采集中是否有人为的错误.已知通过重新采集发现,该组数据的体重应该为58(kg).请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.
(参考公式)






![]() ![]() | 0.10 | 0.05 | 0.01 | 0.005 |
![]() | 2.706 | 3.841 | 6.635 | 7.879 |
(参考数据)







2019年上半年我国多个省市暴发了“非洲猪瘟”疫情,生猪大量病死,存栏量急剧下降,一时间猪肉价格暴涨,其他肉类价格也跟着大幅上扬,严重影响了居民的生活.为了解决这个问题,我国政府一方面鼓励有条件的企业和散户防控疫情,扩大生产;另一方面积极向多个国家开放猪肉进口,扩大肉源,确保市场供给稳定.某大型生猪生产企业分析当前市场形势,决定响应政府号召,扩大生产决策层调阅了该企业过去生产相关数据,就“一天中一头猪的平均成本与生猪存栏数量之间的关系”进行研究.现相关数据统计如下表:
(1)研究员甲根据以上数据认为
与
具有线性回归关系,请帮他求出
关于
的线.性回归方程
(保留小数点后两位有效数字)
(2)研究员乙根据以上数据得出
与
的回归模型:
.为了评价两种模型的拟合效果,请完成以下任务:
①完成下表(计算结果精确到0.01元)(备注:
称为相应于点
的残差);
②分别计算模型甲与模型乙的残差平方和
及
,并通过比较
的大小,判断哪个模型拟合效果更好.
(3)根据市场调查,生猪存栏数量达到1万头时,饲养一头猪每一天的平均收入为7.5元;生猪存栏数量达到1.2万头时,饲养一头猪每一天的平均收入为7.2元若按(2)中拟合效果较好的模型计算一天中一头猪的平均成本,问该生猪存栏数量选择1万头还是1.2万头能获得更多利润?请说明理由.(利润=收入-成本)
参考公式:
.
参考数据:
.
生猪存栏数量![]() | 2 | 3 | 4 | 5 | 8 |
头猪每天平均成本![]() | 3.2 | 2.4 | 2 | 1.9 | 1.5 |
(1)研究员甲根据以上数据认为





(2)研究员乙根据以上数据得出



①完成下表(计算结果精确到0.01元)(备注:


生猪存栏数量![]() | 2 | 3 | 4 | 5 | 8 | |
头猪每天平均成本![]() | 3.2 | 2.4 | 2 | 1.9 | 1.5 | |
模型甲 | 估计值![]() | | | | | |
残差![]() | | | | | | |
模型乙 | 估计值![]() | 3.2 | 2.4 | 2 | 1.76 | 1.4 |
残差![]() | 0 | 0 | 0 | 0.14 | 0.1 |
②分别计算模型甲与模型乙的残差平方和



(3)根据市场调查,生猪存栏数量达到1万头时,饲养一头猪每一天的平均收入为7.5元;生猪存栏数量达到1.2万头时,饲养一头猪每一天的平均收入为7.2元若按(2)中拟合效果较好的模型计算一天中一头猪的平均成本,问该生猪存栏数量选择1万头还是1.2万头能获得更多利润?请说明理由.(利润=收入-成本)
参考公式:

参考数据:

2020年,新冠状肺炎疫情牵动每一个中国人的心,危难时刻众志成城,共克时艰,为疫区助力.福建省漳州市东山县共101个海鲜商家及个人为缓解武汉物质压力,募捐价值百万的海鲜输送武汉.东山岛,别称陵岛,形似蝴蝶亦称蝶岛,隶属于福建省漳州市东山县,是福建省第二大岛,中国第七大岛,介于厦门市和广东省汕头之间,东南是著名的闽南渔场和粤东渔场交汇处,因地理位置发展海产品养殖业具有得天独厚的优势.根据养殖规模与以往的养殖经验,某海鲜商家的海产品每只质量(克)在正常环境下服从正态分布
.
(1)随机购买10只该商家的海产品,求至少买到一只质量小于265克该海产品的概率;
(2)2020年该商家考虑增加先进养殖技术投入,该商家欲预测先进养殖技术投入为49千元时的年收益增量.现用以往的先进养殖技术投入
(千元)与年收益增量
(千元).
的数据绘制散点图,由散点图的样本点分布,可以认为样本点集中在曲线
的附近,且



,
,其中
.根据所给的统计量,求y关于x的回归方程,并预测先进养殖技术投入为49千元时的年收益增量.
附:若随机变量
,则
;
对于一组数据


,其回归线
的斜率和截距的最小二乘估计分别为
.

(1)随机购买10只该商家的海产品,求至少买到一只质量小于265克该海产品的概率;
(2)2020年该商家考虑增加先进养殖技术投入,该商家欲预测先进养殖技术投入为49千元时的年收益增量.现用以往的先进养殖技术投入













附:若随机变量



对于一组数据







对相关系数r来说,下列说法正确的是( ).
A.![]() ![]() ![]() |
B.![]() ![]() ![]() |
C.![]() ![]() ![]() |
D.![]() ![]() ![]() |
某大型歌手选秀活动,过程分为初赛、复赛和决赛.经初赛进入复赛的40名选手被平均分成甲、乙两个班,由组委会聘请两位导师各负责一个班进行声乐培训.下图是根据这40名选手参加复赛时获得的100名大众评审的支持票数制成的茎叶图.赛制规定:参加复赛的40名选手中,获得的支持票数不低于85票的可进入决赛,其中票数不低于95票的选手在决赛时拥有“优先挑战权”.

(1)从进入决赛的选手中随机抽出2名,X表示其中拥有“优先挑战权”的人数,求X的分布列和数学期望;
(2)请填写下面的
列联表,并判断能否在犯错误的概率不超过0.025的前提下认为进入决赛与选择的导师有关?
下面的临界值表仅供参考:
(参考公式:
,其中
)

(1)从进入决赛的选手中随机抽出2名,X表示其中拥有“优先挑战权”的人数,求X的分布列和数学期望;
(2)请填写下面的

| 甲班 | 乙班 | 合计 |
进入决赛 | | | |
未进入决赛 | | | |
合计 | | | |
下面的临界值表仅供参考:
P(![]() | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
![]() | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
(参考公式:


下列关于回归分析的说法中错误的是( )
A.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适 |
B.两个模型中残差平方和越小的模型拟合的效果越好 |
C.在线性回归方程![]() |
D.甲、乙两个模型的![]() |
为了解篮球爱好者小张的投篮命中率与打篮球时间之间的关系,下表记录了小张某月1号到5号每天打篮球时间
(单位:小时)与当天投篮命中率
之间的关系:
(1)求小张这
天的平均投篮命中率;
(2)利用所给数据求小张每天打篮球时间
(单位:小时)与当天投篮命中率
之间的线性回归方程
;(参考公式:
)
(3)用线性回归分析的方法,预测小李该月
号打
小时篮球的投篮命中率.


时间![]() | 1 | 2 | 3 | 4 | 5 |
命中率![]() | 0.4 | 0.5 | 0.6 | 0.6 | 0.4 |
(1)求小张这

(2)利用所给数据求小张每天打篮球时间




(3)用线性回归分析的方法,预测小李该月


已知z,y之间的一组数据如下表:
(1)从x ,y中各取一个数,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为
与
,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.
x | 1 | 3 | 6 | 7 | 8 |
y | 1 | 2 | 3 | 4 | 5 |
(1)从x ,y中各取一个数,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为

