1.1 (1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。 1.2 (1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市
所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3 (1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花
费;(4)统计量;(5)推断统计方法。 1.5 (略)。 1.6 (略)。
第2章 数据的图表展示 2.1
(1) 属于顺序数据。
(2)频数分布表如下
服务质量等级评价的频数分布
服务质量等级 A B C D E 合计 (3)条形图(略) (4)帕累托图(略)。 2.2
(1)频数分布表如下
家庭数/频率 14 21 32 18 15 100 频率/% 14 21 32 18 15 100 40个企业按产品销售收入分组表
按销售收入分企业组 /万元 100以下 100~110 110~120 120~130 130~140 140以上 合计 40 100.0 — — — — 数 /个 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 频率 /% 向上累积 向下累积 企业数 频率 企业数 频率 (2)某管理局下属40个企分组表
按销售收入分组/万元 先进企业 良好企业 一般企业 落后企业 合计 2.3
频数分布表如下
某百货公司日商品销售额分组表
按销售额分组/万元 频数/天 频率/% 40 100.0 企业数/个 11 11 9 9 频率/% 27.5 27.5 22.5 22.5 25~30 30~35 35~40 40~45 45~50 合计 直方图(略)。 2.4
茎 1 2 3 4 5 8 0 1 1 0 8 1 3 2 1 9 1 5 3 2 3 6 6 7 3 9 6 茎叶图如下
叶 6 7 8 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 40 100.0 数据个数 8 8 9 9 9 3 12 5 6 4 箱线图(略)。 2.5
(1)排序略。
(2)频数分布表如下
100只灯泡使用寿命非频数分布
按使用寿命分组/小时 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 2 5 6 14 26 18 13 10 3 3 2 5 6 14 26 18 13 10 3 3 灯泡个数/只 频率/% 合计 (3)直方图(略)。
(4)茎叶图如下 茎 100 100 叶 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 2.6
(1)频数分布表如下 按重量分组 40~42 42~44 44~46 46~48 48~50 52~52 52~ ~56 56~58 58~60 60~62 频率/包 2 3 7 16 17 10 20 8 10 4 3 合计 (2)直方图(略)。
100 (3)食品重量的分布基本上是对称的。 2.7
(1)频数分布表如下 按重量误差分组 10~20 20~30 30~40 40~50 50~60 60~70 70~80 80~90 合计 (2)直方图(略)。 2.8
(1)属于数值型数据。
(2)分组结果如下
分组 频数/个 0 5 7 8 13 9 6 2 50 天数/天 6 8 10 13 12 4 7 60 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计 (3)直方图(略)。 2.9
(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。 2.10
(1)茎叶图如下
A班 树茎 数据个数 树 叶 树叶 数据个数 B班 0 1 2 11 23 7 6 0 4 97 9 6655200 632220 3 4 5 6 7 8 9 10 59 0448 00113449 123345 011456 000 2 4 12 9 8 6 6 3 (2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.11 2.12 2.13 2.14 2.15
(略)。 (略)。 (略)。 (略)。
箱线图如下:(特征请读者自己分析)
第3章 数据的概括性度量 3.1
(1)M010;Me10;x9.6。
(2)QL5.5;QU12。 (3)s4.2。
(4)左偏分布。 3.2
(1)
M019;
Me23。
(2)QL5.5;QU12。 (3)x24;s6.65。 (4)SK1.08;K0.77。 (5)略。 3.3
(1)略。
(2)x7;s0.71。 (3)v10.102;v20.274。 (4)选方法一,因为离散程度小。 3.4
(1)x=274.1(万元);Me=272.5 。
(2)QL=260.25;QU=291.25。 (3)s21.17(万元)。 3.5
甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6
(1)x=426.67(万元);s116.48(万元)。
(2)SK0.203;K0.688。 3.7
(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8
(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离
散系数0.08。
(2) 男生:x=27.27(磅),s2.27(磅); 女生:x=22.73(磅),s2.27(磅); (3)68%;
(4)95%。 3.9
通过计算标准化值来判断,zA1,zB0.5,说明在A项测试中该应试者比平均分数高
出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。 3.10
日期 标准化值Z
通过标准化值来判断,各天的标准化值如下表
周一 周二 周三 周四 周五 周六 周日 3
-0.6
-0.2
0.4
-1.8
-2.2
0
周一和周六两天失去了控制。 3.11
(1)离散系数,因为它消除了不同组数据水平高地的影响。
4.20.024; 172.12.3 幼儿组身高的离散系数:vs0.032;
71.3 (2)成年组身高的离散系数:vs 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 3.12
下表给出了一些主要描述统计量,请读者自己分析。 方法A 平均 中位数 165.6 165 方法B 平均 中位数 128.73 129 方法C 平均 中位数 125.53 126 众数 标准偏差 极差 最小值 最大值 3.13
1 2.13 8 162 170 众数 标准偏差 极差 最小值 最大值 128 1.75 7 125 132 众数 标准偏差 极差 最小值 最大值 126 2.77 12 116 128 (1)方差或标准差;(2)商业类股票;(3)(略)。
第4章 抽样与参数估计
4.1 (1)200。(2)5。(3)正态分布。(4)2(1001)。 4.2 (1)32。(2)0.91。 4.3 0.79。
4.4 (1)x25~N(17,22)。(2)x100~N(17,1)。 4.5 (1)1.41。(2)1.41,1.41,1.34。 4.6 (1)0.4。(2)0.024 。(3)正态分布。
4.7 (1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越
小。
4.8 (1)x2.14;(2)E=4.2;(3)(115.8,124.2)。 4.9 (87819,121301)。
4.10(1)81±1.97;(2)81±2.35;(3)81±3.10。
4.11(1)(24.11,25.);(2)(113.17,126.03);(3)(3.136,3.702)
4.12(1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。 4.13(2.88,3.76);(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9)。
4.15(7.18,11.57)。
4.16(1)(148.9,150.1);(2)中心极限定理。 4.17(1)(100.9,123.7);(2)(0.017,0.183)。 4.18(15.63,16.55)。 4.19(10.36,16.76)。
4.20(1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。 4.21(18.11%,27.%);(17.17%,22.835)。 4.22167。
4.23(1)2522;(2)601;(3)268。 4.24(1)(51.37%,76.63%);(2)36。
4.25(1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。 4.26(1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。 4.27 48。 4.28 139。 第5章 假设检验
5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高
了”,所以原假设与备择假设应为:H0:1035,H1:1035。
5.2 =“某一品种的小鸡因为同类相残而导致的死亡率”,H0:0.04,H1:0.04。 5.3 H0:65,H1:65。
5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但
检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验
结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 5.5 (1)检验统计量zxs/n,在大样本情形下近似服从标准正态分布;
(2)如果zz0.05,就拒绝H0;
(3)检验统计量z=2.94>1.5,所以应该拒绝H0。 5.6 z=3.11,拒绝H0。 5.7 t1.66,不拒绝H0。 5.8 z2.39,拒绝H0。 5.9 t1.04,不拒绝H0 5.10z2.44,拒绝H0。 5.11z=1.93,不拒绝H0。 5.12z=7.48,拒绝H0。 5.132=206.22,拒绝H0。 5.14F2.42,拒绝H0。 第6章 方差分析
6.1 F4.6574F0.018.0215(或Pvalue0.04090.01),不能拒绝原假设。 6.2 F15.8234F0.014.579(或Pvalue0.000010.01),拒绝原假设。 6.3 F10.0984F0.015.4170(或Pvalue0.0006850.01),拒绝原假设。 6.4 F11.7557F0.053.6823(或Pvalue0.0008490.05),拒绝原假设。 6.5 F17.0684F0.053.8853(或Pvalue0.00030.05),拒绝原假设。
xAxB44.43014.4LSD5.85,拒绝原假设; xAxC44.442.61.8LSD5.85,不能拒绝原假设;
xBxC3042.612.6LSD5.85,拒绝原假设。
6.6 方差分析表中所缺的数值如下表:
差异源 组间 组内 总计 SS 420 3836 4256 df 2 27 29 MS 210 142.07 — F 1.478 — — P-value 0.245946 — — F crit 3.3131 — — F1.478F0.053.5131(或Pvalue0.2459460.05),不能拒绝原假设。
第7章 相关与回归分析
7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)r0.920232。
(3)检验统计量t14.4222t22.2281,拒绝原假设,相关系数显着。 7.2 (1)散点图(略)。
(2)r0.8621。
ˆ表示当x0时y的期望值。 7.3 (1)0ˆ表示x每变动一个单位y平均下降0.5个单位。 (2)1(3)E(y)7。 7.4 (1)R290%。
(2)se1。 7.5 (1)散点图(略)。
(2)r0.94。
ˆ0.00358表示运送距离每增加1公里,运ˆ0.11810.00358x。回归系数(3)y1送时间平均增加0.00358天。
7.6 (1) 散点图(略)。二者之间为高度的正线性相关关系。
(2)r0.998128,二者之间为高度的正线性相关关系。
ˆ0.308683表示人均ˆ734.69280.308683x。回归系数(3)估计的回归方程为:y1GDP每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数R20.996259。表明在人均消费水平的变差中,有99.6259%是由人均
GDP决定的。
(5)检验统计量F1331.692F6.61,拒绝原假设,线性关系显着。
ˆ5000734.69280.30868350002278.1078(元)(6)y。
(7)置信区间:[1990.749,2565.4];预测区间:[1580.463,2975.750]。 7.7 (1) 散点图(略),二者之间为负的线性相关关系。
ˆ4.7表示航班正点率每ˆ430.124.7x。回归系数(2)估计的回归方程为:y1增加1%,顾客投诉次数平均下降4.7次。
(3)检验统计量t4.959t22.3060(P-Value=0.001108<0.05),拒绝原假设,
回归系数显着。
ˆ80430.124.780.12(次)(4)y。
(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。 7.8 Excel输出的结果如下(解释与分析请读者自己完成)
Multiple R R Square Adjusted R Square 标准误差 观测值
0.7951 0.6322 0.6117 2.6858 20
SS
MS
F
Significance F
方差分析
df
回归分析 残差 总计
1 18 19
223.1403 129.8452 352.9855
223.1403 7.2136
30.9332
2.798E-05
P-value 0.0000 0.0000
Lower 95%
Upper 95%
57.3117 0.3434
Intercept X Variable 1
Coefficients
标准误差
t Stat
49.3177 0.2492
3.8050 0.0448
12.9612 5.5618
41.3236 0.1551
7.9 (1)方差分析表中所缺的数值如下 方差分析表
变差来源 回归 残差 总计 df 1 10 SS MS F Significance F 2.17E-09 — 1422708.6 1422708.6 3.277 40158.07 4015.807 — 11 12866.67 — — — SSR1422708.60(2)R20.866086.60%。表明汽车销售量的变差中有
SST12866.6786.60%是由于广告费用的变动引起的。 (3)rR20.86600.9306。
ˆ1.420211表示广告费用每增加一个ˆ363.611.420211x。回归系数(4)y1单位,销售量平均增加1.420211个单位。
(5)Significance F=2.17E-09<0.05,线性关系显着。
ˆ13.622.3029x;R293.74%;se3.8092。 7.10 y7.11 (1)27。
(2)4.41。 (3)拒绝H0。 (4)r0.7746。
(5)拒绝H0。
7.12 (1)15.95E(y)18.05。
(2)14.651y019.349。
ˆ46.2915.24x;441.555E(y40)685.045。 7.13 yˆ25.030.0497x11.928x2;预测28.586。 7.14 y7.15 (略)。 7.16 (1)显着。 (2)显着。 (3)显着。
ˆ88.63771.6039x1。 7.17 (1)yˆ83.23012.2902x11.3010x2。 (2)yˆ1.6039表示电视广告费用每增加1万元,(3)不相同。方程(1)中的回归系数1ˆ2.2902表示在报纸广告月销售额平均增加1.6039万元;方程(1)中的回归系数1费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。
288.66%。 (4)R291.91%;Ra(5)1的P-Value=0.0007,2的P-Value=0.0098,均小于0.05,两个回归系数均显着。
ˆ0.591022.3865x1327.6717x2 7.18 (1)yˆ22.3865表示降雨量每增加1毫mm,小麦收获量平均增加(2)回归系数1ˆ327.6717表示温度每增加10C,小麦收获量平均增加22.3865kg/hm2;回归系数2327.6717kg/mh2。 (3)可能存在。
ˆ148.70050.8147x10.8210x20.1350x3。 7.19 (1)y287.83%。 (2)R2.75%;Ra(3)Significance F=3.88E-08<0.05,线性关系显着。
(4)1的P-Value=0.1311>0.05,不显着;2的P-Value=0.0013<0.05,显着;3的P-Value=0.0571>0.05,不显着。 第8章 时间序列分析和预测 8.1 (1)时间序列图(略)。
(2)13.55%。 (3)1232.90(亿元)。 8.2 (1)时间序列图(略)。
(2)1421.2(公斤/公顷)。
(3)0.3时的预测值:F20011380.18,误差均方=291455; 0.5时的预测值:F20011407.23,误差均方=239123。0.5更合适。 8.3 (1)3期移动平均预测值=630.33(万元)。
(2)0.3时的预测值:F19567.95,误差均方=87514.7; 0.4时的预测值:
F19591.06,误差均方=62662.5;0.5时的预测值:F19606.,误差均
方=50236。0.5更合适
ˆ239.7321.9288t。估计标准误差sY31.6628。 (3)趋势方程Yt8.4 (1)趋势图(略)。
ˆ145.781.16077t。2001年预测值=3336.(亿元)。 (2)趋势方程Yt8.5 (1)趋势图(略)。
ˆ69.520213.9495t,2000年预测值=585.65(万吨) (2)线性趋势方程Y。 ˆ374.16130.6137t;二次曲线:Yˆ381.421.8272t0.0337t2;三8.6 线性趋势:Yˆ372.56171.0030t0.1601t20.0036t3。 次曲线:Y8.7 (1)原煤产量趋势图(略)。
ˆ4.58240.9674t0.0309t2,预测值Yˆ11.28(亿吨)(2)趋势方程Y。 t20018.8 (1)图形(略)。
(2)移动平均法或指数平滑法。
(3)移动平均预测=72.49(万元);指数平滑法预测=72.5(万元)( 0.4)。 8.9 (1)略。 (2)结果如下
季节指2001年/月 时间编号 数 1 2 3 4 5 6 7 8 9 10 11 12 8.10各季节指数如下
季节指数 1季度 2季度 3季度 4季度 0.7517 0.8513 1.2343 1.1627 97 98 99 100 101 102 103 104 105 106 107 108 1.0439 0.9939 0.9593 0.9398 0.9439 0.95 0.9287 0.9261 0.9814 1.0075 1.0472 1.2694 值 3056.30 3077.50 3098.71 3119.92 3141.13 3162.33 3183. 3204.75 3225.96 3247.16 3268.37 32.58 值 3190.48 3058.87 2972.48 2931.99 29.88 3032.30 2956.43 2967.86 3166.05 3271.51 3422.77 4175.95 回归预测最终预测季节变动图(略)。
ˆ2043.92163.70t。图形(略) 计算趋势:分离季节因素后的趋势方程为:Yt周期波动图(略)。
8.11各月季节指数如下
1月 0.6744 7月 0.7552
2月 0.6699 8月 0.3449
3月 0.7432 9月 0.9619
4月 0.7903 10月 1.1992
5月 0.8061 11月 1.8662
6月 0.8510 12月 2.3377
季节变动图(略)。
ˆ119.1590.42449t。图形(略)计算趋势:分离季节因素后的趋势方程为:Y。 t周期波动图(略)。 随机波动图(略)。 第9章 指数
9.1 (1)v110.80%。(2)Ip122.46%。(3)Iq90.48%。(4)13920元=26190
元-12270元。
9.2 (1)111.72%。(2)111.60%。(3)100.10%。(4)15.3万元=15.1532万元+0.1468
万元。
9.3 (1)2.62%;8016元。(2)28.42%;1248元。(3)143.37%;132880元。 9.4 (1)单位成本增长11.11%。(2)Ip111.11%;Iq90.91%。 9.5 结果如下表:
年份 1990 1991 1992 1993 1994 1995 1996 1997 1998
缩减后的人均GDP
1584.9 1817.2 2149.4 2562.3 3161.2 4145.2 5148.7 58.1 6357.9
1999 2000
60.0 7049.8
9.6 Ip98.52%,下跌1.48%。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务