差异显著性分析
篇一:显著性差异
差异显著性分析
摘要 本文通过差异显著性分析解决了两专业的每门课程和数学水平是否有明显差异
问题,通过Pearson相关系数解决了高等代数分别与线性代数,概率论和数理统计得分是否有相关的问题。
关键词 t-检验 Pearson相关系数
问题重述 下述2个表格是工科甲乙两个专业的高等数学上册、高等数学下册、
线性代数、概率论等数学课程的成绩数据,请根据数据分析并回答以下问题: (1)针对每门课程分析,两个专业的分数是否有明显差异? (2)针对专业分析,两个专业学生的数学水平有无明显差异?
(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况? (4)根据以上分析,面向工科同学,撰文阐述你对于大学数学课程学习的看法。
模型假设
1、甲专业中有一个数大于100分,由于是百分制,所以将此数换成0.
2、因为每一科的分数总体多数都是处在中间60分左右,不会高分的占多数也不会是低
分的占多数,所以样本可以看作是来自正态或近似正态总体。
模型建立
1、对问题(1)用T检验来判定两个专业每一科的平均值的差异是否显著,因为T检验就是用于小样本,总体标准差σ未知的正态分布资料,是用于小样本的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
1.建立假设、确定检验水准α
H0:μ = μ0 =60(无效假设,) H1:(备择假设)
双侧检验,检验水准:α=0.05 2.计算检验统计量 ,v=n-1
3.查相应界值表,确定P值,下结论
2、问题(2)也是用T检验来判定两专业的数学水平的均值的差异是否显著,方法与问题(1)一样。只是针对对象不同
3、问题(3)用Pearson相关系数来分别判断线性代数,概率论和数理统计得分是否与高等代数的优劣相关。
Pearson相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本
r描述的是两个变量间线性相关强弱的程度。r的绝对值越大,表明相关性越强。
模型求解
1、分别对高数I,高数II,线代,概率,用T检验对两个专业样本求出它们的P值,
若P值小于0.10,则差异显著,因为P(高数I)=0.362586,P(高数II)=0.003922,P(线代)=0.779552,P(概率)=0.718893.所以针对高数II,两专业的差异显著。 2、先对甲专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样
本一,再对专业样本的每一科求均值,得出高数I,高数II,线代,概率的均值作为样本二,用T检验对这两样本求出它们的P值,若若P值小于0.10,则差异显著。因为P(专业)=0.419651,所以两专业的数学水平差异不显著。
3、对先求出每位学生两科高代上下册的平均值来当作是高代的分数,然后分别算出高
代与线代r1=0.552091,高代与概率论和高代与数理统计的Pearson相关系数r2=0.508041,若r的绝对值越大,表明相关性越强。
4、从求解3就可以看出高代的优劣是会影响到线代和概率论和数理统计的得分情况的,
所以可以知道一科学得不好是会影响到其他相关学科的,毕竟对于工科学生,大学里的大部分课程都是相互有贯通的,都是有联系的,一般地,一科可能是另一科的基础,只有在学好这科的前提下才能学好另一科。
模型评价
这个模型可以用于比较两个专业之间各科成绩和数学水平的优劣,以及各科之间的相关性。也可以推广到到其他领域,用来比较两组数据之间的差异显著性和两种变量之间的相关性。
几个显著性差异题目
篇二:显著性差异
第一题
为了比较测定活水中氯气含量的两种方法,特在各种场合收集到8个污水样,每个水样军用这两种方法测定氧气含量(单位:mg/l)具体数据如下: 水样号 1 2 3 4 5 6 7 8
方法一(x) 0.36 1.35 2.56 3.92 5.35 8.33 10.70 10.91
方法二(y) 0.39 0.84 1.76 3.35 4.69 7.70 10.52 10.92
差(d=x-y) -0.03 0.51 0.80 0.57 0.66 0.63 0.18 -0.01
设总体为正态分布,试比较两种测定方法是否有显著差异。请写出检验的P值和结论(其中取=0.05)
解:假设检验(t检验):对两种预测方法进行配对样本T检验。 提出假设 设H0:0
H1:0
22由表一知,x的标准差=4.12463,则SX4.1246317.01257 22Y的标准差=4.22252,则SY4.2225217.82968
成对样本统计量
均值 对 1 方法一(x方法二(y
均值的标准
N 标准差 误
表一
由公式知:SW
22显著性差异。
(n1)SX(m1)Sy
mn2
717.01257717.82968
4.17386
14
(-(-1-2)(5.34355.2125)(-4.312463-4.22252)t-0.00117
0.54.1738611
Swnm
成对样本相关系数
表二
显著性水平=0.05
由表二知相关系数为0.997趋近1,则方法一与方法二呈线性关系。
由表三,差分的置信区间为[0.14495 0.68755],P=sig=0.008<0.05,落在拒绝域内,即0,有显著性差异。
第二题
为了比较两种谷物种子的优劣,特选取十块土质不全相同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子,施肥与田间管理在20小块土地上都是一样,下面是各小块上的单位产量: 土地 种子一的单位产量x 种子二的单位产量y 差d=x-y
1
2
3
4
5
6
7
8
9
10
23 35 29 42 39 29 37 34 35 28
30 39 35 40 38 34 36 33 41 31
-7 -4 -6 2 1 -5 1 1 -6 -3
假定单位产量服从正态分布,试问:两种种子的平均单位产量在显著性水平α=0.05上有无显著差异?
解:假设检验(t检验):对两种种子进行配对样本T检验。 提出假设 设H0:0
H1:0
2由表格知,x的标准差=5.763,则SX5.763233.21217 2Y的标准差=3.773,则SY3.773214.23553
成对样本统计量
对 1 种子一的单位产量
(x)
种子二的单位产量(y)
均值 表三
由公式知:SW
22显著性差异。
(n1)SX(m1)Sy
均值的标准
N 标准差 误 mn2
933.21217914.23553
23.72385
18显著性差异。
(-(-1-2)0t0
0.4472123.7238511
Swnm
显著性水平=0.05
由表四知相关系数为0.809相关程度比较高,种子一与种子二的产量x,y呈线性关系。
由表五,差分的置信区间为[-5.105 -0.095],P=sig=0.043<0.05,落在拒绝域内,即0,有显著性差异。
第三题
一工厂的两个化验室每天同时从工厂的冷却水取样,测量水中的含气量(106)一次,下面是7天的记录: 设每对数据的差dixi-yi(i=1,2,…7)来自正太总体,问两化验室测定结果之间有无显著差异?(=0.01) 解:假设检验(t检验):
首先进行独立样本T检验,由表格知Sig=0.952>0.05,则方差具有齐性。
再对室甲、室乙进行配对样本T检验。 提出假设 设H0:0
H1:0
22
有表七知,x的标准差=0.45121,则SX0.451210.20359 22Y的标准差=0.44575,则SY0.445750.198693
成对样本统计量
对 1 室甲
室乙
均值 均值的标准
N 标准差 误
表七
由公式知:SW
22
(n1)SX(m1)Sy
mn2
60.2035960.198693
0.201142
12
(-(-1-2)(1.467143-1.492857)(-1.4671-
1.4929)t0.4791
0.534520.20114211
Swnm显著性水平=0.01
由表八知相关系数为0.979趋于1,相关程度极高,室甲与室乙水中的含气量呈线性关系。
http://m.myl5520.com/gerenjianli/126212.html