桂林电子科技大学
数学与计算科学学院综合性、设计性实验报告
院(系) 数学与计算科学学院 学号 姓名 成绩 课程 名称 非参数统计 实验项目 名 称 玉米样品间的光谱响应位置参数与尺度检验 教师 评语 教师签名: 年 一,实验目的 1. 理解Mann-Whitney U检验及位置参数检验的基本思想; 2. 会用Minitab软件进行统计分析; 3. 理解尺度参数检验的基本思想; 4. 会用SAS软件进行统计分析; 二,实验原理 Mann-Whitney U统计检验思想 记两个的连续型随机变量总体 X和Y的样本分别为X1,X2,…,xm和yi, y2,…,yn,不 月 日 妨假设合样本的各个之间互不相等。 记合样本容量为 N=m + n。记WXY为所有的X样本和Y 样本做比较之后,Y的样本大于X的样本的个数,即 WXY #{任『)必<^」=1,2广,m;j =1,2,…,n} 则称Wxy为Mann-Whitney U统计量。冋样, 样本小于X的样本的个数,即 W为所有的X样本和Y样本做比较之后,Y的 YXWYX #{(Xi,yj):Xi〉yj,i=12_ ,m;j =1,2,…,n} 显然,WXY +WX =mrb 令 A ”1/ — yj v 0, 0,其他, 则WXY可以表示为 m n WXY 将这mn个©(Xi, yj)球平均,则有 ^(Xi, y j). i =± j =1 WXY
U (Xi,X2, ,Xm; yi, y2, ,yn)二——
称 U (xi, X2,…Xm; y2,…yn)为以(Xi,
,
匚二;(Xi,yj)
i 4 j=1
mn
,
mn
yj)为核的两
x?,…,Xm 和 yi, y2,…,yn
样本
的u统计量。 尺度参数检验
xi,
妨假设合样本的各个随机变量之间互不相等。记样本
yj, j = 1,2/ ,n在合样本中的秩为Rj, H°:b = 1,
X和丫的样本分别为X1, X2 / , X和y「y,…,y,不
b的检验问题有,原假设为
m
2
n
Rj =1,2,…,N,其中N二m • n。则对于尺度参数
记两个的连续型随机变量总体
备择假设为H r : b 1.
n
用y的秩Rj代替y做为统计推断,则可用 Wy = a Ri来做尺度参数检验,此处的 Rj为yi的
得分。记yi的得分为a(Ri),计分函数为a(r)。因此,当计分函数a(r)是单峰或単谷函数时,
n
他满足:当r从1,2增加到N时,a(r)先上升然后下降,或者先下降然后上升。 此时a(R)
i =1
就可以作为尺度参数检验的检验统计量。 三,实验内容
玉米营养品质的鉴定需要对主要营养成分的含量进行检测。光谱检测法是能够检测物质成分含 量的快速分析方法,它可以根据物质的光谱响应特征来鉴别物质并确定化学组成和相对含量,具有 测定时间短、非破坏性、多指标同时测定等优点,能够实现在线、实时、原位的定量分析与监测。
准备126个玉米样品,经过物理方法加工为粉末状。采用 据,同一样品对不同频率的光产生不同的响应,光波长变化范围为 长单位),得到所有样品的光谱响应数据(见
检验附表1中的玉米样品间的光谱响应是否存在差异? 四,实验过程原始记录(数据,图表,计算等) 位置参数检验:
⑴用统计软件 Minitab的Mann-Whitney U检验分别对样品61和样品62,样品61和样品63, 样品62和样品63进行检验。结果如下: 1.
Mann-Whitney检验和置信区间:样品61,样品62
N
中位数
Fourier近红外光谱分析仪采集光谱数
10000~4000cm1 (其中cm1为光波
2013广西第三届研究生数学建模竞赛 B题附表1)。
样品 61 390 0.70192 样品 62 390 0.63105
ETA1-ETA2 的点估计为 0.05045 ETA1-ETA2 的 95.0 置信区间为(0.03774,0.073) W = 170163.0 在0.0000 上,ETA1 = ETA2与ETA1丰ETA2的检验结果显著 在0.0000 显著性水平上,检验结果显著(已对结调整) 2. Mann-Whitney检验和置信区间:样品61,样品63 N 中位数 样品 61 390 0.70192 样品 63 390 0.61091 ETA1-ETA2 的点估计为 0.06294 ETA1-ETA2 的 95.0 置信区间为(0.04243,0.08353) W = 172270.0 在0.0000 上,ETA1 = ETA2与ETA1丰ETA2的检验结果显著 在0.0000 显著性水平上,检验结果显著(已对结调整) 3. Mann-Whitney检验和置信区间:样品62,样品63 N 中位数 样品 62 390 0.63105 样品 63 390 0.61091 ETA1-ETA2 的点估计为 0.00543 ETA1-ETA2 的 95.0 置信区间为(-0.00343,0.02374) W = 155902.0 在0.2517 上,ETA1 = ETA2与ETA1工ETA2的检验结果显著 在0.2517 显著性水平上,检验结果显著(已对结调整) 结果解释: 三组样品的检验统计量分别为 W = 170163.0 , W = 172270.0 , W = 155902.0。三组样品的 的p值 在对结调整时都为 0.0000。由于p值小于所选:水平为0.05,因此有充分的证据否定原假设。因 此,认为对样品61和样品62,样品61和样品63,样品62和样品63光谱响应都有显著差异。 尺度参数检验:
程序:
proc n par1way
data =x6162 mood ab
var xx; class no; run ;
proc n parlway data =x6163 mood ab var xx; class no;
结果:
样品61和样品62:
Th* NP&ai'fA? Pr^sedure Koud Scares IQT Variable ir Clj^slfled by Variable- no
Ths NPJiEllAV Prgedor亡
Ansari-Bradley f^r Tdria^ile n
Cl^slfied 旳 Variable n.&
SICMI
nt> 61
Sin 390 390143515»5 21 ^741?, 5
Espectwl iii^jer Std Dev 甜込:
HQ H:D 19772967. S 19772967,5
€33622. 74B 633&E2-74B
Score
4i7303.3959 54Q95, *94\"
TW
Sm of Scores Especteil irnder Std Dev UsndEr
BO MO
鹊D
Hean Score 19EL 0&聃36
19Z 9025
61 62
390 75232. 0
?6Z4Sa 0 T6245. 0 1叽urn 157X 105SI
AvicrttE.c scares tert used fAverage f^oref TEF- used FQT ties.lood Tv»-Suple Test
Statistic
2
One-Sided FT Trfl-SltJcd IT
1844B515. 5^00
-2.的讯 0. 0133 0. 0366
AnF-ari\"Eradiey TfQ-Siwplc Test Statistic Z
Ctlfi-Sldjed Pr > Z iTC^Sldcd Fr > |Z|
77^^.. dOQQ
0. fi439 0.2533 0r51M
< Z > |Z|
M y =18448515.00比较大,Ay =77258比较小。他们对应的单侧检验的
接受原假设,即认为样品
61和样品62无尺度差异。
p 值为 0.0183 和 0.2598,
样品61和样品63:
lood Scores f*r VariahLe n Claagifled by Variable ao SUB of Scores
EipBCtedl Under BO
Std Dev 亦血K1 HO
lean Sc^re
Ansirl-Ersdley Scores for Variable 胖
Clasflfl&d by Varliible UP
Sin of Scores
Espected (Tiriir Hd
Std Dtv Under BO
Kwn Sc&rt
no X
61 舸 1339484119T72967-9 633623- 2603 •v- 390 211510^.5 1&??2&67.S 633623-6B&
Average scores ・e« used, far tle$r
lood Twp~SaBple Test
Statistic
One-Sided Pr < Z T¥Q-Sided Fr > |Z|
13394341-5000
=2.1750 0.0148 0.02%
4?16$-
542^.S?3l
鹉対H262E D 76243.0 1573.1«?7 19 氏 107692
T6245. Q 1573^ 105T7 193- B9230S
1 3 o Q 7522B.0
Avera-gfi sco-r&s TCTE used for tiest Ansari_Bradl^y ITQ-SIIPIE Test Statistic 2
H2e2.d0«)
(k 63
Otne-Slded Pr > 0.25&3 T>Q-Sl(fed Pr >
2Ul
M y =18394841.50 比较大, Ay = 77262比较小。他们对应的单侧检验的
p 值为 0.0148 和 0.2590,
接受原假设,即认为样品 61和样品63无尺度差异。
样品62和样品63:
Ajisari-Classi Sm of no B
Hood Sc^rci tvT VarLable lx Cli3slfted by Variable tv
JUTI
BraidlEy Scores f-or fariahl 亡 is
fi&d by Variable no
6f
no
&2
N
20S15231 5 13726681. &
liptcTed Under
HO
1&772567.5 1^72967.5
Unrer HO
Std D&r
Dean 脉咛
Expected Std DEV
SCPTCE Under HO Vruder MO 62 63
Sc ere
1ST- 8T6323 203.1230^7
翱0 732T2.» T6245. fl 1573.14356 阳0 邙21 乩 0 T6245. fl 1573-14356
Kean
g33g4C. 13G. 53291 7013
4f HMSZl 蹄也<36
Averase sc-orts TCTE used for ties.
占口saTi-Eridley TTO-SSUIPIE Test
Average t^dres were i±3?d fdr tlea.
7lo«l Tfl(>-S;iiple Test
Statistic
2
OmrSlcted rr > I Tvo-SLdta Fr > |Z|
35B19253.5C00
i. tin 二
小沪
Stitistlc
7
・1l
T32T2. OOM
Onje-Sicted Pr < Z d 也也 TTO-Sided Pr > |Z| 0.05E3
拒绝
o. c^sr
原假设,即认为样品 62和样品63有尺度差异。
M y =20819253.500 比较大,
五,实验结果分析或总结
通过这次实验,我理解了
Ay =73272比较小。他们对应的单侧检验的
p 值为 0.0493 和 0.0294,
Mann-Whitney U检验及位置参数检验和尺度参数检验的基本思想;
学会了如何用Mini tab软件进行统计分析。