第七章 分析化学中的数据处理.ppt
《第七章 分析化学中的数据处理.ppt》由会员分享,可在线阅读,更多相关《第七章 分析化学中的数据处理.ppt(77页珍藏版)》请在麦多课文档分享上搜索。
1、第七章 分析化学中的数据处理,近年来,分析化学中愈来愈广泛地采用统计学方法处理各种分析数据,在统计学中,常遇到总体、样本、样本大小等概念,它们各述如下: 基本术语 总体(母体):所考察对象的全体 样本(子样):总体中随机抽出的一组测量值 样本容量n:样本中试样的数量,即测定次数,第七章 分析化学中的数据处理,例如:对某批矿石中的铁矿石中的铁含量进行分析,经取样、细碎、缩分后,得到一定数量(500g)的试样供分析用。这就是分析试样,是供分析用的总体。如果我们从中称取8份试样进行分析得到8个分析结果,则这一组分析结果,就是该矿石分析试样总体的一个随机样本、样本容量为8。,设样本容量为n,则其平均值
2、为:,若无系统误差,就是真值xT,当测定次数无限增多时,所得平均值即为总体平均值:,此时,测定的精密度用平均偏差来表示, 单次测量的平均偏差:,平均偏差用表示,读“台尔它(delta)”。但在一般情况下,测定次数n值较少。例如小于20,那么这时平均偏差可用 表示。,平均偏差表示精密度比较简单,但有不足之处。因为在一组测定数据中,小偏差的测定次数总是占多数,而大偏差测定次数总是占少数,按平均偏差结果,那么大偏差得不到充分的反映。,例如: 测定铁矿石中铁含量8次,数据如下:56.12、 56.30、 56.32、 56.38、 56.34、 56.40、 56.42、 56.50。平均值为56.3
3、5按平均偏差结果,会使所得偏差结果偏小,这样大偏差得不到充分的反映。如果把数学的统计方法来处理精密度,这样大偏差就能得到充分的反映,即用“标准偏差”表示。在分析化学中广泛采用“标准偏差”来衡量数据的分散程度。,7-1 标准偏差,总体标准偏差: (读“西格玛”) n趋于无限次时,各测量值对总体平均值的偏离,用总体标准偏差表示 。,大小偏差都能得到充分的反映,很好说明数据的分散程度。,样本标准偏差s: n为有限次时,,f=n-1,自由度,相对标准偏差RSD或变异系数CV :,例1,某样测定结果分析见下表,例2,两组数据比较,标准偏差与平均偏差 当n20时,标准偏差与平均偏差的关系:,平均值的标准偏
4、差 从总体中抽出一组容量为n的样本x1,x2,xn,对于有限次,例3,平均值的偏差,7-2 随机误差的正态分布,我们在第一章中学过,误差根据误差的性质和产生的原因,可分为系统误差和随机误差。 系统误差 (可测误差):是由某种固定的原因所造成的。 特征:恒定性重复测定重复出现 单向性误差的大小、方向、正负一定可测性可以测定与校正 产生的原因:由一些经常性的比较固定原因造成的。,偶然误差 (随机误差) 产生的原因:由一些不确定的偶然因素所引起。 特征:不恒定,可大可小,时正时负,难以预料和 控制。随机误差似乎没有什么规律,但在同一条件下进行多次(大量)测定,则随机误差的分布符合统计规律。即按“正态
5、分布”规律分布。,一、正态分布,正态分布即所谓的高斯分布,它的曲线呈对称钟形,两头小,中间大,分布曲线有最高点。,正态分布的数学表达式:,式中: y-概率密度 x-测量值 -总体平均值-标准偏差 (x- )-随机误差,若以x- (随机误差)为横坐标,y(概率密度)为纵坐标,那么随机误差的正态分布曲线为:,由式和图可见随机误差有以下特点:,1、x= 时, y最大,从中说明,测量数据在总体平均值附近,出现的概率最大。最大概率密度为:,2、曲线是以x= 为对称轴,呈集中趋势对称,正负误差概率相等; 3、小误差概率大,大误差概率小; 4、 大,分布平坦, 附近概率小。,反映了测定值的分散程度。 愈大,
6、曲线愈平坦,测定值愈分散; 愈小,曲线愈尖锐,测定值愈集中。和 是正态分布的两个基本的参数。 测量值集中趋势, 表示测量值分布程度,这种正态分布曲线一般用N(,2)表示。,二、标准正态分布,如果把正态分布曲线的横坐标改用u为单位表示,,那么正态分布曲线的数学表达式为:,对上式处理则有:,正态分布曲线与横坐标到之间所夹的面积,代表所有数据出现概率的总和,其值应为1。即概率为:,三、随机误差的区间概率,随机误差在某一区间出现概率(即:测量值在某一区间内出现概率),可以取不同u值进行积分,,正态分布概率积分表就是这样制出来的,表72是从0u进行积分。,随机误差的区间概率,概率 P为: 取不同u值积分
7、,得分布概率积分表,例4,已知=1.75%,=0.10%,测量时无系统误差,求:(1)结果落在(1.750.15)%范围内的概率?(2)结果大于2.00%的概率? 解:,单边检验,7-3 少量数据的统计处理,正态分布是无限次测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限次的测量。对于有限测定次数,总体标准偏差是不知道,只好用样本标准偏差s来代替,这样必然引起正态分布曲线的偏差.,测定值的随机误差的分布不符合正态分布,而是符合t 分布,应用t 分布来处理有限测量数据。,一、t 分布曲线:用t 代替正态分布u,样本标准偏差s代替总体标准偏差有,t分布曲线(见图2-2)与正态分布曲
8、线相似,以t=0为对称轴,t分布曲线的形状与自由度f=n-1有关, f 愈大,曲线愈接近正态分布。与正态分布曲线相似, t分布曲线下面一定范围内的面积,就是该范围内测定值出现的概率。用置信度P表示。,置信度P:测定值x出现在ts范围内的概率。 显著性水准:测定值x在ts范围之外的概率,=1-P t 值与 f 有关,也与不同范围内概率值(置信度P)有关,不同的置信度和自由度所对应的 t值,可用 t a,f 表示。 例如,t0.05,4 表示置信度为95%,自由度f=4时的 t值,从表7-3中可查得 t0.05,4=2.78。,t 分布曲线,与正态分布曲线形状相似,但t分布随自由度f而改变,f趋于
9、时,t分布趋于正态分布; 不同f值及概率所对应的t值已计算出,可查ta,f表获得; 置信度P:落在(ts)范围内的概率 显著性水平a:落在范围外的概率,a=1-P 如:t0.05,10=2.23,表示P=95%, f=10时t=2.23 当f20时, t值与u值已非常接近了,单次测量结果(X)来估计总体平均值的范围,则:= x u,以样本平均值估计:,少量测量数据,t分布处理:,平均值的置信区间,例5 测定结果47.64%、47.69%、47.52%、47.55%,计算置信度为90%、95%、99%时总体平均值的置信区间? 解:,从本例可看出,置信度越高,置信区间就越大,即所估计的区间包括真值
10、的可能性就越大,在分析化学中,一般置信度在95或90。,显著性检验 t 检验法,在实际工作中,往往会遇到对标准或纯物质进行测定时,所得到的平均值与标准值不完全一致; 或者采用两种不同的方法或不同分析人员对同一试样进行分析时,两组分析结果的平均值有一定差异; 这种差异是由偶然误差引起的,还是系统误差引起的? 这类问题在统计学中属于“假设检验”。如果分析结果之间存在“显著性差异”,就认为它们之间有明显的系统误差;否则就认为没有系统误差,纯属偶然误差引起的,认为是正常的。,存在“显著性差异”指有明显的系统误差检验方法有t 检验法和F 检验法t 检验法 (1)平均值与标准值的比较 为了检查分析数据是否
11、存在较大的系统误差,可对试样进行若干次分析,再利用t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。,进行t值检验时,首先按下列计算出t值:,如果 t计t表, 则存在显著性差异, 否则不存在显著性差异(P=95%),例6 用新方法分析结果:10.74%、10.77%、10.77%、10.77%、10.81%、10.82%、10.73%、10.86%、10.81%,已知=10.77%,试问采用新方法,是否引起系统误差? 解:,(2)两组平均值的比较,n1 s1 n2 s2,P一定时,查t值表(f=n1+n2-2)若t计t表,则两组平均值存在显著性差异,否则不存在,t 检验法,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 分析化学 中的 数据处理 PPT
