测量不确定度PPT.ppt
测量不确定度,目 录,第一章:测量不确定度 误差 第二章:概率统计的基础知识 第三章:标准不确定度的评定 第四章:异常值 系统误差 第五章:合成标准不确定度 第六章:扩展不确定度 第七章:权与不等权测量 第八章:最小二乘法,第一章:测量不确定度 误差,1.1 概述 1.2 误差 1.3 测量不确定度 1.4 小结,在科学实验、产品生产、商业贸易及日常生活的各个领域,我们都要进行测量工作。测量的目的是确定被测量的值,测量不确定度表示测量结果的不确定或不肯定的程度,也就是不可信度。,对气体温度进行多次测量,结果为(835.5 3.6),其中 835.5 是多次测量的算术平均值,正负号后面的数字为扩展不确定度 U,它是合成标准不确定度 uc 和包含因子k 的乘积,即。在此例中,得 U=3.6,k 值是基于自由度 用简便方法得到的,3.6 确定了一个估计具有约 95置信水平的区间。该例表示了被测量的值落在(831 9839.1)区间的置信水平约为 95,或测量结果 835.5 在置信水平为 95时的不可信度为土3.6。置信水平取多大的值由测量工作的要求所决定。,1.1 概述,举例说明测量不确定度的含义:,自由度的含义:自由度是方差之不确定度的度量,由于测量不确定度用标准偏差(方差的正平方根)表示,自由度也就是“测量不确定度的不确定度”。自由度大表示测量不确定度的不确定度小,即测量结果之不确定度的可信度高,反之亦然。用上例来说明,当自由度很大时,表示“被测量的值落在 831。9 839.1 区间的置信水平约为 95”的可信度高,对于自由度 v=12,3.6 的不可信度大约是 21。,1.2 误差,测量不确定度表示测量结果的不可信度,或者说表示测量的质量。测量准确度表示测量结果与被测值(真)之间的一致程度。测量误差是测量结果X减去被测量的(真)值a,即:(1.1)例如测量平面三角形的三个内角,测得其和为,而三角形内角个的理论真值为,则误差为,1.理论真值 例如,平面三角形内角之和恒为 180,同一量值自身之差0而自身之比为 1。,被测量的(真)值有时也称为(量的)真值,是通过完善的测量所得到的值,或者说是在某一时刻和某一位量或状态下菜量的效应体现出的客观值。由于要做到“完善的测量”是极其困难的,所在大多数场合被测量的(真)值是未知的,(量的)真值是理想概念。事实上,量子效应排除惟一真值的存在.只有下述几种情况,被测量的(真)值是可知的。,2.计量学的约定真值例如,长度单位1m是光程真空中在(1/299 792 458)s 时间间隔内所行进的路程。长度单位1m,是计量一种约定真值。阿伏加德罗常数,是计量学的约定真值。约定真值都具有一定不确定度但就所要达到的目的而言,其本身的不确定度可以忽略不计。3.标准器具的约定真值 约定真值指在给定的地点,由参考标(即具有所能得到的最高计量特性的计量标准)复现的量值。例如,作为参考标准(标准砝码、标准测量仪器等)在其证书中所给出的值、市场上公平秤给出的值也作为市场上的约定真值。,1.2.1 误差按表示方式分类,1、绝对误差:测量值与被测量的真值之差.2、相对误差:是绝对误差与被测量的真值之比,即(1.2)注:常用分贝(dB)误差表示相对误差。(1.3)例1.1 已知电压比的误差为0.34dB,求相对误差。解,仪器的引用误差定义为:(1.8)上式中引用误差通常指全量程值(或量程上限);示值误差常用绝对值表示。仪器的引用误差也是相对误差的一种,电工仪表,流量测量用仪表等大多采用引用误差,分为不同的准确度等级。若仪表为1.5级,说明合格仪表最大允许引用物超为1.5。,1.2.2 误差按其性质分类,测量结果的误差:包括随机误差和系统误差,即,误差,随机误差,系统误差,测量结果减去在重复条件下对同一被测量实行多次测量结果的平均值,即,在重复条件下对同一被测量实行无限多次测量结果的平均值减去被测量的真值,即,用 表示测量结果由于测量误差引起的损失函数,则由式(1.1)():用泰勒级数展开有:若误差=0,则L(Xk)=L(a)=0不论X比a大或者小,都产生误差,即(X),若损失函数是连续,光滑的即(a),则,1.2.3 误差造成的损失,故:损失函数和成正比,减小误差可以显著地减小损失其曲线如图,1.3 测量不确定度,1927年海森堡通过研究微观物理现象,首先提出了指定和测量所能达到的准确度存在一个基本的极限,称之为不确定度关系。1993年国际标准化组织出版了测量不确定度表示导则统一了测量不确定度的评定与表示方法。,.不确定度的由来,1.3.2 测量不确定度的分类,测量不确定度是与测量结果相关联的参数,表示合理赋予的被测量之值的分散性。该参数用标准偏差(或其倍数)表示,或用置信区间的半宽表示。测量不确定度一般由多个分量组成,把用统计方法评定的分量称为类评定,用其它方法评定称为类评定、类评定的不确定度称为类不确定度。、类评定的不确定度称为类不确定度。(注:类和随机,类和系统不一定存在简单的对应关系),1.3.3 测量不确定度的来源,、被测量的定义不完整、定义值复现不理想及测量方法不理想。、测量设备不完善,在数据处理时所引用常数及其他参数值不准确。、测量环境不理想或测量环境的影响认识不足。、测量人员技术不熟练。、在相同测量条件下,对被测量重复观测时存在随机变化。,1.4小结,测量误差是测量结果减去被测量的(真)值,包括随机误差和系统误差。由于被测量的值在大多数场合是未知的,就要用测量不确定度来表示测量结果的可信程度。测量不确定度小,说明结果可信,反之则不可信。,第二章:概率统计的基础知识,2.1 概率极其分布 2.2 常用的几种概率分布 2.3 随机变量的数字特征 2.4 X分布,t分布,F分布 2.5 大数定律和中心极限定理,随机试验:在相同条件下可以重复进行,而每次所得结果事前不可预测的试验.随机事件(事件):随机试验的每一个可能的结果.频率:若事件A出现的次数为L,各类事件出现总数为N,则L/N称为事件A出现的频率 概率:当各类事件总数N逐渐增多时,频率逐渐稳定于某个客观存在的实常数,处于0与1之间,称为理论频率,亦即在给定条件下事件A出现的概率,用P(A)表示.,2.1 概率及其分布,2.1.1 频率与概率,2.1.2 概率分布,对任意实数x,给出随机变量小于或等于x的概率的一个函数:F(x)=P(x)(2.1)称为的分布函数.,分布函数的性质,对任意实数x1,x2(x1 x2),有,注:若已知的分布函数F(x),就可求出落在(x1,x2 上的概率.单独点的概率在连续情况下通常为0。,对随机变量所有可能的取值x(i=1,2,),若可列出分布函数 P(=x)=pi,i=1,2,则称为离散型随机变量,若存在非负函数f(x),且,使随机变量取值于任一区间(a,b)的概率为 则称为连续型随机变量,称f(x)为的概率密度函数(或分布密度函数)。,(2.2),(2.3),概率密度函数性质:若分布函数F(x)的导数存在,则,概率密度函数如图2.1,f(x)d(x)称为概率元素,它表示y=f(x)与x轴上d(x)微段之间的面积。该面积表示随机变量在区间(x,x+dx)内的概率P,且P(xx+dx)=dF(x)。,图2.1 概率密度函数图,2.2 常用的几种概率分布,正态分布又称高斯分布,是应用最多的一种概率分布。设连续型随机变量的概率密度函数为其中,为常数,且0,则称服从参数为,的正态分布.记为 正态分布曲线右图,2.2.1 正态分布,(2.5),当=0,=1时,称服从标准正态分布.其概率密度函数,分布函数分别用(x),(x)表示,即且可证明(-x)=1-(x)若随机变量N(,),则其取值于区间(a,b)内的概率为,通过变量替换,令 则为标准正态分布。,28,表2.1 标准正态分布函数值表(摘录),表2.2 正态分布时置信水平p与包含因子k的关系,2.2.2 均匀分布,均匀分布又称为矩形分布,如图2.3所示。设连续型随机变量在有限区间e,b内取值,其概率密度函数为,呈矩形,则称在区间e,b内服从均匀分布,可表示为:,(2.11),对于均匀分布,有:,即取值大于b或小于e的概率为0,而在区间e,b中取值均为等概率。,2.2.3 三角分布,若随机变量1,2都是在-a/2,a/2区间呈均匀分布,且相互独立则(=1+2)的概率密度函数为:在区间-a,a呈三角形,如上图所示简称三角分布。,图2.4 三角分布概率密度函数图,(2.12),2.2.4 梯形分布,若随机变量在-a,a区间呈均匀分布,在-b,b区间呈均匀分布,和 相互独立,且ba,则的概率密度函数为 在区间-b-a,b+a呈梯形分布,如上图所示,图2.5 梯形分布概率密度函数图,(2.13),2.2.5 反正弦分布,随机变量在-a,a区间内服从反正弦分布(如图)(可表示为As-a,a,其概率密度函数为可以证明,如果U0,2,则asin(+0)As-a,a,其中a,0为常数。,图2.6 反正弦分布概率密度函数图,(2.14),2.3 随机变量的数字特征,测量不确定度的表示中,数学期望和方差(或者用方差的正平方根即标准偏差)是最基本的特征量。实验数据处理中,基础工作是根据被测量的观测值(实验数据),求出被测量之数学期望和方差的最佳估计值。2.3.1 数学期望定义:若随机变量的分布函数为F(x),而绝对收敛,则称 为的数学期望,记为E()。当取值为 的离散型随机变量的概率为,若 绝对收敛,则 其总和包括了对所能取的 所有值。,如果在相同测量条件下,独方重复测量了n次,每个观测值的权都相等,则可以认为其权均为1/n,则上式成为:,对于具有概率密度函数f(x)的连续型随机变量,若 绝对收敛,则称该积分为 的数学期望,即,(2.17),(2.16),36,数学期望简称期望或均值,用表示,它有如下性质:设C是常数,则有;设是随机变量,C是常数,则有 设1,2是任意两个随机变量,则有 设1,2是两个相互独立的随机变量,则有,(2.21),(2.19),(2.20),(2.18),2.3.2 方差,设是一个随机变量,若 存在,则称 为的方差,记为V(),即 可以改写为:对于离散型随机变量,有 对于连续型随机变量,有,(2.24),(2.23),其中 是 的概率密度函数,38,方差性质:设C是常数,则有,设是随机变量,C是常数,则有,设 是相互独立的随机变量,则有,,(2.28),(2.26),(2.27),2.3.3 协方差与相互系数,对于两维随机变量,协方差是度量它们相互依赖性的数字特征。当 相互相关时,有 其中,称为随机变量和的协方差,记为 其中,称为随机变量 和 的相互系数或标准协方差,是无量纲量。,(2.30),(2.29),Cov(1,2)=Cov(2,1)设a,b 是常数,则有 Cov(a1,b2)=abCov(1,2)设1,2和是三个随机变量,则有 Cov(1+2,)=Cov(1+)+Cov(2+),协方差具有如下性质:,(2.35),(2.33),(2.34),2.3.4 几种概率分布的期望和方差,把正态分布的概率密度函数f(x)式(2.5)分别代入式(2.16)和(2.24),可以得到:,可以看出正态分布的期望为,方差为2。标准正态分布的期望为0,方差为1。方差的正平方根 称为随机变量或概率分布的标准偏差。,下表列出了均匀分布,三角分布,梯形分布和反正弦分布的几种非正态分布的期望,标准偏差及置信水平为100%时地包含因子k 值。,同理,把均匀分布、三角分分布、梯形分布和反正弦分布的概率密度函数分别代入式(216)和式(224),可得上述几种分布的期望、标准偏差。,表2.3 几种非正态分布的期望和标准偏差,期望,2.4 分布,t分布,F分布,设n个相互独立的随机变量1,2,n均服从标准正态分布N(0,1),则统计量 服从参数为n的 分布,记为 分布的概率密度函数为 注:上式中的 为函数,其通式为。n 称为 分布的自由度,常用表示。自由度一般为总和的项数减去总和中受约束的项数。,2.4.1 分布,f(x)的图形和n有关,如下图:,n小时,图形不对称;随着n增大,图形逐渐趋于对称;当n30后,分布的f(x)接近正态分布的概率密度函数,.分布具有如下性质:的数学期望等于自由度,即 的方差等于自由度的两倍,即 设,且他们相互独立,则 统计量的概率积分,即计算 取值超过某给定 值 的概率为,于是有,上式中f(x)是 分布的概率密度函数,是 分布上的 百分点。,例如,则 是上5百分位点。如图2.8所示,2.4.2 t分布,设,且与独立,则称随机变量 服从自由度为的t分布,记为tt().自由度为的t分布的概率密度函数为,F(t)的图形如图2.9所示,对于t0,图形是对称的,其形状类似正态分布的概率密度函数。当 很大时,t分布近似于N(0,1)。当 较小时,t分布与N(0,1)相差很远。,t分布具有如下性质:t数学期望 t方差 t变量的概率积分,即计算t取值超过某给定值 的概率a为,是分布上的 百分点,如图2.10所示,如图2.10所示,f(t)对t=0是对称,有且 满足 也称为双侧 百分位点,如图2.11.,2.4.3 F分布,设 且U,V 相互独立,则随机变量服从自由度为 的F分布,记为.F分布的概率密度函数为,(2.47),(2.48),F分布的概率密度函数(其图形如图所示)有 和 两个参数,相同时,不同的 具有不同的曲线。,F分布具有如下性质:F的数学期望 F的方差 由F分布的定义可知,若随即变量服从 分布,则随即变量 服从 分布.,2.5大数定律及中心极限定理,1.车贝谢夫不等式若随即变量 的方差为V(),则对任意正数,可证明上式表明,若的方差小,则|E()|发生的概率就小。当V()=2已知时,不论随机误差 是何种分布,均有,2.贝努里定理,设L是N次独立实验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,可证明上式表明,事件发生的频率依概率收敛于事件的概率p.,2.5.2 中心极限定理,1.相同分布的中心极限定理若随即变量 有相同的分布,其期望,且。令,可证明 在 n趋向无穷大时趋于标准正态分布。,2.一般情况,对任意正数,有 其中Fi(x)是i的分布函数,则称满足麟德贝格条件.设独立随机变量i(i=1,2,n)满足麟德贝格条件,可证明 在n趋向无限大时趋于标准正态分布.,第三章:标准不确定度的评定,3.1 概述 3.2 标准不确定度的A类评定3.3 标准不确定度的B类评定3.4 小结,3.1概述根据表示方式的不同,测量不确定在使用中有下述三种不同的说法。标准不确定度:用标准偏差表示的测量结果的不确定度。合成标准不确定度uc:简称为合成不确定度。根据其他一些量值求出的测量结果的标准不确定度等于这些两的方差与协方差加权和的正平方根,权重按测量结果随这些量的变化而确定。扩展不确定度U:用包含因子乘以合成标准不确定度,得到一个区间来表示的测量不确定度。,3.2 标准不确定度的A类评定,3.2.1 算术平均值在相同测量条件下,对被测量X进行次独立重复测量,得观测值Xk,=1,2,,则样本算术平均值:3.2.2 A类评定的基本方法 被测量X的方差,式中k=P(X=Xk),k=1,2,n(n).对于相同条件 下的测量,可视为等概率测量.上式可写为 当不存在系统误差时,上式为由于测量次数是有限的,把,称为总体方差,其正平方根称为总体标准偏差总体标准偏差小,说明任一单次观测值对被测量的期望的分散性小。,3.2.3 自由度,自由度是标准不确定度的不确定度,是评定扩展不确定度的依据。通常情况下,自由度为总和的项数减去总和中受约束的项数。总和是指方差计算中的总和,共项。一般来说,待求参数的个数为受约束的项数。例如 则 的自由度为,对正态分布的随机变量X进行n次独立测量的算术平均值的实验标准偏差的标准偏差与算术平均值的标准偏差之比值以及他所对应的观测次数n及自由度v的准确计算结果列于下表中:,3.2.4 A类评定的其他方法,标准不确定度A类评定的基本方法是贝塞尔公式,不过,在有些场合要用到其他方法。1.最大误差法 在相同测量条件下,对被测量X进行次独立测量,得观测Xk,k=1,2,n.若预先知道或能近似估计出X的期望值,计算(Xk-),从中找出绝对值最大的,当X服从正态分布时,可按下式估算(Xk):,66,表3.2 最大误差法的,及v,(Xk)是(X)的估计。不同测量次数n的 值及 的自由度v见表:,2.最大残差法,在个独立重复观测值Xk(=1,2,)满足正态分布的条件下,求出算术平均值及残(余误)差,找出最大残差值,可得的无偏估计 此法用于需要考虑观测值与平均值之差的场合。,68,表3.3 最大残差法的,及v,不同测量次数n的 值及 的自由度v见表:,3.极差法,在独立重复观测值Xk(=1,2,)满足正态分布的条件 下,找出观测值的最大值Xmax及最小值Xmax,它们的差称为极差,即 可得的无偏估计 此法用于需要考虑最大值与最小值之差的场合,而且测量次数较小(49次)为宜。,70,表3.4 极差法的,及v,与不同测量次数n的相应的 值及 的自由度v见表:,3.3 标准不确定度的B类评定,B类评定与A类评定的区别是,A类评定是对一系列观测值用统计分析标准不确定度评定的方法,B类评定是用其他方法进行标准不确定度评定。3.3.1 概述 当被测量X的标准不确定度不是由重复测量得到时,可用下列信息评定:有关测量装置(含仪器)和材料的性能;测量装置制造厂的技术说明书;,校准或其他证书提供的数据;手册给出的参考数据及其不确定度和自由度;以前测量的数据。为方便起见,把这种方法估计的方差 和估计的标准不确定度 的值分别称为B类方差和B类标准不确定度。,3.3.2 给出()及的情况,分别知道了A类,B类的标准不确定度及它们的自由度,就可以求出合成标准不确定度uc以及uc的有效自由度,从而可以确定包含因子的值,得出扩展不确定度=c.可见给出()及对后面的处理极其方便.,3.3.3 给出及的情况当给出扩展不确定度及包含因子时,标准不确定度()可由下式求得:例3.1 校准证书表明标准值为1000的不锈钢标准砝码的质量 为1000.000325,且该值的不确定度按3倍标准偏差为240.可求得该标准砝码的标准不确定度 为,其估计差.,3.3.4 给出置信水平P及其U的情况,给出置信水平及其U的情况有两种.其一,给出相应于置信水平为90%,95%或99%的扩展不确定度U;其二,给出相应于置信水平为50%或67%的区间范围,并且U或 对于被测量X的估计值是对称的,即X落于区间 或.,3.3.5 给出置信区间的上下限的情况,现在给出X的置信区间的上限 和下限,且X落在 和 内的概率为1,而落在该范围外的概率为0.对于这种情况,若没有别的说明,那么只能假设X是按等概率落在该范围的任何地方,即使设X为均匀分布,其期望为,方差为。若 则方差,3.3.6 梯形分布的情况,在第2章中已给出梯形分布的标准偏差为 式中为梯形的下底半宽度,为其上底半宽度.当=0时,成为三角分布,它的.若=1,成为均匀分布,。对于置信区间为 的正态分布,当要求置信水平为99.73%时,其 可以把三角分布看成这种正态分布和均匀分布两者的折中.,3.3.7 B类标准不确定度的自由度,为了确定包含因子的值,从而求出扩展不确定度U,除了要知道A类标准不确定度及其自由度外,还需知道B类标准不确定度及其自由度.但直接给出 B类标准不确定度u(x)的自由度 的还比较少,往往要根据B类标准不确定度的不可信程度来判断其自由度.有,用u(x)代替上式中的 和,可用于定义自由度 式中u(x)指的是B类标准不确定度,是B类标准不确定度的相对不确定度,或者说 是B类标准不确定度的标准偏差。,3.4 小 结,对于测量结果的不同准确度要求,需要给出不同层次的测量结果.基本要求(第一层次)是给出估计值(往往是算术平均值).较高要求(第二层次)是给出估计值及其不确定度,即估计值及其不可信度,从而可以知道该估计值可以信任到什么程度.更高要求(第三层次)是除了给出估计值及其不确定度外,还要回答不确定度的不可信度是多大.,第四章:异常值 系统误差,4.1 异常值概述 4.2 异常值剔除准则 4.3 系统误差概述 4.4 系统误差的发现4.5 在测量过程中减小系统误差的常用方法4.6 小结,82,4.1 异常值概述,在一组观测值中,如果其中最大值(或最小值)严重偏离它所属样本的其余观测值,也就是超过了预期的观测值,则称之为异常值,也称差错或坏值。,产生异常值的原因,客观外界条件的因素,测量人员的主观因素,如测量条件的意外变化(雷击、机械冲击、地震等)使得现实仪器示值出现异常,以及测量装置突发故障;,如测量人员缺乏经验或工作责任感不强、工作过于疲乏,造成操作不当、读书误差、记录错误或计算错误等。,83,注意:,测量过程中,若发现测量条件明显异常,应做录,以便判断是否该剔除。不注明原因而随意划掉一个数据是不科学的。,测量完成后为确定数据中是否含有异常值,应采用统计方法进行判别。,84,相同测量条件下的一系列观测值应服从某种概率分布,在给定一个置信水平(或一个显著性水平)时,确定一个相应的置信区间或置信上、下限(或临界值),凡超过这个界限的观测值,就应该考虑是否属于异常值,从而考虑是否剔除该观测值。,统计方法的原理,85,4.2 异常值剔除准则,拉依打(Pata)准则又称3准则。一组n个独立重复观测值中,第k次观测值 与该组观测值的算术平均值 之差称为残余误差,简称残差,即有一组观测值中,若某一观测值的残差绝对值 大于三倍标准偏差,即则认为该值为异常值,考虑剔除,这就是拉依达准则。,4.2.1 拉依达准则,86,4.2.2 格拉布斯准则,一组个独立重复观测值 其算术平均值为,找出最大残差绝对值。设 服从正态分布,格拉布斯导出了 所服从的理论分布,选定置信水平p,得到和有关的临界值(见下表),即有格拉布斯(Grubbs)准则是,若观测值的最大值或最小值满足则认为 是异常值,考虑剔除。,87,表4.2 格拉布斯检验法的临界值G(n,p)表,88,89,90,91,4.2.3 t检验准则 有n个独立重复观测值 即其中 表示观测值被怀疑的异常值。要判断 是否为异常值,先计算不含 的算术平均值再求出不含 的实验标准偏差然后根据所要求的显著水平 及观测次数n查可表4.3得t检验系数 值,若则该 可被认为是异常值,考虑剔除。,92,4.3 系 统 误 差 概 述,系统误差s是在重复条件下对同一被测量实行无限多次测量结果的平均值减去被测量(真)值。它表现为确定的变化规律。引起系统误差的原因是测量装备不完善,以及对测量有关的物理现象认识不完全。,系统误差表现为恒定系统误差、先行变化的累进系统误差、周期变化的系统误差以及复杂规律变化的系统误差,后三种又成为可变的系统误差。恒定系统误差指在整个测量过程中,误差的大小和符号恒定不变,如千分尺的调零误差,用它测量长度时就是一种恒定系统误差。,93,线性变化的累进系统误差是在测量过程中随某因素而线性递增或递减的,如检定标尺时,由于室温对标准温度20偏差产生的测量误差,它是随被测长度而线性变化的累进系统误差。周期性变化的系统误差是随某因素作周期性变化,如指针式测量仪表、千分表表盘中心与指针回转中心偏心引起示值误差随指针转角周期性变化的系统误差。如下图所示:当该表盘刻度中心与指针的回转中心有偏心值e,则L=esin,示值误差L 与转角呈周期性变化。复杂规律变化的系统误差是在测量过程中按一定的复杂规律变化,例如刻度分度不规则引起的示值误差,导轨的直线误差等。,94,对于一组n个观测值,第k个观测值Xk含有随机误差rk和系统误差sk,即,该组算术平均值,由于随机误差的数学期望为0,即,当测量次数较多时,于是有,残余误差,95,由于恒定系统误差sk与k无关,因而,显然,即恒定系统误差对残差无影响,因而用贝塞尔法计算实验标准偏差时,恒定系统误差对其值无影响。对于线性变化、周期性变化及复杂规律变化的系统误差,,往往不等于0,说明它们会影响实际实验标准偏差值。,96,有一组观测值 共n个,其算术平均值为 第k次观测值 的残差,单次测量值的实验标准偏差 可由下式求得。以测量先后的顺序号k为横坐标,残差值为纵坐标,画出残差散点图如图所示。,组内数据也就是一个组的观测值,是指相同测量条件下,短时间内独立重复观测到的一组数据。,4.4.1 残差统计法,4.4 系统误差的发现,残差统计法适用于组内数据检验,97,用 表示残差 的符号函数,有令统计量,则有若上式不成立,则存在显著的可变系统误差。,1.残差正负号的分配检验法,98,2.和检验法,将观测值按测量先后顺序排列,分为前半组和后半组,并求得前半组残差和,后半组残差和,则有|前半组残差和后半组残差和|若上式不成立,则存在显著的可变系统误差。,99,3.序差检验法阿贝(Abbe)赫梅特(Helmert)判据,按测量顺序求得各观测值的残差 设 并记则有若上式不成立,则存在显著的可变系统误差。,100,4.小样本序差检验法,和上述3类同,设且记 则有 若上式不成立,则存在显著的可变系统误差。见下表4.4,101,表4.4 小样本序差法p值(p=0.95),102,4.4.2 组间数据检验,组间数据检验是对不同组的数据进行分析,判断组间是否存在系统误差。1.正态检验法若进行了独立的m组测量,各组的算术平均值及算术平均值标准偏差为 且任意两个平均值之差服从期望值为0,方差为 的正态分布,则有,103,当 时,即在1000次测量中,只有3次例外,因此在测量次数不太多且测量中不存在系统误差时,一般不应出现 的情况。故可用作为检验组间是否存在系统误差的准则。,104,2.F检验法,对某量独立测量了m组,第i组在相同条件下独立从副测量了ni次,且用Xik表示第i组第k次观测值 为了清楚起见,列表如下:,105,上表中,总算术平均值为,106,组间残差平方和为组内残差平方和的和为若 服从同一正态分布,即各组无系统误差,则式中,即F服从自由度为v1和v2 的F分布。,107,4.4.3 用标准器具检定,用标准器具检定是发现和减少定植系统误差的重要方法。系统误差是否显著,对此可按下述步骤进行:计算算术平均值,式中n为测量次数;计算 式中s(Xk)是按贝塞尔方法求得的实验标准偏差;选定置信水平p,按p及自由度 查附录表1得临界值。,108,比较|t|与值,若|t|,按置信水平p,认为样本数据中有系统误差;反之,则没有系统误差。若系统误差显著,按样本估算系统误差的置信范围为如果该范围恒为正值,说明系统误差为正;如果恒为负值,说明系统误差为负;如果该范围有正有负,表示系统误差不太明显。,109,4.5 测量过程中减少系统误差的常用方法,4.5.1 恒定系统误差的减少,在测量装置上对未知量测量后,立即用一个标准量替代未知量并再作测量,以便在相同测量条件下对标准量和未知量比较。如标准量可以连续改变大小,则可直接测出未知量;如标准量不能连续改变大小,则可求出未知量与标准量的差值。右图是用电桥测电阻的例子,1.标准量替代法,110,2.交换法 在一次测量后,把某些测量条件改变一下,以减少该系统的定值系统误差。如右图是所示。,3.反向补偿法,若已知存在某种恒定系统误差,无法从根源上消除,又不知其大小从而难以进行修正,可考虑有否可能用反向补偿法。先在有恒定系统误差的状态下进行一次测量,再在该恒定系统误差影响相反的另一状态下测一次,取其平均值相互抵消。,111,4.5.2 线形变化系统误差的减少对称测量法 线形变化系统误差往往随时间呈线形变化,因此,将测量顺序对某一时刻对称地进行测量,再通过计算,即可达到减少线形误差的目的。4.5.3 周期性变化系统误差的减小半周期法 对周期性系统误差,可以相隔半个周期进行一次测量,取相继两次读数的平均值,即可有效地减少周期性系统误差。,112,若周期性系统误差可表示为则相隔半个周期,即 时,有 相继两次读数的平均值,113,4.6 小结,因测量装置的突然故障,测量条件的突变或读错记错数据等异常情况引起的异常值,应注明原因并剔除,这是剔除异常值的主要方法。在测量完成后不能确切知道数据中是否含有异常值,可采用统计方法判断。系统误差大多是在测量及数据处理之前就以存在。发现和减小定植系统误差的最好方法是用标准器具或准确度较高的器具进行检定。若无条件用标准器具或准确度较高的器具进行检定,那么发现和减小系统误差的能力取决于对测量技术掌握的熟练程度,以及分析各种测量技术的经验。,114,第五章:合成标准不确定度,5.1 概述 5.2 利用方差性质求合成方差 5.3 不确定度传播律 5.4 不相关的输入量 5.5 相关的输入量 5.6 求合成标准不确定度的两种方法 5.7 小结,115,如果测量结果的标准不确定度包含若干个标准不确定度分量,就要把若干个标准不确定度综合成为合成标准不确定度,用符号 表示。被测量Y的结果,但很多情况下不能直接测量或测量的准确度很低,不能满足要求。而Y和N个输入量 有函数关系 则可通过测得的 的输入估计值 求得Y的估计值y,即求Y合成标准不确定度 有以下两种方法:,5.1 概述,116,(1)不确定度传递律法:分别求得 的算术平均值的实验标准偏差,再用不确定度传递律求。(2)输出量估计方差法:对于,第k次观测值,求出。若 都测量了n次,即k=1,2,n,那么类似地可求出,得到被测量Y的估计值,是n个 的算术平均值,并由式可求出y的标准不确定,117,5.2 利用方差性质求合成方差,例5.2 在t1时刻启动秒表,t2时刻停止秒表,启动和停止秒表的标准不确定度均为0.03s,求测量时间间隔为时,由于启动,停止秒表所引起的标准不确定度。解 启动秒表的标准不确定度是由于持表人看(听)到信号与按秒表的不一致所产生,与持表人使用秒表的熟练程度有关.停止秒表的标准不确定度的产生原因也类似.由于,t2和t1互相独立,因此对上式取方差,得,又因为 所以,118,5.3 不确定度传递(播)律,对于初等函数,不确定度传递律可表示为其中 是 的输入估计值。式中估计的相关系数 y是Y的估计值,是 的协方差的估计值,119,偏倒数 是在 时的,表示输出估计值 y如何随输入估计值 的变化而变化,成为灵敏系数。,120,5.4 不相关的输入量,当 之间不相关时,也即 为0时,不确定度传递(播)律 式可简化为使计算合成标准不确定度比较方便。例5.3 继续第3章的例3.6.被测量V的估计值是,其中,附加修正值,求合成标准不确定度。,121,解 由 得 由式(5.11),V的合成方差得合成标准不确定度.之所以把 和 看为不相关的,是由于 是用统计分析进行评定的,是A类标准不确定度;是按仪表制造厂的技术说明书的信息进行评定的,是B类标准不确定度。,122,5.5 相关的输入量,是在相同测量条件下,不同的独立实验中不同时测得的量,或者他们代表的是独立进行的不同评定的结果量。量中的任一个可以作为常数处理。增大时 可正可负,减小时 可正可负。虽互有影响,但可认为其影响甚微,允许近似处理。对 估计值,评定其协方差的信息不足。,5.5.1 相关性的判断,1.下列情况可判断为不相关,123,2.下列情况可判断为相关 若测量或估计 时采用同一台测量器具、测量标准、参考数据或具有相当大不确定度的测量方法则输入量 常常是相关的。有正线性关系,此时 有负线性关系,此时 增大时 也增大,减小时 也减小,124,5.5.2 相关系数求法,1.直接计算法 相关系数的估计值为 式中 是 的估计值 2.经验估计式若输入估计值 是相关的,且 变化,使 发生 变化,则 的相关系数可由下式近似估计若已知 值,则可利用上式求。,125,3.数点计算法在相同测量条件下,独立重复测得,把n对观测值绘在直角坐标上,然后作平行于纵轴的直线A,使得A线把图中全部点数左右均分;做平行于横轴的直线B,B线把图中全部点数上下均分,尽量使A,B线上无点,A线和B线所划分四个象限内的点数分别记为,则可按下式求相关系数估计值注:点数较少时,该法不准确。,126,5.5.3 使观测值之间无关的实验处理措施,为了使观测值之间无关,可在实验和处理数据是采取下述措施:若各个观测值都存在一个固定的系统误差,则它们之间有一定程度相关。若将固定的系统误差修正后,则上述各观测值就可能不相关。用同一个调零进行多次测量,则各读数之间有一定的相关。因此在每次读数之前重新调零再读数,则得到的观测值之间就可能不相关了。在较长时间间隔测量时,要注意是否存在漂移,扣除漂移,则各读数之间可能不相关。实验室中的公共值,可用不同的恒源器接至各个仪器,隔断公共值对不同仪器的影响,而使其观测值之间不相关。,127,5.6 求合成标准不确定度的两种方法,在5.1节中,已经说到对于间接测量有两种方法求合成标准不确定度,下面举例说明两种方法是如何进行的,结果如何,以及适用的场合有哪些。,例5.11 通过测量电路两端的正弦交流点位差幅值V、交流电流幅值I以及交流电位差相对于交流电流的移相角,对这个电路中的元件电阻R及电抗X进行测定。测量的三个输入量是V,I和,而三个输出量是R,X和Z。因为Z2=R2+X2,所以只有两个独立的输出量。被测量与输入量之间的关系可用欧姆定律表达,即,在相同条件下,同时、独立测得5组V,I和的观测值在下表中给出。试求R,X和Z的合成标准不确定度。,128,解 因为对同一元件(R或X)同时测量其,它们之间是相关的,所以在评定被测量R,X和Z的标准不确定度时必须考虑相关性。所需的相关系数用式 可以得到。而计算所用的,值列于上表中。若 分别用x1,x2和x3表示,则,129,(1)第一种方法(不确定度传递律法)三个被测量R,X及Z的算术平均值 的值是用表5.1中给出的V,I和的算术平均值 带入式5.31得到的,的标准不确定度由式5.10计算求得。正如上面指出的那样,输入量 是相关的。以 为例说明,由式5.10,x1表示,x2表示,y=f(x1,x2,x3)表示 得到 的合成标准不确定度,即,130,式中,将表5.1中的有关值带入带入式(5.32),计算得,类似的,可计算求得,的值,均列于表5.2,131,(2)第二种方法(输出量估计方差法)因为已经获得三个输入量V,I及的5组观测值的数据,可以由每组输入数据计算出R,X 及Z的值,计算公式为R=(V/I)cos,X=(V/I)sin及Z=V/I。取5个值的算术平均值为R,X 及Z的最佳估计值。按3.12式可求出每个平均值 的实验标准偏差(为其合成标准不确定度),计算结果列于表5.3,132,5.7 小结,利用方差性质求合成方差只适用于函数关系极其简单的情况。对于间接测量,当输入量的测量次数均相等时。利用函数关系求出输出量各组相应值,再求出输出值的实验标准偏差。是既方便又准确的。不确定度传递律是通用的方法。对于不相关的输入量,通过适当的变量置换,可以把相关的输入量置换为另外的不相关输入量。,133,第六章:扩展不确定度,6.1 扩展不确定度的表示方式 6.2 算术平均值的扩展不确定度 6.3 包括因子k值的选择 6.4 有效自由度v 6.5 扩展不确定度的另一种表示方式 6.6 用简便方法选择包含因子k值 6.7 有效自由度是否大于10的判断 6.8 小结,134,6.1 扩展不确定度的表示方式,扩展不确定度又称为总不确定度,常用符号U表示.它是由合成标准不确定度 乘以包含因子k得到,即(6.1)k值通常在23之间.扩展不确定度把合成标准不确定度扩大了k倍,可期望被测量Y的值落在区间Y=yU内具有很高的置信水平(也称为包含概率)。置信水平用符号p表示,相应的U可写为Up。,135,测量结果在给定区间的置信水平也可用被测量Y的值落在给定区间内的频率表示,这里的频率是观察值在给定区间内的次数与观察值总次数之比.用频率表示的优点是直观性好,易于理解,但要求频率具有大的样本,以便能很好地度量概率。大样本往往引起测量费用大量增加,