hodnotu v medzilaboratórnych porovnávacích experimentoch - PDF

Description
Metódy výpočtu konfidenčných intervalov pre referenčnú hodnotu v medzilaboratórnych porovnávacích experimentoch Ústav merania Slovenská akadémia vied Dúbravská cesta Bratislava REQUEST ,

Please download to get full document.

View again

of 33
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Information
Category:

Investor Relations

Publish on:

Views: 15 | Pages: 33

Extension: PDF | Download: 0

Share
Transcript
Metódy výpočtu konfidenčných intervalov pre referenčnú hodnotu v medzilaboratórnych porovnávacích experimentoch Ústav merania Slovenská akadémia vied Dúbravská cesta Bratislava REQUEST , 2007, Praha Medzilaboratórne porovnávacie pokusy V príspevku sa budeme zaoberat problematikou kombinovania výsledkov merania neznámej (ale rovnakej) veličiny, meranej nezávisle vo viacerých laboratóriach, alebo pomocou viacerých nezávislých meracích metód: Na základe iniciatívy publikovanej v dokumente Mutual Recognition Arrangement (MRA), bol podnietený výskum v oblasti hl adania vhodných metód na sumarizovanie výsledkov medzilaboratórnych porovnávacích pokusov (IC - Interlaboratory Comparisons). Zo štatistického pohl adu, problematika určenia tzv. porovnávacej referenčnej hodnoty (CRV - Comparison Reference Value) je príbuzná s problematikou určnia spoločnej strednej hodnoty (Common Mean Problem). V tejto prednáške budeme prezentovat niektoré štatistické a metrologické postupy na konštrukciu intervalových odhadov pre spoločnú strednú hodnotu, resp. pre porovnávaciu referenčnú hodnotu. Neistoty v meraní Žiadne meranie neumožňuje dokonalé určenie hodnoty veličiny, ktorá je meraná (measurand). Neistota merania: Miera rozloženia (variability) hodnôt, ktoré nemožno považovat za neprípustné (nemožné) v procese merania. V roku 1993 ISO (International Organization for Standardization) vydalo svoju publikáciu o spôsobe vyjadrovania neistôt v meraní Guide to the Expression of Uncertainty in Measurement - GUM, aby tak zabezpečila jednotný prístup k vyhodnocovaniu neistôt v meraní. Postupy uvedené v GUM však vyvolávajú u štatistikov isté obavy, ked že kombinujú frekventistické miery a postupy a charakteristiky subjektívnych distribúcii spôsobom, ktorý plne neakceptuje ani frekventistická škola štatistiky, ani bayesovská štatistika. Glesser (Statistical Science, 1998) však vo svojom článku ako prvý poukázal, že tieto odporúčania možno považovat za približné riešenia určitých frekventistických a bayesovských problémov štatistickej indukcie. Neistoty v meraní podl a GUM Stručný popis metódy na vyhodnocovanie a vyjadrovanie neistôt v meraní podl a GUM: Rovnica merania (Measurement Equation): Zaujímavá je situácia, ked veličina, ktorá má byt určená meraním, povedzme Y (measurand), nie je meraná priamo, ale je určená z N d alších veličín, X 1, X 2,..., X N pomocou funkčného vzt ahu f, často označovaného ako rovnica merania: Y = f(x 1, X 2,..., X N ). Medzi X i sú zahrnuté korekčné faktory, ako aj veličiny, ktoré berú do úvahy iné zdroje variability (napr. rôzny personál, prístroje, výbery, laboratória a podmienky merania). Rovnica merania nevyjadruje len fyzikálny zákon, ale aj proces merania, a má obsahovat všetky veličiny, ktoré prispievajú významne k neistote výsledku merania. Neistoty v meraní podl a GUM Odhad meranej veličiny Y, označovaný ako y, sa získa z rovnice merania, ked za vstupné veličiny funkcie f dosadíme x 1, x 2,..., x N odhady veličín X 1, X 2,..., X N. Teda y = f(x 1, x 2,..., x N ). GUM uvádza ako príklad rovnicu merania: P = f(v, R 0, b, t) = V 2 /R 0 [1 + b(t t0)], kde P je výkon, V napätie, R 0 odpor meraný pri teplote t 0, b tepelná konštanta odporu, t teplota. Neistoty v meraní podl a GUM Klasifikácia zložiek neistoty: Neistota výsledku merania y závisí od neistôt u(x i) (stručne u i) vstupných odhadov x i. Zložky neistoty možno kategorizovat podl a metódy, podl a ktorej sa vyhodnonocujú: Vyhodnocovanie typu A (Type A evaluation): metóda vyhodnocovania neistôt pomocou štatistickej analýzy série pozorovaní, Vyhodnocovanie typu B (Type B evaluation): metóda vyhodnocovania neistôt pomocou iných metód, než pomocou štatistickej analýzy série pozorovaní. Neistoty v meraní podl a GUM Reprezentácia zložiek neistoty: Každú zložku neistoty (vyhodnotenú ktorýmkol vek spôsobom) reprezentuje odhadnutá štandarná odchýlka (označovaná ako štandardná neistota u i). Štandardná neistota: Typ A Zložka neistoty získana metódou vyhodnocovania typu A. Je reprezentovaná štatistickým odhadom štandardnej odchýlky s i a pridruženými stupňami vol nosti ν i. Pre takú zložku neistoty platí u i = s i. Štandardná neistota: Typ B Zložka neistoty získana metódou vyhodnocovania typu B je reprezentovaná veličinou u j, ktorú možno považovat za zodpovedajúcu štandardnú odchýlku predpokladaného pravdepodobnostného rozdelenia založeného na úplnej dostupnej informácii, u j = σ j. Neistoty v meraní podl a GUM Vyhodnocovanie zložky neistoty typu A: Vyhodnocovanie štandardnej neistoty typu A môže byt založené na vhodných štatistických metódach pre analýzy dát. Príkladom je výpočet štandardnej odchýlky pre výberový priemer, založený na nezávislých opakovaných pozorovaniach; využitie metódy najmenších štvorcov na odhad parametrov (a ich štandardných odchliek) funkcie strednej hodnoty; využitie metódy analýzy rozptylu (ANOVA) na idenifikáciu a kvantifikáciu náhodných efektov v určitých typoch meraní. x i = X i = 1 n n k=1 X i,k, u(x i) = s( X i) = n k=1(x i,k X i) 2 1/2. Príklad: 1 n(n 1) Uvažujme veličinu X i, ktorej hodnota má byt odhadnutá na základe n nezávislých pozorovaní X i,k veličiny X i. Potom odhadom veličiny X i je výberový priemer x i so štandarnou neistotou u(x i) Neistoty v meraní podl a GUM Vyhodnocovanie zložky neistoty typu B: Vyhodnocovanie štandardnej neistoty typu B je zvyčajne založené na odbornom (vedeckom) úsudku, s využitím všetkej dostupnej relevantnej informácie, ktorá može zahŕňat : skúsenosti s predchádzajucích meraní, skúsenosti, alebo všeobecnú znalost o chovaní sa a o vlastnostiach materiálov a prístrojov, údaje výrobcov prístrojov, údaje z kalibráčných certifikátov, alebo iných správ (reports), neistoty priradené referenčným údajom zo všeobecne uznávaných zdrojov (handbooks) Neistoty v meraní podl a GUM Výpočet kombinovanej štandardnej neistoty (Zákon šírenia neistôt): Kombinovaná štandardná neistota výsledku merania y, označovaná ako u c(y), reprezentuje odhadnutú štandardnú odchýlku výsledku merania, a jej odhad je určený vzt ahom u 2 c(y) = N 1 N i=1 f x i u 2 ( x i) + 2 i=1 N j=i+1 f x i f x j u ( x i, x j ). Rovnica je založená na aproximácii prvého rádu pomocou rozvoja rovnice merania Y = f(x 1, X 2,..., X N ) do Taylorovho radu. Parciálne derivácie f podl a X i (koeficienty citlivosti) sú počítané v bodoch Xi = xi. u(x i) sú štandardné neistoty prislúchajúce odhadom vstupných veličín x i; u(x i, x j ) sú odhadnuté kovariancie prislúchajúce dhadom vstupných veličín x i a x j. Neistoty v meraní podl a GUM Interpretácia neistoty merania: Za predpokladu, že pravdepodobnostné rozdelenie charakterizujúce výsledok merania y je približne normálne (gausovské rozdelenie) a kombinovaná neistota u c(y) je spol ahlivým odhadom štandardnej odchýlky výsledku merania y, potom interval y u c(y), y + u c(y) pokrýva približne 68% rozdelenia hodnôt, ktoré možno rozumne považovat za hodnoty veličiny Y, ktorej y je odhadom. Teda, približne so 68% hladinou spol ahlivosti hodnota veličiny Y je väčšia ako y u c(y) a menšia, alebo rovná hodnote y + u c(y), čo sa zvyčajne zapisuje v tvare Y = y ± u c(y). Neistoty v meraní podl a GUM Rozšírená neistota a faktor pokrytia: Hoci sa kombinovaná neistota u c používa na vyjadrenie neistoty pre väčšinu výsledkov merania, pre niektoré komerčné, priemyselné a právne aplikácie (napr. v prípade ochrany zdravia) sa vyžaduje miera neitoty merania, ktorá definuje interval okolo výsledku merania y, kde skutočná hodnota meranej veličiny Y leží s predpísanou spol ahlivost ou. Miera neistoty, ktorá spĺňa túto požiadavku sa označuje ako rozšírená neistota (expanded uncerainty) a označuje sa symbolom U, pričom kde k je faktor pokrytia. U = k u c Teda, Y = y ± U, a so stanovenou spol ahlivost ou, ktorá prislúcha faktoru pokrytia k, platí, že meranej veličiny Y môže byt väčšia ako y U, alebo menšia (nanajvýš rovná) ako y + U. Neistoty v meraní podl a GUM Faktor pokrytia Volí na základe požadovanej úrovne spol ahlivosti pokrytia. Typické hodnoty faktora k bývajú v rozsahu 2 až 3. Za predpokladu normálneho rozdelenia, a za predpokaldu, že u c je spol ahlivý odhad neistoty merania y, U = 1.96u c, obyčajne sa však za faktor pokrytia volí k = 2, teda U = 2u c, 4o definuje približne 95% interval spol ahlivosti pre Y. Relatívna rozšírená neistota: Analogicky s relatívnou štandardnou neistotou u r a relatívnou kombinovanou štandardnou neistotou u c,r sa definuje relatívna rozšírená neistota výsledku merania: U r = U y, pokial sa y nerovná 0. Neistoty v meraní podl a GUM Nekonzistentonst GUM a štatistického prístupu: GUM neoznačuje systematickým spôsobom a nerozlišuje dôsledne parametre rozdelení, náhodné premenné a ich realizácie, odhady parametrov a ich realizácie, teoretické štandarndné odchýlky (neistoty), výberové štandarné odchýlky a ich realizácie. Tieto pojmy sa vnímajú rôzne podl a kontextu a v konečnom dôsledku vedú k problematickej interpretácii navrhovaných postupov. Kl účová porovnávacia referenčná hodnota (KCRV) Špeciálnym prípadom porovnávacích experimentov sú kl účové porovnávania, ktoré sa vykonávajú na úrovni národných metrologických ústavov, a ktoré sú definované v dokumente Mutual Recognition Arrangement. KCRV (Key Comparison Reference Value) sa objavuje v kontexte ciel ov definovaných v dokumente MRA (Mutual Recognition Arrangement) z dvoch dôvodov: potreba demonštrovat, že národné etalóny nadväzujú na etalóny SI jednotiek a korešpondujú aj navzájom medzi sebou (traceability), KCRV je vhodný spôsob prezentovania výsledkov v kl účových porovnávacích experomentov. Metóda zvolená na výpočet KCRV je záležitost ou účastníkov v kl účových porovnávaniach (nie je jednoznačne definovaná), ale v každom prípade, konečné rozhodnutie musí byt odsúhlasené pracovnou skupinou daného kl účového porovnávania. KCRV je často určené ako aritmetický, alebo vážený priemer odhadov hodnôt meranej veličiny (measurand) jednotlivých účastníkov kl účového porovnávania. Štatistický model pre medzilaboratórne porovnávania Nech k 2 označuje počet nezávislých laboratórii v porovnávacom experimente. Budeme predpokladt, že každé laboratóriu opakuje merania rovnakej veličiny, ktorej skutočná hodnota je µ, nezávisle n i-krát, n i 2, i = 1,..., k. Pre každé laboratórium budeme predpokladat platnost modelu: kde Y ij = (µ + ε ij ) + B i, (1) Y ij - výsledky merania neznámej veličiny (so skutočnou hodnotou µ) v i-tom laboratóriu, j = 1,..., n i, ε ij N(0, σ 2 (A),i) - navzájom nezávislé chyby merania i = 1,..., k, j = 1,..., n i, pričom σ (A),i sú neznáme štandardné odchýlky, ktoré možno odhadnut (metódou typu A), B i D i(β i, σ 2 (B),i) - náhodné premenné reprezentujúce laboratórne systematické chyby, D i označuje typ distribúcie (napr. normálne, rovnomerné, alebo trojuholníkové rozdelenie), so strednou hodnotou β i a štandardnou odchýlkou σ (B),i, ktoré možno určit metódou typu B, i = 1,..., k. Špeciálne prípady modelu (1) Prípad 1: Model so spoločnou strednou hodnotou, bez systematických chýb (σ (B),i = 0): Y ij = µ + ε ij, Fairweather (Appl.Stat., 1972), Jordan and Krishnamoorthy (Biometrics, 1996), Yu, Sun and Sinha (JSPI, 1999), Hartung and Makambi (Univ. Dortmund, 2000), Krishnamoorthy and Lu (Biometrics, 2003). Prípad 2: Model so spoločnou strednou hodnotou (heteroskedastický model jednoduchého triedenia): Y ij = µ + B i + ε ij, (β i = 0 and σ (B),i = σ 0, and D i N, teda B i N(0, σ 2 0)). Rukhin and Vangel (JASA, 1998), Hartung, Böckenhoff and Knapp (JSPI, 2003), Iyer, Wang and Mathew (JASA, 2004). Prípad 3: Model so spoločnou strednou hodnotou a systematickými chybami s rovnomerným rozdelením: Y ij = µ + B i + ε ij, (β i = 0 and D i U i). Teda B i U i( δ i, δ i) kde δ i = 3σ (B),i. Iyer, Wang and Mathew (JASA, 2004). Metrologický prístup Uvažujme model: kde Y ij = µ i + ε ij, (2) ε ij N(0, σ 2 (A),i) - navzájom nezávilé chyby merania i = 1,..., k, j = 1,..., n i, σ (A),i sú neznáme štandardné odchýlky, ktoré možno odhadnút (metódou typu A), µ i = µ + b i, reprezentuje hodnotu meranej veličiny zat aženú systematickou chybou i-teho laboratória (b i je realizovaná, ale neznáma, systematická chyba laboratória), i = 1,..., k. Ak by sme poznali skutočnú hodnotu µ i, potom naša vedomost o skutočnej hodnote meranej veličiny (teda o µ) je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej µ (i) = µ i B i, kde B i D i(β i, σ 2 (B),i) reprezentuje našu vedomost o možnej systematickej chybe i-teho laboratória. Parametre možno určit metódou typu B, i = 1,..., k. Vidiet, že platí E( µ (i) ) = µ + (b i β i). Porovnávacia referenčná hodnota Ciel om porovnávacích experimentov je určenie porovnávacej referenčnej hodnoty (CRV - Comparison Reference Value) a jej neistoty. Porovnávacia referenčná hodnota nie je jednoznačne definovaná, ale mal by to byt vhodný odhad (estimator) parametra µ (skutočnej hodnoty meranej veličiny) založený na meraniach z jednotlivých laboratórii. KCRV je často určené ako aritmetický, alebo vážený priemer odhadov hodnôt meranej veličiny µ jednotlivých účastníkov kl účového porovnávania. Výberové štatistiky Výstupom porovnávacieho experimentu sú laboratórne výberové priemery (odhady veličín µ i = µ + b i) a výberové rozptyly (odhady parametrov σ 2 (A),i): Ȳ i = 1 n i n i j=1 Y ij, S 2 i = 1 n i 1 n i j=1 (Y ij Ȳi)2. (3) Náhodné premenné Ȳi a S2 i, i = 1,..., k, sú navzájom nezávislé. Za platnosti štatistického modelu (1) platí: (Ȳi µ) Bi + εi, (ni 1)S2 i σ 2 (A),i χ 2 n i 1, (4) kde B i D i(β i, σ 2 (B),i) a ε i N(0, σ 2 (A),i/n i) sú navzájom nezávislé. Za platnosti metrologického modelu (2) platí: (Ȳi µi) εi, (ni 1)S2 i σ 2 (A),i χ 2 n i 1 Ȳi µi S i/ n i t ni 1, (5) kde t ni 1 označuje náhodnú premennú so Studentovým t-rozdelením s n i 1 stupňami vol nosti. Príklad kl účového porovnávania Referencia: H.J. von Martens et al.: Final report on key comparison CCAUV.V-K1. Metrologia 40, 2003, Tech. Suppl Kl účové porovnávanie medzi 12 národnými metrologickými ústavmi v oblasti vibrácii. Meraná bola citlivost akcelerometrov. No. Acronym Laboratory Name Country 1 PTB Physikalisch-Technische Bundesanstalt Germany 2 BNM-CESTA Bureau National de Métrology - C.E.A C.E.S.T.A France 3 CSIRO-NML CSIRO National Measurement Laboratory Australia 4 CMI Czech Institute of Metrology Czech Republic 5 CSIR-NML CSIR National Metrology Laboratory of South Africa South Africa 6 CENAM Centro National de Metrologia Mexico 7 NRC National Research Council of Canada Canada 8 KRISS Korea Research Institute of Science and Standards Korea 9 NMIJ National Metrology Institute of Japan Japan 10 VNIIM D.I. Mendeleyev Institute for Metrology Russia 11 NIST National Institute of Standards and Technology United States 12 NMi-VSL Netherlands Meetinstituut, Van Swinden Laboratorium The Netherlands Príklad kl účového porovnávania No. Laboratory ȳ i s i n i σ (B),i 1 PTB BNM-CESTA CSIRO-NML CMI CSIR-NML CENAM NRC KRISS NMIJ VNIIM NIST Nmi-VSL Tabul ka: Hodnoty výberových priemerov a zodpovedajúcich štandardných odchýlok. Príklad kl účového porovnávania Laboratory Sample Means ± 2 Expanded Uncertainty Charge Sensitivity Laboratory Obr.: Hodnoty výberových priemerov a rozšírené kombinované neistoty: ȳ i ± 2 ( s2 i n i + σ(b),i 2 )1/2 Exaktný konfidenčný interval pre meranú veličinu µ Prípad 1: Uvažujme štatistický model so spoločnou strednou hodnotou bez systematických chýb: Y ij = µ + ε ij, Fairweather (Appl.Stat., 1972): Zo vzt ahov (3) a (4) máme T i = Ȳi µ ÔS 2 i /n i t ni 1, i = 1,..., k. Označme W =Èk i=1 uiti, kde ui sú nenáhodné koeficienty, napr. u i = 1/Var(T i). Nech q 1 α/2 označuje d alej (1 α/2)-kvantil rozdelenia náhodnej premennej W, teda: Pr( W q 1 α/2 ) = 1 α 2. Odtial, možno priamo odvodit exaktný (1 α) 100% konfidenčný interval pre hodnotu µ: i i=1õn u Si ˆµ ± ˆq 1 α/2 =Èk 2 i Ȳ i Èk i=1õn i S 2 i ± q 1 α/2, (6) Èk u i i i=1õn u Si 2 i Hodnoty kvantilov náhodnej premennej W možno určit simulačne, alebo presným numerickým výpočtom pomocou algoritmu TDIST. Konfidenčný interval pre meranú veličinu µ Prípad 3: Uvažujme štatistický model so apoločnou strednou hodnotou a systematickými chybami, Y ij = µ + B i + ε ij, pričom β i = 0 and B i U i( δ i, δ i), kde δ i = 3σ (B),i. Ako sme už ukázali platí: (Ȳi µ) Bi + εi, (ni 1)S2 i σ 2 (A),i χ 2 n i 1, kde B i U( δ i, δ i) a ε i N(0, σ2 (A),i n i ) sú nezávislé náhodné premenné. Za dodatočného predpokladu, že δ i = 3γ iσ (A),i, teda γ i = σ (B),i σ (A),i T i = Ȳi µ S 2 i n i ( 3n iγ i)u i + Z i, ÖQ i n i 1 kde U i U( 1, 1), Z i N(0, 1) a Q i χ 2 n i 1. dostávame Konfidenčný interval pre meranú veličinu µ Označme W =Èk i=1 u i Ti, kde ui sú nenáhodné koeficienty, napr. ui = 1/Var(Ti ), a nech q 1 α/2 označuje (1 α/2)-kvantil rozdelenia náhodnej premennej W : Pr( W q 1 α/2) = 1 α 2. Odtial, exaktný (1 α) 100% konfidenčný interval pre µ je daný ako i i=1õn ˆµ ± ˆq Si 1 α/2 =Èk 2 ui Ȳ i Èk i i=1õn u Si 2 i ± Èkq 1 α/2 i=1õn i S 2 i u i. Teoretická distribučná funkcia náhodnej premennej Ti W =Èk i=1 u i Ti je neznáma. resp. Navyše, závisí od neznámych parametrov γ i = σ (B),i, ktoré však možno σ (A),i odhadnút, napr. ˆγ i = σ (B),i. Si 2 Pre dané hodnoty γ i,kvantil q 1 α/2 možno odhadnút simulačne. Intervalový odhad pre µ na základe metrologického prístupu Na základe metrologického prístupu máme: (Ȳi µi) εi, (ni 1)S2 i σ 2 (A),i χ 2 n i 1 T i = Ȳi µi ÕS 2 i n i t ni 1, a potom naša naša vedomost o skutočnej hodnote µ je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej µ (i) = µ i B i, kde B i U( δ i, δ i). Parameter µ i = µ + b i je neznámy. Avšak na základe napozorovaných hodnôt ȳ i a si 2 je naša vedomost o skutočnej hodnote µ i je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej µ i = ȳ i + s 2 i n i T i, kde ȳ i a si 2 sú považované za konštanty a T i t ni 1. Kombináciou týchto vzt ahov dostaneme µ (i) = µ i B i ȳ i + s 2 i n i T i B i ȳ i + s 2 i n i T i 3σ (B),i U i, kde T i t ni 1 a U i U( 1, 1) sú nezávislé náhodné premenné. Intervalový odhad pre µ na základe metrologického prístupu Kombinovaním týchto rozdelení možno našu vedomost o skutočnej hodnote veličiny µ reprezentovant pravdepodobnostným rozdelením náhodnej premennej µ = w i µ (i) = w iȳ i + w k i=1 k i=1 k i=1 i¼ s T i 3σ (B),i U i½, n i kde w i,èk i=1 i 2 wi = 1, sú vhodne zvolené váhy, napr. proporcionálne hodnotám prop w i 1 Var( µ (i) ) = 1. si 2 n i 1 n i n i 3 + σ2 (B),i Odtial dostávame približný (1 α) 100% konfidenčný interval pre µ ˆµ q (1 α 2 ), ˆµ + q (1 α 2 ), kde ˆµ =Èk i=1 wiȳ i a q (1 α 2 ) je 1 α 2 kvantil rozdelenia µ ˆµ. Intervalové odhady meranej veličiny µ (Príklad) Confidence Intervals for the Comparison Reference Value Charge Sensitivity Laboratory Obr.: 95% konfidenčné intervaly pre µ: (i) štatistický ± 1.823e-004 (ii) metrologický ± 0.946e-004. Algoritmus TD
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks