1、NORME INTERNATIONALE 3494 INTERNATIONAL ORGANIZATION FOR STANDARDIZATION .MEl(AYHAPOAHAA OPTAHM3ALWl II0 CTAHAPTM3ALIMWORGANISATION INTERNATIONALE DE NORMALISATION Interprtation statistique des donnes - Efficacit des tests portant sur des moyennes et des variantes Statistical interpretation of data
2、- Po wer of tests relating to means and variantes Premire dition - 1976-12-01 CDU 519.28 Rf. no : ISO 3494-1976 (F) Descripteurs : statistique, donne, moyenne mathmatique, variante, essai, test statistique, rendement, efficacit. Prix bas sur 44 pages AVANT-PROPOS LISO (Organisation Internationale de
3、 Normalisation) est une fdration mondiale dorganismes nationaux de normalisation (Comits Membres ISO). Llaboration des Normes Internationales est confie aux Comits Techniques ISO. Chaque Comit Membre intress par une tude a le droit de faire partie du Comit Technique correspondant. Les organisations
4、internationales, gouvernementales et non gouvernementales, en liaison avec IISO, participent galement aux travaux. Les Projets de Normes Internationales adopts par les Comits Techniques sont soumis aux Comits Membres pour approbation, avant leur acceptation comme Normes Internationales par le Consei
5、l de IISO. La Norme Internationale ISO 3494 a t tablie par le Comit Technique ISO/TC 69, Application des mthodes statistiques, et a t soumise aux Comits Membres en mars 1975. Elle a t approuve par les Comits Membres des pays suivants : Afrique du Sud, Allemagne Australie Autriche Belgique Brsil Bulg
6、arie Canada France Rp. d Hongrie Inde Isral Mexique Nouvelle-Zlande Pays-Bas Pologne Portugal Roumanie Royaume-Uni Suisse Tchcoslovaquie Turquie U.R.S.S. U.S.A. Yougoslavie Les Comits Membres des pays suivants ont dsapprouv le document pour des raisons techniques : Japon Sude Organisation Internatio
7、nale de Normalisation, 1976 l Imprim en Suisse ii SOMMAI RE SECTION UN TESTS DE COMPARAISON Page - Remarques a jnrales . . . . . . . . . . . . . . . . . . . . . . . . - . . . l l 1 - Note historique . . . . . . . . . . . . . . . . . . . . . . . . l . l l . . l . 2 1 Chapitre Tests de comparaison Com
8、paraison dune moyenne une valeur donne connue A . . . . . . . . . . . . . . . . . 3 Comparaison dune moyenne une valeur donne inconnue A . . . . . . . . . . . . . . . . . 4 Comparaison de deux moyennes connues C . . . . . . . . . . . . . . . . . 6 Comparaison de deux moyennes inconnues C . . . . . .
9、 . . . . . . . . . . . 8 MOYENNES Rfrence du Variante(s) tableau de IISO 2854 I VARIANCES Chapitre Tests de comparaison 5 Comparaison dune variante une valeur donne 6 Comparaison de deux variantes Rfrence du tableau de IISO 2854 E G SECTION DEUX : DIAGRAMMES - Rfrences des diagrammes . . . . . l l .
10、 . - Diagrammes . . . . . . . . . g . . . . 10 . 11 12 13 . . . III Page blanche NORME INTERNATIONALE ISO 34944976 (F) Interprtation statistique des donnes - Efficacit des tests portant sur des moyennes et des variantes SECTION UN : TESTS DE COMPARAISON REMARQUES GNRALES 1) La prsente Norme Internat
11、ionale fait suite 160 2854, Interprtation Stat p dpend aussi de la valeur choisie pour le risque de Ire espce, de leffectif du (ou des) chantillon(s) et de la nature du test (bilatral ou unilatral). Dans les tests de comparaison de moyennes, p dpend aussi de lcart-type de la (ou des) population(s).
12、Lorsque celui-ci est inconnu, le risque 6 ne peut pas tre connu exactement. 5) Les courbes defficacit peuvent tre utilises dans les problmes suivants : a) problme 1 : Pour une alternative et un effectif (ou des effectifs) dchantillon donns, dterminer la probabilit fl de ne pas rejeter lhypothse null
13、e (risque de 2e espce); b) problme 2 : Pour une alternative et une valeur donnes de /3, dterminer leffectif (ou les effectifs) dchantillon prlever. Bien quune seule srie de diagrammes permette de rsoudre les deux problmes, deux sries de diagrammes seront prsentes, afin de faciliter les applications
14、pratiques : - diagrammes 1.1 14.1, donnant en fonction de lalternative, pour a = 005 ou a = 001 et pour diff- rentes valeurs de leffectif (ou des effectifs) dchan- tillon, le risque p; - diagrammes 1.2 14.2, donnant en fonction de lalternative, pour cy = 005 ou cI1= 001 et pour diffrentes valeurs du
15、 risque p, leffectif (ou les effectifs) dchantillon prlever. 6) Lattention est attire sur la signification pratique de linterprtation statistique au moyen des tests dhypothse et des courbes defficacit. Lorsquon teste une hypothse telle que m =mo (ou ml = m2), on dsire gnralement savoir si lon peut c
16、onclure, avec un faible risque de se tromper, que m nest pas trop diffrent de m. (ou ml pas trop diffrent de m2). De mme, le choix de la valeur CI= 005 ou a = 001 pour le risque de Ire espce associ au test comporte une part darbitraire. II peut donc tre utile dexaminer quel serait le rsultat du test
17、 pour des valeurs voisines de m o (ou des valeurs de la diffrence D=m, -m2 voisines de 0), avec ventuellement les deux valeurs du risque de Ire espce CY = 005 et cy = 001 et, dans de telles circonstances, dvaluer au moyen des courbes defficacit le risque /3 associ diffrentes alternatives. 1 ISO 3494
18、-1976 (F) 7) Les diagrammes qui sont donns dans la section deux de la prsente Norme Internationale sont dcrits et comments dans six chapitres qui correspondent aux tableaux de IISO 2854. La correspondance dtaille entre les diffrents diagrammes, les problmes quils permettent de rsoudre, les chapitres
19、 de la prsente Norme Internationale et les tableaux de IISO 2854, figure en tte de lensemble des diagrammes. NOTE HISTORIQUE Les concepts de risques de Ire et de 2e espce ont t introduits par J. Neyman et E.S. Pearson dans un article paru en 1928. Par la suite, ces auteurs ont estim que le complment
20、 de la probabilit de commettre lerreur de 2e espce - quils appelrent la puissance) du test, dans sont aptitude rvler comme significative une alternative spcifie lhypothse nulle (ou hypothse teste) - tait en gnral un concept plus facile comprendre pour les praticiens. Cest cette (puissance, ou probab
21、ilit de rvler un cart donn lhypothse nulle, quils dsignrent par le symbole p. II nest dailleurs pas ncessaire dintroduire le terme de (puissance). On peut plus simplement parler de la probabilit quun test statistique appliqu un chantillon, un niveau de signification cy, rvle quun paramtre X de la po
22、pulation diffre (lorsquil en est bien ainsi) dau moins une quantit donne dune valeur spcifie Xo ou soit, par rapport celle-ci, dans un rapport au moins gal un nombre donn. Le changement de notation a probablement t introduit aux U.S.A. par les praticiens des applications industrielles de la statisti
23、que, afin quen mme temps que le (risque du fournisseur a), soit pris en considration le risque du client), dsign alors par /3. Le symbole /3 a t retenu pour le risque de 2e espce dans IISO 3534, Statistique - Vocabulaire et symboles. II a donc t adopt avec la mme signification dans la prsente Norme
24、Internationale. Cependant, comme ce symbole est utilis, et continuera sans doute tre utilis dans les deux sens dans la littrature statistique, il convient de sassurer, dans chaque cas dutilisation, du sens qui lui est effectivement attribu. ISO 34941976 (F) l 1 COMPARAISON DUNE MOYENNE UNE VALEUR DO
25、NNE (VARIANCE CONNUE) m-m0 b) X = - (test unilatral m mo m -mo c) x=- (test unilatral m mo) alternatives (T mmg; b) soit m rno, les hypothses alternatives correspon- dant m rno ( - c) x= Af( n m-mo) ct (test unilatral m mo) alterna- tives m mo = 230, la valeur choisie pour le risque de Ire espce tan
26、t a = Of05 (a! est donc ici le risque du fournisseur). Le client sait, par exprience, que la moyenne des diffrents lots peut varier, mais que la dispersion des charges de rupture, lintrieur dun mme lot, est pratiquement constante et caractrise par un cart-type 0 = 033. 1.5.1 Le client envisage de pr
27、lever n = 10 bobines par lot, et dsire connatre la probabilit quil aura de ne pas rejeter lhypothse m 230 (donc daccepter le lot), alors quen fait la charge moyenne de rupture serait m = 210. Le diagramme consulter est le diagramme 3.1. La valeur du paramtre X, pour m = 2,10, est A=- 4-t n m-mo) m (
28、230 - 210) - 0 - 033 = 192 - 2.1 (test bilatral) risque de Ire espce cy = Of01 La droite v = 00 donne pour 100 6 la valeur 36 : fl= 0,36 - 3.1 (test unilatral) risque de 1 re espce cy = Of05 ou 36 %. - 4.1 (test unilatral) risque de Ire espce a = Of01 fl est lordonne du point dabscisse X sur la cour
29、be v = 00 du diagramme convenable. 1.5.2 Cette valeur tant considre par le client comme beaucoup trop leve, celui-ci dcide de prlever un chantillon deffectif suffisamment important pour que le risque fi sabaisse Of1 0 (ou 10 %) si m = 210. 1.4 Problme 2 : /3 tant donn, dterminer leffectif n Pour les
30、 diffrentes valeurs de m, on dfinit lalternative par le paramtre X (0 X 00) avec Le diagramme consulter est le diagramme 3.2. La valeur du paramtre X, pour m = 2,10, est X=-m-m,= 230 - 210 CJ 033 = 061 a) X= Im -QI ci (test bilatral) alternatives m # mo La valeur de n, lue sur la droite (trace en po
31、intill) fi = 0,10, estn = 22. 3 ISO 3494-1976 (F) 2 COMPARAISON DUNE MOYENNE UNE VALEUR DONNE (VARIANCE INCONNUE) Voir tableau A de IISO 2854. REMARQUE IMPORTANTE Le risque de 2e espce p dpend de la vraie valeur 0 de lcart-type de la population, qui est inconnu. On ne peut donc connatre fl que de fa
32、on approximative, et condition de disposer dun ordre de grandeur de o. dfaut dinformation antrieure valable, on prendra pour CJ lestimation s obtenue sur lchantillon. II est vivement conseill dexaminer la rpercussion sur les valeurs lues sur les courbes, dune erreur commise sur lcart-type o. Limprci
33、sion peut tre trs grande lorsque o a t estim partir dun chantillon de faible effectif; on pourra sen rendre compte en encadrant s par les limites de confiance de o calcules selon la mthode du tableau F de IISO 2854. 2.1 Notations n = effectif de lchantillon m = moyenne de la population m0 = valeur d
34、onne (7 = cart-type de la population (que lon remplacera par une valeur approche) V =n-1 2.2 Hypothses testes Pour un test bilatral, lhypothse nulle est m = mol les hypothses alternatives correspondant m # mo. Pour un test unilatral, lhypothse nulle est a) soit m G mo, les hypothses alternatives cor
35、respon- dant m mg; b) soit m 2 mg, les hypothses alternatives correspon- dant m mo - c) x= d-t n m-mo) 0 (test unilatral 113 mo) alterna- tives m mo m -m0 c) X=-y- (test unilatral m mo) alternatives m 2,30 (donc daccepter le lot), alors quen fait la charge moyenne de rupture serait m = 2,lO.l) Le di
36、agramme consulter est le diagramme 3.1. Les valeurs du paramtre X qui correspondent aux valeurs extrmes de 0 sont m (230 -2,lO) = 2 , h1= 0,30 I hs - - m (230 - 2,W = 1 4 0,45 I 1) Cest-dire la probabilit quen utilisant le test t de Student avec le niveau de signification Q! = 0,05, la valeur m = 2,
37、lO ne soit pas rvle comme significativement infrieure mg = 2,30. 4 ISO 34944976 (F) Les valeurs correspondantes de 100 /3, lues (par interpolation) pour v = 9, sont 40 et 64; soit p1 = 0,40 (ou 40 %) PS = 0,64 (ou 64 %) 2.5.2 Le client dsire que, dans lhypothse la plus dfavorable (0 = os = 0,45), p
38、ne dpasse pas 0,lO (ou 10 %) si m = 2,lO. Le diagramme consulter est le diagramme 3.2, courbe fi = O,lO, avec A= 2,30 - 2,lO 0,45 = 0,44 Pour fi = 0,lO et X = 0,44, on trouve n de lordre de 45. Aprs contrle de quelques lots, sil est constat que lcart-type est stable, 0 pourra tre estim avec une meil
39、leure prcision; leffectif prlever dans les lots suivants pourra vraisemblablement tre rduit, les garanties du fournisseur et du client tant conserves. 5 ISO 34944976 (F) 3 COMPARAISON DE DEUX MOYENNES (VARIAN- CES CONNUES) Voir tableau C de IISO 2854. 3.1 Notations Effectif de lchantillon Moyenne Va
40、riante cart-type de la diffrence des moyennes des deux chantillons 3.2 Hypothses testes Population 1 I Population 2 “1 “2 ml m2 Pour un test bilatral, lhypothse nulle est ml = m2, les hypothses alternatives correspondant ml # m2. Pour un test unilatral, lhypothse nulle est a) soit ml m2; b) soit ml
41、m2, les hypothses alternatives correspon- dant ml m2 c) A= m2 -ml od (test unilatral ml 2 m2) alternatives ml cm2 Suivant le cas, le diagramme consulter est - 1 .l (test bilatral) risque de 1 re espce a! = 0,05 - 2.1 (test bilatral) risque de Ire espce CY = 0,Ol - 3.1 (test unilatral) risque de Ire
42、espce Q! = 0,05 - 4.1 (test unilatral) risque de 1 re espce cy = 0,Ol fi est lordonne du point dabscisse X sur la courbe v = 00 du diagramme convenable. Lorsque leffectif total des deux chantillons est fix, n1 +n2 = 2 n, on obtient la meilleure efficacit (fi minimum) avec “1 n2 - - 01 O2 do (71 n1 =
43、2n- (3 + (J2 O2 n2=2noT 1 2 Iml A=& o -m21 1 +a 2 n Iml i f x= -m21 ? = = 0 , si 0, 02 0 1 3.4 Problme 2 : p tant donn, dterminer les effectifs nl etn2 Utilisant, suivant le cas, les diagrammes 1.1, 2.1, 3.1 ou 4.1, la courbe v = 00 permet de rsoudre le problme dans le cas gnral. Au point dordonne /
44、3 de cette courbe correspond labscisse X, et tout couple (n, n2) convient, condition que o2 o2 ml -m2 1 1 2 1+x= - n1 n2 x Le prlvement le plus conomique (nl + n2 minimum) est tel que “1 n2 -=- 01 O2 do x 2 “1 = 0, (0, + 02) - ( 1 ml -m2 x 2 n2 =02 (0, +a,) - ( 1 in, =n2=2 mLq =02=oj Dans le cas par
45、ticulier o ol = o2 = 0, nl = n2 = n, il est plus commode de dfinir, pour les diffrentes valeurs de la diffrence ml -m2, lalternative par le paramtre X (0 X -), avec a) X= If-4 77721 a G (test bilatral) alternatives ml #m2 6 ISO 34941976 (F) b) A= m-m2 afi (test unilatral ml m2 m2-1711 c) x=- 0* (tes
46、t unilatral ml m2) alternatives m1m2 et dutiliser, suivant le cas, lun des diagrammes suivants : - 1.2 (test bilatral) risque de Ire espce cy = 0,05 - 2.2 (test bilatral) risque de Ire espce a = 0,Ol - 3.2 (test unilatral) risque de Ire espce ar = 0,05 - 4.2 (test unilatral) risque de Ire espce a =
47、0,Ol n est lordonne du point dabscisse X sur la droite (trace en pointill) qui correspond la valeur donne 0. 3.5 Exemple Un fournisseur de fil de coton a modifi sa fabrication, mais selon sa dclaration, la charge de rupture moyenne reste la mme (ml = m2), ml correspondant lancienne fabrication et m2 la nouvelle. Le client est dispos adopter la nouvelle fabrication, mais dsire vrifier la dclaration du fournisseur en effectuant, sur des lments de fil dune longueur donne, prlevs dans diffrentes bobines, le test bilatral de lhypoths