3.4 : Limites de confiance (2023)

  1. Dernière mise à jour
  2. Enregistrer au format PDF
  • Identifiant de la page
    1732
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}}}\) \( \newcommand{\vecd}[1]{\overset{-\!- \!\rightharpoonup}{\vphantom{a}\smash{#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{ span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart }{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\ norme}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm {span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\ mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{ \ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{ \unicode[.8,0]{x212B}}\)

    Objectifs d'apprentissage
    • Les limites de confiance vous indiquent la précision probable de votre estimation de la moyenne.

    Introduction

    Après avoir calculé la moyenne d'un ensemble d'observations, vous devez donner une indication de la proximité probable de votre estimation par rapport à la moyenne paramétrique (« vraie »). Une façon d’y parvenir consiste à utiliser des limites de confiance. Les limites de confiance sont les nombres situés aux extrémités supérieure et inférieure d'un intervalle de confiance ; par exemple, si votre moyenne est \(7,4\) avec des limites de confiance de \(5,4\) et \(9,4\), votre intervalle de confiance est de \(5,4\) à \(9,4\). La plupart des gens utilisent des limites de confiance de \(95\%\), bien que vous puissiez utiliser d'autres valeurs. Définir des limites de confiance de \(95\%\) signifie que si vous préleviez des échantillons aléatoires répétés dans une population et calculiez la moyenne et les limites de confiance pour chaque échantillon, l'intervalle de confiance pour \(95\%\) de vos échantillons inclurait la valeur paramétrique. signifier.

    Pour illustrer cela, voici les moyennes et les intervalles de confiance pour des échantillons de \(100\) d'observations de \(3\) provenant d'une population avec une moyenne paramétrique de \(5\). Parmi les \(100\) échantillons, \(94\) (indiqués par \(X\) pour la moyenne et une ligne fine pour l'intervalle de confiance) ont la moyenne paramétrique dans leur intervalle de confiance de \(95\%\), et \(6\) (représenté par des cercles et des lignes épaisses) ont la moyenne paramétrique en dehors de l'intervalle de confiance.

    3.4: Limites de confiance (2)

    Avec des échantillons de plus grande taille, les intervalles de confiance \(95\%\) deviennent plus petits :

    3.4: Limites de confiance (3)

    Lorsque vous calculez l'intervalle de confiance pour un seul échantillon, il est tentant de dire qu'« il existe une probabilité de \(95\%\) que l'intervalle de confiance inclut la moyenne paramétrique ». Ceci est techniquement incorrect, car cela implique que si vous collectiez des échantillons avec le même intervalle de confiance, ils incluraient parfois la moyenne paramétrique et parfois non. Par exemple, le premier échantillon de la figure ci-dessus a des limites de confiance de \(4,59\) et \(5,51\). Il serait incorrect de dire que \(95\%\) du temps, la moyenne paramétrique de cette population se situerait entre \(4,59\) et \(5,51\). Si vous preniez des échantillons répétés de cette même population et obteniez à plusieurs reprises des limites de confiance de \(4,59\) et \(5,51\), la moyenne paramétrique (qui est \(5\), rappelez-vous) serait dans cet intervalle \(100\ %\) du temps. Certains statisticiens ne se soucient pas de cette distinction déroutante et pédante, mais d'autres sont très pointilleux à ce sujet, c'est donc bon à savoir.

    Limites de confiance pour les variables de mesure

    Pour calculer les limites de confiance d'une variable de mesure, multipliez l'erreur type de la moyenne par la valeur t appropriée. La valeur \(t\) est déterminée par la probabilité (\(0,05\) pour un intervalle de confiance \(95\%\)) et les degrés de liberté (\(n-1\)). Dans une feuille de calcul, vous pouvez utiliser=(STDEV(Oui)/SQRT(COUNT(Oui)))*TINV(0,05,COUNT(Oui)-1), où \(Ys\) est la plage de cellules contenant vos données. Vous ajoutez cette valeur et la soustrayez de la moyenne pour obtenir les limites de confiance. Ainsi, si la moyenne est \(87\) et la valeur \(t\) multipliée par l'erreur type est \(10,3\), les limites de confiance seraient \(76,7\) et \(97,3\). Vous pouvez également signaler cela sous la forme "\(87\pm 10.3\) (\(95\%\) limites de confiance)." Les gens signalent à la fois les limites de confiance et les erreurs standard comme « quelque chose de moyen \(\pm \) », alors assurez-vous toujours de préciser de quoi vous parlez.

    Tout ce qui précède s'applique uniquement aux variables de mesure normalement distribuées. Pour les données de mesure provenant d'une distribution très anormale, les techniques d'amorçage, dont je ne parlerai pas ici, pourraient donner de meilleures estimations des limites de confiance.

    (Video) ECL8202, Cours 3.4 Calcul des intervalles de confiance

    Limites de confiance pour les variables nominales

    Il existe une formule différente, plus compliquée, basée sur la distribution binomiale, pour calculer les limites de confiance des proportions (données nominales). Il est important de noter que cela donne des limites de confiance qui ne sont pas symétriques autour de la proportion, en particulier pour les proportions proches de zéro ou de un. John Pezzullo dispose d'une page Web facile à utiliser pour les intervalles de confiance d'une proportion. Pour voir comment cela fonctionne, disons que vous avez pris un échantillon de \(20\) hommes et que vous avez trouvé \(2\) daltoniens et \(18\) non-daltoniens. Accédez à la page Web et entrez \(2\) dans la case "Numérateur" et \(20\) dans la case "Dénominateur", puis cliquez sur "Calculer". Les résultats de cet exemple seraient une limite de confiance inférieure de \(0,0124\) et une limite de confiance supérieure de \(0,3170\). Vous ne pouvez pas déclarer la proportion d'hommes daltoniens comme "\(0,10\pm quelque chose\)", vous devrez plutôt dire "\(0,10 \) avec des limites de confiance de \(95\%\) de \(0,0124\) et \(0,3170\)."

    Une technique alternative pour estimer les limites de confiance d’une proportion suppose que les proportions de l’échantillon sont normalement distribuées. Cette technique approximative donne des limites de confiance symétriques qui, pour des proportions proches de zéro ou de un, sont évidemment incorrectes. Par exemple, si vous calculez les limites de confiance en utilisant l'approximation normale sur \(0,10\) avec une taille d'échantillon de \(20\), vous obtenez \(-0,03\) et \(0,23\), ce qui est ridicule (vous ne pouvait pas avoir moins de \(0\%\) d'hommes daltoniens). Il serait également incorrect de dire que les limites de confiance étaient \(0\) et \(0,23\), car vous savez que la proportion d'hommes daltoniens dans votre population est supérieure à \(0\) (votre échantillon comptait deux hommes daltoniens). , vous savez donc que la population compte au moins deux daltoniens). Je considère que les limites de confiance pour les proportions basées sur l'approximation normale sont obsolètes dans la plupart des cas ; vous devez utiliser l'intervalle de confiance basé sur la distribution binomiale, à moins que la taille de l'échantillon ne soit si grande qu'elle est peu pratique sur le plan informatique. Malheureusement, davantage de personnes utilisent les limites de confiance basées sur l’approximation normale plutôt que les limites de confiance binomiales correctes.

    La formule pour l'intervalle de confiance \(95\%\) utilisant l'approximation normale est \(p\pm 1.96\sqrt{\left [ \frac{p(1-p)}{n} \right ]}\), où \(p\) est la proportion et \(n\) est la taille de l'échantillon. Ainsi, pour \(P=0,20\) et \(n=100\), l'intervalle de confiance serait \(\pm 1,96\sqrt{\left [ \frac{0,20(1-0,20)}{100} \right ]}\), ou \(0,20\pm 0,078\). Une règle empirique courante dit qu'il est acceptable d'utiliser cette approximation tant que \(npq\) est supérieur à \(5\) ; ma règle générale est de n'utiliser l'approximation normale que lorsque la taille de l'échantillon est si grande que le calcul de l'intervalle de confiance binomial exact fait sortir de la fumée de votre ordinateur.

    Tests statistiques avec intervalles de confiance

    Ce manuel présente principalement des statistiques « classiques » ou « fréquentistes », dans lesquelles des hypothèses sont testées en estimant la probabilité d'obtenir les résultats observés par hasard, si la valeur nulle est vraie (la valeur \(P\)). Une autre manière de faire des statistiques consiste à attribuer un intervalle de confiance à une mesure de l’écart par rapport à l’hypothèse nulle. Par exemple, plutôt que de comparer deux moyennes avec une étude à deux échantillonst–test, certains statisticiens calculeraient l’intervalle de confiance de la différence des moyennes.

    Cette approche est utile si un petit écart par rapport à l'hypothèse nulle s'avère inintéressant, lorsque vous êtes plus intéressé par l'ampleur de l'effet que par son existence. Par exemple, si vous effectuez les tests finaux d'un nouveau médicament dont vous êtes sûr qu'il aura un certain effet, vous seriez principalement intéressé par l'estimation de son efficacité et de votre confiance dans l'ampleur de cet effet. Vous voudriez que votre résultat soit « Ce médicament a réduit la tension artérielle systolique de \(10,7 mm\; \; Hg\), avec un intervalle de confiance de \(7,8\) à \(13,6\), » et non « Ce médicament réduction significative de la pression artérielle systolique (\(P=0,0007\))."

    Utiliser les limites de confiance de cette manière, comme alternative aux statistiques fréquentistes, a de nombreux partisans, et cela peut être une approche utile. Cependant, je vois souvent des gens dire des choses comme « La différence de pression artérielle moyenne était de \(10,7 mm\; \; Hg\), avec un intervalle de confiance de \(7,8\) à \(13,6\) ; parce que l'intervalle de confiance sur la différence n'inclut pas \(0\), les moyennes sont significativement différentes." Ce n’est qu’une manière maladroite et détournée de tester des hypothèses, et ils devraient simplement l’admettre et faire un test statistique fréquentiste.

    Il existe un mythe selon lequel lorsque deux moyennes ont des intervalles de confiance qui se chevauchent, les moyennes ne sont pas significativement différentes (au niveau \(P<0,05\)). Une autre version de ce mythe est que si chaque moyenne se situe en dehors de l’intervalle de confiance de l’autre moyenne, les moyennes sont significativement différentes. Aucune de ces affirmations n’est vraie (Schenker et Gentleman 2001, Payton et al. 2003) ; il est facile pour deux ensembles de nombres d'avoir des intervalles de confiance qui se chevauchent, tout en étant néanmoins significativement différents par un échantillon à deuxt-test; à l’inverse, chaque moyenne peut être en dehors de l’intervalle de confiance de l’autre, mais elles ne sont toujours pas significativement différentes. N'essayez pas de comparer deux moyennes en comparant visuellement leurs intervalles de confiance, utilisez simplement le bon test statistique.

    Statistiques similaires

    Les limites de confiance et l’erreur type de la moyenne ont le même objectif : exprimer la fiabilité d’une estimation de la moyenne. Lorsque vous regardez des articles scientifiques, parfois les « barres d'erreur » sur les graphiques ou le nombre ± après les moyennes dans les tableaux représentent l'erreur type de la moyenne, tandis que dans d'autres articles, ils représentent des intervalles de confiance de \(95\%\). Je préfère les intervalles de confiance \(95\%\). Lorsque je vois un graphique avec un tas de points et de barres d'erreur représentant les moyennes et les intervalles de confiance, je sais que la plupart (\(95\%\)) des barres d'erreur incluent les moyennes paramétriques. Lorsque les barres d’erreur sont des erreurs standard de la moyenne, seuls les deux tiers environ des barres sont censés inclure les moyennes paramétriques ; Je dois mentalement doubler les barres pour obtenir la taille approximative de l'intervalle de confiance \(95\%\) (car \(t(0,05)\) est d'environ \(2\) pour toutes les valeurs de \(n, sauf les très petites). \)). Quelle que soit la statistique que vous décidez d’utiliser, assurez-vous d’indiquer clairement ce que représentent les barres d’erreur sur vos graphiques. Un nombre surprenant d'articles ne précisent pas ce que représentent leurs barres d'erreur, ce qui signifie que la seule information que les barres d'erreur transmettent au lecteur est que les auteurs sont négligents et négligents.

    (Video) Estimer une proportion à l'aide d'un intervalle de confiance (1) - PostBac

    Exemples

    Données de mesure

    Les données sur le naseux à nez noir de la page Web centrale sur les tendances ont une moyenne arithmétique de \(70,0\). La limite de confiance inférieure est \(45,3\) (\(70,0-24,7\)) et la limite de confiance supérieure est \(94,7\) (\(70+24,7\)).

    Données nominales

    Si vous travaillez avec de nombreuses proportions, il est bon d'avoir une idée approximative des limites de confiance pour différentes tailles d'échantillon, afin d'avoir une idée de la quantité de données dont vous aurez besoin pour une comparaison particulière. Pour des proportions proches de \(50\%\), les intervalles de confiance sont approximativement de \(\pm 30\%,\; 10\%,\; 3\%\), et \(1\%\) pour \(n =10,\; 100,\; 1000,\) et \(10,000\), respectivement. C'est pourquoi la « marge d'erreur » dans les sondages politiques, qui ont généralement une taille d'échantillon d'environ \(1 000\), est généralement d'environ \(3\%\). Bien entendu, cette idée approximative ne remplace pas une véritable analyse de puissance.

    n proportion=0,10 proportion=0,50
    dix 0,0025, 0,4450 0,1871, 0,8129
    100 0,0490, 0,1762 0,3983, 0,6017
    1000 0,0821, 0,1203 0,4685, 0,5315
    10 000 0,0942, 0,1060 0,4902, 0,5098

    Comment calculer les limites de confiance

    Feuilles de calcul

    La feuille de calcul de statistiques descriptives descriptive.xls calcule les limites de confiance de \(95\%\) de la moyenne pour un maximum de \(1 000\) mesures. Les intervalles de confiance pour une feuille de calcul de proportions binomialesconfiance.xls calcule les limites de confiance \(95\%\) pour les variables nominales, en utilisant à la fois l'approximation binomiale exacte et normale.

    les pages Web

    Cette page Web calcule les intervalles de confiance de la moyenne pour un maximum de \(10 000\) observations de mesure. La page Web pour les intervalles de confiance d'une proportion gère les variables nominales.

    (Video) Limits of Trigonometric Functions

    R.

    \(R\) de Salvatore MangiaficoCompagnonpropose des exemples de programmes R pour les limites de confiance pour les variables de mesure et nominales.

    SAS

    Pour obtenir les limites de confiance d'une variable de mesure, ajoutez CIBASIC à l'instruction PROC UNIVARIATE, comme ceci :

    poisson de données;
    emplacement d'entrée $ numéro de dace ;
    cartes;
    Mill_Creek_1 76
    Mill_Creek_2 102
    Nord_Branch_Rock_Creek_1 12
    Nord_Branch_Rock_Creek_2 39
    Rock_Creek_1 55
    Rock_Creek_2 93
    Rock_Creek_3 98
    Rock_Creek_4 53
    Turquie_Branche 102
    ;
    proc données univariées = poisson cibasic ;
    courir;

    Le résultat inclura les limites de confiance \(95\%\) pour la moyenne (et pour l'écart type et la variance, dont vous n'auriez presque jamais besoin) :

    Limites de confiance de base en supposant la normalité

    Estimation des paramètres Limites de confiance à 95 %

    (Video) Let the environment guide our development | Johan Rockstrom

    Moyenne 70,00000 45,33665 94,66335
    Écart type 32,08582 21,67259 61,46908
    Écart 1030 469.70135 3778

    Cela montre que les données sur le naseux du nez noir ont une moyenne de \(70\), avec des limites de confiance de \(45,3\) et \(94,7\).

    Vous pouvez obtenir les limites de confiance pour une proportion binomiale à l'aide de PROC FREQ. Voici l'exemple de programme de la page de test exact d'adéquation :

    données gus;
    entrez la patte $ ;
    cartes;
    droite
    gauche
    droite
    droite
    droite
    droite
    gauche
    droite
    droite
    droite
    ;
    données de fréquence de procédure = gus ;
    pattes de tables / binôme (P.=0,5);
    binôme exact;
    courir;

    Et voici une partie du résultat :

    Proportion binomiale
    pour patte = gauche
    --------------------------------
    Proportion 0,2000
    ASE 0,1265
    Limite de configuration inférieure à 95 % 0,0000
    Limite de conf supérieure à 95 % 0,4479

    Limites exactes de la configuration
    Limite de configuration inférieure à 95 % 0,0252
    Limite de configuration supérieure à 95 % 0,5561

    La première paire de limites de confiance indiquée est basée sur l'approximation normale ; la deuxième paire est la meilleure, basée sur le calcul binomial exact. Notez que si vous avez plus de deux valeurs de la variable nominale, les limites de confiance ne seront calculées que pour la valeur dont le nom est en premier par ordre alphabétique. Par exemple, si l'ensemble de données Gus incluait « gauche », « droite » et « les deux » comme valeurs, SAS calculerait uniquement les limites de confiance sur la proportion des « deux ». Une façon maladroite de résoudre ce problème serait d'exécuter le programme trois fois, en changeant le nom de « gauche » en « aleft », puis de changer le nom de « droite » en « droit », pour que chacun soit le premier en une seule exécution.

    Les références

    1. Payton, ME, MH Greenstone et N. Schenker. 2003. Intervalles de confiance ou intervalles d'erreur standard qui se chevauchent : que signifient-ils en termes de signification statistique ? Journal de la science des insectes 3 : 34.
    2. Schenker, N. et J. F. Gentleman. 2001. Sur l'évaluation de l'importance des différences en examinant le chevauchement entre les intervalles de confiance. Statisticien américain 55 : 182-186.
    (Video) 5 transformational policies for a prosperous and sustainable world | Johan Rockström

    Videos

    1. How To...Calculate the Confidence Interval for a Sample
    (Eugene O'Loughlin)
    2. Denmark: provoking the limits of tolerance
    (Best Documentary)
    3. On the Trail of a Killer | Critical Role | Campaign 3, Episode 4
    (Critical Role)
    4. Complete Salvation And How To Receive It - Part 1 | Derek Prince
    (Derek Prince With Subtitles)
    5. CIRCULATION: TÈS EKRI SOU REGLEMAN SIKILASYON YO NAN ETA LA FLORID / AN KREYÒL.
    (CAP-HAITIEN en_Vrac)
    6. Top 07 Reasons Why He Won't Commit To You
    (Ismael Gomez III)

    References

    Top Articles
    Latest Posts
    Article information

    Author: Lidia Grady

    Last Updated: 07/09/2023

    Views: 5969

    Rating: 4.4 / 5 (45 voted)

    Reviews: 84% of readers found this page helpful

    Author information

    Name: Lidia Grady

    Birthday: 1992-01-22

    Address: Suite 493 356 Dale Fall, New Wanda, RI 52485

    Phone: +29914464387516

    Job: Customer Engineer

    Hobby: Cryptography, Writing, Dowsing, Stand-up comedy, Calligraphy, Web surfing, Ghost hunting

    Introduction: My name is Lidia Grady, I am a thankful, fine, glamorous, lucky, lively, pleasant, shiny person who loves writing and wants to share my knowledge and understanding with you.