Vurder statistisk signifikans

Hypotesetesting støttes av statistisk analyse. Statistisk signifikans beregnes ut fra en p-verdi, som indikerer sannsynligheten for det observerte resultatet, gitt at et bestemt utsagn (nullhypotesen) er tilfredsstilt. Hvis denne p-verdien er mindre enn det angitte signifikansnivået (vanligvis 0,05), kan eksperimentatoren anta at nullhypotesen er usann og akseptere den alternative hypotesen. Ved hjelp av en enkel t-test kan du beregne en p-verdi og sammenligne signifikansen mellom to ulike grupper av et datasett.

Trinn

Del 1 av 3: Sette opp eksperimentet

Bilde med tittelen Vurder statistisk signifikans Trinn 1
1. Definer hypotesen din. Det første trinnet i å vurdere statistisk signifikans er å definere spørsmålet som skal besvares og stille hypotesen din. Hypotesen er et utsagn om dine eksperimentelle data og forskjellene som kan eksistere i populasjonen. I hvert eksperiment er det både en null og en alternativ hypotese. Generelt sett vil du sammenligne to grupper for å se om de er like eller forskjellige.
  • Nullhypotesen (H0) sier generelt at det ikke er noen forskjell mellom dine to sett med data. For eksempel: elever som har lest stoffet før timen, oppnår ikke bedre sluttkarakterer.
  • Den alternative hypotesen (Hen) er det motsatte av nullhypotesen og er påstanden du prøver å støtte med eksperimentelle data. For eksempel: elever som har lest stoffet før timen oppnår bedre sluttkarakterer.
Bilde med tittelen Vurder statistisk signifikans Trinn 2
2. Angi signifikansnivået for å bestemme hvor uvanlige dataene dine må være før de kan anses som vesentlige. Signifikansnivået (også kalt alfa) er terskelen du setter for å bestemme signifikans. Hvis p-verdien er mindre enn eller lik det angitte signifikansnivået, kan dataene anses som statistisk signifikante.
  • Som en generell regel er signifikansnivået (eller alfa) ofte satt til 0,05, noe som betyr at sannsynligheten for å ved et uhell observere forskjellene i dataene dine bare er 5 %.
  • Et høyere konfidensnivå (og dermed en lavere p-verdi) betyr at resultatene er mer signifikante.
  • Hvis du vil at dataene skal være mer pålitelige, setter du p-verdien under 0,01. Lavere p-verdier brukes ofte i industrien ved feilsøking av produkter. Det er veldig viktig å kunne ha stor tillit til at hver del fungerer akkurat som den skal.
  • For de fleste eksperimenter mot en hypotese er et signifikansnivå på 0,05 akseptabelt.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 3
    3. Bestem deg for å bruke en en-hale eller to-hale test. En av forutsetningene en t-test gjør er at data er normalfordelt. En normalfordeling av data danner en klokkekurve med de fleste testdataene som faller i midten. t-testen er en matematisk test for å se om data faller utenfor normalfordelingen (over eller under), i "halene" av kurven.
  • Hvis du ikke er sikker på om dataene dine er over eller under kontrollgruppen, bruk en todelt test. Lar deg teste for signifikans i begge retninger.
  • Hvis du vet hvilken retning dataene dine har en tendens til å bevege seg, bruk en ensidig test. I eksemplet som er gitt forventer du at elevenes karakterer blir bedre; det er derfor du bruker en ensidig test.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 4
    4. Bestem prøvestørrelsen med en kraftanalyse. Kraften til en test er sannsynligheten for at det forventede resultatet vil bli observert, gitt en bestemt prøvestørrelse. Den vanlige terskelen for kraft (eller β) er 80 %. En effektanalyse kan bli litt vanskelig uten noen foreløpige data fordi du trenger litt informasjon om de forventede midtverdiene mellom hver gruppe og deres standardavvik. Bruk en online kraftanalysekalkulator for å bestemme den optimale prøvestørrelsen for dataene dine.
  • Forskere gjør vanligvis en liten pilotstudie for å informere om styrkeanalysen deres og for å bestemme prøvestørrelsen som trengs for en større, mer omfattende studie.
  • Hvis du ikke har ressurser til å gjøre en kompleks pilotstudie, gjør noen anslag om mulige gjennomsnitt basert på å lese litteraturen og studiene som andre kan ha gjort. Dette vil gi deg et godt utgangspunkt for prøvestørrelse til å begynne med.
  • Del 2 av 3: Beregning av standardavviket

    Bilde med tittelen Vurder statistisk signifikans Trinn 5
    1. Finn formelen for standardavviket. Standardavviket er et mål på spredningen av dataene dine. Den gir deg informasjon om hvor like hvert datapunkt i prøven din er. Ved første øyekast kan ligningen virke litt komplisert, men de følgende trinnene vil lede deg gjennom beregningen. Formelen er: s = √∑((xJeg – µ)/(N – 1)).
    • s er standardavviket.
    • ∑ indikerer at du må legge sammen alle de innsamlede prøveverdiene.
    • XJeg representerer hver enkelt verdi av dataene dine.
    • µ er gjennomsnittet (eller midten) av dataene dine for hver gruppe.
    • N er summen av prøven.
    Bilde med tittelen Vurder statistisk signifikans Trinn 6
    2. Gjennomsnitt av testdataene i hver gruppe. For å beregne standardavviket må du først midlere testdataene i de enkelte gruppene. Gjennomsnittet er angitt med den greske bokstaven mu eller µ. For å gjøre dette, legger du sammen hver del av data og deler den på det totale antallet data.
  • For å finne gjennomsnittskarakteren til gruppen som leste stoffet før timen, la oss for eksempel se på noen data. For enkelhets skyld bruker vi et datasett med 5 poeng: 90, 91, 85, 83 og 94.
  • Legg alle dataene sammen: 90 + 91 + 85 + 83 + 94 = 443.
  • Del summen med antall data, N = 5:443 / 5 = 88,6.
  • Gjennomsnittskarakteren for denne gruppen er 88,6.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 7
    3. Trekk hver beregning fra gjennomsnittet. Den neste delen av beregningen inkluderer delen (xJeg – µ) av ligningen. Du trekker hver data fra det nettopp beregnede gjennomsnittet. I vårt eksempel ender du opp med fem subtraksjoner.
  • (90 – 88,6), (91–88,6), (85–88,6), (83–88,6) og (94–88,6).
  • De beregnede tallene er nå 1,4, 2,4, -3,6, -5,6 og 5,4.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 8
    4. Kvaddra hvert av disse tallene og legg dem sammen. Hvert av de nye tallene du nettopp har regnet ut vil nå kvadratisk. Dette trinnet skaper også negative tegn. Hvis du har et minustegn etter dette trinnet eller på slutten av beregningen, kan det hende du har glemt dette trinnet.
  • I vårt eksempel jobber vi nå med 1.96 5.76, 12.96, 31.36 og 29.16.
  • Å legge disse rutene sammen gir: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 9
    5. Del dette på størrelsen på det totale utvalget, minus 1. Formelen deler på N-1, fordi den korrigerer for at du ikke har telt en hel populasjon ennå; du tar et utvalg fra populasjonen av alle elever for å gjøre et estimat.
  • Trekk fra: N – 1 = 5 – 1 = 4
  • Del: 81,2/4 = 20,3
  • Bilde med tittelen Vurder statistisk signifikans Trinn 10
    6. Ta kvadratroten. Når du har delt på antall data minus én, regner du ut kvadratroten av dette siste tallet. Dette er det siste trinnet i beregningen av standardavviket. Det finnes statistiske programmer som kan gjøre denne beregningen for deg, etter å ha lagt inn rådata.
  • I vårt eksempel er standardavviket for sluttkarakterene til elever som hadde lest stoffet før timen: s = √20,3 = 4,51.
  • Del 3 av 3: Bestem betydningen

    Bilde med tittelen Vurder statistisk signifikans Trinn 11
    1. Beregn forskjellen mellom de to gruppene av prøven. Til nå har eksemplet bare dekket én av utvalgsgruppene. Ønsker du å sammenligne to grupper, har du selvsagt data fra begge gruppene. Beregn standardavviket til den andre gruppen med testdata og bruk den til å beregne forskjellen mellom de to eksperimentelle gruppene. Formelen for varians er sd = √((s1/N1) + (s2/N2)).
    • sd er variansen mellom gruppene dine.
    • s1 er standardavviket til gruppe 1 og N1 er utvalgsstørrelsen til gruppe 1.
    • s2 er standardavviket til gruppe 2 og N2 er utvalgsstørrelsen til gruppe 2.
    • For eksempelets skyld, la oss si at dataene fra gruppe 2 (elever som ikke hadde lest før timen) hadde en prøvestørrelse på 5 og et standardavvik på 5,81. Variansen er:
    • sd = √((s1)/N1) + ((s2)/N2))
    • sd = √(((4,51)/5) + ((5,81)/5)) = √((20,34/5) + (33,76/5)) = √(4,07 + 6,75) = √10,82 = 3,29.
    Bilde med tittelen Vurder statistisk signifikans Trinn 12
    2. Beregn t-score for dataene dine. Med en t-score kan du konvertere data til et skjema som du kan sammenligne med andre data. Med t-score kan du utføre en t-test, for å beregne sannsynligheten for at to grupper skiller seg betydelig fra hverandre. Formelen for en t-score er: t = (µ1 – µ2)/sd.
  • µ1 er gjennomsnittet av den første gruppen.
  • µ2 er gjennomsnittet av den andre gruppen.
  • sd er variansen mellom prøvene.
  • Bruk det større gjennomsnittet som µ1, slik at du ikke har en negativ verdi for t.
  • I vårt eksempel, la oss si at prøvegjennomsnittet for gruppe 2 (de som ikke leste) var 80. t-poengsummen er da: t = (µ1 – µ2)/sd = (88,6 – 80)/3,29 = 2,61.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 13
    3. Bestem graden av frihet til prøven din. Ved bruk av t-score bestemmes frihetsgradene ved hjelp av utvalgsstørrelsen. Legg sammen antall testdata fra hver gruppe, og del deretter på to. I vårt eksempel, graden av frihet; d.f.) 8, fordi det var fem data i den første gruppen og fem i den andre gruppen ((5 + 5) – 2 = 8).
    Bilde med tittelen Vurder statistisk signifikans Trinn 14
    4. Bruk en t-tabell for å vurdere betydning. En tabell med t-score og antall frihetsgrader finner du i en standard statistikkbok eller på nett. Se på raden med frihetsgrader for dataene dine og finn p-verdien som tilsvarer t-skåren din.
  • med 8 d.f. og en t-score på 2,61, faller p-verdien for en ensidig test mellom 0,01 og 0,025. Fordi vårt angitte signifikansnivå er mindre enn eller lik 0,05, er dataene våre statistisk signifikante. Med disse dataene forkaster vi nullhypotesen og aksepterer den alternative hypotesen: Elever som leser stoffet før timen får bedre sluttkarakterer.
  • Bilde med tittelen Vurder statistisk signifikans Trinn 15
    5. Vurder en oppfølgingsstudie. Mange forskere gjør en liten pilotstudie med noen få målinger for å forstå hvordan man legger opp en større studie. En annen studie, med flere målinger, vil bidra til å øke tilliten til konklusjonen din.

    Tips

    • Statistikk er et omfattende og komplisert felt. Ta en videregående skole eller høyere utdanning klasse på statistisk slutning for å bedre forstå statistisk signifikans.

    Advarsler

    • Denne analysen er spesifikk for en t-test for å teste forskjellene mellom to normalfordelte populasjoner. Du kan trenge en annen statistisk test avhengig av kompleksiteten til datainnsamlingen din.

    Оцените, пожалуйста статью