Korrelasjonskoeffisienten, betegnet som r eller ρ, er målet på den lineære korrelasjonen (forholdet, både i styrke og retning) mellom to variabler. Den varierer fra -1 til +1, ved å bruke pluss- og minustegn for å representere den positive og negative korrelasjonen. Hvis korrelasjonskoeffisienten er nøyaktig -1, så er forholdet mellom de to variablene fullstendig negativt; hvis korrelasjonskoeffisienten er nøyaktig +1, så er sammenhengen helt positiv. To variabler kan ha en positiv korrelasjon, en negativ korrelasjon eller ingen korrelasjon i det hele tatt. Du kan beregne korrelasjonen for hånd, ved å bruke noen gratis korrelasjonskalkulatorer tilgjengelig på nettet, eller ved å bruke de statistiske funksjonene til en god grafisk kalkulator.
Trinn
Metode 1 av 4: Beregning av korrelasjonskoeffisienten for hånd
1.
Samle inn dataene dine først. For å begynne å beregne en effektiv korrelasjon, undersøk først dataparene. Det er nyttig å legge dem i et bord, både vertikalt og horisontalt. Merk hver rad eller kolonne x og y.
- For eksempel: anta at du har fire datapar for X og y. Tabellen kan da se slik ut:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7
2. Regn ut gjennomsnittet av X. For å beregne gjennomsnittet, må du legge til alle verdiene av X legg til og del deretter på antall verdier.
Med utgangspunkt i eksemplet ovenfor, legg merke til at du har fire verdier for X. For å beregne gjennomsnittet, tell alle verdier for X og del den på 4. Regnestykket ser da slik ut:


3. Finn gjennomsnittet av y. For å få gjennomsnittet av y For å finne den, følg de samme trinnene, legg alle verdiene til y sammen og del deretter på antall verdier.
I eksemplet ovenfor har du også fire verdier for y. Legg alle disse verdiene sammen og del deretter på 4. Beregningene vil da se slik ut:


4. Bestem standardavviket til X. Når du har midler, kan du beregne standardavviket. Bruk formelen for dette:
Med eksempeldataene vil beregningene dine se slik ut:




5. Beregn standardavviket til y. Bruk de samme grunnleggende trinnene, finn standardavviket til y. Du skal bruke den samme formelen ved å bruke datapunktene for y.
Med eksempeldataene vil beregningene dine se slik ut:




6. Se den grunnleggende formelen for å bestemme en korrelasjonskoeffisient. Formelen for å beregne en korrelasjonskoeffisient bruker middelverdier, standardavvik og antall par i et datasett (representert av n). Selve korrelasjonskoeffisienten er representert med den lille bokstaven r eller den greske bokstaven ρ (rho). For denne artikkelen vil vi bruke formelen kjent som Pearson-korrelasjonskoeffisienten som vist nedenfor:
Du kan legge merke til små variasjoner i formelen, her eller i andre forklaringer. For eksempel vil noen bruke den greske notasjonen med rho og sigma, mens andre vil bruke r og s. Noen forklaringer kan bruke litt forskjellige formler, men de vil være matematisk likeverdige med denne.7. Bestem korrelasjonskoeffisienten. Du har nå middel og standardavvik for variablene dine, så du kan gå videre til korrelasjonskoeffisientformelen. Husk at n representerer antall verdier du har. Du har allerede utarbeidet den andre relevante informasjonen i trinnene ovenfor.
Ved å bruke eksempeldataene kan du legge inn dataene i korrelasjonskoeffisientformelen og beregne den slik:
[
]



8. Tolk resultatet. For dette datasettet er korrelasjonskoeffisienten 0,988. Dette tallet forteller deg to ting om dataene. Se på tegnet på tallet og størrelsen på tallet.
Siden korrelasjonskoeffisienten er positiv, kan du si at det er en positiv korrelasjon mellom x-dataene og y-dataene. Dette betyr at når x-verdiene øker, forventer du at y-verdiene også øker.Siden korrelasjonskoeffisienten er veldig nær +1, er x-data og y-data veldig nært beslektet. Hvis du skulle tegne disse punktene, ville du se at de er en veldig god tilnærming til en rett linje.Metode 2 av 4: Bruk av online korrelasjonskalkulatorer
1. Søk på nettet etter korrelasjonskalkulatorer. Å måle korrelasjon er en ganske standard beregning for statistikere. Beregningen kan bli veldig kjedelig for store datasett hvis den gjøres for hånd. Derfor har mange kilder gjort vanlige korrelasjonsberegninger tilgjengelig på nett. Bruk hvilken som helst søkemotor og skriv inn søkeordet "korrelasjonskalkulator".
2. For dataene i. Vennligst les instruksjonene på nettstedet nøye slik at du kan legge inn dataene riktig. Det er viktig at dataparene holdes i orden ellers får du et feil korrelasjonsresultat. Ulike nettsteder bruker forskjellig formatering for å legge inn data.
For eksempel: på nettsiden http://nkalkulatorer.com/statistikk/korrelasjonskoeffisient-kalkulator.htm finn en horisontal boks for å angi x-verdier og en andre horisontal boks for å angi y-verdier. Du skriver inn begrepene kun atskilt med komma. Så x-datasettet beregnet tidligere i denne artikkelen skal legges inn som 1,2,4,5. y-datasettet legges inn som 1,3,5,7.På en annen side, http://www.alkohol.com/kalkulatorer/statistikk/korrelasjonskoeffisient/, du kan legge inn data både horisontalt og vertikalt, så lenge du holder datapunktene i orden.3. Beregn resultatene. Disse beregningsnettstedene er populære fordi, generelt, etter at du har lagt inn dataene, er alt du trenger å gjøre å klikke på "Beregn"-knappen -- resultatet vises automatisk.
Metode 3 av 4: Bruke en grafisk kalkulator
1.
Skriv inn detaljene dine. Slå på statistikkfunksjonen på grafkalkulatoren og velg kommandoen `Rediger`.
- Hver kalkulator har litt forskjellige tastekommandoer. Denne artikkelen gir spesifikke instruksjoner for Texas Instruments TI-86.
- Gå inn i Stat-funksjonen ved å trykke [2nd]-Stat (over `+`-tasten) og deretter F2-Edit.
2. Fjern alle gamle lagrede data. De fleste kalkulatorer vil beholde de statistiske dataene til de er slettet. For å være sikker på at du ikke forveksler gamle data med nye data, må du først slette all tidligere lagret informasjon.
Bruk piltastene for å flytte markøren for å markere kategorien `xStat`. Trykk deretter `Slett` og `Enter. Dette bør fjerne alle verdier i xStat-kolonnen.Bruk piltastene for å markere kategorien `yStat`. Trykk "Slett" og "Enter" for å fjerne dataene fra den kolonnen også.3. Skriv inn dataverdiene dine. Bruk piltastene til å flytte markøren til det første rommet under xStat-overskriften. Skriv inn din første dataverdi og trykk deretter Enter. Du bør se plassen nederst på skjermen `xStat(1)=__` der verdien fyller den tomme plassen. Når du trykker Enter, vil data fylle tabellen, markøren vil flytte til neste linje, og linjen nederst på skjermen skal nå lese `xStat(2)=__`.
Fortsett å angi alle x-verdier.Når du har lagt inn x-verdiene, bruk piltastene for å gå til yStat-kolonnen og angi y-verdiene.Når alle data er lagt inn, trykk Avslutt for å tømme skjermen og gå ut av Stat-menyen.4. Beregn den lineære regresjonsstatistikken. Korrelasjonskoeffisienten er et mål på hvor godt dataene tilnærmer seg en rett linje. En grafisk kalkulator med statistiske funksjoner kan veldig raskt beregne den beste tilpasningslinjen og korrelasjonskoeffisienten.
Gå inn i Stat-funksjonen og trykk deretter på Calc-knappen. På TI-86 er dette [2nd][Stat][F1].Velg lineære regresjonsberegninger. På TI-86 er den [F3], merket "LinR.` Den grafiske skjermen vil da vise linjen `LinR _` med en blinkende markør.Du må nå skrive inn navnene på de to variablene du vil beregne. Disse er xStat og yStat.På TI-86 velger du listen over navn (`Names`) ved å trykke [2nd][List][F3].Den nederste linjen på skjermen skal nå vise de tilgjengelige variablene. Velg [xStat] (dette er sannsynligvis knappen F1 eller F2), skriv deretter inn et komma og deretter [yStat].Trykk Enter for å beregne dataene5. Tolk resultatene. Når du trykker Enter, vil kalkulatoren umiddelbart beregne følgende informasjon for dataene du skrev inn:
: Dette er den generelle formelen for en rett linje. Men i stedet for det velkjente `y=mx+b`, presenteres dette i omvendt rekkefølge.
. Dette er verdien av skjæringspunktet med y-aksen til linjen som passer best.
. Dette er stigningstallet på linjen som passer best.
. Dette er korrelasjonskoeffisienten.
. Dette er antallet datapar som brukes i beregningen.Metode 4 av 4: Gjenta det grunnleggende
1.
Forstå begrepet korrelasjon. Korrelasjon refererer til den statistiske sammenhengen mellom to størrelser. Korrelasjonskoeffisienten er et enkelt tall som du kan beregne for to sett med datapunkter. Tallet er alltid noe mellom -1 og +1, og indikerer hvor tett de to datasettene er forbundet.
- For eksempel, hvis du målte høyden og alderen til barn opp til ca. 12 år, ville du forvente å finne en sterk positiv korrelasjon. Når barn blir eldre, har de en tendens til å bli høyere.
- Et eksempel på en negativ korrelasjon er å sammenligne tiden noen bruker på å trene golf og den personens golfscore. Etter hvert som øvelsen skrider frem, bør poengsummen synke.
- Til syvende og sist vil du forvente liten korrelasjon, positiv eller negativ, mellom for eksempel en persons skostørrelse og eksamenskarakterene.

2. Regn ut gjennomsnittet. Det aritmetiske gjennomsnittet, eller "gjennomsnittet", av et sett med data beregnes ved å legge alle verdiene til dataene sammen og deretter dele på antall verdier i settet. Når du vil bestemme korrelasjonskoeffisienten for dataene dine, må du beregne gjennomsnittet av hvert sett med data.
Gjennomsnittet av en variabel er indikert med variabelen med en horisontal linje over. Dette blir ofte referert til som `x-bar` eller `y-bar` for datasettene til x og y. Alternativt kan gjennomsnittet angis med den lille greske bokstaven μ (mu). For å representere gjennomsnittet av datapunktene til x, kan du for eksempel bruke μX eller μ(x).For eksempel, hvis du har et sett med x (1,2,5,6,9,10), vil gjennomsnittet av disse dataene bli beregnet som følger:


3. Kjenne til viktigheten av standardavviket. I statistikk måler standardavviket variasjon, og viser spredningen av tallene i forhold til gjennomsnittet. En gruppe tall med lavt standardavvik er ganske nær hverandre. En gruppe tall med høyt standardavvik er mer spredt.
Som et symbol er standardavviket uttrykt med den lille bokstaven s eller den greske bokstaven σ (sigma). Så standardavviket til x-dataene skrives som sX ellerX.4. Gjenkjenne summeringsnotasjonen. Summeringsoperatoren er en av de vanligste operatorene i matematikk, som representerer en sum av verdier. Det er representert med den greske store bokstaven, sigma eller ∑.
For eksempel, hvis du har et sett med datapunkter x (1,2,5,6,9,10), betyr ∑x:1+2+5+6+9+10 = 33Tips
- Korrelasjonskoeffisienten blir noen ganger referert til som `Pearson produkt-øyeblikk korrelasjonskoeffisient`, til ære for Karl Pearson, dens utvikler.
- Generelt representerer en korrelasjonskoeffisient større enn 0,8 (positiv eller negativ) en sterk korrelasjon; en korrelasjonskoeffisient lavere enn 0,5 (igjen positiv eller negativ) representerer en svak korrelasjonskoeffisient.
Advarsler
- Korrelasjon viser at to sett med data på en eller annen måte henger sammen. Vær imidlertid forsiktig med å tolke dette som en årsakssammenheng. Hvis du for eksempel sammenligner folks skostørrelser og høyden deres, vil du sannsynligvis finne en sterk positiv korrelasjon. Større mennesker har generelt større føtter. Dette betyr imidlertid ikke at å bli høy vil få føttene til å vokse, eller at store føtter vil gjøre deg høy. De bare skjer sammen.
Artikler om emnet "Bestemme korrelasjonskoeffisienten"