Beregne summen av kvadrater (sse)

Summen av kvadrater, eller SSE, er en foreløpig statistisk beregning som fører til forskjellige dataverdier. Når du har et sett med dataverdier, er det nyttig å kunne bestemme hvor nært disse verdiene er relatert til hverandre. Du må organisere dataene dine i en tabell og deretter gjøre noen ganske enkle beregninger. Når du har funnet SSE for et datasett, kan du finne variansen og standardavviket.

Trinn

Metode 1 av 3: Beregn SSE for hånd

Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 1
1. Lag en tabell med tre kolonner. Den enkleste måten å beregne SSE på er å starte med en tabell med tre kolonner. Merk de tre kolonnene Hvor i{displaystyle {text{Verdi}}}{displaystyle {text{Verdi}}}, avvik{displaystyle {text{Avvik}}}{displaystyle {text{Avvik}}}, og avvik2{displaystyle {text{Avvik}}^{2}}{displaystyle {text{Avvik}}^{2}}.
Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 2
2. Fyll inn detaljene. Den første kolonnen inneholder verdiene til målingene dine. Fyll kolonnen Hvor i{displaystyle {text{Verdi}}}{displaystyle {text{Verdi}}} med avlesningene dine. Dette kan være resultatene av et eksperiment, en statistisk studie eller bare data fra en matematisk oppgave.
  • Anta i dette tilfellet at du jobber med medisinske data og at du har en liste over kroppstemperaturene til ti pasienter. Forventet normal kroppstemperatur er 98,6 grader. Temperaturen til ti pasienter måles og gir verdiene 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2 og 99.1. Temperaturen til ti pasienter måles og gir verdiene 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2 og 99.1. Skriv disse verdiene i den første kolonnen.
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 3
    3. Regn ut gjennomsnittet. Før du kan beregne feilen for hver måling, må du beregne gjennomsnittet av hele datasettet.
  • Gjennomsnittet av et datasett er summen av dets verdier delt på antall verdier i settet. Dette kan representeres symbolsk, med variabelen μ{displaystyle mu }mu:
  • μ=ΣXn{displaystyle mu ={frac {Sigma x}{n}}}{displaystyle mu ={frac {Sigma x}{n}}}
  • For disse dataene beregnes gjennomsnittet som følger:
  • μ=99,0+98,6+98,5+101,1+98,3+98,6+97,9+98,4+99,2+99,110{displaystyle mu ={frac {99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.1} {10}}}{displaystyle mu ={frac {99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.1} {10}}}
  • μ=988,710{displaystyle mu ={frac {988.7}{10}}}{displaystyle mu ={frac {988.7}{10}}}
  • μ=98,87{displaystyle mu =98.87}{displaystyle mu =98.87}
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 4
    4. Beregn de individuelle feilverdiene. I den andre kolonnen i tabellen må du angi feilverdiene for hver dataverdi. Feilen er forskjellen mellom avlesningen og gjennomsnittet.
  • For det gitte datasettet trekker du gjennomsnittet, 98,87, fra hver målte verdi, og fyller ut den andre kolonnen med resultatene. Disse ti beregningene går slik:
  • 99,0-98,87=0,1. 3{displaystyle 99.0-98.87=0.13}{displaystyle 99.0-98.87=0.13}
  • 98,6-98,87=-0,27{displaystyle 98.6-98.87=-0.27}{displaystyle 98.6-98.87=-0.27}
  • 98,5-98,87=-0,37{displaystyle 98.5-98.87=-0.37}{displaystyle 98.5-98.87=-0.37}
  • 101,1-98,87=2,23{displaystyle 101.1-98.87=2.23}{displaystyle 101.1-98.87=2.23}
  • 98,3-98,87=-0,57{displaystyle 98.3-98.87=-0.57}{displaystyle 98.3-98.87=-0.57}
  • 98,6-98,87=-0,27{displaystyle 98.6-98.87=-0.27}{displaystyle 98.6-98.87=-0.27}
  • 97,9-98,87=-0,97{displaystyle 97.9-98.87=-0.97}{displaystyle 97.9-98.87=-0.97}
  • 98,4-98,87=-0,47{displaystyle 98.4-98.87=-0.47}{displaystyle 98.4-98.87=-0.47}
  • 99,2-98,87=0,33{displaystyle 99.2-98.87=0.33}{displaystyle 99.2-98.87=0.33}
  • 99,1-98,87=0,23{displaystyle 99.1-98.87=0.23}{displaystyle 99.1-98.87=0.23}
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 5
    5. Beregn SSE. I den tredje kolonnen i tabellen finner du kvadratet til hver av de resulterende verdiene i den midterste kolonnen. Disse representerer kvadratene på avviket fra gjennomsnittet for hver målte dataverdi.
  • For hver verdi i den midterste kolonnen, bruk en kalkulator for å beregne kvadratet. Registrer resultatene i den tredje kolonnen, som følger:
  • 0,1. 32=0,0169{displaystyle 0.13^{2}=0.0169}{displaystyle 0.13^{2}=0.0169}
  • (-0,27)2=0,0729{displaystyle (-0,27)^{2}=0,0729}{displaystyle (-0,27)^{2}=0,0729}
  • (-0,37)2=0,1369{displaystyle (-0,37)^{2}=0,1369}{displaystyle (-0,37)^{2}=0,1369}
  • 2,232=4,9729{displaystyle 2.23^{2}=4.9729}{displaystyle 2.23^{2}=4.9729}
  • (-0,57)2=0,3249{displaystyle (-0,57)^{2}=0,3249}{displaystyle (-0,57)^{2}=0,3249}
  • (-0,27)2=0,0729{displaystyle (-0,27)^{2}=0,0729}{displaystyle (-0,27)^{2}=0,0729}
  • (-0,97)2=0,9409{displaystyle (-0,97)^{2}=0,9409}{displaystyle (-0,97)^{2}=0,9409}
  • (-0,47)2=0,2209{displaystyle (-0,47)^{2}=0,2209}{displaystyle (-0,47)^{2}=0,2209}
  • 0,332=0,1089{displaystyle 0.33^{2}=0.1089}{displaystyle 0.33^{2}=0.1089}
  • 0,232=0,0529{displaystyle 0,23^{2}=0,0529}{displaystyle 0,23^{2}=0,0529}
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 6
    6. Legg sammen kvadratene av feilene. Det siste trinnet er å finne summen av verdiene i den tredje kolonnen. Det ønskede resultatet er SSE, eller summen av kvadratene av feilene.
  • For dette datasettet beregnes SSE ved å legge til de ti verdiene i den tredje kolonnen:
  • ssE=6,921{displaystyle SSE=6.921}{displaystyle SSE=6.921}
  • Metode 2 av 3: Lag et Excel-regneark for å beregne SSE

    Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 7
    1. Merk kolonnene i regnearket. Du lager en tabell med tre kolonner i Excel, med de samme tre overskriftene som ovenfor.
    • I celle A1 skriver du "Verdi" som overskrift.
    • I boks B1, skriv `Avvik` som overskrift.
    • I boks C1, skriv `Avvik i rute` som overskrift.
    Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 8
    2. Skriv inn detaljene dine. I den første kolonnen må du angi verdiene for målingene dine. Hvis settet er lite, kan du enkelt skrive det inn for hånd. Hvis du har et stort datasett, må du kanskje kopiere og lime inn dataene i kolonnen.
    Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 9
    3. Bestem gjennomsnittet av datapunktene. Excel har en funksjon som beregner gjennomsnittet for deg. I en tom celle under datatabellen din (det spiller ingen rolle hvilken celle du velger), skriv inn:
  • =Gjennomsnitt(A2:___)
  • Ikke skriv tomt mellomrom. Fyll ut feltet med cellenavnet til det siste datapunktet. For eksempel, hvis du har 100 datapunkter, vil du bruke funksjonen:
  • =Gjennomsnitt(A2:A101)
  • Denne funksjonen inneholder dataene fra cellene A2 til A101, fordi den øverste raden inneholder kolonneoverskriftene.
  • Når du trykker Enter eller klikker til en annen celle i tabellen, fylles den nylig programmerte cellen automatisk med gjennomsnittet av dataverdiene dine.
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 10
    4. Gå inn i feilmålingsfunksjonen. I den første tomme cellen i `Avvik`-kolonnen må du angi en funksjon for å beregne forskjellen mellom hvert datapunkt og gjennomsnittet. For å gjøre dette, bruk cellenavnet der gjennomsnittet er plassert. La oss anta at du har brukt celle A104 for nå.
  • Feilberegningsfunksjonen, som du skriver inn i celle B2, er:
  • =A2-$A$104. Dollartegnene er nødvendige for å sikre at du låser boks A104 for hver beregning.
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 11
    5. Fyll inn funksjonen for kvadratfeilene. I den tredje kolonnen kan du instruere Excel til å beregne ønsket kvadrat.
  • I celle C2 skriver du inn følgende funksjon:
  • =B2^2
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 12
    6. Kopier funksjonene for å fylle hele tabellen. Etter å ha lagt inn funksjonene i den øverste cellen i hver kolonne, henholdsvis B2 og C2, må du fylle hele tabellen. Du kan skrive inn funksjonen på nytt i hver linje i tabellen, men dette vil ta altfor lang tid. Bruk musen til å markere cellene B2 og C2 sammen, og uten å slippe museknappen, dra til den nederste cellen i hver kolonne.
  • Forutsatt at du har 100 datapunkter i tabellen, dra musen til cellene B101 og C101.
  • Når du slipper museknappen, kopieres formlene til alle cellene i tabellen. Tabellen skal automatisk fylles med de beregnede verdiene.
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 13
    7. Finn SSE. Kolonne C i tabellen inneholder alle kvadratiske feilverdier. Det siste trinnet er å la Excel beregne summen av disse verdiene.
  • I en celle under tabellen, sannsynligvis C102 i dette eksemplet, skriv inn følgende funksjon:
  • =Sum(C2:C101)
  • Hvis du klikker på Enter eller klikker bort i en annen celle i tabellen, får du SSE-verdien til dataene dine.
  • Metode 3 av 3: Relaterer SSE til andre statistiske data

    Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 14
    1. Beregn avviket til SSE. Å finne SSE for et datasett er generelt en byggestein for å finne andre, mer nyttige verdier. Den første av disse er varians. Variansen er et mål som indikerer hvor mye de målte dataene avviker fra gjennomsnittet. Det er faktisk gjennomsnittet av de kvadratiske forskjellene fra gjennomsnittet.
    • Siden SSE er summen av kvadrerte feil, kan du finne gjennomsnittet (det er variansen) bare ved å dele på antall verdier. Men hvis du beregner variansen til et utvalg sett, i stedet for en hel populasjon, deler du variansen med (n-1) i stedet for n. Så:
    • Varians = SSE/n, hvis du beregner variansen til en hel populasjon.
    • Varians = SSE/(n-1), hvis du beregner variansen til et utvalg data.
  • For prøveproblemet med pasientenes temperatur kan vi anta at 10 pasienter utgjør kun en prøve. Derfor beregnes variansen som følger:
  • Forskjell=SSE(n-1){displaystyle {text{Variasjon}}={frac {text{SSE}}{(n-1)}}}{displaystyle {text{Variasjon}}={frac {text{SSE}}{(n-1)}}}
  • Forskjell=6,9219{displaystyle {text{Variasjon}}={frac {6,921}{9}}}{displaystyle {text{Variasjon}}={frac {6,921}{9}}}
  • Forskjell=0,769{displaystyle {text{Variasjon}}=0,769}{displaystyle {text{Variasjon}}=0,769}
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 15
    2. Beregn standardavviket til SSE. Standardavviket er en vanlig brukt verdi som indikerer hvor mye verdiene til et datasett avviker fra gjennomsnittet. Standardavviket er kvadratroten av variansen. Merk at variansen er gjennomsnittet av de kvadrerte feilmålene.
  • Derfor, etter at du har beregnet SSE, kan du finne standardavviket som følger:
  • standardavvik=SSEn-1{displaystyle {text{Standardavvik}}={sqrt {frac {text{SSE}}{n-1}}}}{displaystyle {text{Standardavvik}}={sqrt {frac {text{SSE}}{n-1}}}}
  • For prøven av temperaturmålingene kan du finne standardavviket som følger:
  • standardavvik=SSEn-1{displaystyle {text{Standardavvik}}={sqrt {frac {text{SSE}}{n-1}}}}{displaystyle {text{Standardavvik}}={sqrt {frac {text{SSE}}{n-1}}}}
  • standardavvik=6,9219{displaystyle {text{Standard Deviation}}={sqrt {frac {text{6,921}}{9}}}}{displaystyle {text{Standard Deviation}}={sqrt {frac {text{6,921}}{9}}}}
  • standardavvik=0,769{displaystyle {text{Standardavvik}}={sqrt {0.769}}}{displaystyle {text{Standardavvik}}={sqrt {0.769}}}
  • standardavvik=0,877{displaystyle {text{Standardavvik}}=0,877}{displaystyle {text{Standardavvik}}=0,877}
  • Bilde med tittelen Beregn summen av kvadrater for feil (SSE) Trinn 16
    3. Bruk SSE for å bestemme kovariansen. Denne artikkelen fokuserte på datasett som kun måler én enkelt verdi om gangen. Imidlertid kan du i mange studier sammenligne to separate verdier. For eksempel vil du vite hvordan disse to verdiene er relatert til hverandre, ikke bare til gjennomsnittet av datasettet. Denne verdien er kovariansen.
  • Beregningene for kovarians er for detaljerte til å beskrives her, bortsett fra at du vil bruke SSE for hver datatype og deretter sammenligne den. For en mer detaljert beskrivelse av kovariansen og de involverte beregningene, se finn artikler om dette emnet på wikiHow.
  • Som et eksempel på bruk av kovarians, kan du sammenligne alderen til pasientene i en medisinsk studie med effektiviteten til et medikament for å senke febertemperaturen. Så har du ett datasett med aldre og et andre datasett med temperaturer. Du finner da SSE for hvert datasett, og derfra varians, standardavvik og kovarians.

  • Оцените, пожалуйста статью