Beskrivande statistik
Data från en population eller ett stickprov kan beskrivas genom uppräkning av egenskaper (om materialet inte är för stort) eller med sammanfattande mått som anger: 1) antal observationer 2) observationernas centralvärde och 3) variabilitet eller spridning. Data kan också beskrivas grafiskt. Här följer ett exempel som visar på huvudregler för att beskriva data.
Exempel: Födelsevikt, Apgar och kön hos 9 barn
|
Barn |
|
Vikt (gr) |
|
Apgar |
|
Kön |
|
1 |
|
3250 |
|
8 |
|
P |
|
2 |
|
3331 |
|
10 |
|
P |
|
3 |
|
3245 |
|
9 |
|
F |
|
4 |
|
3612 |
|
9 |
|
P |
|
5 |
|
2894 |
|
10 |
|
P |
|
6 |
|
3913 |
|
10 |
|
F |
|
7 |
|
4146 |
|
10 |
|
F |
|
8 |
|
2581 |
|
9 |
|
P |
|
9 |
|
2834 |
|
8 |
|
F |
Centralmått
Födelsevikt
Medelvärdet = (3250 + 3331 + 3245 + 3612 + 2894 + 3913 + 4146 + 2581 + 2834)/9 = 29806/9 = 3311.8
Medianen: 2581, 2834, 2894, 3245, ***3250***, 3331, 3612, 3913, 4146
Typvärde: saknas
Medelvärde (eng. mean) och median (eng. median) är lika i symmetriska fördelningar.
Om medelvärdet är större än medianen så är fördelningen skev åt höger och om medelvärdet är mindre än medianen så är fördelningen skev åt vänster.
En fördelning kan ha mer än ett typvärde (eng. mode) och brukar då beskrivas med antalet typvärden. En fördelning kan t. ex.sägas vara bimodal eller trimodal.
Födelseordning
|
Apgar score |
|
frekvens |
|
8 |
|
2 |
|
9 |
|
3 |
|
10 |
|
4 |
Medelvärdet = (8 + 10 + 9 + 9 + 10 + 10 + 10 + 9 + 8)/9 = 83/9 = 9.2 [?]
Medianen = 8, 8, 9, 9, ***9***, 10, 10, 10, 10
Typvärdet = 10
Kön
|
Kön |
|
Frekvens |
|
P |
|
5 |
|
F |
|
4 |
Medelvärde = ?
Median = ?
Typvärde = P
Typ av skala
|
Skala |
|
Rangordning |
|
Ekvidistanta skalsteg |
|
Exempel |
|
Nominalskala |
|
Nej |
|
Nej |
|
Kön |
|
Ordinalskala |
|
Ja |
|
Nej |
|
Apgar |
|
Intervallskala |
|
Ja |
|
Ja |
|
Vikt |
|
Skala |
|
Medelvärde |
|
Median |
|
Typvärde |
|
Nominalskala |
|
Nej |
|
Nej |
|
Ja |
|
Ordinalskala |
|
Nej |
|
Ja |
|
Ja |
|
Intervallskala |
|
Ja |
|
Ja |
|
Ja |
Spridningsmått
Födelsevikt
s^2 = (3250 -3311.8)^2 + (3331-3311.8)^2 + (3245-3311.8)^2 + (3612-3311.8)^2 + (2894-3311.8)^2 + (3913-3311.8)^2 + (4146-3311.8)^2 + (2581-3311.8)^2 + (2834-3311.8)^2)/8 = 2093058/8 = 261632.3
s = 511.5
Bättre beräkningsalgoritm för handräkning finns.
Variationskoefficienten, CV = standardavvikelsen/medelvärdet.
I vilken fördelning som helst ligger 75% av observationerna inom medelvärde +/- 2 standardavvikelser.
I normalfördelningen ligger 95% av observationerna inom medelvärde +/- 2 standardavvikelser.
|
Skala |
|
Standardavvikelse |
|
Percentiler |
|
Range |
|
Min-Max |
|
Antal skalsteg |
|
Nominalskala |
|
Nej |
|
Nej |
|
Nej |
|
Nej |
|
Ja |
|
Ordinalskala |
|
Nej |
|
Ja |
|
Ja |
|
Ja |
|
Nej |
|
Intervallskala |
|
Ja |
|
Ja |
|
Ja |
|
Ja |
|
Nej |
Grafisk presentation
|
Skala |
|
Histogram |
|
Stolpdiagram |
|
Cirkeldiagram |
|
Scattergram |
|
Nominalskala |
|
Nej |
|
Ja |
|
Ja |
|
Nej |
|
Ordinalskala |
|
Nej |
|
Ja |
|
Ja |
|
Nej |
|
Intervallskala, diskret |
|
Nej |
|
Ja |
|
Ja |
|
Ja |
|
Intervallskala, kontinuerlig |
|
Ja |
|
Nej |
|
Nej |
|
Ja |
Praktisk uppgift
Beskriv på en A4-sida, med lämpliga central- och spridningsmått och med grafisk presentation, klassmedlemmarnas kön, ålder, längd och vikt. Redovisa för klassen.