Beskrivande statistik

Data från en population eller ett stickprov kan beskrivas genom uppräkning av egenskaper (om materialet inte är för stort) eller med sammanfattande mått som anger: 1) antal observationer 2) observationernas centralvärde och 3) variabilitet eller spridning. Data kan också beskrivas grafiskt. Här följer ett exempel som visar på huvudregler för att beskriva data.

 

Exempel: Födelsevikt, Apgar och kön hos 9 barn

Barn

 

Vikt (gr)

 

Apgar

 

Kön

1

 

3250

 

8

 

P

2

 

3331

 

10

 

P

3

 

3245

 

9

 

F

4

 

3612

 

9

 

P

5

 

2894

 

10

 

P

6

 

3913

 

10

 

F

7

 

4146

 

10

 

F

8

 

2581

 

9

 

P

9

 

2834

 

8

 

F

 

Centralmått

Födelsevikt

Medelvärdet = (3250 + 3331 + 3245 + 3612 + 2894 + 3913 + 4146 + 2581 + 2834)/9 = 29806/9 = 3311.8

Medianen: 2581, 2834, 2894, 3245, ***3250***, 3331, 3612, 3913, 4146

Typvärde: saknas

Medelvärde (eng. mean) och median (eng. median) är lika i symmetriska fördelningar.

Om medelvärdet är större än medianen så är fördelningen skev åt höger och om medelvärdet är mindre än medianen så är fördelningen skev åt vänster.

En fördelning kan ha mer än ett typvärde (eng. mode) och brukar då beskrivas med antalet typvärden. En fördelning kan t. ex.sägas vara bimodal eller trimodal.

 

Födelseordning

Apgar score

 

frekvens

8

 

2

9

 

3

10

 

4

 

Medelvärdet = (8 + 10 + 9 + 9 + 10 + 10 + 10 + 9 + 8)/9 = 83/9 = 9.2 [?]

Medianen = 8, 8, 9, 9, ***9***, 10, 10, 10, 10

Typvärdet = 10

 

Kön

Kön

 

Frekvens

P

 

5

F

 

4

Medelvärde = ?

Median = ?

Typvärde = P

 

Typ av skala

Skala

 

Rangordning

 

Ekvidistanta skalsteg

 

Exempel

Nominalskala

 

Nej

 

Nej

 

Kön

Ordinalskala

 

Ja

 

Nej

 

Apgar

Intervallskala

 

Ja

 

Ja

 

Vikt

 

Skala

 

Medelvärde

 

Median

 

Typvärde

Nominalskala

 

Nej

 

Nej

 

Ja

Ordinalskala

 

Nej

 

Ja

 

Ja

Intervallskala

 

Ja

 

Ja

 

Ja

 

Spridningsmått

Födelsevikt

s^2 = (3250 -3311.8)^2 + (3331-3311.8)^2 + (3245-3311.8)^2 + (3612-3311.8)^2 + (2894-3311.8)^2 + (3913-3311.8)^2 + (4146-3311.8)^2 + (2581-3311.8)^2 + (2834-3311.8)^2)/8 = 2093058/8 = 261632.3

s = 511.5

Bättre beräkningsalgoritm för handräkning finns.

 

Variationskoefficienten, CV = standardavvikelsen/medelvärdet.

I vilken fördelning som helst ligger 75% av observationerna inom medelvärde +/- 2 standardavvikelser.

I normalfördelningen ligger 95% av observationerna inom medelvärde +/- 2 standardavvikelser.

 

Skala

 

Standardavvikelse

 

Percentiler

 

Range

 

Min-Max

 

Antal skalsteg

Nominalskala

 

Nej

 

Nej

 

Nej

 

Nej

 

Ja

Ordinalskala

 

Nej

 

Ja

 

Ja

 

Ja

 

Nej

Intervallskala

 

Ja

 

Ja

 

Ja

 

Ja

 

Nej

 

Grafisk presentation

Skala

 

Histogram

 

Stolpdiagram

 

Cirkeldiagram

 

Scattergram

Nominalskala

 

Nej

 

Ja

 

Ja

 

Nej

Ordinalskala

 

Nej

 

Ja

 

Ja

 

Nej

Intervallskala, diskret

 

Nej

 

Ja

 

Ja

 

Ja

Intervallskala, kontinuerlig

 

Ja

 

Nej

 

Nej

 

Ja

 

Praktisk uppgift

Beskriv på en A4-sida, med lämpliga central- och spridningsmått och med grafisk presentation, klassmedlemmarnas kön, ålder, längd och vikt. Redovisa för klassen.