At bestemme kvartilsæt
Indhold
-
At finde kvartilsæt i ikke-grupperet datamateriale
-
At finde kvartilsæt i grupperet datamateriale
Et regneark er særdeles velegnet til at behandle datamateriale. Når man har et datamateriale, skal man fra en begyndelse vælge metode til at behandle materialet. Her beskriver vi to metoder:
-
Når man sorterer sit materiale i intervaller (i "kasser") fordi materialet er meget stort. Dette kalder man at man grupperer materialet.
-
Når materialet ikke kræver en sortering, kalder man materialet for ikke-grupperet.
Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.
Når man arbejder med boksplot, kan man både beskrive et grupperet og et ikke-grupperet materiale i et boksplot. Et boksplot kræver imidlertid at man har den mindste og den største værdi (minimum og maksimum). Når man arbejder med grupperet materiale, er det ikke altid man har oplysninger om mindste- og størsteværdi. Det kan f.eks. være en indkomstfordeling fra Danmarks Statistik hvor der måske var 32 % af borgerne i en kommune der tjente over 400 000 kr. i 2003.
I nogle tilfælde er det en forholdsvis lille del af materialet detligger uden for oplyste værdier. Det kan være at 3 % af de 15-24-årigeborgere i en kommune tjente over 400 000 kr. i 2003. Man kan derforvælge at se bort fra op til 5 % materiale i bunden og i toppen, forderved at få en mindste- og størsteværdi til et boksplot. Dette kræver naturligvis at man tydeligt gør opmærksom på det i sin fremlæggelse af databehandlingen.
Et boksplot kræver følgende oplysninger:
-
Den mindste værdi i materialet (minimum)
-
Den største værdi i materialet (maksimum)
-
Nedre kvartil
-
Median
-
Øvre kvartil
At finde kvartilsæt i ikke-grupperet datamateriale
Hvis et materiale er overskueligt, er det lettest at finde kvartilsættet på følgende måde:
Eksempel med ulige antal data
4 | 6 | 10 | 12 | 18 | 18 | 22 | 29 | 31 | 35 | 38 | 44 | 50 |
Her kan vi umiddelbart aflæse at minimum er 4 og maksimum er 50. For at finde medianen finder vi det midterste tal der her er 22. Vi finder dernæst den midterste værdi af dataene under medianen og derefter den midterste værdi af dataene over medianen. Dette kan anskueliggøres således:

Den nedre kvartil udregnes som:
Den øvre kvartil udregnes på samme måde som:
Eksempel med lige antal data
Hvis det er et lige antal data, bliver det medianen der ikkeumiddelbart kan aflæses, men den nedre og den øvre kvartil umiddelbart kan aflæses. Vi markerer her igen med pile:

Vi beregner her medianen til:
. Nedre kvartil aflæses til 140, men den øvre kvartil aflæses til 240.
Det kan også være at man har et stort datamateriale som man ikke ønsker at gruppere fordi man har dataene liggende i sit regneark. I et sådant tilfælde kan Excel finde kvartilsættet på følgende måde, idet vores data her står i cellerne A1 til A100:
-
Nedre kvartil: I en celle skriver man: =kvartil(A1:A100;1). Dernæst trykker man "Enter".
-
Median: I næste celle skriver man: =kvartil(A1:A100;2). Igen efterfulgt af "Enter".
-
Øvre kvartil: Endelig skriver man: =kvartil(A1:A100;3). Også efterfulgt af "Enter".
Hvis det er vanskeligt at overskue hvad der er minimum og maksimum, kan Excel finde dem på samme måde som kvartilsættet. Her skriver man blot 0 for minimum og 4 for maksimum, altså:
-
Minimum: I en celle skriver man: =kvartil(A1:A100;0) efterfulgt af "Enter".
-
Maksimum: I en celle skriver man: =kvartil(A1:A100;4) efterfulgt af "Enter".
At finde kvartilsæt i grupperet datamateriale
Hvis et datamateriale er grupperet, finder man kvartilsættet vha.sumkurven - som det er beskrevet i bogen s. 185-188. Se evt.vejledningen "At tegne sumkurve vha. Excel" her på hjemmesiden.