I medicin er det vigtigt at kende noget til statistik, da man med statistik kan vurdere evidensen af nye medicinske forskningsresultater. I denne artikel defineres nogle af de vigtigste statistiske begreber og værktøjer der er relevante i medicinsk statistik.
Middelværdien
Der findes flere slags gennemsnit af et datasæt, hvoraf det mest almindelige er middelværdien.
Den generelle gennemsnitslige værdi i et datasæt kaldes for middelværdien og kan bl.a. symboliseres ved at sætte en streg over symbolet for hver enkelt værdi.
Hvor er middelværdien er den enkelte obervation i datasættet og er antallet af observationer.
Medianen
Medianen er den værdi der deler et datasæt i to halvdele. Hvis man sorterer datasættet efter stigende værdier, er medianen den værdi der er i midten, dvs. værdi nummer:
Hvor er antallet af observationer.
Mode
Mode er den værdi der forekommer mest ofte i et datasæt.
Relative risk (RR)
Den relative risiko er risikoen i en casegruppe divideret med risikoen i en kontrolgruppe.
Odds ratio (OR)
Odds ratio er forholdet mellem odds i en casegruppe og odds i en kontrolgruppe.
t-test
En t-test sammenligner to populationer og man undersøger om man kan antage at middelværdierne i de to populationer er identiske.
Nulhypotesen
Nulhypotsen er en hypotese man stiller for at bevise at noget er sandt, som f.eks. at et lægemiddel virker. I stedet laver man så en hypotese for det modsatte, dvs. at lægemidlet ikke virker og så forsøger man at afvise hypotesen.
Den modsatte hypotese, for at lægemidlet virker, kalder man den alternative hypotese.
Formålet er at det er nemmere at bevise at en hypotese er falsk, end at bevise at den er sand.
p-værdier
En p-værdi er et tal man udregner for at vurdere om et forsøg der viser der er en forskel mellem to værdier er ren tilfældighed, eller om der faktisk er en forskel (under antagelse af at forsøget er ordentligt designet). Man siger at en p-værdi under 0,05 betyder at resultatet er statistisk signifikant.
p-værdien er en sandsynlighed for at vi ville observere vores værdier, selvom observationen var falsk. Dvs. det er sandsynligheden for at nulhypotesen er sand. Derfor skal p-værdien helst være så lav som muligt.
Det er en konvention at en p-værdi under 0,05 er statistisk signifikant, ligesom det er en konvention at værdier i et 95% konfidensinterval er statistisk signifikant. En p-værdi under 0,01 kalder man meget statistisk signifikant.
Konfidensinterval
Et 95% konfidensinterval er et interval omkring middelværdien, hvor det er 95% sandsynlighed for at den sande værdi ligger i. Det anvendes ofte til at vurdere om et resultat er statistisk signifikant.
Hvor er middelværdien, er standardafvigelsen og er antallet af observationer.
Hvis intervallet der beregnes befinder sig omkring værdien der viser at der ikke er nogle forskelle mellem observationer (nulhypotesens værdi), betyder dette at resultatet ikke er statistisk signifikant. Vær dog opmærksom på at selvom et konfidensinterval viser at et resultat er statistisk signifikant, vil resultatet stadig kunnne være påvirket af bias.
Vær også opmærksom på at selvom resultatet ikke er statistisk signifikant, betyder dette ikke at resultatet er falsk. Et større forsøg kunne have vist statistisk signifikans.
Bemærk at man også kan udlede p-værdien udfra et konfidensinterval. Hvis nulhypotesens værdi er indeholdt i konfidensintervallet er p>0,05, mens hvis intervallet ikke indeholder nulhypotesens værdi er p<0,05.
Bias
Bias er et begreb der dækker alle mulige systematiske fejl i forbindelse med et forsøg, pga. den måde forsøget blev designet, udført eller udledning af resultater.
Sidst opdateret 30. maj 2023