Forskning går ofte ut på å finne en sammenheng mellom ulike fenomener. Formålet kan være å se nærmere på hva som påvirker klimaet, hvorfor en populasjon går ned i ett område, eller om det er sammenheng mellom livsstil og spesifikke sykdommer. Det er imidlertid viktig å forstå forskjellen mellom korrelasjon og årsakssammenheng. Forvirringen mellom disse begrepene kan av og til gi de merkeligste konklusjoner.
Korrelasjon
Korrelasjon er å se på sammenhengen mellom forskjellige faktorer. Kan vi si noe om hvor sterk sammenhengen er? Hva kan vi gjøre for å redusere effekten av uheldige faktorer? ? Hva er sannsynligheten for at bestemte parametere virker inn på en situasjon, og i hvor stor grad? Er det sammenheng i det hele tatt?
Ulike varianter av korrelasjon
En korrelasjon viser sammenhengen mellom to variable parametere. Korrelasjonen skrives som en funksjon mellom -1 og 1. Dersom sammenhengen er sammenfallende, oppgis korrelasjonen som 1. Motsatt vil -1 påvise at det er negativ sammenheng.
Når vi har positiv korrelasjon, forteller det oss at de to faktorene påvirker hverandre i takt, mens det motsatte er tilfelle med negativ korrelasjon; de variable faktorene som blir belyst, påvirker hverandre i utakt.
En korrelasjon er ikke alltid det samme som en årsakssammenheng
Korrelasjon betyr ikke at det er en årsakssammenheng mellom to variable faktorer, selv om det ved første øyekast kan se slik ut. Det er lett å falle for fristelsen til å foreta litt for raske konklusjoner. Det er som med Jeppe på Berget: ”En sten kan ikke flyve. Mor Nille kan ikke flyve. Ergo er mor Nille en sten”.
Et klassisk eksempel er den feilaktige konklusjonen om at det oppstår større materielle skader når det er flere brannmenn som deltar i brannslukkingen enn tilsvarende branner der det er færre brannmenn til stede. Det er ingen årsakssammenheng i dette tilfellet selv om korrelasjonen er sterk. Forklaringen er heller at ved store branner deltar flere brannmenn i utrykningen og at større branner logisk nok forårsaker større materielle skader.
Et annet eksempel er sterk korrelasjon mellom barns matematikkprestasjoner og hvilket skonummer de bruker. Selv om det kan se ut til å være en årsakssammenheng er det heller slik at eldre barn har lært mer matematikk og derfor gjør det bedre enn yngre barn. Som regel har også eldre barn større sko.
Usikkerhet, faktorenes rekkefølge og bakenforliggende faktorer
Ønsker vi å finne ut av om det er årsakssammenheng mellom to variabler, må vi være sikre på at årsaken kommer før effekten et gitt tidsforløp. Det må være korrelasjon mellom årsaks- og effektvariabelen (statistisk sammenheng).
Det må foreligge bevis for at sammenhengen ikke er falsk eller tilfeldig. I tillegg må vi sjekke at det ikke er bakenforliggende årsaker som samtidig påvirker begge faktorene, både årsak og virkning.
Vitenskap
I vitenskapen er det meget viktig å kunne finne hvilke faktorer som påvirker hva. Dette er ikke alltid like enkelt, og det hender at vi ser undersøkelser som feilaktig mener å påvise at to ting henger sammen, når det egentlig kun er snakk om tilfeldigheter. Derfor forsøker man i forskningen å isolere alle faktorer slik at man er mer sikre på hva som påvirker hva.
Les også: Hvordan bruke sammensatte ord