• Hoved
  • Nyheter
  • Oversampling brukes til å studere små grupper, ikke forutinntatningsresultater

Oversampling brukes til å studere små grupper, ikke forutinntatningsresultater

Hvert valgår dukker det opp spørsmål om hvordan avstemningsteknikker og -praksis kan forvride avstemningsresultatene på en eller annen måte. I de siste ukene før valget i år er praksisen med 'oversampling' og dens mulige effekt på presidentens meningsmålinger i medias søkelys.

Oversampling er praksisen med å velge respondenter slik at noen grupper utgjør en større andel av undersøkelsesutvalget enn de gjør i befolkningen. Oversampling av små grupper kan være vanskelig og kostbart, men det gjør at meningsmålingene kan belyse grupper som ellers ville være for små til å rapportere om.

Dette kan høres ut som om det vil gjøre undersøkelsen lite representativ, men spørreundersøkelser retter opp dette gjennom vekting. Med vekting blir grupper som ble overprøvd brakt tilbake i tråd med deres faktiske andel av befolkningen - noe som fjerner potensialet for skjevhet.

Når folk tenker på meningsmålinger, kan de tenke seg å ta et tilfeldig utvalg av alle voksne i USA der alle har samme sjanse til å bli valgt. Når dette er valgt, vil utvalget i gjennomsnitt se ut som hele befolkningen når det gjelder andelen som tilhører forskjellige grupper.

For eksempel bør prosentandelen menn og kvinner eller andelen yngre og eldre komme nær deres sanne andel av befolkningen. For telefonundersøkelsene som Pew Research Center gjennomfører, er prosessen litt mer komplisert (for å redegjøre for ting som mobiltelefoner og det faktum at ikke alle svarer på undersøkelser), men vanligvis vil vi at alle voksne skal ha like sjanse for å være valgt i prøven.

Dette fungerer veldig bra hvis du er interessert i befolkningen generelt, men ofte vil vi vite hva forskjellige typer mennesker tenker om spørsmål og hvordan de sammenligner seg med hverandre. Når vi er interessert i å lære om grupper som bare utgjør en liten andel av befolkningen, kan den vanlige tilnærmingen gi oss for få mennesker i hver gruppe til å produsere pålitelige estimater. Når vi ønsker å se nøye på små grupper, må vi utforme utvalget på en annen måte slik at vi har nok respondenter i hver gruppe til å analysere. Vi gjør dette ved å gi medlemmer av den lille gruppen en større sjanse for å bli valgt enn alle andre.



Et godt eksempel er en Pew Research Center-undersøkelse fra juni i år, der vi ønsket å fokusere i dybden på den amerikanske spanske befolkningen. I forrige undersøkelse fra mars var det 291 spansktalende respondenter av 2254 totale respondenter, eller 13% av utvalget før vekting. Dette er ganske nær den sanne latinamerikanske andelen av befolkningen (15%), men vi ønsket å ha mer enn 291 personer som svarte, slik at vi kunne gjøre en grundigere analyse. For å ha et større utvalg av latinamerikanere i juni, undersøkte vi 543 latinamerikanere av 2245 respondenter totalt, eller 24% av det uvektede utvalget. Dette ga oss et mye større utvalg å analysere, og gjorde estimatene for Hispanics mer presise.

Hvis vi bare stoppet her, ville estimater for den totale befolkningen overrepresentere latinamerikanere. I stedet veier vi dem ned igjen, slik at når vi ser på hele utvalget, faller andelen latinamerikanere tilbake i tråd med deres faktiske andel av befolkningen. På denne måten har vi fortsatt mer presise estimater når vi ser på Hispanics spesifikt, men vi har også riktig fordeling når vi ser på prøven som helhet.

Pew Research Center's 2014 Religious Landscape Survey brukte også oversampling i stater som Wyoming, slik at forskere kunne lage pålitelige estimater om Wyomingites 'religiøse tro og praksis. Takket være oversampling intervjuet vi 316 Wyoming-innbyggere, i stedet for anslagsvis 63 under en ikke-oversampling-design. Vektingen av undersøkelsen justert for dette ved å tilpasse 0,9% av respondentene fra Wyoming til deres faktiske andel av andelen av den amerikanske befolkningen (0,2%).

Facebook   twitter