Uw enquêtegegevens wegen: Wat u moet weten en hoe u het goed kunt aanpakken

Leer hoe het wegen van enquêtegegevens steekproeffouten corrigeert om uw marktonderzoek echt representatief te maken. Deze gids legt de kernconcepten uit, weegt de voor- en nadelen af, en laat u zien hoe u wegingsfactoren effectief toepast.

Data Analysis

Feedback Management

Market Research

New Features / Product Updates

Survey Dashboards

Survey Design and Best Practices

Lees tijd 8 Min.

Melanie Vultorius

Weighting Your Survey Data What You Need to Know and How To DO It Right

Samenvatting

Dit blogartikel gaat in op het onderwerp gegevensweging en legt uit waarom het zo belangrijk is in het onderzoeksproces. Om u te helpen een beter begrip te krijgen op het gebied van de weging van enquêtegegevens, beginnen we met het definiëren ervan en schetsen we hoe Survalyzer het gebruikt. U kunt meer te weten komen over het onderscheid tussen gewogen en niet-gewogen gegevens in dit artikel. We nemen ook de voor- en nadelen van gegevensweging door en leggen uit hoe u daarmee meer controle zou kunnen krijgen over de door u verzamelde enquêtegegevens.

Inleiding

Het is voor vrijwel alle onderzoeken essentieel om erachter te komen hoe een populatie denkt, zich gedraagt of reageert. In sommige gevallen is de betrokken populatie beperkt tot een specifieke groep respondenten, zoals uw huidige klanten of leden van een panel. In andere gevallen moet het sample een grotere populatie vertegenwoordigen. En als uw sample niet representatief is met betrekking tot de gewenste populatie, kan het wegen van gegevens een geschikte manier zijn om metingen uit te voeren.

Wat houdt het wegen van enquêtegegevens in?

Het wegen van enquêtegegevens is een statistische techniek die in marktonderzoek wordt gebruikt om enquêteresultaten aan te passen zodat ze een accurate weergave van de doelpopulatie zijn. Hierbij worden verschillende gewichten toegekend aan verschillende antwoorden, op basis van bepaalde kenmerken zoals leeftijd, geslacht, etniciteit, enz. om ervoor te zorgen dat het sample de grotere populatie nauwkeurig weerspiegelt. Dit wordt gedaan om vertekening te minimaliseren en de betrouwbaarheid en geldigheid van de enquêteresultaten te vergroten.

Wanneer is het wegen van gegevens nuttig?

Door het wegen worden verschillen in de selectiekans en het non-responspercentage van de respondenten tegengegaan. Deze verschillen kunnen worden beïnvloed door demografische factoren zoals leeftijd, geslacht, opleiding, inkomen en locatie. In situaties van non-responsvertekening, over- of onderbevraging van bepaalde groepen, of beide, wordt aanbevolen de gegevens te wegen.

Oversampling is een steekproefstrategie waarbij sommige groepen doelbewust vaker worden geselecteerd dan andere om een steekproef te verkrijgen die groot genoeg is voor de analyse.

Undersampling is de tegenovergestelde methode, waarbij de steekproefomvang opzettelijk wordt verkleind om een gelijke vertegenwoordiging van verschillende groepen te waarborgen.

Van non-responsvertekening is sprake wanneer personen, die niet aan een enquête deelnemen, andere kenmerken of meningen hebben dan degenen die wel deelnemen, waardoor de resultaten onnauwkeurig of vertekend zijn. Dit kan ertoe leiden dat bepaalde aspecten van een populatie worden onder- of overschat, waardoor de gegevens vertekend worden weergegeven.

Het effect van niet-gewogen gegevens op de analyse en resultaten

Niet-gewogen gegevens kunnen leiden tot onnauwkeurige analyses. Er kunnen vertekeningen optreden door een ongelijke demografische vertegenwoordiging, wat de nauwkeurigheid van de resultaten beïnvloedt. Het effect van niet-gewogen gegevens blijkt uit het verschil tussen sample- en populatiegegevens. Als de samplegegevens de populatie niet nauwkeurig vertegenwoordigen, zullen de resultaten en de analyse een vertekend beeld geven, wat leidt tot onjuiste conclusies en een verkeerde besluitvorming.

Hoe werkt het wegen van enquêtegegevens in detail

De eerste stap bij het uitvoeren van een succesvol onderzoek is om te beginnen met een specifieke use case. In dit artikel richten wij ons op een use case voor gegevensverzameling waarbij het doel is inzicht te krijgen in de beleving van de algemene populatie ten aanzien van een specifiek onderwerp, zoals de beleving van de klimaatverandering.

1. Verzamelen van gegevens

Om gegevens voor dit onderzoek te verzamelen, moeten we eerst een vraag formuleren. In dit geval is de vraag: “In hoeverre beschouwt u de klimaatverandering als een bedreiging? Kunt u dat aangeven.” Zodra we de vraag hebben geformuleerd, kunnen we overgaan tot het verzamelen van demografische gegevens zoals geslacht, leeftijd, opleiding en regio.

Met betrekking tot het geslacht kunnen we gegevens verzamelen over:

vrouwen,
mannen,
en genderneutrale personen.

De term “genderneutraal” wordt vaak gebruikt als een verzamelcategorie voor personen die zich identificeren als non-binair of gender non-conform. Deze categorie kan complex zijn en vereist zorgvuldige bestudering bij het wegen van de gegevens. Het is belangrijk ervoor te zorgen dat alle respondenten goed vertegenwoordigd zijn in het uiteindelijke sample en dat hun antwoorden niet onopzettelijk vertekend worden door het wegingsproces.

Met betrekking tot leeftijd moeten we de leeftijdscategorieën in het desbetreffende geval controleren, zoals:

18-24 jaar
25-34 jaar
35-44 jaar
45-54 jaar
55-64 jaar

Zorg ervoor dat de antwoordcategorieën van uw vraag elkaar niet overlappen, bijv. antwoordcategorie 20-30 / 30-40 jaar maakt het moeilijk de juiste keuze te maken, wanneer u 30 jaar oud bent..

Onderwijs is ook een belangrijke demografische factor om rekening mee te houden. Enkele veel voorkomende categorieën zijn:

Geen enkele vorm van onderwijs
Basisonderwijs
Middelbaar onderwijs
Bachelordiploma
Masterdiploma
Doctoraatsdiploma

Deze categorieën kunnen duidelijk inzicht verschaffen in de opleidingsniveaus van de respondenten en hoe dat hun antwoorden op bepaalde vragen kan beïnvloeden. Het is van essentieel belang om bij de keuze van de juiste categorieën rekening te houden met de enquêtecontext en het doel ervan.

Regio is een andere belangrijke demografische factor die in het onderzoek moet worden opgenomen. In dit voorbeeld kunnen we de Nederlandse provincies als regio nemen.

Al deze factoren kunnen de selectie van respondenten en de percentages non-respons beïnvloeden. De kenmerken van de respondent, zoals zijn houding en gedrag, kunnen ook voor de weging worden gebruikt.

2. Ontwerp van de werkelijke verdelingstabel (verzamelde gegevens)

Na het verzamelen van de gegevens maken we de werkelijke verdelingstabel, die de verdeling van de antwoorden per demografische groep weergeeft.

Demografische groep	Percentage
Ongehuwde man	18.5%
Ongehuwde vrouw	18.7%
Gehuwde man	21.2%
Gehuwde vrouw	20.9%
Weduwnaar	2.3%
Weduwe	3.1%
Gescheiden man	4.7%
Gescheiden vrouw	6.6%

3. Kijk naar de verwachte verdelingstabel (echte populatiegegevens)

Een verwachte verdelingstabel laat zien hoe de verdeling van enquêteantwoorden eruit zou zien als de steekproef volledig representatief zou zijn voor de populatie. Dit soort tabel wordt vergeleken met de werkelijke verdelingstabel als een maatstaf om te zien of er opvallende veranderingen zijn die wijzen op een vertekening van de enquêtesteekproef.

Demografische groep	Percentage
Ongehuwde man	20%
Ongehuwde vrouw	16.9%
Gehuwde man	23.8%
Gehuwde vrouw	23.7%
Weduwnaar	1.4%
Weduwe	4.7%
Gescheiden man	4.1%
Gescheiden vrouw	5.4%

Als u naar verwachte verdelingstabellen zou willen kijken, welke bronnen kunt u dan gebruiken?

Destatis, BFS, en CBS zijn de erkende statistische instellingen van respectievelijk Duitsland, Zwitserland en Nederland, die enorm nuttig kunnen zijn bij het wegen van gegevens in marktonderzoek, vanwege hun betrouwbare en uitgebreide demografische gegevens over de populatie van deze landen.

Deze sites verschaffen gedetailleerde informatie over de kenmerken van verschillende demografische groepen zoals leeftijd, geslacht, opleiding en inkomen, die onderzoekers kunnen gebruiken om te garanderen dat de steekproef in een enquête de doelpopulatie vertegenwoordigt en om eventuele vertekeningen als gevolg van over- of undersampling te corrigeren.

4. Wegingsfactoren vergelijken en berekenen

In dit voorbeeld zagen we een overbevraging van vrouwen en respondenten uit één regio, wat tot vertekende resultaten kan leiden. Om dit te ondervangen, kunnen we door weging de gegevens zo aanpassen dat ze de werkelijke populatieverdeling weerspiegelen, zodat de resultaten representatiever voor de hele populatie zijn.

Stel, dat u de gegevens uit de vorige tabel wilt wegen voor geslacht en burgerlijke staat. Eerst berekent u dan de wegingsfactoren voor elke demografische groep door het verwachte percentage door het werkelijke percentage te delen:

Demografische groep	Verwachte verdeling	Werkelijke verdeling	Wegingsfactor
Ongehuwde man	20%	18.5%	1.08
Ongehuwde vrouw	16.9%	18.7%	0.90
Gehuwde man	23.8%	21.2%	1.12
Gehuwde vrouw	23.7%	20.9%	1.14
Weduwnaar	1.4%	2.3%	0.61
Weduwe	4.7%	3.1%	1.52
Gescheiden man	4.1%	4.7%	0.87
Gescheiden vrouw	5.4%	6.6%	0.82

Vervolgens past u deze wegingen toe op de enquêtegegevens. Als de enquête bijvoorbeeld 100 ongehuwde mannen zou tellen, zou u dat aantal met 1,08 vermenigvuldigen om de gewogen telling voor die groep te krijgen. U zou dit proces voor elke demografische groep kunnen herhalen.

Voor- en nadelen van gegevensweging

Zoals elke statistische methode, heeft het gebruik van enquêtegegevens zowel voor- als nadelen die moeten worden overwogen, voordat ze worden gebruikt. Dit hoofdstuk geeft u een overzicht van de voor- en nadelen van gegevensweging, zodat u het juiste moment kunt bepalen waarop deze wordt geïmplementeerd.

Voordelen

Helpt bij het corrigeren van non-respons vertekening, wat de nauwkeurigheid ten goede komt

Zorgt voor een betere vertegenwoordiging van minder vertegenwoordigde groepen

Maakt betrouwbare en robuuste statistische analyse en modellering mogelijk

Stemt steekproefgegevens af op bekende populatiegegevens

Verbetert de algemene kwaliteit en geldigheid van onderzoeksresultaten

Nadelen

Tijdrovend en duur om te implementeren, vooral wanneer het handmatig gebeurt

Kan leiden tot extra complexiteit en fouten in het gegevensanalyseproces

Het kan nodig zijn aannames over de onderliggende populatie te doen, wat tot onjuiste wegingen kan leiden

Kan niet geschikt of effectief zijn in alle onderzoekssituaties, met name in gevallen waarin een eenvoudige aselecte steekproef geschikt is

Resultaten kunnen moeilijker te interpreteren of aan belanghebbenden mee te delen zijn, vooral als de wegingsfactoren complex zijn of hen onbekend zijn

Hoe weging te gebruiken in Survalyzer

Bij het gebruik van weging in Survalyzer is de eerste stap het maken van een enquête en het verzamelen van gegevens. Zodra de gegevens zijn verzameld, is de volgende stap het maken van een wegingsdefinitie of het instellen van wegingen voor de enquête. Dit wordt gedaan door wegingsvariabelen te definiëren, zoals leeftijd, geslacht, inkomen en opleiding, en aan elke variabele een weegfactor toe te wijzen. We hebben alles uitgelegd in ons helpcentrumartikel over wegingsoplossingen.

Nadat de wegingsdefinitie is gemaakt, moet deze worden geüpload naar Survalyzer. Na het uploaden moet de enquête worden gesloten. Het berekeningsproces wordt geactiveerd, als de enquête wordt gesloten en de gewogen gegevens worden gegenereerd. Het is belangrijk op te merken dat het wegingsproces in Survalyzer flexibel is, zodat gebruikers de wegingen naar behoefte kunnen aanpassen en de gegevens op elk moment opnieuw kunnen berekenen. Door deze stappen te volgen, kunnen onderzoekers ervoor zorgen dat hun enquêtegegevens correct worden gewogen en nauwkeurige en representatieve inzichten opleveren.

In Survalyzer is weging van gegevens uitsluitend beschikbaar in het Professional Analytics-product, dat geavanceerde functies biedt voor de analyse van enquêtegegevens.

Uploading a weighting definition to Survalyzer

Conclusie

Over het algemeen is gegevensweging een effectieve techniek in marktonderzoek om ervoor te zorgen dat de resultaten nauwkeurig zijn. Het is een ingewikkeld proces, maar als het goed wordt uitgevoerd, zorgt het ervoor dat de enquêteresultaten de doelgroep weerspiegelen. Enquêtegegevens moeten worden gewogen op basis van factoren zoals demografie, kenmerken van de respondent en steekproefmethoden. Door betrouwbare bronnen van werkelijke populatiegegevens in de enquête te gebruiken, kunt u ervoor zorgen dat de steekproef de doelpopulatie vertegenwoordigt en kunt u eventuele vertekeningen die worden veroorzaakt door over- of undersampling corrigeren.

Auteur

Melanie Vultorius

Meer van Survalyzer