Mannen produceren meer afval?!

Op de foto zie je een koolmees mannetje dat een pakketje afval afvoert. Het nest moet schoon blijven, en dan kun je het afval afvoeren of opeten. Lekker circulair. Vrouwtjes schijnen dat opeten vaker te doen dan mannetjes, omdat ze de voedingsstoffen harder nodig hebben. Dus er is een verschil tussen de geslachten in de manier van afval afvoeren. Nu is het duidelijk dat mensen geen vogels zijn, maar ik word toch wel nieuwsgierig: is er bij mensen een verschil tussen mannen en vrouwen in wat ze met hun afval doen?

Het Centraal Bureau voor de Statistiek deelt gegevens over afvalproductie per gemeente en ook over de samenstelling van de bevolking per gemeente. In 2016 produceerden de meeste gemeenten tussen de 400 en 700 kg huishoudelijk afval per inwoner, iets minder dan vijf jaar geleden. Goed nieuws dus dat de totale hoeveelheid huishoudelijk afval afneemt af en ook dat er steeds meer gescheiden wordt ingezameld, zoals het CBS onlangs schreef.


Zouden gemeenten met een scheve man/vrouw verhouding evenveel afval produceren als gemeenten waar het aantal mannen en vrouwen in balans is? De meeste gemeenten zitten vrij dicht rond de 50% met hun man-vrouw verhouding, 80% valt tussen de 48.8% en de 50.7%. Weinig spreiding dus. En toch, als je het aantal kilo's afval per inwoner uitzet tegen het percentage man in een gemeente lijkt er wel een positieve relatie te zijn. Met elk procent meer man in een gemeente neemt de afvalproductie gemiddeld met 25 kilo toe. Nu is het wel zo dat er een uitschieter is van een gemeente met heel hoge afvalproductie, wat veel invloed heeft op het model; als dat punt genegeerd wordt, dan is de schatting 17 kilo erbij met elke procent meer man.


De uitschieter is overigens Schiermonnikoog. Een gemeente met veel toerisme en een hoge afvalproductie per inwoner, zou dat met elkaar te maken hebben? Dat is een mooie vraag en natuurlijk het topje van de ijsberg, want gemeenten kunnen in zoveel dingen verschillen: het aantal inwoners of ook bijvoorbeeld oppervlakte cultuurgrond. Onderling kunnen die factoren ook weer samenhangen, zo blijken gemeenten met relatief veel mannen ook een groot oppervlakte cultuurgrond hebben.


Als je nu al die factoren (aantal inwoners, toerisme, oppervlakte cultuurgrond) ook meeneemt in het model, dan is het percentage man opeens niet meer significant. Een mooi voorbeeld van verklarende variabelen die gecorreleerd zijn.

En wat is nu het beste model? Ja, dat hangt ervan af wat nu precies de vraag is. Wil je weten wat de oorzaak is voor een hogere afvalproductie? Dan is gericht en gecontroleerd onderzoek nodig. Gaat het alleen om welke data de meest accurate voorspelling van de hoeveelheid afval geeft, los van de werkelijke oorzaak? Dan verdelen we de dataset in een test en train dataset en bekijken welk model het beste voorspelt. In ons geval is dat oppervlakte cultuurgrond en aantal inwoners, waarbij grotere oppervlakten cultuurgrond geassocieerd zijn met meer afval, en een hoog aantal inwoners juist met minder afval per inwoner. Hierbij moet benadrukt worden dat we kijken naar totaal huishoudelijk afval, dus inclusief gft, grof vuil etc. Als men alleen kijkt naar huishoudelijk restafval, verandert het plaatje compleet: met elke procent meer man in de gemeente neemt de productie van huishoudelijk restafval juist af met 27 kilo, terwijl ook toerisme en het aantal inwoners in het model voorkomen.

Voor sommigen misschien redenen om een veelgebruikt citaat aan te halen over lies en statistics; voor mij gewoon leuk om te zien wat er beschikbaar is aan open data. Dit laat zien wat de mogelijkheden zijn, en illustreert ook valkuilen zoals de rol van uitschieters en gecorreleerde variabelen.

Bronnen: CBS