Haalt mijn auto de APK van volgend jaar: gebruik van open data van RDW

Onderweg van werk naar huis werd ik ingehaald door een auto die mijn aandacht trok: het was een groot en ongewoon model, en afgaand op het vintage uiterlijk, met al vele jaren ervaring op de teller. De discussie aan de keukentafel over welk merk auto het nu precies kon zijn geweest, werd eenvoudig (en in mijn nadeel) beslecht door het gememoriseerde kenteken op te zoeken in de database van RDW. Het was een Chevrolet Malibu, met een bouwjaar dat precies mijn geboortejaar bleek te zijn. Inderdaad vele jaren ervaring dus. Via de RDW is een schat aan data op te vragen en daar is veel meer mee te doen dan een simpele kenteken-check van merk en bouwjaar. Uit de tabel met gekentekende voertuigen blijkt bijvoorbeeld dat van de bijna 14 miljoen voertuigen er maar 470 Chevrolet Malibu zijn. Ongeveer 1 op de 29650, dat is behoorlijk zeldzaam. In de dataset zitten ook bromfietsen, motorfietsen en nog wat voertuigsoorten. Als je alleen naar personenauto’s kijkt, is het nog steeds 1 op de 19900, nog steeds zeldzaam. Ter vergelijking een ander, vrijwel willekeurig, merk en model, de Volkswagen Golf: 1 op de 26 personenauto’s blijkt er eentje te zijn. Het voordeel van ‘gewoon’ is dat er heel veel data is om mee te werken, en dus kunnen meer nauwkeurige uitspraken gedaan worden dan voor zeldzame auto’s.

Wanneer je de kenteken tabel combineert met gebreken waarop voertuigen zijn afgekeurd voor de APK kun je uitzoeken welk afkeurpunt het vaakst voorkomt in de meer dan 21 miljoen rijen met geconstateerde APK gebreken voor alle auto’s, en of dat ook het geval is voor je favoriete merk.


Dus de top vier komt neer op niet functionerend licht, afgesleten banden en olielekkage, geen grote verrassingen. Of de slijtage aan de stuur- of fuseekogel typisch is voor Chevrolet Malibu verdient wellicht weer aandacht, al is dat slechts voor een kleine groep relevant. Interessanter voor een groter publiek is of er verband is tussen afkeurpunten over de jaren heen. Als je auto eenmaal wordt afgekeurd, heb je dan het jaar daarop ook meer kans op hetzelfde, of een ander gebrek? Dat hebben we onderzocht voor auto’s van het merk Volkswagen Golf met behulp van de eerder genoemde datasets. Tussen maart 2014 en april 2017 werden 101190 exemplaren op meer dan 1 datum afgekeurd.

De netwerken hieronder laten zien waar de belangrijkste verbanden liggen. De grootte van de cirkels geeft aan hoe vaak een gebrek voorkomt. De kleur van de cirkel geeft de categorie van het gebrek aan, bijvoorbeeld bruin voor olie en grijs voor uitlaat. De lijnen tussen de cirkels geven aan welke gebreken het vaakst na elkaar voorkomen. Een lijn terug naar dezelfde cirkel betekent een gebrek dat zich blijft herhalen, dat is bijvoorbeeld bij overmatige olielekkage het geval.


Bij Cabriolet en Hatchback treedt olielekkage in verhouding wat vaker op dan bij de Stationwagon. Dat hoeft niet aan het model op zich te liggen, het kan ook te maken hebben met de leeftijd van de auto’s.


In bovenstaand figuur is te zien dat het aantal exemplaren dat meer dan 1 keer werd afgekeurd tussen maart 2014 en april 2017 sterk toeneemt met leeftijd. Auto’s toegelaten in 2012 werden in 7.5% gevallen meer dan een keer afgekeurd tussen maart 2014 en april 2017; voor auto’s uit 2006 is dat al 45%.


Het merendeel van de meervoudig afgekeurde exemplaren bestaat uit hatchbacks; de meeste stationwagons zijn van veel recentere datum dan de hatchbacks en komen dus nog niet zo vaak voor met APK geconstateerde gebreken. Dus een goede vergelijking houdt ook rekening met leeftijd van de auto, en allerlei andere factoren die ook mogelijk invloed hebben. Denk aan gewicht, kilometerstand, of brandstof, is het een bedrijfsauto, etc. Het doel voor nu is om te laten zien wat er mogelijk is met publieke data; dit kan zowel voor particulieren als bedrijven interessant zijn.

De kop boven het artikel is kort; de vraag is waarschijnlijk niet of de APK gehaald wordt, maar wat het gaat kosten om volgend jaar de APK te passeren, hoe verhoudt dat zich tot de dagwaarde van de auto, en wat gaat een vervangend exemplaar kosten. De historie van dat vervangend exemplaar wordt natuurlijk wel eerst grondig bestudeerd. Voor inzicht in tussentijdse kosten is het nog zoeken naar een databron. Voor een uitgebreid overzicht van tweedehands vraagprijzen voor een bepaald merk en model is Gaspedaal een mooie bron. Mooi onderwerp voor een vervolgartikel.

Mocht u vragen hebben zoals: welke producten worden door mijn klanten na elkaar aangeschaft? Of: Wat is het verband tussen storingen in onze machines? Neem dan contact op met Nextgem (mail info@nextgem.nl of bel Marcel Boeren 064 682 0513) om te zien wat wij voor u kunnen betekenen.

Dit artikel is gebaseerd op data van RDW , geanalyseerd in R versie 3.4.1 met gebruik van ‘igraph’ voor de netwerkvisualisatie.

Mon, 14 May