Database Tweede Kamerverkiezingen 2010

Bij The Prize Consultancy a/i/p. kunt u terecht voor software om politieke data te bewerken en verwerken. Met deze software, en deels handmatig, zijn de resultaten van de Tweede Kamerverkiezingen van 9 juni 2010 al voorbewerkt. Ik verkoop een (niet overdraagbare) licentie van de database. Het gaat om de uitslagen per stembureau van alle gemeenten, optellend tot de officieel vastgestelde einduitslag.

Deze dataset bevat zowel de uitslagen als geografische gegevens. De uitslagen zijn ook te verkrijgen bij de Kiesraad. Adresgegevens van de stembureaus zijn ook te verkrijgen bij elke gemeente afzonderlijk. De toegevoegde waarde van de dataset van The Prize Consultancy a/i/p. zit in de arbeid.

De arbeid

In een proces van ongeveer 70 uur heb ik alle adressen van de 9.539 stembureaus bij elkaar gezocht. Bovendien zijn er vier „virtuele” stembureaus: de briefstembureaus EU-landen, Aruba, Nederlandse Antillen en buiten EU. De 430 los aangeleverde gemeentelijke uitslagen zijn samen gezet. Elk stembureau is verder voorzien van een lengte- en breedtegraad-coördinaat. In een vorige versie van de database zijn in een proces van ongeveer 20 uur alle nog ontbrekende postcodes (6-positie) bij de stembureaus gezocht.

Versie 5 is vanaf augustus 2012 beschikbaar, en is in ongeveer 20 uur van de grond af opnieuw opgebouwd, gebruikmakend van de Basisregistraties adressen en gebouwen (BAG). Daarin zijn (in theorie) de kadastrale gegevens van alle gebouwen in Nederland opgenomen. Bovendien zijn nu alle rijksdriehoekscoördinaten opgenomen. Voor de omrekening tussen WGS84 (GPS) en Rijksdriehoeksstelsel zijn deze formules gebruikt, met een nauwkeurigheid van enkele centimeters.

Er zit veel handmatig werk in. Veel stembureaus hadden alleen een straataanduiding zonder huisnummer. Dat huisnummer is er zoveel mogelijk bijgezocht om exact de goede postcode en geocode te geven. Soms moest dat via Google Street View. Denk aan achteringangen van buurthuizen, parochiezaaltjes, enz. Andere adressen zaten niet in de BAG, en soms bevatte de BAG fouten. Er zijn na de automatische procedure handmatig 343 adressen gecorrigeerd. Als gevolg hiervan zijn alle adressen nu veel preciezer op de kaart geprikt.

Elke stap in de bewerking van de dataset had nieuwe correcties tot gevolg. Die hadden te maken met typfouten bij gemeenten, Friese straatnamen, op elkaar lijkende straatnamen (leidend tot verkeerde geocodes in nabijgelegen dorpen), enz. Zelfs verkeerd geschreven namen in Google Maps (Gerrit Th. Rotmanlaan in Almere met en zonder „h”). Met het gebruik van de BAG moet uiteindelijk verschil in spelling van straatnamen tot het verleden gaan behoren.

Verschillende versies

Op één gemeente na waren de adresgegevens online te vinden. Gemeente West Maas en Waal stuurde die per fax, hier terug te vinden als PDF.

West Maas en Waal is daarom ook mooi om te laten zien wat de dataset inhoudt. In dit geval een komma-gescheiden bestand, dat zich gemakkelijk laat openen o.a. in Excel. Klik hier, of rechtsklik erop om het bestand gemakkelijk te downloaden.

De kwaliteitsontwikkeling van de database is ook mooi in beeld te brengen met de subset van West Maas en Waal. Ik heb ze in Google Fusion gezet. NRC Handelsblad gebruikte een eerste versie, en deed daar zelf nabewerking op. Die kwam in juli 2010 online als „Wat stemden uw buren”. In Fusion heet die „BUREN”. Zelf deed ik een andere nabewerking, die via deze site te koop werd aangeboden. In Fusion heet die „OUD”. De nieuwe versie met de Bag heet in Fusion „BAG”. De Google Fusion-kaart zoomt in op Beneden-Leeuwen, maar u kunt zelf uitzoomen voor de hele gemeente West Maas en Waal. Zo kunt u zelf de kwaliteitsontwikkeling zien, via de knop „Location” in Google Fusion.

De dataset is te koop. U koopt daarmee een licentie op het toegevoegde werk. De achterliggende data zijn openbaar en gratis elders verkrijgbaar.

Zelf proberen

Wie de tijd spendeert kan dat werk zelf ook doen. Begin bijv. met de gemeente De Wolden. Een stembureau had als aanduiding „Prot.kerk Echten”. Zoek daar het adres bij, de geocode en de postcode. Nee, niet in Zuidwolde of Ruinerwold.

Of zoek de adressen van de stembureaus van Waalre. In het bestand van de Kiesraad staat alleen „Stembureau_1” t/m „Stembureau_9”.

Te Koop

De versie zoals nu te koop is 99,5% correct, voortkomend uit fouten die niet nader gecheckt kunnen worden en die door de gemeenten zelf verkeerd zijn opgegeven of verkeerd opgeslagen in hun online publicaties.

Een (niet overdraagbare) licentie voor het gebruik van de dataset is te verkrijgen à 1.600 Euro ex. BTW per licentie. Dat is inclusief de updates van de afgelopen jaren. Licentiehouders kunnen voor 400 euro ex. BTW de laatste versie verkrijgen.

De database 2010 is in principe niet gratis verkrijgbaar. Organisaties kunnen mij inhuren voor analyses, of zelf de database kopen. Onderzoekers kunnen mij uitnodigen om samen aan een publicatie te werken.