Gratis: heel veel gegevens
Lees hier het pdf van dit artikel.
Allerlei instanties verzamelen ontzettend veel gegevens. Gegevens over bedrijven, over mensen, over locaties. Vaak zijn deze gegevens niet vrij toegankelijk voor anderen. Dat is jammer, meent Sebastiaan ter Burg. Open data hebben veel economische en maatschappelijke voordelen. Door veel te meten, én te verspreiden, komen we met z’n allen meer te weten.
Door Sebastiaan ter Burg
Gaat het zo regenen? Kan ik nog even naar de supermarkt fietsen? Veel mensen kijken voor dit soort vragen even naar Buienradar. Misschien doet u dat zelf ook wel eens. De gegevens die Buienradar nodig heeft om u dit te vertellen verzamelt het bedrijf niet zelf. Het maakt gebruik van de data die het KNMI tegen betaling beschikbaar stelt voor hergebruik. Een slimme ondernemer wist deze data net wat begrijpelijker weer te geven dan het KNMI. Aan elk gebruik van de site en de applicaties verdiende hij geld en inmiddels is Buienradar voor een onbekend bedrag verkocht aan RTL.
Buienradar wordt vaak aangehaald als hét schoolvoorbeeld van een succesvolle data toepassing. Helaas is dit echter nog geen open data toepassing: de data is nog niet toegankelijk voor anderen, vaak door een hoge financiële drempel.1 Net zoals bij het KNMI vloeien wereldwijd dagelijks vele gigabytes aan gegevens bij serverparken binnen. Bijna al deze gegevens blijven nu nog achter gesloten deuren van de verzamelende organisaties. Dat is jammer, want met die gegevens kunnen geen nieuwe ‘buienradars’ worden gebouwd. Organisaties worden vanuit verschillende hoeken opgeroepen om hun data beschikbaar te stellen als open data. Een goed plan, zo betoog ik in dit artikel.
Economische waarde
Open data betekent dat bepaalde data hergebruikt, verwerkt en hergepubliceerd mag worden zonder restricties zoals copyright, patenten of andere controlemechanismen. Het idee van open data is niet nieuw. Het volgt in de voetsporen van andere ‘open’ bewegingen, zoals open source (het beschikbaar stellen van software) en open content (tekst, foto’s, video’s, muziek). De lijst met ‘open’ stromingen is nog veel langer, maar in de basis is het idee hetzelfde.
Voorstanders van open data toepassingen wijzen in de eerste plaats op de toegevoegde economische waarde van vrij beschikbare gegevens. Gegevens worden wel het nieuwe goud genoemd. ‘… data is gold. We have a huge goldmine in public administration. Let’s start mining it’, zei Neelie Kroes, vice-president van de Europese Commissie bij de presentatie van de open data strategie van de Europese Commissie. 2 Op Europees niveau wordt de economische waarde van open data geschat op minstens € 27 miljard. 3 Die waarde wordt niet alleen toegekend aan de ontwikkeling van nieuwe diensten – mogelijk gemaakt door vrij beschikbare data – maar ook aan besparingen bij organisaties en bij overheden. Deze besparingen zitten in dubbel werk dat niet meer gedaan hoeft te worden en in taken die overgelaten kunnen worden aan anderen. Alhoewel deze ramingen onder vuur liggen zijn er al vele voorbeelden waarbij de waarde van open data is aangetoond.4 In Oostenrijk steeg het gebruik van geografische, meteorologische en wettelijke data met 7000% nadat de verstrekking ervan werd verlaagd naar marginale kosten. Door de kostenverlaging durfden veel meer (kleine) ondernemers te investeren in het ontwikkelen van nieuwe diensten op basis van deze data. In Canada werd voor 3.2 miljard Canadese dollars aan belastingfraude gevonden door een onderzoeksjournalist.5 Zonder de openbare gegevens had hij deze fraude niet kunnen vinden.
Net zoals een goudmijn is ruwe data overigens niet ‘zomaar’ door iedereen te gebruiken. Het vraagt expertise en creativiteit om daar iets moois van te maken, zoals diensten die het dagelijks leven makkelijker en leuker maken. En dat kan best lucratief zijn, zoals Buienradar bewijst. Consumenten zijn namelijk steeds meer bereid te betalen voor dit soort diensten: door een applicatie te kopen of een abonnement af te sluiten, door hun tijd en aandacht te spenderen aan reclameboodschappen of door zelf gegevens te leveren die de dienstverlening weer kunnen verbeteren. Voorbeelden van diensten waar dat al bij gebeurt zijn ‘live file-informatie’ waarmee je route onderweg aangepast wordt om files te ontwijken.
Hiervoor moet iemand een abonnement afsluiten, maar het navigatiesysteem levert vervolgens ook weer data terug aan de dienst. Of hardlopen met je GPS zodat je je snelheid en afstand tijdens het lopen kunt aflezen en de training live door je vrienden bekeken kan worden. Met de toenemende beschikbaarheid van smartphones, tablets, internet-tv’s en mediastreamers wordt verwacht dat deze markt de komende jaren sterk zal groeien.
De successen zoals Buienradar zijn echter schaars. Het grootste obstakel voor deze markt is dat de data niet beschikbaar is of dat er een financiële drempel is die de data voor een kleine ondernemer onbereikbaar maakt. Door de data beschikbaar te maken kan deze dienstensector een grote impuls krijgen.
Maatschappelijke waarde
Naast de financiële voordelen zijn de maatschappelijke kansen misschien nog wel belangrijker. Deze kans doet zich voornamelijk voor bij de data van de overheid. Open overheidsdata kan transparantie en participatie bevorderen, en daarmee democratische processen versterken: het vergroot democratisch engagement.6 Het beschikbaar stellen van data maakt het namelijk mogelijk dat de samenleving – mensen tezamen – taken van de overheid terugneemt. Zo zou het knmi de hoeveelheid uitingen kunnen terugbrengen naarmate meer toepassingen als Buienradar een rol overnemen. Het kan de kloof tussen overheid en burger een stukje kleiner maken, omdat burgers meer inzicht krijgen in de werkwijze van de overheid. Overheid en burgers kunnen verder ook meer samenwerken aan een betere samenleving, zoals het voorbeeld van de journalist die de belastingfraude vond. Open data is één van de bouwstenen naar een open overheid die haar inwoners serieus neemt en in staat acht om mee te helpen.
Een paar voorbeelden. Op de website Where Does My Money Go 7 kunnen belastingbetalers in het Verenigd Koninkrijk precies zien waar hun belastinggeld heen gaat. Deze website is een initiatief van de Open Knowledge Foundation, een onafhankelijke stichting die de financiële overheidsdata hergebruikt heeft. Met deze website worden discussies over grote bedragen begrijpelijk voor elke inwoner: de miljarden voor ontwikkelingssamenwerking worden ineens teruggebracht naar de paar pond per persoon. Dit wordt inmiddels zo goed ontvangen dat er plannen zijn om een uit eenzetting van de bestedingen mee te sturen met elke belastingaanslag.8
Het project openKvK 9 in Nederland is een voorbeeld waaruit blijkt dat samenwerking kan leiden tot een verhoging van de kwaliteit van data. Initiatiefnemer Stefan de Konink maakte een kopie van de database van de Kamer van Koophandel omdat hij graag ’s avonds de KvK-gegevens van ondernemingen wil inzien. Deze functionaliteit is op de KvK-website niet beschikbaar. Op openKvK zijn deze gegevens wél 24 uur per dag in te zien. Bij het ordenen van de gegevens bleken er kleine fouten in de database van de KvK te zitten, zoals websites en e-mailadressen waar leestekens in misten. Het zijn maar details, maar door deze details waren verschillende bedrijven minder goed bereikbaar dan hun concurrenten. Een initiatief dat gestart werd om de bereikbaarheid van de gegevens te bevorderen zorgde er dus ook voor dat de kwaliteit van de gegevens toenam. Deze voorbeelden illustreren dat organisaties ook in hun eigen vingers snijden door data voor zichzelf te houden: ze ontzeggen zichzelf het collectieve intellectuele potentieel van de massa.
Risico’s
Is het dan alleen maar een halleluja-verhaal? Zeker niet. Het openen van data brengt de nodige juridische en technische risico’s met zich mee. Allereerst is niet alle data is geschikt om beschikbaar te stellen. Dit omdat 1) de privacy van mensen kan worden geschaad (dit is geregeld in de Wet bescherming persoonsgegevens) en 2) de nationale veiligheid in het geding is (geregeld in de Wet openbaarheid van bestuur). Het beveiligen van juist deze gegevens vormt daarbij een risico. Daarnaast zijn er ook technische obstakels bij het vrijgeven van veel gegevens.
Eén oorzaak daarvan is de remmende voorsprong die Nederland heeft. Bijvoorbeeld: de computersystemen waar veel overheidsorganisaties op draaien waren bij hun ingebruikname in 1978 revolutionair. Nu zorgen ze voor grote problemen: de gegevens zijn er moeilijk uit te halen en de systemen zijn moeilijk te koppelen met het internet. De gegevens zullen dus op een alternatieve wijze beschikbaar gemaakt moeten worden en dit kan op korte termijn een kostbare aangelegenheid zijn. De enkele ambtenaar die zijn cijfers in een Excel-spreadsheet op zijn bureaublad heeft op geslagen heeft in dit geval dus geluk: die kan hij/zij morgen online publiceren. De verwachting is dat het nog een tijd zal duren voordat Nederland het transparante land is waar de potentie van open data ten volle benut wordt door een betrokken samenleving. Het vraagt om maatschappijbrede investeringen op verschillende vlakken, zoals het vergroten van kennis en bewustzijn binnen organisaties. En natuurlijk is de onvermijdelijke vraag: wat zou u graag willen weten?
Sebastiaan ter Burg is een open content adviseur en producent. Als adviseur begeleidt hij organisaties met het beschikbaar stellen van hun content, zoals gegevens, teksten en beeldmateriaal. Hij is ook bestuurlid van stichting Dat Zou Jij Wel Willen Weten. Deze stichting heeft als doelstelling om alle informatie die in het publieke belang openbaar moet zijn toegankelijk te maken en/of anderen te ondersteunen en motiveren om dit te doen.
Noten
1 Buienradar is geen open data toepassing omdat er voor de data betaald moet worden. In het begin moest Buienrader het knmi hier € 200.000 per jaar voor betalen.
2 Bron: europa.eu/rapid/pressReleasesAction.do?reference=SPEE CH/11/872&format=HTML&aged=0&language=EN&guiLanguag e=en
3 Op de website wiki.linkedgov.org/index.php/The_economic_ impact_of_open_data zijn links te vinden naar verschillende ramingen van de waarde van open data.
4 Op wiki.linkedgov.org/index.php/The_economic_impact_of_ open_data is een lijst onderzoeken gepubliceerd naar de effecten en de potentie van open data.
5 Bron: eaves.ca/2010/04/14/ case-study-open-data-and-the-public-purse
6 Bron: Davies, T (2010) The Roles of Open Government Data in Democratic Engagement and Reform of Public Services, journal. webscience.org/414
7 Bron: www.wheredoesmymoneygo.org
8 Bron: www.guardian.co.uk/uk/2012/mar/20/ budget-2012-taxpayers-personal-statement
9 Zie www.openkvk.nl
Heeft dit artikel uw interesse gewekt? Klik hier voor meer info en abonnementen.
– –
Dit artikel verscheen in idee nr. 5 2012: Meten is weten, en is te vinden bij het onderwerp transparantie.