Naar de content

Met Twitter op zoek naar stankoverlast

Interactieve kaart toont probleemgebied

Arcadis

Het gebruik van locatie- en tijdgebonden data is niet langer alleen voorbehouden aan slimme marketeers, die willen weten hoe lang een klant in een winkel blijft. Ook de overheid heeft sociale media en de smartphone ontdekt als bron van informatie. Zo hebben de DCMR Milieudienst Rijnmond en Arcadis Twitter gebruikt om illegale lozingen op te sporen en daarover informatie te vergaren.

Twitter is een digtale klaagmuur, zeker in Nederland. We zeuren overal over: de harde muziek van de buren, vertraagde treinen, werkzaamheden en vast ook over stank. Daar moeten we wat mee, dachten ze bij Arcadis en DCMR en dus benaderden ze Andreas Wombacher en Maurice van Keulen, onderzoekers van de universiteit Twente, gespecialiseerd in Data Management Technology.

“De Milieudienst Rijnmond heeft een meldkamer waar onder meer telefoontjes van mensen binnen komen, maar waar ook informatie van sensoren wordt gebruikt om bijvoorbeeld het weglekken of vervliegen van schadelijke chemicaliën te detecteren”, legt Van Keulen uit. “Mensen bellen echter niet meer als er iets aan de hand is, dus moet je op een andere manier met de burger in contact komen. Daarom wilden ze sensorinformatie koppelen aan tweets van mensen die klagen over stank. Zo hoopten ze problemen eerder op het spoor te komen. Ook is het mogelijk om, als ze de meldingen in plaats en tijd kunnen volgen, terug te kijken in de historie en te achterhalen waar een probleem ontstond. De milieudienst zet deze technologie dan ook in voor allerlei zaken, bijvoorbeeld om via Twitter vervuild oppervlaktewater door illegale lozingen op te sporen.”

Stank

Twitter maakt het mogelijk om tweets automatisch van een GPS-locatie te voorzien. Een makkelijk dataproject, denk je misschien. Even die locatiemetadata filteren en je ziet bijvoorbeeld alle tweets over Rotterdam-Noord. Was het maar zo simpel, aldus Van Keulen. Iedereen kiest er zelf voor om die GPS-functie aan te zetten en slechts twee procent van de mensen heeft dat ook daadwerkelijk gedaan. Zonder de locatie van de tweets kun je ze niet op een kaart tonen en niet filteren op Rotterdam-Noord. En aan stanktweets uit New York heeft de DCMR natuurlijk niet veel.

De onderzoekers besloten daarom naar de inhoud van de tweet te kijken voor het bepalen van de locatie waarover iemand stank rapporteert. “Maar iedereen beschrijft een locatie op heel verschillende manieren: met straatnamen, bijzondere gebouwen, markante landschapselementen enzovoorts. Die moeten allemaal meegenomen worden. Ook gebruikt niet iedereen dezelfde woorden voor stank.”

Op basis van de Twitterdata wordt een heat map samengesteld. In een oogopslag is duidelijk waar de problemen zich bevinden.

Marleine van der Werf

Miljoenen tweets

Hiervoor is een pilot opgezet. Er werden lijsten opgesteld met dergelijke woorden om tweets te identificeren en te filteren. Ook werd naar tweets over historische lozingen en andere gebeurtenissen gezocht. “In de gevonden berichten werden dan weer nieuwe woorden gelezen die aan de lijst werden toegevoegd,” verklaart Van Keulen. Bottleneck bij het project: mensen bleken veel minder dan verwacht over zaken als stank te twitteren. Waarschijnlijk omdat ze denken dat er toch niets met die melding gedaan werd. Daarom veranderde DCMR van aanpak en ging diverse burgers actief benaderen of ze bewust wilden gaan twitteren.

Hoe visualiseer je de meldingen en klachten op een kaart van het gebied? De onderzoekers wilden een interactieve kaart ontwikkelen die vanuit grote hoeveelheden data, exacte geaggregeerde informatie toont en snel genoeg update voor vloeiend inzoomen en in plaats en tijd kan verschuiven. Van Keulen maakt de vergelijking met Buienradar. “Daarbij zijn de buienplaatjes vooraf berekend, maar in ons project kon je dus real-time de meldingconcentraties van stank voorbij zien trekken.” Data aggregatie is een proces waarin informatie wordt verzameld en uitgedrukt in een gebundelde vorm.

Arcadis heeft een eigen omgeving ontwikkeld genaamd Atrium om dergelijke geografische applicaties te maken. “Ze gebruiken daarbij open source GIS-software (Geographic Information Systems) en open source databases zoals PostgreSQL. Daarmee is het mogelijk om thematische informatie, zoals bijvoorbeeld hoeveelheden meldingen of tweets, op een kaart te visualiseren.” Met GIS-software kunnen ruimtelijke gegevens of informatie over geografische objecten, worden opgeslagen, geanalyseerd en gepresenteerd. PostgreSQL is een databasemanagementsysteem, onder meer geschikt voor Linux en Windows.

Een complex probleem bij het zoomen en verschuiven op een kaart en de analyse van miljoenen tweets is het behoud van snelheid. Van Keulen: “Alles vooraf berekenen is niet mogelijk, maar alles direct berekenen is te traag. En afhankelijkheid van specialistische databasetechnologie is voor partijen als Arcadis commercieel niet interessant. Daarom hebben we zelf een nieuwe technologie ontworpen die als een plugin aan een open source database als PostgreSQL toegevoegd kan worden.”

Arcadis heeft een eigen omgeving ontwikkeld met de naam Atrium. Daarin zien ze geografisch weergegeven waar zich een probleem voordoet.

Arcadis

Prefab

Van Keulen legt uit dat het een nieuwe indexstructuur is speciaal voor het versnellen van het berekenen van geaggregeerde informatie. “Je kunt het vergelijken met prefab in de bouw. Huizen worden tegenwoordig niet meer ter plekke helemaal van de grond af gebouwd, maar hele wanden met ramen en deuren worden aangevoerd. Die zijn vooraf in de fabriek gemaakt. De onderdelen zijn slim ontworpen om in verschillende gebouwen gebruikt te worden. Onze indexstructuur is ook zo ontworpen zoddat bepaalde stukjes voorberekend worden zodat die slim voor meerdere _zoom_-niveaus ingezet kunnen worden. Op deze manier bereken je met normale open source technologie toch direct exacte geaggregeerde informatie, snel genoeg voor vloeiend inzoom en verschuiven.”

De onderzoeker benadrukt dat je ook bij andere projecten baat hebt bij deze indextechnologie. “In principe kan elke applicatie waarin thematische data gevisualiseerd wordt in plaats en tijd hiermee worden versneld. Met subsidie vanuit het Commit-onderzoeksprogramma hebben we de onderzoeksresultaten verder uitgewerkt tot robuuste software, met een heldere uitleg en demonstraties. Daarmee wordt het niet alleen voor Arcadis, maar ook voor andere bedrijven mogelijk de software te gebruiken.”

ReactiesReageer