Meldingen openbare ruimte efficiënter afhandelen

Anton Kuijer

Data Scientist

Timo Nijhof

Data Scientist

Gemeentes hebben jaarlijks te maken met tienduizenden “meldingen openbare ruimte”. Deze gaan met name over zaken in de openbare ruimte die kapot of vervuild zijn. Ze variëren van losliggende stoeptegels, kapotte lantaarnpalen, stankoverlast, tot hondenpoep en ga zo maar door. Door verbeterde dienstverlening (via websites en apps) is de drempel om te kunnen melden veel lager geworden. Voor de burger is dit zeer gunstig, maar dit vergt wel iets extra’s van de dienstverlener. De gemeente Almere bijvoorbeeld, heeft een goedwerkend systeem dat gebruikt wordt om meldingen te registreren, te verwerken en af te handelen. Jaarlijks komen er 25.000 meldingen binnen. Vooralsnog worden deze handmatig verwerkt, want meldingen (tekstueel) zijn nou eenmaal moeilijk automatisch te doorgronden en te verwerken. Dit zorgt voor meer werk voor de werknemers van de gemeente. Wij vroegen ons af: kan het ook efficiënter?

In Almere worden alle meldingen al jaren vastgelegd. De werknemer kent hier vervolgens een categorie aan toe en zet deze melding door naar de juiste dienstverleners. Uit deze data zijn natuurlijk al veel inzichten te halen. Maar het wordt pas echt interessant als we kunnen onderzoeken of we de werknemer kunnen ondersteunen, bijvoorbeeld bij het toekennen van de categorieën. Dit is precies wat we in dit verkennend onderzoek doen.

Allereerst hebben we gekeken of we met behulp van machine learning een model kunnen trainen op basis van zogeheten hoofdcategorieën. In het huidige systeem kent de melder zelf een hoofdcategorie toe aan de klacht. Uit de praktijk blijkt dat deze geregeld foutief wordt ingevuld. Het automatisch kunnen classificeren van deze hoofdcategorie zou dit kunnen helpen voorkomen. Zo zou het model bijvoorbeeld een suggestie kunnen doen bij het invullen van de melding, zodat de melder minder de fout in gaat.  Je zou er zelfs aan kunnen denken om de melder niet meer zelf categorieën in te laten vullen, maar deze “onder water” automatisch toe te kennen.  Dit alles met als doel om zowel de werknemer van de gemeente en de dienstverlener onnodig werk te besparen.

Om een dergelijk automatisch model mogelijk te maken hebben we 400.000 meldingen geanalyseerd en de computer laten bepalen welke woorden en woordcombinaties iets zeggen over de categorie van de melding. In onderstaande visualisatie zie je door welke woorden de drie hoofdcategorieën zich het best laten onderscheiden. De categorieën zijn: onderhoud openbare ruimte, schoon en stadstoezicht.

Uit deze wordcloud komt heel duidelijk naar voren dat sommige woorden vaker voorkomen bij een bepaalde hoofdcategorie. De volgende stap was om een classificatiemodel te trainen. Een eerste versie van dit model classificeerde al snel ruim 81% van de meldingen goed (o.b.v. 400.000 meldingen en tienduizenden unieke woorden/woordcombinaties). Momenteel zijn we bezig een zelfde model te trainen op subcategorieën. Dat zijn er meer dan honderd en dit zorgt weer voor hele reeks nieuwe uitdagingen. In Den Bosch is onze collega Ruben inmiddels met een zelfde dossier aan de slag gegaan.

Wordt vervolgd.

 

 

Deel dit artikel
Share on LinkedInTweet about this on TwitterShare on FacebookEmail this to someone