'Doormiddel van een dataset hebben wij voorspeld of een klant opnieuw een overstap zou maken via Gaslicht.com'
- Onderwijsproject
Rob Otzen is vierdejaarsstudent van de opleiding HBO-ICT met als major Business IT & Management (BITM). Tijdens het eerste semester van het vierde jaar heeft hij zich samen met een andere student beziggehouden met een project voor Gaslicht.com. Door middel van 'Predictive Modelling' hebben zij op basis van een dataset voorspeld of een klant wel of niet zou terugkeren voor een tweede of derde overstap via Gaslicht.com.
'Tijdens dit blok hebben wij in duo's een project uitgevoerd voor Gaslicht.com. Dit is een onafhankelijke energievergelijker via waar klanten een energieabonnement kunnen afsluiten. Bij dit project zijn wij met een gegeven dataset voorspellingen gaan maken voor gaslicht doormiddel van 'Data Science'. Om deze voorspellingen te bereiken zijn wij bezig gegaan met 'Predictive Modelling'. Dit is een manier van voorspellen door voorspellende modellen te gebruiken. Voorspellende modellen zijn bijvoorbeeld regressie of classificatie. Dit houdt in dat men een soort van klein programmaatje gaat trainen om patronen te herkennen. Bijvoorbeeld als een voertuig 4 wielen heeft, een motor en een chassis, dan voorspelt het model dat het een auto is. Maar als het voertuig 2 wielen heeft, geen motor en zeer licht is, het voorspelt dat het een fiets is.'
'Ter voorbereiding op dit project zijn er een aantal lessen gegeven in het 4e jaar die betrekking hebben tot voorspellend modeleren en/of data science. Zo zijn wij in de les 'Predictive Modelling and Machine Learning' bezig geweest met het maken van voorspellende modellen in Python, een veel voorkomende programmeertaal.'
'Voor dit project hebben we samengewerkt met twee medewerkers van Gaslicht.com. Deze medewerkers hebben ons voorzien van een dataset die wij konden gebruiken voor het voorspellend model. Elk tweetal kreeg dezelfde dataset en de eerste stap van het project was om erachter te komen of men überhaupt met de gegeven dataset zou kunnen voorspellen of een klant zal terugkeren of niet. De dataset bevatte onder andere de volgende informatie: of de klant gebruik maakt van groen(e) gas/elektriciteit, welke welkomstbonus ze hebben ontvangen, het geslacht van de klant, of de klant het 'send e-mail reminder' vakje had aangevinkt enzovoorts.'
'Gedurende het project bleek het dat men met de gegeven dataset niet goed kon voorspellen of iemand terugkomt voor een tweede (of latere) overstap. Ons model had uiteindelijk een 'accuracy' van 68% (dit wil zeggen dat 68% van de klanten correct worden voorspeld als terugkerende of niet). Wel konden we concluderen dat het van groot belang is of iemand het ‘send e-mail reminder’ vakje heeft aangevinkt. Wanneer de klant dit niet deed, was de kans een stuk groter dat diegene niet zou terugkeren.'
'Het leuke van dit project was dat het een realistisch project was voor een echte klant. Extra leuk was dat er nog geen uitkomst bekend was: Gaslicht.com had deze dataset zelf nog niet gebruikt om te gaan voorspellen. Daarnaast werd ons volledige vrijheid gegeven voor het uitvoeren van het project. Het maakte niet uit hoe wij de voorspellingen zouden doen, zolang wij elke stap konden uitleggen waarom we bepaalde keuzes maakten en een duidelijke uitkomst hadden was het goed.'
Hoe tevreden ben jij met de informatie op deze pagina?