Hoe werkt predictive AI?

Predictive AI is een AI-technologie. Of wat je ook kan zeggen: een vorm van kunstmatige intelligentie. Het verschilt van bijvoorbeeld generative AI. Met generative AI – zoals ChatGPT – kun je content creëren. Met predictive AI kan dat niet. De output van predictive AI is altijd een voorspelling. Op basis van een kansberekening.

Predictive AI maakt gebruik van historische gegevens, van algoritmes en van machine learning modellen om daarmee toekomstige uitkomsten of trends te voorspellen. Het analyseert patronen in bestaande datasets en extrapoleert deze naar toekomstige scenario’s. Hoe dat werkt en wat dat oplevert, lees je hieronder.

Wat kun je met predictive AI in marketing?

Voor marketeers is predictive AI een game changer. Elke marketeer heeft als kerntaak om zijn doelgroep(en) te begrijpen, de vraag naar producten of diensten te vergroten en uiteindelijk de verkoop te stimuleren. Een citaat dat wij hebben geleend van Zorm.nl. Hoe dan ook, op alle taakgebieden van een marketeer kan predictive AI je helpen. Het beïnvloedt je werk op een positieve wijze. Om het op te sommen:

Voorspelling van klantgedrag

Met predictive AI krijg je inzicht in klantloyaliteit en kun je geweldige churn-analyses maken. Met de AI-modellen kun je voorspellingen doen over aankoopgewoonten zoals orderwaarde en aankoopfrequentie. Ook Spotler zet hierop in. In dit artikel lees je er veel over.

Campagneoptimalisatie

Predictive AI kun je prima inzetten om je A/B-testen te verbeteren en om de kanalen die je inzet te optimaliseren. Zo kan predictive AI je helpen om het juiste kanaal te kiezen voor het juiste moment in je campagne. Predictive AI is goed in timing.

Lead scoring en segmentatie

Als je inzicht hebt in mogelijke toekomstige conversies, dan kan predictive AI die informatie gebruiken om leads te classificeren. Wat vervolgens weer informatie kan opleveren voor zinvolle segmentaties.

Dynamic Pricing

Veel organisaties willen beprijzing laten afhangen van de vraag naar producten of diensten. Als je kunt voorspellen hoe die vraag zich gaat ontwikkelen, dan kun je altijd op het juiste moment je prijzen daarop aanpassen. Predictive AI maakt dat mogelijk.

Personalisatie van content

Predicitve AI is bijzonder hulpvaardig in aanbevelingssystemen. Vooral grote organisaties maken hier gebruik van. Zo werkt Amazon met aanbevelingen voor de juiste kledingmaat afhankelijk van de stijl- en merkkeuze van klanten. Simpelweg omdat niet elk kledingmerk dezelfde maattabel hanteert. En kies je als klant voor een bepaald kledingstuk, dan krijg je via reviews en feedback van andere klanten te horen of het slim is om het desbetreffende kledingstuk een maatje groter of kleiner te bestellen. Klanten vinden dit geweldig.

Maar ook een organisatie als Netflix maakt volop gebruik van deze slimme vormen van personalisatie. Wij geven er graag een voorbeeld van. Het geeft namelijk goed weer wat predictive AI mogelijk maakt.

Voorbeeld predictive AI bij Netflix

Netflix wil graag veel kijkers op zijn platform. Gelukkig zitten de marketeers bij Netflix op een goudmijn aan data. Voorkeuren van klanten zijn immers ruim voorhanden. Al die data zet Netflix op een slimme manier in. De aanbevelingssytemen van Netflix worden gepersonaliseerd door de inzet van predictive AI. Maar hoe ziet dat er in de praktijk uit?

Zelfde aanbeveling, maar toch gepersonaliseerd

Binnen Netflix is het mogelijk om filmposters te personaliseren op basis van eerder bekeken films, voorkeuren voor bepaalde acteurs en voorkeuren voor bepaalde filmgenres:

Verschillend gedrag wordt gemotiveerd door verschillende thumbnails van Stranger Things
Een voorbeeld van verschillende Netflix thumbnails door Den of Geek

Netflix probeert met deze slimme aanbevelingstechniek om meer klanten te verleiden voor deze specifieke film of serie. Dit is een mooi voorbeeld van de kracht van predictive AI. Alle informatie over dit voorbeeld van Netflix inclusief een aantal prachtige cases van Bol, Jumbo en de ING vind je allemaal terug in de bluepaper Personalized E-commerce.

Welke data heb je nodig voor predictive AI?

Soorten en type data die je kunt inzetten

Je zult ongetwijfeld begrijpen dat de voordelen van predictive AI alleen mogelijk zijn als de data op orde is. De voorspellingen vinden immers plaats op basis van historische gegevens. Als je prijsontwikkelingen en tijdstippen van aankoop onvoldoende in je systemen opslaat, dan wordt zoiets als dynamic pricing lastig. En als Netflix filmposters personaliseert, dan moet je wel opslaan hoe vaak welke klant welk type film het liefst bekijkt.

De data die je nodig hebt om Predictive AI mogelijk te maken, is dus afhankelijk van je business en is daarnaast vooral afhankelijk van wat je met predictive AI wilt gaan doen.

Data die Spotler inzet in zijn Predictive AI-module

Wij willen graag dat onze klanten met onze software geld verdienen en geld besparen. Om die reden zetten wij in op het verbeteren van de Customer Lifetime Value (CLV). De data die hiervoor nodig is: customer_id, transaction_timestamp, invoice_id, item_number en order_type. Deze data wordt geladen in een specifiek statistisch model dat onder data scientists veelvuldig wordt ingezet om voorspellingen te doen over orderwaarde en transactiefrequentie.

Daarnaast maken we gebruik van het model Random Forest. Dat model voeden we niet alleen met bovenstaande data, maar ook met zaken als e-mailgedrag en website-interacties.

Over beide modellen volgt hieronder een kleine uitleg. Zo krijg je een goede introductie op predictive AI en de werking ervan.

Hoe verbeter je de CLV met predictive AI?

Als je inzicht wilt krijgen in de toekomstige ontwikkeling van de CLV van klanten, dan start je met de volgende historische gegevens: het aantal keren dat een klant iets bij je gekocht heeft, de orderwaarde van elke aankoop en het tijdstip waarop de laatste aankoop heeft plaatsgevonden. Of anders: je maakt per klant een RFM-overzicht. RFM staat voor Recency, Frequency en Monetary Value.

Een RFM overzicht in Spotler Activate
Een RFM overzicht in Spotler Activate

Vaak wordt de CLV berekend door de klantwaarde (gebaseerd op RFM) te vermenigvuldigen met de gemiddelde duur van een klantrelatie. Feitelijk vermenigvuldig je gegevens die je kent vanuit klantgedrag. Het zijn historische gegevens. Deze berekening geeft je geen zicht op toekomstige ontwikkelingen en is deterministisch van aard. Terwijl je met de CLV iets wilt zeggen over de lifetime value. Je wilt liever een antwoord op de volgende drie vragen:

  • Hoeveel transacties zullen er in -bijvoorbeeld- de komende maand plaatsvinden?
  • Welke klanten zullen in de gestelde periode een aankoop doen?
  • Wat is de gemiddelde orderwaarde die je per klant kunt verwachten?

Met die kennis kun je immers geweldige marketingacties opzetten.

Voorspellingen maken met CLV-gegevens

Als je bovenstaande drie vragen wilt beantwoorden, dan doe je een voorspelling over mogelijk toekomstig gedrag. Om dat voor elkaar te krijgen, heb je een wiskundig model nodig dat dat voor je uitrekent. Lang verhaal kort: het model met de beste papieren is het BG/NBD-model inclusief een gamma-verdeling van de gegevens (GG-model).

BG/NBD + GG-model staat voor Beta Geometric / Negative Binominal Distribution + Gamma Gamma Submodel. Dit klinkt heel ingewikkeld, maar is in feite een model voor kansberekening. Het model is nog niet zo oud. Het is ontwikkeld door Fader, Hardie en Lee in 2005. Een korte uitleg:

Aantal transacties voorspellen met het BG/NBD-model

Engelstalige marketeers en onderzoekers hebben de ingewikkelde afkorting van het model teruggebracht tot ‘Buy Till You Die’. Het model berekent de mogelijke hoeveelheid transacties in een vooraf vastgestelde periode (dit is het deel ‘Buy’). Bijvoorbeeld: hoeveel transacties zullen er plaatsvinden in de komende maand? Maar ook: welke klanten zullen in de komende maand iets kopen?

Het model is ‘negative binominal’. Immers, als je weet welke klanten de komende maand een aankoop zullen doen, dan weet je ook welke klanten dat niet zullen doen. Daarnaast heb je ongetwijfeld een aantal klanten die helemaal niets meer bij je kopen of die al maandenlang een inactief bestaan hebben in je database (dit is het deel ‘Till You Die’).

Als je al die informatie over actieve en inactieve klanten in het BG/NBD-model stopt, dan krijg je inzicht in welke klanten mogelijk zullen churnen, een aankoop zullen doen en hoe vaak een aankoop plaatsvindt.

Gemiddelde orderwaarde voorspellen met het GG-model

Verder krijg je via het GG-model inzicht in de gemiddelde orderwaarde die je kunt verwachten per klant.

Onthoud: in het GG-model wordt gekeken naar de totale orderwaarde die elke klant heeft en die waarde wordt vervolgens willekeurig verdeeld over het totaal aantal transacties. Op die manier kan de gemiddelde orderwaarde over verschillende periodes veranderen. Als laatste vindt er een gamma-verdeling plaats van de gemiddelde orderwaarde over alle klanten.

Of iets eenvoudiger: je ontvangt een voorspelling van de gemiddelde orderwaarde per klant door op een wiskundige manier te kijken naar de gemiddelde orderwaarde voor alle klanten.

Spotler zet het BG/NBD + GG-model in

Zoals je hebt gelezen wordt het Predictive AI-model van Spotler gevoed met RFM-data. Wij zetten voor de CLV-voorspellingen ook het BG/NBD + GG-model in.

Welke machine learning modellen maken predictive AI mogelijk?

Organisaties gebruiken niet alleen het voorspellende BG/NBD + GG-model, maar verfijnen de uitkomsten ook door te kijken naar e-mailgedrag, website-interacties, reacties op seizoensaanbiedingen, aanwezigheid op events et cetera.

Het is prima voor te stellen dat een klant op basis van het aantal transacties laag scoort, maar wel veel rondkijkt op je website en een bezoek heeft gebracht aan je laatste event. Elke voorspelling wordt beter als ook deze data wordt meegewogen. Daar heb je verschillende AI-modellen voor.

Voorbeelden van machine learning modellen voor predictive AI

Er zijn verschillende machine learning modellen die worden ingezet bij Predictive AI. Denk aan: Gradient Boosting Machines zoals XGBoost, Logistic Regression, Recurrent Neural Networks (RNN) en Random Forest. Het voert te ver om in dit artikel al deze modellen uit te leggen. Wij concentreren ons op Random Forest, omdat Spotler dat model zelf inzet.

Houd wel in de gaten dat generative AI-modellen als output een kansberekening geven. Als een klant elke maand precies één artikel bij je koopt, dan kun je verwachten dat deze klant de volgende maand deze actie herhaalt. De kans erop is groot, maar een wetmatigheid is het niet. De uitkomst is niet gedetermineerd.

Verschil tussen deterministisch en probabilistisch

AI-modellen zijn probabilistisch en niet deterministisch van aard. Of eenvoudiger: AI-modellen houden rekening met de factor ‘onzekerheid’ in de voorspellingen die ze doen. Mensen doen de hele dag niet anders als ze beslissingen nemen. Heel vaak zijn die beslissingen gebaseerd op incomplete en onzekere informatie.

Wij hebben er zelfs een mooi woord voor: intuïtie. En er is zelfs een vergelijking die zegt dat ‘denken + gevoel = weten’. Nu hebben AI-modellen geen gevoel, maar ze zijn wel probabilistisch. We hebben Chi Shing Chang, managing director van SPARQUE.AI gevraagd om een quote.

Verschil tussen deterministisch en probabilistisch

“Stel dat je een dierenwinkel hebt en bezoekers graag een gerichte aanbieding stuurt. In een deterministisch model zeg je: iedereen die de categorie ‘hond’ bezoekt, krijgt een e-mail met een aanbieding voor zijn hond. Maar wat nu als een bezoeker meerdere categorieën bezoekt? Een probabilistisch model houdt hier rekening mee door waarschijnlijkheden te berekenen. Als voorbeeld: het gedrag van de bezoeker valt op te splitsen in 60% hond, 25% kat, 10% vogel en 5% knaagdier. Heb je een keer een leuke aanbieding voor kattenbezitters en niet voor hondenliefhebbers, dan kun je een bezoeker met het genoemde zoekgedrag toch iets relevants sturen.”

Chi Shing Chang, SPARQUE.AI

Het verschil aangeduid tussen deterministische en probablistische predictive AI

Hoe werkt het statistisch model Random Forest?

Kijk eens naar de volgende tabel:

Customer ID Laatste aankoop Aankopen
per jaar
Gemiddeld bedrag Aantal e-mail opens Aantal e-mail kliks Promo
100 13-12-2024 10 15 6 4 winter
101 09-10-2024 2 70 3 2 oktober

Stel dat je op 1 januari 2025 van deze twee klanten – met customer_id 100 en 101– wilt voorspellen welke van de twee het meest waarschijnlijk binnen 30 dagen een nieuwe aankoop gaat doen. Hoe zou je dat aanpakken? Grote kans dat je beslisbomen gaat opzetten. Misschien niet letterlijk, maar dan op z’n minst in je hoofd. Visueel kun je denken aan het volgende:

Opzetten beslisbomen

Een standaard beslisboom voor predictive AI modellen

Vanuit deze eenvoudig beslisboom zou je de voorspelling kunnen doen dat alle klanten met de waarde 1 waarschijnlijk binnen 30 dagen een nieuwe aankoop zullen doen. Natuurlijk is dit niet heel nauwkeurig. Je begrijpt ongetwijfeld dat je zo’n beslisboom kunt uitbreiden met meerdere beslismomenten en dat datasets gebaseerd op meerdere beslisbomen complex kunnen worden. Voor je ’t weet, heb je een heel woud met beslisbomen. Het AI-model heet ook niet voor niets Random Forest.

Maar waarom heb je een heel woud nodig? Dit heeft te maken met een belangrijk onderdeel van het AI-model: bootstrap aggregation. Dit vraagt om enige uitleg.

Bootstrap aggregation

De term bootstrap aggregation verwijst naar een statistische methode waarmee je data kunt verzamelen. Om het niet al te ingewikkeld te maken: denk aan een groep muzikanten die gezamenlijk in een orkest spelen. Vervolgens speelt slechts één muzikant (bijvoorbeeld een hoboïst) zijn deel in het muziekstuk. We weten allemaal dat het dan lastig is om het muziekstuk te raden. Zo’n voorspelling wordt makkelijker (of nauwkeuriger) zodra meerdere muzikanten hun deel spelen van het muziekstuk.

Op zoek naar een nieuwe auto… 🚗

Scenario 1:

Je bent op zoek naar een nieuwe auto en je vraagt een goede vriend welke auto je het beste kunt aanschaffen. Hij zegt tegen jou: koop de nieuwe Ford Explorer. Hoe groot is de kans dat je nu naar de showroom rent?

Scenario 2:

Je bent op zoek naar een nieuwe auto en je stelt een goede vriend een aantal vragen. Denk aan:

  • Kun je mij een aantal goede auto’s aanraden die passen binnen mijn budget?
  • Zou jij mij aanraden om een volledig nieuwe auto te kopen of eerder een occasion?
  • Welke auto heeft volgens jou de beste optiepakketten?
  • Weet jij welke auto na 150.000 kilometer de beste inruilwaarde heeft?
  • Welke automerken geven de meest uitgebreide garantie?
  • Welke automerken zijn gunstig in onderhoud?

Na een inventarisatie van alle antwoorden concludeer je dat een nieuwe Ford Explorer de beste optie is. Is de kans op aanschaf in scenario 2 groter of kleiner dan in scenario 1? Precies: veel groter. Dit is in lekentermen de manier waarop bootstrap aggregation werkt.

Waarom is bootstrap een goede voorspeller?

Bij bootstrap aggregation worden subsets samengesteld uit de oorspronkelijke dataset. Of vanuit het autovoorbeeld: deelvragen gemaakt vanuit de hoofdvraag. Een kleine nuance: in elke subset zit telkens dezelfde hoeveelheid data als in de oorspronkelijke set. Wat natuurlijk goed mogelijk is, is dat er in de verschillende subsets dezelfde gegevens zitten. Immers, de nieuwe Ford Explorer moet opduiken in verschillende subsets.

Zo’n subset heet ook wel een bootstrap-steekproef. Deze steekproeven worden willekeurig getrokken uit de oorspronkelijke set. Vandaar Random Forest. Dit is een krachtige techniek. Je kunt statistische voorspellingen doen zonder dat je hoeft te vertrouwen op aannames.

Natuurlijk is de betrouwbaarheid van deze methode getest. Een leuk voorbeeld is een test waarin het model moest voorspellen wat de bodembedekking was van een stuk land in het Amerikaanse Colorado. Het model werd gevoed met data als aantal uren zon, aanwezigheid van water etc. Random Forest scoorde 94%.

Hoe traint het model zichzelf?

Predictive AI heeft net als generative AI de eigenschap dat het ‘leert’ of zichzelf traint. De vraag is natuurlijk: hoe ziet dat eruit in zo’n AI-model als Random Forest?

Het trainen van Predictive AI gebeurt door het splitsen van data in trainings- en testsets. Bijvoorbeeld 80% trainen en 20% testen. De testdata wordt vervolgens gebruikt om de trainingsdata te controleren. Om het toe te lichten:

Hoe traint Predictive AI zichzelf?

Onze kennis van de wereld

Stel dat je wilt voorspellen wat de temperatuur wordt in Den Haag op 28 december 2025. Hoe doe je dat? Eén: je weet dat het december is en niet hoogzomer. Je weet dat Den Haag in Nederland ligt. En je kent de temperatuur van vandaag. Verder weet je dat je vorig jaar op 28 december nog stond te koukleumen op het Lange Voorhout. Kortom, 5 graden.

Wat een model moet leren

Als mensen zetten wij veel kennis van de wereld in om voorspellingen te doen. Een AI-model heeft die kennis niet, maar heeft deze wel nodig. De automatische menselijke connectie tussen ‘begin december’ en ‘kouder dan in hoogzomer’ moet een AI-model leren. Een AI-model doet dat door in de trainingsset historische data te beoordelen op (bijvoorbeeld temperaturen op verschillende tijdstippen) 1= ja of 0 = nee of waar versus onwaar voor de uitkomst die we graag willen: wat is de temperatuur op 28 december 2024? De beslisbomen die uiteindelijk naar het juiste resultaat leiden, worden vervolgens getest met vergelijkbare data (testset).

Onthoud: het AI-model heeft geen idee dat het met ‘temperatuur’ bezig is. ‘Wereldse’ gegevens (kliks in een mail of temperatuur in Den Haag) worden namelijk ingevoerd als numerieke gegevens. Zou je het AI-model aan de slag zetten met de vraag Wat wordt het weer in Rotterdam op 28 december 2024? dan moet het AI-model opnieuw alles uitrekenen, terwijl wij als mensen kunnen roepen ‘dat zal niet veel verschillen met Den Haag’.

Je kunt ook zeggen: mensen leren door ervaring plus kennis van de wereld en een Predictive AI-model leert door beslisbomen te testen. Uiteraard: een AI-model kan met heel veel gegevens rekenen, waardoor de voorspelling uiteindelijk beter wordt dan wij als mensen met onze wereldse kennis voor elkaar kunnen krijgen.

Uitkomst predictive AI-model: kansberekening

De uitkomst van het Predictive AI-model is een kansberekening. Het model voorspelt voor iedere klant de waarschijnlijkheid dat een aankoop plaatsvindt binnen de termijnen waarvoor je een voorspelling wenst. Het volgende zou een mogelijke uitkomst van het model kunnen zijn:

Customer ID Kans op kopen (30 dagen) Kans op kopen (60 dagen) Kans op kopen (90 dagen)
100 85% 92% 98%
101 20% 50% 65%

Kansberekening loopt -theoretisch- van 1% naar 100%. De onderverdeling in percentages kun je verbijzonderen naar decielen of opdelen in tientallen. Een beetje zoals de rapportcijfers van vroeger. Scoor je 85% of een 8,5 dan doe je ’t goed. In Spotler Activate doen wij iets vergelijkbaars. Klant 101 komt voor de kans op ‘kopen 30 dagen’ in het tweede deciel.

Implementatie van predictive AI in je marketing

De voorspellingen kun je gebruiken om gepersonaliseerde acties te plannen. Klanten met een hoge kans op kopen, sluit je uit van bepaalde acties. Dat zij gaan kopen, is meer dan waarschijnlijk. Hiermee kun je geld besparen. Je geeft immers geen marketinggeld uit aan klanten die sowieso gaan kopen.

Klanten met een gemiddelde kans op kopen, stuur je bijvoorbeeld een mailing met een gerichte productaanbeveling en klanten met een lage kans geef je korting. Op deze wijze target je heel precies wat uiteindelijk voor de conversie goed uitpakt. Of anders: op deze wijze verdien je geld met de inzet van predictive AI

Wat zijn de voordelen van predictive AI?

Predictive AI heeft vier belangrijke voordelen:

Kosteneffectiviteit

Dit moet met de uitleg hierboven nu wel duidelijk zijn. Met predictive AI is er minder sprake van geldverspilling omdat je zeer nauwkeurig kunt targeten.

Efficiëntieverbetering

Je kunt predictive AI aan het werk zetten met het automatiseren van taken als segmentatie en targeting. Maar ook als je dit soort taken niet automatiseert, geeft de uitkomst van predictive AI je veel informatie over klantsegmenten. De modellen zijn immers probabilistisch. Je hebt niet alleen statische gegevens waarop je beslissingen baseert, maar ook voorspellingen over mogelijk toekomstig gedrag.

Meer klantbetrokkenheid

Met predictive AI kun je klanten in gerichte campagnes stoppen en een zeer gepersonaliseerde ervaring bieden. Als je goed weet in te schatten wat je klanten op welk moment in hun klantreis nodig hebben, dan vergroot je de klantbetrokkenheid.

Verbeterde besluitvorming

Predictive AI is niet alleen een feest voor je database, maar ook voor je eigen organisatie. Je zet immers geavanceerde data-analyses in voor strategische marketingkeuzes. Elke besluit om een bepaalde campagne wel of niet in te zetten, wordt met predictive AI beter onderbouwd.

Conclusie

Met predictive AI kunnen bedrijven proactief handelen in plaats van reactief, wat leidt tot efficiëntere processen en betere resultaten. Met predictive AI kunnen klanten van Spotler geld besparen en geld verdienen.

Nog niet uitgeleerd over Predictive AI?

In de podcastaflevering ‘Het geheime wapen van slimme marketing: Predictive Modelling’ leggen Albert Mombarg en Andreas Pohan Simandjuntak uit hoe je klantgedrag kunt voorspellen.

Go to top