Analytics, de basis voor data science

Max Wiertz
05-10-2021

Bij data science (en ook BI) gaat het in de basis altijd over ‘analytics’; het (kwantitatief, cijfermatig) analyseren van data om er bruikbare kennis en inzichten uit te halen die leiden tot beter gefundeerde beslissingen. Goed dus om even in het fenomeen analytics te duiken.

In een reeks artikelen in onze rubriek #techtalk wil ik je graag op een niet-technische, conceptuele manier kennis laten maken met het brede vakgebied data science. De insteek van deze artikelen is het geven van een helikopterview, waarmee ik je wil helpen om de mogelijkheden van en met data beter te begrijpen en constructieve gesprekken met dataspecialisten te voeren. Ik hoop dat ik je kan inspireren om na te denken over wat je er wellicht binnen je eigen organisatie mee kan bereiken.

Analytics

Binnen analytics worden vier categorieën onderkend; descriptive analytics, diagnostic analytics, predictive analytics en prescriptive analytics. Deze categorieën onderscheiden zich van elkaar door het type toepassing en door hoe diep de analyse ingrijpt in de te nemen beslissingen.

Descriptive analytics

Descriptive analytics gaat over de vraag wat er in het verleden gebeurd is. Data science in deze hoek gaat meestal over het statistisch analyseren van data om mogelijk aanvankelijk verborgen inzichten of correlaties in de onderliggende processen of gegevens te ontdekken en deze inzichtelijk te maken.

Stel bijvoorbeeld dat in een ziekenhuis een uitzonderlijk hoog aantal mensen wordt binnengebracht bij de spoedeisende hulp. Dan kunnen descriptive analytics je vertellen dat dit gebeurt en je real-time inzicht geven in alle relevante bijbehorende statistische gegevens (datums, volumes, patiëntgegevens, …).

 

Diagnostic analytics

Diagnostic analytics gaat een stap verder, hier gaat het over de vraag waarom er in het verleden iets gebeurd is. Bij de data science op dit vlak gaat het over het gebruik van statistiek om patronen uit data te achterhalen die verklaren waarom iets is zoals het is.

In het voorbeeld van de spoedeisende hulp zouden diagnostic analytics kunnen verklaren waar de pieken in de aantallen patiënten vandaan komen.

 

Predictive analytics

Predictive analytics gaat over het voorspellen van de toekomst op basis van (historische) data. Veelal wordt historische data met behulp van een machine learning/AI (zie Machine Learning zo eenvoudig mogelijk uitgelegd en Artificial Intelligence zo eenvoudig mogelijk uitgelegd) omgezet in een model dat op basis van de actuele data een voorspelling kan maken van wat er vervolgens zal gaan gebeuren.

Weer terug bij het voorbeeld van de spoedeisende hulp in een ziekenhuis zou predictive analytics kunnen helpen om pieken in de toestroom van patiënten te voorspellen.


Prescriptive analytics

Prescriptive analytics gaat over het geautomatiseerd vinden van de beste oplossing, optie of keuze. Hierbij helpen algoritmen als alle informatie beschikbaar is (of voorspeld is met behulp van predictive analytics) om de beste beslissing te nemen (decision support) of nemen de beslissing volledig zelfstandig (decision automation). Daarbij kunnen eventueel de implicaties van een bepaalde keuze inzichtelijk worden gemaakt.

Stel nu dat je in het voorbeeld van de spoedeisende hulp aan de hand van de voorspelling een toename van het aantal patiënten verwacht, zouden prescriptive analytics kunnen helpen om een passende personeelsplanning te maken.

Samengevat:descriptive en diagnostic analytics kijken naar historische data om te duiden wat er in het verleden gebeurd is en waarom. Predictive en prescriptive analytics gebruiken de historische data om vooruit te kijken wat er in de toekomst gaat gebeuren en welke acties genomen kunnen worden op basis daarvan.

Nu we in dit artikel analytics uitgebreid besproken hebben, wil ik een vervolgartikel wijden aan een aanhoudende discussie binnen de wereld van data science en data-analyse; waarom moet een data scientist leren programmeren?