Data scientist, data engineer of data-analist?

Max Wiertz

De functie data scientist is breed, net als het vakgebied data science. Beide termen zijn veelomvattende containerbegrippen. Naast data scientist zien we regelmatig ook de functies data engineer en data-analist langskomen. Goed dus om de verschillende functies - of misschien beter: expertisegebieden - te duiden.

In een reeks artikelen in onze rubriek #techtalk wil ik je graag op een niet-technische, conceptuele manier kennis laten maken met het brede vakgebied data science. De insteek van deze artikelen is het geven van een helikopterview, waarmee ik je wil helpen om dataprofessionals beter te begrijpen en constructieve discussies met hen te voeren. Ik ben ervan overtuigd dat dat de basis legt voor succesvolle dataprojecten. Hopelijk weet ik je ook te inspireren om na te denken over de mogelijkheden van data science binnen je eigen organisatie. Er liggen vaak onverwacht veel kansen!

 

Data scientist

Van de genoemde begrippen wil ik beginnen bij het ‘klassieke’ expertisegebied van de data scientist, waarbij we de data scientist zien als iemand die modellen maakt waarmee uit datasets waardevolle voorspellingen gedestilleerd worden. Om dit te kunnen bereiken moet je als data scientist om te beginnen kunnen programmeren, daarnaast moet je echter ook thuis zijn in de analytics, statistiek en AI (AI = Artificial Intelligence; machine learning, deep learning, neurale netwerken, …). Daarnaast moet je communicatief sterk zijn en over goede presentatie- en visualisatievaardigheden beschikken.

Vaak wordt een functie in dit expertisegebied data scientist genoemd. We zien echter ook vaker, misschien wel duidelijkere, betere, functietitels als AI engineer of ML engineer (ML = Machine Learning).


Data-analist

Vervolgens onderkennen we het expertisegebied data-analist. Een data-analist is iemand die gegevens analyseert om belangrijke kennis en inzichten voor een organisatie te extraheren. Ook een data-analist heeft een goede wiskundige basis (statistiek) nodig. En ook zij visualiseren resultaten om inzichten duidelijk over te kunnen dragen. Dus ook hier zijn goede communicatieve vaardigheden onontbeerlijk.


Data engineer

Het expertisegebied data engineer richt zich veel meer op de infrastructurele technische kant die nodig is bij het omzetten van die data in betekenisvolle kennis en inzichten. Data engineering concentreert zich op de techniek, de inrichting en de architectuur van de dataverwerkende processen. Zoals het draaiend krijgen, draaiend houden, automatiseren en doorontwikkelen van data pipelines voor het ophalen, opschonen en integreren van data. Veelal wordt ook het productierijp maken en onderhouden van voorspellingsmodellen in productie tot de taken onder data engineering geschaard.

Verschillen

Het werk van een data scientist en een data-analist gaat dus grotendeels hand in hand. Echter, waar een data-analist met name inzichten verzamelt in organisaties met betrekking op de huidige stand van zaken, gaat een data scientist verder. Deze duikt nog dieper in de materie en de trends en ontwikkelt modellen om voorspellingen te doen voor de toekomst. Daarnaast houdt hij zich ook bezig met het evalueren van de voorspellende modellen en bouwt aan nog betere versies van de onderliggende algoritmes. Verder beschikt een data scientist - zoals gezegd - ook over programmeervaardigheden, dat is bij een data-analist niet altijd aan de orde.

Zowel de modellen van data scientists, als de dashboards van data-analisten leveren pas waarde als ze ‘in productie’ zijn. Pas als ze echt gebruikt worden, continu verbeterd worden en steeds over de meest actuele data beschikken zijn ze echt af. Dit is waar data engineers zich op richten; zij zorgen ervoor dat de ontwikkelde oplossingen die het experimentele stadium ontstijgen en in de praktijk meerwaarde bieden. Dat doen zij door de technische infrastructuur te voorzien en onderhouden en de data-oplossingen beschikbaar te stellen voor gebruikers. Kortom, waar data scientists en data-analisten veelal met name werken aan de inhoudelijke, vaak wiskundige en analytische kant van het ontwikkelen data science-oplossingen, werkt de data-engineer meer aan de technische en infrastructurele kant ervan.

Data scientist = dataprofessional

In onze beleving hoort een praktische dataprofessional in alle expertisegebieden thuis te zijn. Wij zien dataprofessionals als T-shaped; ze beschikken over een brede kennis van het hele vakgebied en hebben zich meer verdiept in een specifiek deelgebied. Wij noemen ze overigens gewoon data scientist. Al kunnen we ook prima leven met een meer specifieke functietitel als AI engineer, data-analist of data engineer, maar de best passende functietitel vinden wij gewoonweg dataprofessional!

Nu we de grote containerbegrippen hebben uitgelegd, is het tijd om in het volgende artikel in deze reeks een aantal buzzwords die we vaak horen in relatie tot data science te gaan duiden om vervolgens in vervolgartikelen dieper in te gaan op de afzonderlijk sub-vakgebieden binnen data science. Denk bijvoorbeeld aan machine learning, artificial intelligence en deep learning.