R workshop introductie in data mining: haal meer inzichten uit uw eigen databases

Datamining is een proces, waarin je een serie van analyses kunt automatiseren in een of meer stromen van data verzameling, preparatie, transformatie, exploratie, modeling en deployment.

Met datamining traceer je niet voor de handliggende patronen en relaties. Met R beschik je over een uitgebreid assortiment aan datamining technieken met hoge automatiseerbaarheid.

Je leert hoe datamining met R ingezet kan worden in diverse toepassingen binnen je organisatie.

De workshop duurt 2 dagen.

Programma

In de workshop ligt op dag 1 de focus op het krijgen van overzicht en inzicht in data mining en het ‘minen’ van de eigen data.

Introductie in data mining

  • Crisp-dm data mining methodiek
  • Verzamelen van uw data
  • Verkennen van uw data
  • Data audit
  • Outlier detectie
  • Koppelen van de databestanden
  • Afgeleide attributen maken (de meest voorkomende data preparatie functies)

De eerste data mining analyses op uw data

  • Op zoek naar relaties in de data
  • Maken van een analyse opzet
  • Partitioneren van data in training and test sets
  • Balanceren van data
  • Introductie in classificatie vraagstukken

Op dag 2 ligt de focus op het krijgen van overzicht en inzicht in predictive modeling en clustering

Datamining analyse technieken

  • Soorten data mining technieken
  • Van vraagstelling naar keuze van analyse techniek
  • Uitleg van de werking van de technieken
  • Decision tree models
  • Regression models
  • K-means clustering
  • Market basket analyse
  • Data visualisatie

Beoordelen van modellen

  • Lift charts
  • Classification plots
  • Model accuracy
  • Tips & tricks

Model deployment

  • Uitscoren van kansen en voorspelde groeplidmaatschap
  • Exporteren van de data
  • Tips & tricks

Voor wie bedoeld?

Voor kwantitatieve marktonderzoekers, data analisten. Deze cursus sluit goed aan wanneer je zelfstandig datamining analyses wilt uitvoeren op bijvoorbeeld klantdatabases.

Benodigde voorkennis

Begrip van de basis statistiek en bekendheid met programmeren in R. Bijvoorbeeld de workshop Introductie in R ’the basics’.