Workshop Introductie in R ’the basics’
R levert je een groot assortiment aan statistische en grafische technieken, zoals lineaire en niet-lineaire regressie, statistische testen, classificatie technieken, cluster analyses en time-series analyses.
R is open source, platform onafhankelijk en gratis.
In deze workshop leer je werken met de meest populaire statistische taal binnen data science.
Deze workshop duurt 2 dagen.
Programma
Dag1
Inleiding in het programmeren in R
- Basis beginselen van R
- Installeren en packages
- Hulp krijgen en de R community
- Interface R
- Interface R Studio
- Verschillen tussen R en R Studio
- Customising R Studio
- Laden en bewaren van werkomgevingen, projecten en scripts
- Shortcuts in R-studio
Datamanagement in R
- Datatypen en dataobjecten
- R-objecten aanmaken en aanpassen
- Inlezen, bewaren en exporteren van datasets
- Data typen, definities
- Missing values
Datapreparatie in R
- Werken met de commandline en RStudio
- Rekenen met R
- Vectoren (variabelen) en data.frames (datasets)
- Afleiden van nieuwe variabelen
- Datum en tijd variabelen
- Tekstdata
- Bewerkingen op cases
- Koppelen van bestanden
- Sampling
- Data verkennen
- Outlier detectie
Beschrijvende statistische analysetechnieken
- Frequencies
- Crosstabs
- Gemiddelden vergelijken
Dag 2
Toetsende & voorspellende statistische analysetechnieken
- Chi-square test in crosstabs
- T-test
- One-way anova
- Man Whitney test
- Wilcoxon test
- Correlatie
- Regressie
De grafische mogelijkheden van R
- Basis grafiek typen
- Geavanceerde grafische visualisaties maken en bewerken
- Netwerk plots
- Rapportages maken
- Exporteren van output
Voor wie bedoeld?
Voor kwantitatieve marktonderzoekers en data analisten. Deze cursus sluit goed aan wanneer je de ambitie hebt om je te bekwamen in data science.
Benodigde voorkennis
Begrip van de basis statistiek.