| Aan het eind van de cursus kun je
- bedenken en beargumenteren welk data mining algoritme geschikt voor welk probleem;
- verschillende data mining algoritmen toepassen, analyseren en implementeren;
- de kwaliteit van de verkregen oplossingen evalueren.
|
| Hoe kunnen we systemen maken die kunnen leren? Of meer specifiek: hoe extraheren we relevante, interessante informatie uit "big data"? Je zult leren dat er verschillende algoritmen zijn, afhankelijk van de vraag die je wilt beantwoorden en van de eigenschappen van de data waar je mee moet werken. In een project zul je de algoritmen implementeren en/of testen op bestaande datasets. |
|
|
|
 We zullen verschillende problemen behandelen met bijbehorende algoritmen: • exploratieve data analyse (histograms, boxplots, principale componenten-analyse, multi-dimensionele schaling); • beschrijvende modellen (clustering, associatieanalyse, kansmodellen); • classificeren (beslisbomen, naive Bayes classificatoren, naaste buren-algoritme, neurale netwerken).
Daarbij passeren verschillende basisprincipes de revue zoals (rekenen met) afstandsmaten, (Bayesiaanse) kansrekening, cross-validatie en bootstrapping. |
De beoordeling wordt gebaseerd op een midterm tentamen (voor 35%), een eindterm tentamen (voor 35%) en een werkstuk (voor 30%). Huiswerkopdrachten zijn verplicht en moeten voldoende worden gemaakt. Hertentamen komt in de plaats van zowel midterm als eindterm tentamen en telt dan voor 70%. |
Je • bent bekend met elementaire begrippen uit de kansrekening als kansen, kansverdelingen en verwachtingswaarden; • kunt eenvoudige berekeningen hiermee uitvoeren; • weet wat vectoren en matrices zijn; • kunt deze optellen en met elkaar vermenigvuldigen.
Deze voorkennis komt aan de orde in de cursussen Calculus en Kansrekening en Matrixrekenen. |
"Introduction to data mining", Tan, Steinbach and Kumar (sterk aanbevolen) |
• 32 uur computerpracticum • 32 uur hoorcollege • 104 uur zelfstudie Toelichting werkvormen: De theorie wordt behandeld in hoorcolleges. In de werkcolleges kun je werken aan de huiswerkopdrachten, met name het programmeren en toepassen van data mining algoritmen in Matlab of Python. Verder praktische ervaring wordt opgedaan in een project, waar je zelf een data mining algoritmen toepast op een dataset. |
| | Aanbevolen materiaalBoek"Introduction to data mining", Tan, Steinbach and Kumar (sterk aanbevolen) |
 |
| Werkvormen Computerpracticum 
 | Cursusgebeurtenis 
 | Hoorcollege 
 | Zelfstudie  AlgemeenDe theorie wordt behandeld in hoorcolleges. In de werkcolleges kun je werken aan de huiswerkopdrachten, met name het programmeren en toepassen van data mining algoritmen in Matlab of Python. Verder praktische ervaring wordt opgedaan in een project, waar je zelf een data mining algoritmen toepast op een dataset.
 |
| Toetsen TentamenWeging |  | 1 |
Gelegenheden |  | Blok KW2, Blok KW4 |
 |
|
| |