1/13
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
You know what unsupervised learning is (Unsupervised Learning)
Unsupervised learning zoekt naar structuren of patronen in data zonder gelabelde output. Het model leert zelf groepen of verbanden te herkennen.
You know how unsupervised learning works? (Unsupervised Learning)
Provide the machine learning algorithm uncategorized, unlabeled input data to see what patterns it finds
Observe and learn from the patterns the machine identifies
Problems:
Clustering
Anomaly detection
You understand what clustering is in ML (Clustering)
• Clustering groepeert data op basis van gelijkenissen. Er wordt gezocht naar natuurlijke verdelingen in de dataset zonder vooraf gedefinieerde labels.
You know how similarity is measured in clustering (Similarity Measurements)
• Gelijkenis kan gemeten worden via afstanden (zoals Euclidische afstand) of correlaties. Maar correlatie betekent niet noodzakelijk causaliteit.
You can explain how K-means clustering works (K-means Clustering)
• K-means groepeert data in ‘k’ clusters. Het algoritme wijst elk datapunt toe aan het dichtstbijzijnde centrum, en verplaatst deze centra totdat ze stabiel zijn.
You know how to find the optimal number of clusters in K-means (Elbow Method)
• De ‘elbow’-methode evalueert hoeveel de fout afneemt bij toenemend aantal clusters. Het ‘knikpunt’ toont waar extra clusters weinig extra informatie bieden.
You can name and explain 3 main types of recommender systems (Recommender Systems)
Popularity based: op basis van trending items of algemene populariteit
Content based: op basis van eigenschappen van het item (genre, regisseur, enz.)
Collaborative filtering: op basis van gedrag en voorkeuren van andere gebruikers
You understand how popularity-based recommendations work (Popularity Based)
• Systeem op basis van gewogen scores zoals IMDb. Houdt rekening met zowel gemiddelde beoordeling als aantal stemmen.
You can explain how content-based recommenders work (Content Based)
• Analyseert kenmerken van items die je leuk vindt, bouwt een gebruikersprofiel en raadt soortgelijke items aan. Gebruikt vaak one-hot encoding voor features.
You know the limitations of content-based recommenders (Cold Start)
• Bij nieuwe genres of items zonder eerdere beoordelingen weet het systeem niet of je het leuk zal vinden. Geen data = geen voorspelling mogelijk.
You understand how text data can be used in recommendations (NLP Vectorization)
• Met CountVectorizer (bag of words / one-hot) worden films of teksten omgezet in vectoren. Cosine similarity bepaalt hoe gelijk films zijn.
You know what collaborative filtering is (Collaborative Filtering)
• Gebaseerd op het gedrag van andere gebruikers. Het systeem leert wie op jou lijkt of welke items bij soortgelijke gebruikers populair zijn, zonder naar de inhoud van de items te kijken.
You can distinguish user-based and item-based collaborative filtering (User vs Item Based)
• User-based; zoek naar gebruikers die lijken op jou, en kijk wat zij leuk vinden
• Item-based; zoek naar items die gelijkaardige gebruikers ook leuk vonden
You know the main problems with collaborative filtering (Sparsity, Cold Start, Scalability)
• Sparsity; gebruikers beoordelen maar een fractie van de items
• Cold start; moeilijk om iets aan te raden aan nieuwe gebruikers of voor nieuwe items
• Scalability; grote datasets zorgen voor zware matrixberekeningen