5 ML: Unsuppervised Learning

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/13

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

14 Terms

1
New cards

You know what unsupervised learning is (Unsupervised Learning)

  • Unsupervised learning zoekt naar structuren of patronen in data zonder gelabelde output. Het model leert zelf groepen of verbanden te herkennen.

2
New cards

You know how unsupervised learning works? (Unsupervised Learning)

  • Provide the machine learning algorithm uncategorized, unlabeled input data to see what patterns it finds

  • Observe and learn from the patterns the machine identifies

Problems:

  • Clustering

  • Anomaly detection

3
New cards

You understand what clustering is in ML (Clustering)

• Clustering groepeert data op basis van gelijkenissen. Er wordt gezocht naar natuurlijke verdelingen in de dataset zonder vooraf gedefinieerde labels.

4
New cards

You know how similarity is measured in clustering (Similarity Measurements)

• Gelijkenis kan gemeten worden via afstanden (zoals Euclidische afstand) of correlaties. Maar correlatie betekent niet noodzakelijk causaliteit.

5
New cards

You can explain how K-means clustering works (K-means Clustering)

• K-means groepeert data in ‘k’ clusters. Het algoritme wijst elk datapunt toe aan het dichtstbijzijnde centrum, en verplaatst deze centra totdat ze stabiel zijn.

6
New cards

You know how to find the optimal number of clusters in K-means (Elbow Method)

• De ‘elbow’-methode evalueert hoeveel de fout afneemt bij toenemend aantal clusters. Het ‘knikpunt’ toont waar extra clusters weinig extra informatie bieden.

7
New cards

You can name and explain 3 main types of recommender systems (Recommender Systems)

  • Popularity based: op basis van trending items of algemene populariteit

  • Content based: op basis van eigenschappen van het item (genre, regisseur, enz.)

  • Collaborative filtering: op basis van gedrag en voorkeuren van andere gebruikers

8
New cards

You understand how popularity-based recommendations work (Popularity Based)

• Systeem op basis van gewogen scores zoals IMDb. Houdt rekening met zowel gemiddelde beoordeling als aantal stemmen.

9
New cards

You can explain how content-based recommenders work (Content Based)

• Analyseert kenmerken van items die je leuk vindt, bouwt een gebruikersprofiel en raadt soortgelijke items aan. Gebruikt vaak one-hot encoding voor features.

10
New cards

You know the limitations of content-based recommenders (Cold Start)

• Bij nieuwe genres of items zonder eerdere beoordelingen weet het systeem niet of je het leuk zal vinden. Geen data = geen voorspelling mogelijk.

11
New cards

You understand how text data can be used in recommendations (NLP Vectorization)

• Met CountVectorizer (bag of words / one-hot) worden films of teksten omgezet in vectoren. Cosine similarity bepaalt hoe gelijk films zijn.

12
New cards

You know what collaborative filtering is (Collaborative Filtering)

• Gebaseerd op het gedrag van andere gebruikers. Het systeem leert wie op jou lijkt of welke items bij soortgelijke gebruikers populair zijn, zonder naar de inhoud van de items te kijken.

13
New cards

You can distinguish user-based and item-based collaborative filtering (User vs Item Based)

• User-based; zoek naar gebruikers die lijken op jou, en kijk wat zij leuk vinden
• Item-based; zoek naar items die gelijkaardige gebruikers ook leuk vonden

14
New cards

You know the main problems with collaborative filtering (Sparsity, Cold Start, Scalability)

• Sparsity; gebruikers beoordelen maar een fractie van de items
• Cold start; moeilijk om iets aan te raden aan nieuwe gebruikers of voor nieuwe items
• Scalability; grote datasets zorgen voor zware matrixberekeningen