K-means clustering

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/3

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

4 Terms

1
New cards

K

ilość clusters

2
New cards

proces obliczania

  1. randomowo wybiera się K punktów (tyle ile chcemy clusterów) w naszych danych - initial clusters

    .….. …....

  2. oblicza się odległość od pierwszego punktu danych po lewej do każdego z initial clusters i przypisujemy go do najbliższego initial cluster

    ... …....

  3. robimy to samo z pozostałymi punktami

  4. obliczamy średnią dla punktów z każdego clustera

  5. obliczamy variation dla punktów z każdego clustera

Cykl ten jest powtarzany tak długo, aż znajdzie się ustawienie w którym każdy cluster będzie miał w miarę równe variance i następne próby nie dają lepszego wyniku

3
New cards

ilość K

obliczamy variance dla każdej ilości K

w pewnym momencie osiągniemy ilość, po której variance nie będzie już tak drastycznie spadać

ta ilość jest optymalna

4
New cards

dane nielinearne\wielowymiarowe

proces jest taki sam, tylko metoda obliczenia się zmienia

dwu lub więcej wymiarowe (mają wartość x i y na układzie współrzędnych) - euclidean distance