1/3
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
K
ilość clusters
proces obliczania
randomowo wybiera się K punktów (tyle ile chcemy clusterów) w naszych danych - initial clusters
.….. …. …...
oblicza się odległość od pierwszego punktu danych po lewej do każdego z initial clusters i przypisujemy go do najbliższego initial cluster
.….. …. …...
robimy to samo z pozostałymi punktami
obliczamy średnią dla punktów z każdego clustera
obliczamy variation dla punktów z każdego clustera
Cykl ten jest powtarzany tak długo, aż znajdzie się ustawienie w którym każdy cluster będzie miał w miarę równe variance i następne próby nie dają lepszego wyniku
ilość K
obliczamy variance dla każdej ilości K
w pewnym momencie osiągniemy ilość, po której variance nie będzie już tak drastycznie spadać
ta ilość jest optymalna
dane nielinearne\wielowymiarowe
proces jest taki sam, tylko metoda obliczenia się zmienia
dwu lub więcej wymiarowe (mają wartość x i y na układzie współrzędnych) - euclidean distance