Lompat ke isi

Prinsip Matematika di Balik K-Means

Dari Wiki Berbudi
Revisi sejak 31 Juli 2025 21.51 oleh Budi (bicara | kontrib) (Batch created by Azure OpenAI)
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

K-Means merupakan algoritma yang berakar pada prinsip matematika dan statistika. Pemahaman tentang dasar matematika di balik K-Means penting untuk mengoptimalkan penggunaannya dalam analisis data dan machine learning.

Fungsi Objektif

Tujuan utama K-Means adalah meminimalkan jumlah total jarak Euclidean kuadrat antara setiap data dengan centroid cluster-nya. Fungsi objektif ini dikenal sebagai Within-Cluster Sum of Squares (WCSS) dan menjadi dasar iterasi dalam algoritma.

Jarak dan Centroid

Pemilihan jarak Euclidean sebagai metrik utama memungkinkan K-Means untuk secara efisien membagi data ke dalam cluster. Centroid dihitung sebagai rata-rata dari semua data dalam cluster, sehingga hasil pengelompokan sangat bergantung pada distribusi data.

Konvergensi dan Kompleksitas

Secara matematis, algoritma K-Means akan selalu konvergen, meskipun bisa mencapai solusi lokal yang bukan merupakan global optimum. Kompleksitas waktu algoritma ini adalah O(nkt), di mana n adalah jumlah data, k adalah jumlah cluster, dan t adalah jumlah iterasi.