Lompat ke isi

DBSCAN

Dari Wiki Berbudi

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) adalah algoritma clustering berbasis kepadatan yang mampu menemukan kluster dengan bentuk arbitrer dan mengidentifikasi data outlier. Algoritma ini banyak digunakan dalam data mining dan analisis spasial.

Konsep Dasar

DBSCAN mengelompokkan data berdasarkan kepadatan titik-titik data. Algoritma ini membutuhkan dua parameter utama: epsilon (jarak maksimum antar titik dalam satu kluster) dan MinPts (jumlah minimum titik untuk membentuk kluster). Titik yang tidak memenuhi syarat akan dianggap sebagai outlier.

Cara Kerja DBSCAN

Algoritma DBSCAN memulai dengan memilih sebuah titik secara acak, lalu memeriksa tetangganya dalam radius epsilon. Jika jumlah tetangga lebih dari MinPts, maka titik-titik tersebut membentuk satu kluster. Proses ini diulang hingga seluruh titik diproses.

Kelebihan dan Kekurangan

DBSCAN unggul dalam menangani data dengan bentuk kluster yang tidak teratur dan dapat mendeteksi outlier dengan baik. Namun, algoritma ini kurang efektif jika kepadatan data sangat bervariasi atau jika data berdimensi tinggi.