Lompat ke isi

Overfitting pada Decision Tree

Dari Wiki Berbudi

Overfitting adalah salah satu masalah utama dalam pohon keputusan di mana model terlalu menyesuaikan diri dengan data latih sehingga performa pada data baru menjadi buruk. Hal ini terjadi ketika pohon terlalu dalam dan menangkap noise atau pola yang tidak relevan dalam data.

Penyebab Overfitting

Overfitting sering disebabkan oleh pembentukan pohon yang terlalu kompleks tanpa batasan tertentu, seperti jumlah level pohon atau jumlah data minimal pada setiap simpul. Selain itu, data yang mengandung banyak noise juga dapat menyebabkan overfitting pada decision tree.

Dampak Overfitting

Model yang overfit biasanya menunjukkan akurasi tinggi pada data pelatihan namun rendah pada data pengujian. Hal ini menyebabkan model tidak dapat digeneralisasi dengan baik ke data baru, sehingga kurang efektif dalam praktik.

Cara Mengatasi Overfitting

Untuk mengatasi overfitting, dapat dilakukan teknik pruning, membatasi kedalaman pohon, atau menggunakan ensemble methods seperti Random Forest yang menggabungkan beberapa pohon keputusan sekaligus.