Lompat ke isi

Regresi linear

Dari Wiki Berbudi
Revisi sejak 20 September 2025 10.34 oleh Budi (bicara | kontrib) (←Membuat halaman berisi 'Regresi linear adalah salah satu metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Metode ini mengasumsikan bahwa hubungan antara variabel-variabel tersebut dapat direpresentasikan dengan garis lurus. Regresi linear banyak digunakan dalam berbagai bidang seperti ekonomi, ilmu sosial, biologi, dan ilmu komputer untuk melakukan prediksi atau inferensi terha...')
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

Regresi linear adalah salah satu metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Metode ini mengasumsikan bahwa hubungan antara variabel-variabel tersebut dapat direpresentasikan dengan garis lurus. Regresi linear banyak digunakan dalam berbagai bidang seperti ekonomi, ilmu sosial, biologi, dan ilmu komputer untuk melakukan prediksi atau inferensi terhadap suatu fenomena. Model regresi linear yang paling sederhana adalah regresi linear sederhana, yang melibatkan satu variabel bebas dan satu variabel terikat.

Konsep Dasar

Konsep utama dalam regresi linear adalah mencari garis terbaik yang meminimalkan selisih antara nilai yang diprediksi oleh model dan nilai aktual dari data. Selisih ini disebut residu atau error. Garis terbaik biasanya ditentukan dengan metode kuadrat terkecil (ordinary least squares/OLS). Persamaan umum regresi linear sederhana dapat ditulis sebagai:

Y = a + bX + e

di mana Y adalah variabel dependen, X adalah variabel independen, a adalah intercept, b adalah koefisien regresi, dan e adalah error.

Jenis Regresi Linear

Secara umum, regresi linear dibagi menjadi dua jenis utama:

  1. Regresi linear sederhana: hanya melibatkan satu variabel independen.
  2. Regresi linear berganda: melibatkan dua atau lebih variabel independen.

Kedua jenis ini menggunakan prinsip yang sama, tetapi regresi linear berganda memungkinkan analisis yang lebih kompleks dengan mempertimbangkan interaksi antarvariabel.

Asumsi-asumsi dalam Regresi Linear

Agar hasil regresi linear valid, terdapat beberapa asumsi yang harus dipenuhi:

  1. Hubungan antara variabel dependen dan independen bersifat linear.
  2. Error terdistribusi normal.
  3. Varians error konstan (homoskedastisitas).
  4. Tidak terdapat multikolinearitas yang tinggi antarvariabel independen.
  5. Error bersifat independen satu sama lain.

Apabila asumsi-asumsi ini tidak terpenuhi, maka hasil estimasi dapat menjadi bias atau tidak efisien.

Estimasi Parameter

Dalam regresi linear, estimasi parameter biasanya dilakukan dengan metode kuadrat terkecil. Metode ini bekerja dengan meminimalkan jumlah kuadrat residu untuk mendapatkan nilai parameter yang optimal. Koefisien regresi menunjukkan seberapa besar perubahan rata-rata pada variabel dependen untuk setiap perubahan satu satuan pada variabel independen.

Pengujian Signifikansi

Setelah parameter diestimasi, langkah berikutnya adalah menguji signifikansinya. Uji yang umum digunakan adalah uji t untuk setiap koefisien, guna menentukan apakah variabel independen berpengaruh signifikan terhadap variabel dependen. Selain itu, uji F digunakan untuk menguji signifikansi model secara keseluruhan.

Koefisien Determinasi

Koefisien determinasi (R²) digunakan untuk mengukur seberapa baik model regresi linear mampu menjelaskan variasi pada variabel dependen. Nilai R² berkisar antara 0 dan 1. Semakin mendekati 1, semakin baik model dalam menjelaskan data. Namun, nilai R² yang tinggi tidak selalu berarti model tersebut baik, karena bisa saja terjadi overfitting.

Aplikasi Regresi Linear

Regresi linear digunakan secara luas dalam berbagai bidang. Contohnya, dalam ekonomi untuk memprediksi konsumsi berdasarkan pendapatan, dalam epidemiologi untuk mengkaji hubungan antara paparan dan risiko penyakit, atau dalam pembelajaran mesin untuk membuat model prediksi berbasis data historis.

Kelebihan Regresi Linear

Beberapa kelebihan regresi linear antara lain:

  1. Sederhana dan mudah diinterpretasikan.
  2. Memiliki dasar teori yang kuat.
  3. Efisien untuk dataset dengan ukuran kecil hingga menengah.
  4. Dapat digunakan sebagai baseline model dalam machine learning.

Keterbatasan Regresi Linear

Namun, regresi linear juga memiliki keterbatasan, seperti:

  1. Tidak efektif jika hubungan antara variabel tidak linear.
  2. Rentan terhadap outlier.
  3. Membutuhkan pemenuhan asumsi klasik.
  4. Kurang cocok untuk data dengan multikolinearitas tinggi.

Variasi dan Pengembangan

Terdapat berbagai pengembangan dari regresi linear, seperti regresi ridge, regresi Lasso, dan regresi robust yang dirancang untuk mengatasi kelemahan tertentu dari regresi linear klasik. Dalam analisis data modern, variasi ini sering digunakan untuk meningkatkan akurasi prediksi dan mengurangi masalah overfitting.

Implementasi dalam Perangkat Lunak

Regresi linear dapat dengan mudah diimplementasikan menggunakan berbagai perangkat lunak statistik seperti R, Python dengan pustaka scikit-learn, SPSS, atau Excel. Implementasi ini memungkinkan pengguna untuk melakukan analisis regresi dengan cepat dan memvisualisasikan hasilnya.

Kesimpulan

Regresi linear tetap menjadi salah satu metode analisis yang paling populer dan fundamental dalam statistik dan pembelajaran mesin. Meskipun sederhana, metode ini sangat berguna untuk memahami dan memodelkan hubungan antarvariabel. Dengan pemahaman yang baik tentang asumsi dan keterbatasannya, regresi linear dapat memberikan wawasan yang bermakna dan prediksi yang cukup akurat.