Skip to content

Menjajal R untuk analisis korelasi dan regresi

Kehandalan R untuk analisis statistik perlu kita uji. Seberapa cepat dan simpel. Dua analisis yang menjadi ‘kelinci percobaan’ di dalam simulasi ini adalah korelasi dan regresi. Kedua analisis ini akan menggunakan data yang sebelumnya telah disiapkan dan bisa di download di link berikut s.bps.go.id/R_UNDIP. Menggunakan data penjualan dan iklan, akan saya simulasikan bagaimana aplikasi R ini bekerja. Tidak akan saya bahas mengenai apa itu analisis korelasi dan regresi. Saya yakin banyak sekali website dan buku-buku referensi yang membahas kedua analisis ini. Artikel ini hanya akan membahas bagaimana aplikasi R bekerja untuk kedua analisis serta bagaimana kita membaca hasil analisis atau proses interpretasi.

Scatter Plot Regresi


Analisis Korelasi
Menggunakan data yang sudah disediakan di atas, saya akan mensimulasikan bagaimana korelasi atau hubungan antara iklan dengan hasil penjualan suatu produk. Langkah-langkah yang saya lakukan adalah:

  • Import data excel ke dalam R, dengan cara click import dataset di bagian kanan atas kemudian pilih from excel dan cari dimana lokasi file berada.
  • Setelah data set terimport ke dalam R, langkah selanjutnya adalah membuat data frame dengan mengetik di console R >data_penjualan=data.frame(data_penjualan)
  • Kemudian kita tentukan variabel y (terikat) dan variabel x (tidak terikat) dengan cara mengetik di console R >y=data_penjualan$Penjualan_Y dan >x=data_penjualan$Iklan_X
  • Dikala kita sudah melakukan setting data menjadi variabel Y dan X, maka langkah selanjutnya adalah melakukan proses analisis korelasi. Dengan cara mengetik di console >cor(x,y) atau >cor(y,x) kita bisa membolak-balik variabel x dan y. 
  • Kita ingat bahwa nilai korelasi itu berada di kisaran – 1 < x < 1 yang berarti bahwa nilai hasil perhitungan korelasi berada di antara minus 1 hingga positif 1. Semakin mendekati nilai 1 maka hubungan (korelasi) dua variabel tersebut kuat. 
  • Hasil perhitungan dari data ini menunjukkan 0,9261306 atau mendekati 1 sehingga bisa kita simpulkan bahwa ada korelasi yang cukup kuat antara iklan dengan penjualan.
  • Sampai langkah ini sebenarnya sudah cukup menggambarkan nilai korelasi, tetapi jika kita ingin mengetahui hasil analisis yang lebih komplit maka kita bisa memberikan perintah di console >cor.test(y,x), R akan memberikan informasi detail mengenai nilai t hitung p-value hingga model atau mode yang kita gunakan. Setting default R adalah Pearson’s product-moment.
  • Detail screen recording menganalisis korelasi menggunakan R disajikan di dalam video berikut ini.

Analisis Regresi
Masih menggunakan data yang sama yaitu data penjualan, langkah selanjutnya adalah saya mensimulasikan menggunakan R untuk analisis regresi. Karena sebelumnya data yang sudah saya import sudah saya setting menjadi data frame, maka pada tahap ini saya tidak perlu melakuan dataset kembali. Bagi yang belum melakukan data set maka tetap perlu melakukan dataset dengan mendefinisikan variabel y dan variabel x. Adapun langkah-langkahnya sebagai berikut:

  • Langkah pertama adalah membuat definisi >regresi=lm(y~x). Sebenarnya tanpa melakukan pembuatan definisi perintah inipun bisa yaitu dengan cara langsung menulis perintah >lm(y~x), namun karena alasan memudahkan saja maka saya akan melakukan pendefinisian terlebih dahulu. LM sendiri merupakan singkatan dari linear model.
  • Setelah membuat definisi seperti di atas, eksekusi analisis regresi linear sudah bisa dilakukan dengan cara mengetik di console >regresi maka akan muncul nilai hasil interpretasinya. R akan memunculkan nilai koefisien (interpret) sebesar 35.271 dan nilai x sebesar 1.814 yang artinya jika kita masukkan ke dalam rumus persamaan regresi akan menjadi y = 35,271 + 1,814X.
  • Langkah selanjutnya adalah melakukan pengecekan hasil analisis detail setiap variabel dengan cara mengetik di console >summary(regresi). Maka secara otomatis akan menampilkan informasi mengenai standar error setiap variabel, t hitung untuk setiap variabel hingga p-value.
  • Kemudian jika kita ingin menampilkan scatter plot hasil analisis regresi linear kita bisa menulis di console R >plot(x,y,xlab=”iklan”,ylab=”penjualan”,pch=21) yang artinya kita akan menyajikan IKLAN sebagai sumbu X dan Penjualan sebagai sumbu Y.
  • Adapun untuk menyajikan garis regresinya bisa dengan menggunakan perintah >abline(regresi), maka secara otomatis akan tergambar garis regresinya.


%d bloggers like this: