Regresi linier vs logistik
Dalam analisis statistik, penting untuk mengidentifikasi hubungan antara variabel yang terkait dengan penelitian ini. Terkadang itu mungkin satu -satunya tujuan analisis itu sendiri. Salah satu alat kuat yang digunakan untuk menetapkan keberadaan hubungan dan mengidentifikasi hubungan adalah analisis regresi.
Bentuk analisis regresi paling sederhana adalah regresi linier, di mana hubungan antara variabel adalah hubungan linier. Dalam istilah statistik, itu memunculkan hubungan antara variabel penjelas dan variabel respons. Misalnya, menggunakan regresi kami dapat menetapkan hubungan antara harga komoditas dan konsumsi berdasarkan data yang dikumpulkan dari sampel acak. Analisis regresi akan menghasilkan fungsi regresi dari kumpulan data, yang merupakan model matematika yang paling sesuai dengan data yang tersedia. Ini dapat dengan mudah diwakili oleh plot sebaran. Regresi grafis setara dengan menemukan kurva pemasangan terbaik untuk set data yang diberikan. Fungsi kurva adalah fungsi regresi. Menggunakan model matematika penggunaan komoditas dapat diprediksi untuk harga tertentu.
Oleh karena itu, analisis regresi banyak digunakan dalam memprediksi dan meramalkan. Ini juga digunakan untuk membangun hubungan dalam data eksperimental, di bidang fisika, kimia, dan dalam banyak ilmu alam dan disiplin teknik. Jika hubungan atau fungsi regresi adalah fungsi linier, maka prosesnya dikenal sebagai regresi linier. Dalam plot sebaran, itu dapat direpresentasikan sebagai garis lurus. Jika fungsinya bukan kombinasi linier dari parameter, maka regresi adalah non-linear.
Regresi logistik sebanding dengan regresi multivariat, dan itu menciptakan model untuk menjelaskan dampak beberapa prediktor pada variabel respons. Namun, dalam regresi logistik, variabel hasil akhir harus kategori (biasanya dibagi; i.e., Sepasang hasil yang dapat dicapai, seperti kematian atau kelangsungan hidup, meskipun teknik khusus memungkinkan lebih banyak informasi yang dikategorikan untuk dimodelkan). Variabel hasil kontinu dapat diubah menjadi variabel kategori, untuk digunakan untuk regresi logistik; Namun, runtuhnya variabel kontinu dengan cara ini sebagian besar berkecil hati karena mengurangi keakuratan.
Tidak seperti dalam regresi linier, terhadap rata -rata, variabel prediktor dalam regresi logistik tidak harus dipaksa untuk terhubung secara linier, secara umum didistribusikan, atau memiliki varian yang sama di dalam setiap cluster. Akibatnya, hubungan antara prediktor dan variabel hasil tidak mungkin menjadi fungsi linier.
Apa perbedaan antara regresi logistik dan linier?
• Dalam regresi linier, hubungan linier antara variabel penjelas dan variabel respons diasumsikan dan parameter yang memuaskan model ditemukan dengan analisis, untuk memberikan hubungan yang tepat.
• Regresi linier dilakukan untuk variabel kuantitatif, dan fungsi yang dihasilkan adalah kuantitatif.
• Dalam regresi logistik, data yang digunakan dapat kategori atau kuantitatif, tetapi hasilnya selalu kategori.