Populasi vs Sampel standar deviasi
Dalam statistik, beberapa indeks digunakan untuk menggambarkan kumpulan data yang sesuai dengan kecenderungan pusat, dispersi, dan kemiringannya. Deviasi Standar adalah salah satu ukuran dispersi data yang paling umum dari pusat kumpulan data.
Karena kesulitan praktis, tidak mungkin memanfaatkan data dari seluruh populasi ketika hipotesis diuji. Oleh karena itu, kami menggunakan nilai data dari sampel untuk membuat kesimpulan tentang populasi. Dalam situasi seperti itu, ini disebut estimator karena mereka memperkirakan nilai parameter populasi.
Sangat penting untuk menggunakan estimator yang tidak bias dalam inferensi. Estimator dikatakan tidak memihak jika nilai yang diharapkan dari estimator itu sama dengan parameter populasi. Misalnya, kami menggunakan rata -rata sampel sebagai penaksir yang tidak bias untuk rata -rata populasi. (Secara matematis, dapat ditunjukkan bahwa nilai yang diharapkan dari rata -rata sampel sama dengan rata -rata populasi). Dalam hal memperkirakan standar deviasi populasi, standar deviasi sampel juga merupakan penaksir yang tidak bias.
Apa itu standar deviasi populasi?
Ketika data dari seluruh populasi dapat diperhitungkan (misalnya dalam kasus sensus) dimungkinkan untuk menghitung standar deviasi populasi. Untuk menghitung standar deviasi populasi, pertama penyimpangan nilai data dari rata -rata populasi dihitung. Root rata -rata kuadrat (rata -rata kuadratik) dari penyimpangan disebut standar deviasi populasi.
Dalam kelas 10 siswa, data tentang siswa dapat dengan mudah dikumpulkan. Jika hipotesis diuji pada populasi siswa ini, maka tidak perlu menggunakan nilai sampel. Misalnya, bobot 10 siswa (dalam kilogram) diukur menjadi 70, 62, 65, 72, 80, 70, 63, 72, 77 dan 79. Maka berat rata -rata sepuluh orang (dalam kilogram) adalah (70+62+65+72+80+70+63+72+77+79)/10, yaitu 71 (dalam kilogram). Ini adalah rata -rata populasi.
Sekarang untuk menghitung standar deviasi populasi, kami menghitung penyimpangan dari rata -rata. Penyimpangan masing -masing dari rata -rata adalah (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 dan (79 - 71) = 8. Jumlah kotak penyimpangan adalah (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Deviasi standar populasi adalah √ (366/10) = 6.05 (dalam kilogram). 71 adalah berat rata -rata yang tepat dari siswa kelas dan 6.05 adalah standar deviasi berat yang tepat dari 71.
Apa itu sampel standar deviasi?
Ketika data dari sampel (ukuran N) digunakan untuk memperkirakan parameter populasi, standar deviasi sampel dihitung. Pertama penyimpangan nilai data dari rata -rata sampel dihitung. Karena rata -rata sampel digunakan sebagai pengganti rata -rata populasi (yang tidak diketahui), mengambil rata -rata kuadratik tidak tepat. Untuk mengkompensasi penggunaan rata-rata sampel, jumlah kotak penyimpangan dibagi dengan (n-1) bukan n. Deviasi standar sampel adalah akar kuadrat dari ini. Dalam simbol matematika, s = √ ∑ (xSaya-X)2 / (n-1), di mana s adalah standar deviasi sampel, ẍ adalah rata-rata sampel dan xSayaadalah titik data.
Sekarang asumsikan bahwa, dalam contoh sebelumnya, populasinya adalah siswa dari seluruh sekolah. Kemudian, kelas hanya akan menjadi sampel. Jika sampel ini digunakan dalam estimasi, standar deviasi sampel akan √ (366/9) = 6.38 (dalam kilogram) karena 366 dibagi dengan 9 bukan 10 (ukuran sampel). Fakta untuk mengamati adalah bahwa ini tidak dijamin menjadi nilai standar deviasi populasi yang tepat. Itu hanyalah perkiraan untuk itu.
Apa perbedaan antara standar deviasi populasi dan standar deviasi sampel? • Deviasi standar populasi adalah nilai parameter yang tepat yang digunakan untuk mengukur dispersi dari pusat, sedangkan standar deviasi sampel adalah estimator yang tidak bias untuk itu. • Deviasi standar populasi dihitung ketika semua data mengenai setiap individu dari populasi diketahui. Lain, standar deviasi sampel dihitung. • Deviasi standar populasi diberikan oleh σ = √ ∑ (xi-µ)2/ n di mana µ adalah rata-rata populasi dan n adalah ukuran populasi tetapi standar deviasi sampel diberikan oleh s = √ ∑ (xi-ẍ)2 / (n-1) di mana ẍ adalah rata-rata sampel dan n adalah ukuran sampel.
|