Pusat Tendency vs Dispersion
Dalam statistik deskriptif dan inferensi, beberapa indeks digunakan untuk menggambarkan satu set data yang sepadan dengan kecenderungan, penyebaran, dan kecenderungannya yang utama: tiga sifat paling penting yang menentukan bentuk relatif taburan set data.
Apakah kecenderungan utama?
Kecenderungan pusat merujuk dan menempatkan pusat pengedaran nilai. Maksud, mod, dan median adalah indeks yang paling biasa digunakan dalam menggambarkan kecenderungan pusat set data. Sekiranya set data bersifat simetrik, kedua-dua median dan min dari set data bertepatan dengan satu sama lain.
Memandangkan set data, min dikira dengan mengambil jumlah semua nilai data dan kemudian membahagikannya dengan bilangan data. Sebagai contoh, berat 10 orang (dalam kilogram) diukur menjadi 70, 62, 65, 72, 80, 70, 63, 72, 77 dan 79. Kemudian berat min sebanyak sepuluh orang (dalam kilogram) boleh dikira seperti berikut. Jumlah berat adalah 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Maksud = (jumlah) / (bilangan data) = 710/10 = 71 (dalam kilogram). Difahamkan bahawa outliers (titik data yang menyimpang dari arah aliran normal) cenderung menjejaskan min. Oleh itu, dengan kehadiran outliers bermakna semata-mata tidak akan memberikan gambaran yang betul tentang pusat set data.
Median ialah titik data yang terdapat di tengah yang tepat dari set data. Satu cara untuk mengira median adalah untuk memerintahkan titik data dalam urutan menaik, dan kemudian cari titik data di tengah. Contohnya, jika pernah memerintahkan set data sebelumnya seperti, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Oleh itu, (70 + 72) / 2 = 71 adalah di tengah. Daripada ini, dilihat bahawa median tidak perlu berada dalam set data. Median tidak terjejas oleh kehadiran pihak luar. Oleh itu, median akan berfungsi sebagai ukuran kecenderungan pusat yang lebih baik dengan adanya kelebihan.
Mod adalah nilai paling kerap berlaku dalam set data. Dalam contoh sebelumnya, nilai 70 dan 72 kedua-dua berlaku dua kali dan dengan itu, kedua-duanya adalah mod. Ini menunjukkan bahawa, dalam beberapa pengagihan, terdapat lebih daripada satu nilai modal. Sekiranya terdapat hanya satu mod, set data dikatakan tidak sama, dalam kes ini, set data adalah bimodal.
Apa penyebarannya?
Penyebaran adalah jumlah penyebaran data mengenai pusat pengedaran. Julat dan sisihan piawai adalah langkah penyebaran yang paling biasa digunakan.
Julat itu hanya nilai tertinggi tolak nilai terendah. Dalam contoh terdahulu, nilai tertinggi ialah 80 dan nilai terendah ialah 62, jadi julat ialah 80-62 = 18. Tetapi rentang tidak memberikan gambaran yang mencukupi mengenai penyebaran.
Untuk mengira sisihan piawai, terlebih dahulu penyimpangan nilai data dari min dikira. Maksud kuadrat akar penyimpangan dipanggil sisihan piawai. Dalam contoh terdahulu, penyimpangan masing-masing dari min ialah (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 dan (79 - 71) sisihan sisihan adalah (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Sisihan piawai adalah √ (366/10) = 6.05 (dalam kilogram). Kecuali data yang ditetapkan sangat condong, dari ini dapat disimpulkan bahwa mayoritas data berada dalam jeda 71 ± 6.05, dan memang demikian dalam contoh khusus ini.
Apakah perbezaan antara kecenderungan pusat dan penyebaran? • Kecenderungan pusat merujuk dan menempatkan pusat pengedaran nilai • Penyebaran adalah jumlah penyebaran data mengenai pusat set data.
|