Perbezaan antara varians Sampel & Varians Penduduk

Penjelasan

Dalam Perangkaan istilah pensampelan merujuk kepada pemilihan sebahagian daripada data statistik agregat untuk tujuan memperoleh maklumat yang relevan mengenai keseluruhannya. Agregat atau keseluruhan maklumat statistik mengenai sifat khusus semua ahli yang diliputi oleh penyiasatan disebut 'populasi' atau 'alam semesta'. (Das, N.G., 2010). Bahagian terpilih penduduk yang digunakan untuk mendapatkan ciri-ciri populasi atau alam semesta disebut sebagai 'sampel'. Penduduk diambil dari unit atau ahli individu, dan beberapa unit dimasukkan ke dalam sampel. Jumlah bilangan populasi dipanggil saiz populasi, dan sampel itu dipanggil saiz sampel. Penduduk dan sampel boleh terhingga atau tidak terbatas dan sama seperti mereka boleh wujud atau hipotesis.

Perbezaan: Varians adalah nilai berangka yang menunjukkan betapa luas angka-angka individu dalam kumpulan data mengedarkan diri mereka tentang min. Itulah sejauh mana setiap nombor dari min, dan dengan itu dari satu sama lain. Varians nilai sifar bermakna semua data adalah sama. Lebih banyak varians, lebih banyak lagi nilai-nilai yang menyebarkan tentang min, oleh itu antara satu sama lain. Kurangnya varians, kurang nilai yang menyebarkan tentang min, oleh itu dari satu sama lain, dan varians tidak boleh negatif.

Perbezaan antara varians populasi dan varians sampel

Perbezaan utama antara varians populasi dan varians sampel berkaitan dengan pengiraan varians. Varians dikira dalam lima langkah. Maksud pertama dikira, maka kita mengira penyimpangan dari min, dan ketiga penyimpangan adalah kuadrat, keempat penyimpangan kuadrat disimpulkan dan akhirnya jumlah ini dibahagikan dengan bilangan item yang dikira varians. Oleh itu, variance = Σ (xi-x -) / n. Di mana xi = ith. Nombor, x- = min dan n = bilangan item ...

Sekarang, apabila varians dikira dari data populasi, n adalah sama dengan jumlah item. Oleh itu, jika varians dalam tekanan darah semua 1000 orang akan dikira dari data pada tekanan darah semua 1000 orang, maka n = 1000. Walau bagaimanapun apabila varians dikira dari data sampel 1 akan ditolak dari n sebelum membahagikan jumlah penyimpangan kuasa dua. Jadi dalam contoh di atas jika data sampel mempunyai 100 item, penyebutnya akan menjadi 100 - 1 = 99.

Disebabkan ini, nilai varians yang dikira daripada data sampel adalah lebih tinggi daripada nilai yang boleh didapati dengan menggunakan data populasi. Logik melakukan itu adalah untuk mengimbangi kekurangan maklumat tentang data penduduk. Tidak mustahil untuk mencari perbezaan ketinggian dalam manusia, kerana kekurangan mutlak maklumat tentang ketinggian semua makhluk hidup, bukan untuk membincangkan masa depan. Sekalipun kita mengambil satu contoh sederhana, seperti data populasi pada ketinggian semua orang hidup di AS, secara fizikal mungkin, tetapi biaya dan waktu yang terlibat dalam hal ini akan mengalahkan tujuan perhitungannya. Ini adalah sebab data sampel diambil untuk kebanyakan tujuan statistik, dan ini disertakan dengan kekurangan maklumat mengenai majoriti data. Dalam usaha untuk mengimbangi ini, nilai varians dan sisihan piawai, yang mana kuadrat kekurangan adalah lebih tinggi sekiranya data sampel daripada varians dari data populasi.

Ini bertindak sebagai perisai automatik untuk penganalisis dan pembuat keputusan. Logik ini digunakan untuk membuat keputusan mengenai belanjawan modal, kewangan peribadi dan perniagaan, pembinaan, pengurusan lalu lintas, dan banyak bidang yang berlaku. Ini membantu pemegang kepentingan berada di pihak yang selamat semasa mengambil keputusan atau untuk kesimpulan lain.

Ringkasan: Varians populasi merujuk kepada nilai varians yang dikira dari data populasi, dan varians sampel adalah varians yang dikira dari data sampel. Disebabkan nilai penyebut dalam formula untuk varians dalam kes data sampel adalah 'n-1', dan ia adalah 'n' untuk data populasi. Oleh itu, kedua-dua varians dan sisihan piawai yang diperolehi daripada data sampel adalah lebih daripada yang diperoleh daripada data populasi.