Perbezaan antara Kesalahan Standard dan Kesalahan Piawai

Pengenalan

Standard Dpenghapusan (SD) dan Standakan Error (SE) istilah yang seolah-olah sama; Walau bagaimanapun, mereka secara konseptual sangat berbeza-beza bahawa mereka digunakan hampir bergantungan dalam kesusasteraan Statistik. Kedua-dua istilah biasanya didahului oleh simbol plus-minus (+/-) yang menandakan fakta bahawa mereka menentukan nilai simetrik atau mewakili pelbagai nilai. Selalunya, kedua-dua istilah muncul dengan purata (min) satu set nilai diukur.

Menariknya, SE tidak mempunyai kaitan dengan standard, dengan kesilapan, atau dengan komunikasi data saintifik.

Lihat pandangan terperinci mengenai asal usul dan penjelasan SD dan SE akan mendedahkan, mengapa statistik ahli profesional dan mereka yang menggunakannya secara cursorily, kedua-duanya cenderung menyesal.

Penyimpangan Standard (SD)

SD adalah a penjelasan statistik menggambarkan penyebaran taburan. Sebagai metrik, ia berguna apabila data diedarkan secara normal. Walau bagaimanapun, ia kurang berguna apabila data sangat miring atau bimodal kerana ia tidak menggambarkan bentuk pengedaran dengan baik. Biasanya, kami menggunakan SD apabila melaporkan ciri-ciri sampel, kerana kami berhasrat untuk terangkan berapa data yang berbeza-beza di sekitar min. Statistik berguna yang lain untuk menghuraikan penyebaran data adalah julat antara kuartil, persentil ke-25 dan ke-75, dan julat data.

Rajah 1. SD adalah ukuran penyebaran data. Apabila data adalah sampel dari taburan yang diedarkan secara normal, maka seseorang mengharapkan dua pertiga daripada data untuk berada dalam 1 sisihan piawai min.

Varians adalah a penjelasan statistik juga, dan ia ditakrifkan sebagai kuadrat sisihan piawai. Ia tidak biasanya dilaporkan apabila menerangkan keputusan, tetapi ia adalah formula yang lebih berkesan secara matematik (a.k.a. jumlah penyimpangan kuasa dua) dan memainkan peranan dalam pengiraan statistik.

Sebagai contoh, jika kita mempunyai dua statistik P & Q dengan perbezaan yang diketahui var(P) & var(Q), maka varians jumlahnya P + Q adalah sama dengan jumlah varians: var(P) +var(Q). Sekarang jelas mengapa ahli statistik suka bercakap mengenai variasi.

Tetapi sisihan piawai membawa erti yang penting untuk menyebarkan, terutamanya apabila data diedarkan secara normal: Jeda interval +/ - 1 SD boleh dijangka dapat menangkap 2/3 sampel, dan min selang +- 2 SD boleh dijangka dapat menangkap 95% sampel.

SD memberikan petunjuk sejauh mana tanggapan individu terhadap soalan berbeza atau "menyimpang" dari min. SD memberitahu penyelidik bagaimana penyebaran respons - adakah mereka tertumpu di sekitar min, atau tersebar luas & luas? Adakah semua responden anda menilai produk anda di tengah-tengah skala anda, atau ada yang meluluskannya dan ada yang tidak bersetuju?

Pertimbangkan percubaan di mana responden diminta menilai satu produk pada satu siri atribut pada skala 5 mata. Maksud bagi sekumpulan sepuluh responden (berlabel 'A' melalui 'J' di bawah) untuk "nilai yang baik untuk wang" adalah 3.2 dengan SD dari 0.4 dan min bagi "kebolehpercayaan produk" adalah 3.4 dengan SD dari 2.1.

Sekilas pandang (melihat cara sahaja), nampaknya kebolehpercayaan dinilai lebih tinggi daripada nilai. Tetapi SD yang lebih tinggi untuk kebolehpercayaan dapat ditunjukkan (seperti ditunjukkan dalam taburan di bawah) bahawa respons sangat terpolarisasi, di mana kebanyakan responden tidak mempunyai masalah kebolehpercayaan (menilai atribut sebagai "5"), tetapi segmen responden yang lebih kecil, tetapi penting masalah kebolehpercayaan dan menilai sifat "1". Melihat maksudnya sahaja menceritakan sebahagian daripada cerita, bagaimanapun, lebih kerap daripada tidak, inilah yang difokuskan oleh para penyelidik. Pengagihan maklum balas adalah penting untuk dipertimbangkan dan SD menyediakan langkah deskriptif yang berharga mengenai perkara ini.

Responden Nilai Baik untuk Wang Kebolehpercayaan Produk
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
Saya 3 5
J 3 5
Maksudnya 3.2 3.4
Std. Dev. 0.4 2.1

Tinjauan Pertama: Responden menarafkan produk pada skala 5-mata

Dua pengagihan yang sangat berbeza terhadap tindak balas skala 5-titik dapat menghasilkan makna yang sama. Pertimbangkan contoh berikut yang menunjukkan nilai tindak balas untuk dua penilaian yang berbeza.

Dalam contoh pertama (Penilaian "A"), SD adalah sifar kerana SEMUA respons adalah tepat nilai min. Respons individu tidak menyimpang sama sekali dari min.

Dalam Nilai "B", walaupun kumpulan bermakna sama (3.0) sebagai taburan pertama, Standard Deviation lebih tinggi. Penyimpangan Piawaian 1.15 menunjukkan bahawa jawapan individu, secara purata *, sedikit lebih dari 1 mata jauh dari min.

Responden Penilaian "A" Penilaian "B"
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
Saya 3 4
J 3 5
Maksudnya 3.0 3.0
Std. Dev. 0.00 1.15

Kajian Kedua: Responden menilai produk pada skala 5-point

Satu lagi cara untuk melihat SD adalah dengan merancang pengedaran sebagai histogram jawapan. Pengedaran dengan SD rendah akan dipaparkan sebagai bentuk sempit tinggi, sementara SD yang besar akan ditunjukkan oleh bentuk yang lebih luas.

SD umumnya tidak menunjukkan "betul atau salah" atau "lebih baik atau lebih buruk" - SD yang lebih rendah tidak semestinya lebih diingini. Ia digunakan semata-mata sebagai statistik deskriptif. Ia menerangkan pengagihan berkaitan dengan min.

Tpenafian teknikal berkaitan SD

Pemikiran SD sebagai "penyelewengan purata" adalah cara yang sangat baik untuk memahami maknanya secara konseptual. Walau bagaimanapun, ia tidak dikira sebagai purata (jika ia adalah, kita akan menyebutnya "penyelarasan purata"). Sebaliknya, ia adalah "piawai," kaedah yang agak rumit untuk mengira nilai menggunakan jumlah kotak itu.

Untuk tujuan praktikal, pengiraan tidak penting. Kebanyakan program tabulasi, spreadsheet atau alat pengurusan data lain akan menghitung SD untuk anda. Lebih penting ialah memahami apa yang disampaikan oleh statistik.

Kesalahan biasa

Kesalahan standard ialah menyimpulkan statistik yang digunakan apabila membandingkan sampel bermakna (purata) di seluruh populasi. Ia adalah ukuran ketepatan daripada sampel sampel. Purata sampel adalah statistik yang diperoleh daripada data yang mempunyai pengedaran pendasar. Kami tidak dapat menggambarkannya dengan cara yang sama seperti data, kerana kami telah melakukan eksperimen tunggal dan hanya mempunyai satu nilai. Teori statistik memberitahu kita bahawa min sampel (untuk sampel yang cukup "cukup" dan di bawah beberapa keadaan biasa) adalah hampir diedarkan secara normal. Penyimpangan piawai pengedaran normal ini adalah apa yang kita sebut ralat standard.

Rajah 2. Pengagihan di repre bawahmenyentuh taburan data, sedangkan taburan di bahagian atas adalah pengedaran teoretis dari sampel min. SD 20 adalah ukuran penyebaran data, sedangkan SE 5 adalah ukuran ketidakpastian sekitar min sampel.

Apabila kita ingin membandingkan cara hasil daripada eksperimen dua sampel Rawatan A vs Rawatan B, maka kita perlu untuk menganggarkan sejauh mana kita telah mengukur cara.

Sebenarnya, kami berminat dengan sejauh mana kami mengukur perbezaan antara kedua-dua cara. Kami panggil ukuran ini kesilapan standard perbezaannya. Anda mungkin tidak terkejut apabila mengetahui bahawa kesilapan piawai perbezaan dalam cara sampel adalah fungsi kesilapan standard cara:

Sekarang bahawa anda telah memahami bahawa kesilapan standard min (SE) dan sisihan piawai pengedaran (SD) adalah dua binatang yang berbeza, anda mungkin tertanya-tanya bagaimana mereka mendapat keliru di tempat pertama. Walaupun mereka berbeza secara konseptual, mereka mempunyai hubungan yang mudah secara matematik:

,di mana n adalah bilangan titik data.

Perhatikan bahawa ralat standard bergantung pada dua komponen: sisihan piawai sampel, dan saiz sampel n. Ini menjadikan rasa intuitif: semakin besar sisihan piawai sampel, kurang tepat kita boleh kira-kira perkiraan kami tentang maksud sebenar.

Juga, besar saiz sampel, lebih banyak maklumat yang kita ada mengenai populasi dan lebih tepatnya kita dapat menganggarkan maksud sebenar.

SE adalah petunjuk kebolehpercayaan min. SE kecil adalah petunjuk bahawa min sampel adalah refleksi yang lebih tepat dari min populasi sebenar. Saiz sampel yang lebih besar biasanya akan menghasilkan SE yang lebih kecil (sementara SD tidak terjejas secara langsung oleh saiz sampel).

Kebanyakan kajian kaji selidik melibatkan lukisan sampel dari populasi. Kami kemudian membuat kesimpulan tentang populasi dari hasil yang diperoleh daripada sampel itu. Jika sampel kedua diambil, keputusan mungkin tidak sepadan dengan sampel pertama. Jika nilai min bagi atribut penarafan ialah 3.2 untuk satu sampel, mungkin 3.4 untuk sampel kedua saiz yang sama. Sekiranya kita hendak membuat bilangan sampel yang tidak terhingga (saiz yang sama) daripada populasi kita, kita dapat memaparkan cara diperhatikan sebagai pengedaran. Kita kemudian dapat mengira purata semua contoh sampel kita. Maksud ini akan menyamai maksud penduduk sebenar. Kita juga boleh mengira SD pengagihan cara sampel. SD dalam pengedaran cara sampel ini adalah SE bagi setiap sampel sampel individu.

Oleh itu, kami mempunyai pemerhatian yang paling penting: SE ialah SD penduduk penduduk.

Contoh Maksudnya
Pertama 3.2
2hb 3.4
Ke-3 3.3
4 3.2
5 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Maksudnya 3.3
Std. Dev. 0.13

Jadual yang menggambarkan hubungan antara SD dan SE

Sekarang jelas bahawa jika SD pengedaran ini membantu kita untuk memahami sejauh mana contoh sampel adalah dari penduduk sejagat sebenar, maka kita boleh menggunakan ini untuk memahami betapa tepatnya setiap contoh sampel individu adalah berkaitan dengan min yang benar. Inilah intipati SE.

Sebenarnya, kita hanya mengambil sampel tunggal dari populasi kita, tetapi kita boleh menggunakan hasil ini untuk memberikan anggaran kebolehpercayaan min sampel yang diperhatikan.

Sebenarnya, SE memberitahu kita bahawa kita boleh 95% yakin bahawa sampel sampel yang diperhatikan adalah ditambah atau tolak kira-kira 2 (sebenarnya 1.96) Kesilapan Standard dari min populasi.

Jadual di bawah menunjukkan pengagihan maklum balas daripada sampel pertama (dan hanya) yang digunakan untuk penyelidikan kami. SE 0.13, yang agak kecil, memberikan kita satu petunjuk bahawa min kita relatif hampir dengan min yang benar dari keseluruhan penduduk kita. Margin kesilapan (pada 95% keyakinan) untuk min kita adalah (kira-kira) dua kali nilai (+/- 0.26), memberitahu kita bahawa min yang benar kemungkinan besar antara 2.94 dan 3.46.

Responden Penilaian
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
Saya 3
J 3
Maksudnya 3.2
Std. Err 0.13

Ringkasan

Ramai penyelidik gagal memahami perbezaan antara Standard Deviation dan Standard Error, walaupun mereka biasanya dimasukkan dalam analisis data. Walaupun pengiraan sebenar untuk Standard Deviation dan Ralat Piawai kelihatan sangat serupa, mereka mewakili dua sangat berbeza, tetapi pelengkap, langkah-langkah. SD memberitahu kami tentang bentuk pengedaran kami, sejauh mana nilai data individu adalah dari nilai min. SE memberitahu kita betapa dekatnya sampel kami adalah min yang benar dari penduduk keseluruhan. Bersama-sama, mereka membantu memberikan gambar yang lebih lengkap daripada yang bermakna sahaja yang boleh memberitahu kami.