Data perkataan merujuk kepada maklumat yang dikumpulkan dan direkodkan. Ia boleh dalam bentuk nombor, perkataan, pengukuran dan banyak lagi.
Terdapat dua jenis data dan ini adalah data kualitatif dan data kuantitatif. Perbezaan antara dua jenis data ialah data kuantitatif digunakan untuk menggambarkan maklumat berangka. Sebagai contoh, pengukuran suhu akan jatuh di bawah jenis data ini.
Sebaliknya, data kualitatif digunakan untuk menggambarkan maklumat dalam kata-kata. Selepas mengumpul data, ia perlu dianjurkan oleh itu keperluan untuk memisahkan data berkumpulan daripada data yang tidak dikumpulkan. Kedua-duanya adalah bentuk data yang berguna tetapi perbezaan diantara mereka ialah data yang tidak dikumpulkan adalah data mentah. Ini bermakna ia baru dikumpulkan tetapi tidak disusun dalam mana-mana kumpulan atau kelas. Sebaliknya, data dikumpulkan ialah data yang telah diorganisir ke dalam kumpulan dari data mentah.
Seperti yang dinyatakan di atas, data dikumpulkan adalah jenis data yang diklasifikasikan kepada kumpulan selepas pengumpulan. Data mentah dikategorikan ke dalam pelbagai kumpulan dan jadual dibuat. Tujuan utama jadual adalah untuk menunjukkan titik data yang berlaku dalam setiap kumpulan. Sebagai contoh, apabila ujian dilakukan, hasilnya adalah data dalam senario ini dan terdapat banyak cara untuk mengelompokkan data ini. Sebagai contoh, bilangan pelajar yang menjaringkan di atas setiap 20 markah boleh direkodkan.
Secara alternatif, gred boleh digunakan. Contohnya, 90-100 ke F 0-59 dengan setiap kategori menunjukkan bilangan pelajar dalam setiap kategori. Jadual histogram dan kekerapan digunakan untuk menunjukkan dan mentafsirkan data berkumpulan. Inilah contohnya
Pengumpulan data mempunyai kelebihan berikut:
Data terkumpul yang juga dikenali sebagai data mentah adalah data yang tidak diletakkan dalam mana-mana kumpulan atau kategori selepas pengumpulan. Oleh itu, data dikategorikan dalam bilangan atau ciri, oleh itu data yang belum dimasukkan dalam mana-mana kategori tidak dikumpulkan. Sebagai contoh, semasa menjalankan banci dan anda ingin menganalisis berapa wanita di atas usia 45 berada di kawasan tertentu, anda perlu mengetahui berapa banyak orang yang tinggal di kawasan itu.
Bilangan individu yang tinggal di kawasan tersebut tidak ada data atau maklumat mentah kerana tiada apa yang dikategorikan. Oleh itu, kita dapat membuat kesimpulan bahawa data yang dikumpulkan adalah data yang digunakan untuk menunjukkan maklumat mengenai individu sampel atau penduduk.
Beberapa kelebihan data tidak terkumpul adalah seperti berikut;
Data berkumpulan adalah data yang telah dianjurkan dalam kelas selepas analisisnya. Contohnya termasuk berapa banyak beg jagung yang dikumpul semasa musim hujan adalah buruk. Sebaliknya, data yang tidak dikumpulkan adalah data yang tidak termasuk dalam mana-mana kumpulan. Ia masih data mentah.
Apabila mengumpul data, data yang tidak dikumpulkan lebih disukai kerana maklumat itu masih dalam bentuk asalnya. Ia tidak diganggu oleh klasifikasi atau subbahagian. Bagaimanapun, apabila menganalisis dan menggambar grafik, data yang dikumpulkan lebih disukai kerana ia mudah untuk mentafsir.
Apabila mengira cara data dikumpulkan dan tidak dikumpulkan, akan ada perubahan. Purata data dikumpulkan lebih disukai kerana lebih tepat berbanding dengan purata data yang tidak dikumpulkan. Purata data tak terkumpul boleh mengakibatkan manipulasi median yang salah oleh sebab itu ia dianggap tidak cekap dalam kebanyakan kes.
Jadual frekuensi digunakan untuk menunjukkan maklumat data dikumpulkan sedangkan dalam kes data yang tidak dikumpulkan, maklumat tersebut kelihatan seperti senarai besar nombor. Ini disebabkan fakta bahawa maklumat itu masih mentah.
Data berkumpulan ialah data yang telah dianjurkan ke dalam pengedaran frekuensi sedangkan data yang tidak dikumpulkan tidak diringkaskan dengan apa-apa cara.