Gudang data adalah sistem yang direka untuk menyimpan dan mengatur data dalam repositori utama termasuk data dari sumber lain. Ini adalah konsep utama perisikan perniagaan dalam model pangkalan data relasional yang menggunakan teknik analitik untuk mengintegrasikan data perniagaan ke pangkalan data pusat.
Terdapat dua model seni bina yang biasa digunakan dalam pergudangan data:
Kedua-duanya adalah model pangkalan data multidimensi biasa yang digunakan untuk menangani keperluan pangkalan data yang besar untuk tujuan analisis dalam gudang data sebenar.
Kami membentangkan perbandingan yang tidak berat sebelah antara kedua-dua untuk lebih memahami mana yang lebih baik daripada yang lain.
Ia adalah model seni bina yang paling biasa dan diterima secara meluas yang digunakan untuk membangunkan gudang data dan data data di mana data diatur menjadi fakta dan dimensi. Ini adalah model seni bina yang paling sederhana di mana satu jadual fakta digunakan untuk merujuk kepada pelbagai jadual dimensi, meniru corak bintang.
Seperti namanya, gambarajah menyerupai bintang dengan jadual fakta di tengah dan banyak jadual dimensi yang memancarinya, mewujudkan pola seperti bintang.
Ia juga dikenali sebagai Star Join Schema dan ia menyimpan semua atribut dari dimensi ke dalam satu jadual fakta yang dinormalkan untuk menavigasi dengan cepat melalui set data multidimensi yang besar yang merangkumi masa tindak balas pertanyaan cepat.
Ia merupakan lanjutan skema bintang dengan fungsi tambahan. Tidak seperti skema bintang, jadual dimensi dalam skema salji salji dinormalisasi ke dalam beberapa jadual berkaitan.
Model seni bina mewakili susunan logis jadual dalam hirarki hubungan banyak-ke-satu di mana beberapa jadual dimensi dinormalisasikan ke dalam jadual sub-dimensi, menyerupai salji seperti corak, maka nama.
Ia adalah versi yang lebih kompleks dari skema bintang dengan lebih banyak bergabung di antara jadual dimensi yang menyumbang untuk masa pemprosesan lambat untuk mengambil data yang bermaksud waktu respon pertanyaan lambat. Ia meminimumkan kelebihan data yang seterusnya meningkatkan prestasi pertanyaan.
Dalam pangkalan data hubungan, skema bintang adalah model seni bina yang paling mudah digunakan untuk membangunkan gudang data dan data multidimensional. Seperti namanya, model itu menyerupai bintang dengan mata yang memancar dari tengah yang bermaksud jadual fakta adalah pusat dan titik adalah jadual dimensi. Seperti model dimensi lain, ia terdiri daripada data dalam bentuk fakta dan dimensi. Skema salji salji, sebaliknya, adalah model seni bina yang lebih kompleks yang merujuk kepada pangkalan data multidimensi dengan susunan logik jadual dalam bentuk salji salji.
Skema salji salji hampir sama dengan skema bintang kecuali ia boleh mempunyai lebih daripada satu jadual dimensi yang kemudiannya dinormalisasi ke dalam beberapa jadual berkaitan yang disebut sebagai jadual sub-dimensi. Ia mewakili pelbagai tahap perhubungan yang menjadi corak salji. Walau bagaimanapun, skema bintang menyimpan semua atribut berkaitan dimensi ke dalam satu jadual dimensi denormalized yang menjadikannya mudah difahami dan menangani pertanyaan yang lebih mudah.
Jadual dimensi tidak boleh mengandungi baris pendua dalam model pangkalan data hubungan untuk fakta mudah bahawa ia boleh mewujudkan kekaburan dalam pengambilan semula. Setiap jadual harus mempunyai lajur atau gabungan lajur yang disebut kunci utama yang secara unik mengenal pasti semua rekod jadual. Kunci asing adalah lajur atau kumpulan lajur yang menyediakan hubungan antara dua jadual. Dalam skema bintang, setiap jadual dimensi mempunyai kunci utama yang berkaitan dengan kunci asing dalam jadual fakta. Hierarki perniagaan dalam skema salji salji diwakili oleh hubungan kunci utama / asing utama antara jadual dimensi.
Perbezaan utama antara dua model pangkalan data relasional adalah normalisasi. Jadual dimensi dalam skema bintang tidak dinormalisasi bermakna model perniagaan akan menggunakan ruang yang lebih banyak untuk menyimpan jadual dimensi dan lebih banyak ruang bermakna rekod yang berlebihan yang pada akhirnya akan menyebabkan ketidakkonsistenan. Skema snowflake, sebaliknya, meminimumkan kelebihan data kerana jadual dimensi dinormalkan yang menyumbang rekod yang jauh lebih sedikit. Hierarki perniagaan dan dimensinya dipelihara melalui integriti rujukan yang bermaksud hubungan boleh dikemaskini secara bebas dalam gudang data.
Skema bintang kurang bergabung di antara jadual dimensi dan jadual fakta berbanding dengan skema salji salji yang mempunyai pelbagai bergabung yang menyumbang kerumitan pertanyaan yang kurang. Kerana dimensi dalam skema bintang dihubungkan melalui jadual hakiki pusat, ia mempunyai laluan bergabung yang jelas yang bermaksud maklum balas masa tindak balas pantas dan masa tindak balas pantas bermakna prestasi yang lebih baik. Skema salji salji mempunyai jumlah yang lebih tinggi untuk bergabung dengan permintaan maklum balas yang lebih panjang yang mengakibatkan pertanyaan yang lebih rumit yang akhirnya menjejaskan prestasi.
Kedua-duanya adalah model seni bina yang paling biasa dan digunakan secara meluas untuk membangunkan gudang pangkalan data dan data data. Walau bagaimanapun, setiap model perniagaan mempunyai bahagian yang adil untuk kebaikan dan keburukan. Walaupun skema bintang adalah model multidimensi yang paling mudah digunakan untuk menyusun data ke dalam fakta dan dimensi, sangat sesuai untuk membangunkan data data yang melibatkan hubungan yang kurang kompleks. Skema salji adalah perwakilan logik jadual dalam pangkalan data multidimensi di mana dimensi disimpan dalam jadual sub-dimensi. Perbezaan utama antara keduanya adalah normalisasi. Jadual-jadual dimensi dalam skema salji salji benar-benar dinormalisasi ke dalam pelbagai jadual paparan, sedangkan dalam skema bintang, jadual dimensi dinamakan semula menjadi satu jadual fakta tengah.