Ciri yang cemerlang ialah "sokongan data besar-besaran" dan "teknologi perolehan pantas". Gudang data ialah persekitaran data berstruktur untuk sistem sokongan keputusan dan sumber data aplikasi analisis dalam talian, dan pangkalan data adalah teras kepada keseluruhan persekitaran gudang data, di mana data disimpan dan menyediakan sokongan untuk mendapatkan semula data, ia adalah luar biasa; Ia dicirikan oleh sokongan untuk data besar-besaran dan teknologi mendapatkan semula pantas.
Persekitaran pengendalian tutorial ini: sistem Windows 7, komputer Dell G3.
Berbanding dengan pangkalan data operasi, ciri luar biasa gudang data ialah "sokongan data besar-besaran" dan "teknologi perolehan pantas".
Data warehouse, nama Inggeris ialah Data Warehouse, yang boleh disingkatkan sebagai DW atau DWH. Gudang data ialah koleksi strategik yang menyediakan sokongan untuk semua jenis data untuk proses membuat keputusan di semua peringkat perusahaan. Ia ialah stor data tunggal yang dicipta untuk pelaporan analisis dan tujuan sokongan keputusan. Menyediakan panduan tentang penambahbaikan proses perniagaan, masa pemantauan, kos, kualiti dan kawalan untuk perusahaan yang memerlukan kecerdasan perniagaan.
Gudang data ialah persekitaran data berstruktur untuk sistem sokongan keputusan (dss) dan sumber data aplikasi analisis dalam talian. Penggudangan data mengkaji dan menyelesaikan masalah mendapatkan maklumat daripada pangkalan data. Gudang data dicirikan oleh orientasi subjek, penyepaduan, kestabilan dan kebolehubahan masa.
Ciri-ciri gudang data
Gudang data adalah untuk perlombongan lanjut sumber data dan keperluan membuat keputusan apabila sejumlah besar pangkalan data sudah wujud . Dan dijana, ia bukan apa yang dipanggil "pangkalan data besar". Tujuan membina penyelesaian gudang data adalah untuk menjadi asas untuk pertanyaan dan analisis bahagian hadapan Disebabkan lebihan yang besar, storan yang diperlukan juga besar. Untuk menyediakan aplikasi bahagian hadapan dengan lebih baik, gudang data selalunya mempunyai ciri-ciri berikut:
1.
Data analisis gudang data biasanya dibahagikan kepada hari, minggu, bulan, suku tahun, dan lain-lain. Dapat dilihat bahawa data kitaran harian memerlukan kecekapan tertinggi, memerlukan 24 jam atau walaupun 12 jam Pelanggan boleh melihat analisis data semalam. Oleh kerana sesetengah syarikat mempunyai jumlah data yang besar setiap hari, masalah sering berlaku dengan gudang data yang direka dengan buruk, dan data hanya boleh diberikan dengan kelewatan 1-3 hari, yang jelas tidak mungkin.
2.
Pelbagai maklumat yang disediakan oleh gudang data mestilah data yang tepat, tetapi kerana proses gudang data biasanya dibahagikan kepada beberapa langkah, termasuk pembersihan data, pemuatan, pertanyaan, paparan, dll., ia adalah rumit Seni bina akan mempunyai lebih banyak lapisan, jadi data kotor dalam sumber data atau kod yang tidak tepat boleh menyebabkan herotan data Apabila pelanggan melihat maklumat yang salah, mereka mungkin membuat keputusan yang salah melalui analisis, menyebabkan kerugian dan bukannya faedah.
3.
Sebab beberapa seni bina sistem gudang data berskala besar adalah kompleks kerana mereka mengambil kira kebolehskalaan dalam 3-5 tahun akan datang, tidak perlu membelanjakan wang untuk membina semula sistem gudang data terlalu cepat pada masa hadapan Boleh berjalan dengan sangat stabil. Terutamanya dicerminkan dalam rasionaliti pemodelan data, terdapat beberapa lagi lapisan tengah dalam penyelesaian gudang data, supaya aliran data besar-besaran mempunyai penampan yang mencukupi, supaya jumlah data tidak akan lebih besar dan ia tidak akan dapat dijalankan .
Seperti yang dapat dilihat daripada pengenalan di atas, teknologi gudang data boleh membangkitkan data yang terkumpul oleh perusahaan selama bertahun-tahun ia bukan sahaja menguruskan data besar ini untuk perusahaan, tetapi juga mengetuk potensi nilai data, dengan itu menjadi sistem operasi dan penyelenggaraan untuk perusahaan komunikasi Salah satu sorotan.
Secara umum, sistem sokongan keputusan berdasarkan gudang data terdiri daripada tiga komponen: teknologi gudang data, teknologi pemprosesan analisis dalam talian dan teknologi perlombongan data adalah teras sistem Dalam artikel ini, kami akan menumpukan pada teknologi gudang data, memperkenalkan teknologi utama gudang data moden dan langkah utama pemprosesan data, dan membincangkan cara menggunakan teknologi ini untuk membantu operasi dan penyelenggaraan dalam sistem operasi dan penyelenggaraan komunikasi.
4. Berorientasikan topik
Organisasi data pangkalan data operasi berorientasikan tugas pemprosesan transaksi Setiap sistem perniagaan dipisahkan antara satu sama lain, dan data masuk gudang data disusun mengikut sesuatu yang dianjurkan mengikut kawasan subjek. Tema ini sepadan dengan sifat berorientasikan aplikasi pangkalan data tradisional Ia adalah konsep abstrak yang mensintesis, mengklasifikasikan, menganalisis dan menggunakan data dalam sistem maklumat perusahaan pada tahap yang lebih tinggi. Setiap tema sepadan dengan kawasan analisis makro. Gudang data menghapuskan data yang tidak berguna untuk membuat keputusan dan memberikan pandangan ringkas tentang subjek tertentu.
Komposisi gudang data
Alat pengekstrakan data
Ekstrak data daripada pelbagai Keluarkan kaedah storan, lakukan transformasi dan organisasi yang diperlukan, dan kemudian simpannya dalam gudang data. Keupayaan untuk mengakses pelbagai kaedah penyimpanan data adalah kunci kepada alat pengekstrakan data Ia sepatutnya dapat menjana program COBOL, bahasa kawalan kerja MVS (JCL), skrip UNIX, dan pernyataan SQL untuk mengakses data yang berbeza. Transformasi data termasuk memadamkan segmen data yang tidak bermakna untuk aplikasi membuat keputusan menukar kepada nama data dan definisi yang disatukan;
Pangkalan Data
ialah teras kepada keseluruhan persekitaran gudang data, tempat data disimpan dan menyediakan sokongan untuk mendapatkan semula data. Berbanding dengan pangkalan data manipulatif, ciri cemerlangnya ialah sokongan untuk data besar-besaran dan teknologi perolehan semula pantas.
Metadata
Metadata ialah data yang menerangkan struktur dan kaedah penciptaan data dalam gudang data. Ia boleh dibahagikan kepada dua kategori mengikut kegunaan berbeza, metadata teknikal dan metadata komersial.
Metadata teknikal ialah data yang digunakan oleh pereka bentuk dan pengurus gudang data untuk membangun dan mengurus penggunaan gudang data setiap hari. Termasuk: maklumat sumber data; rekod, sejarah keluaran maklumat, dsb.
Metadata perniagaan menerangkan data dalam gudang data daripada perspektif perniagaan komersial. Termasuk: perihalan topik perniagaan, data yang disertakan, pertanyaan dan laporan;
metadata menyediakan direktori maklumat (direktori maklumat) untuk mengakses gudang data ini secara menyeluruh menerangkan data dalam gudang data data diperolehi dan cara mengakses data tersebut. Ia adalah pusat operasi dan penyelenggaraan gudang data Pelayan gudang data menggunakannya untuk menyimpan dan mengemas kini data, dan pengguna menggunakannya untuk memahami dan mengakses data.
Data mart
Sebahagian data yang diasingkan daripada gudang data untuk tujuan aplikasi atau skop aplikasi tertentu, yang juga boleh dipanggil data jabatan atau data subjek (kawasan subjek). Dalam proses pelaksanaan gudang data, anda selalunya boleh bermula dengan data mart satu jabatan, dan kemudian menggunakan beberapa data mart untuk membentuk gudang data yang lengkap. Apa yang perlu diambil perhatian ialah apabila melaksanakan data mart yang berbeza, definisi medan dengan maksud yang sama mestilah serasi, supaya ia tidak akan menyebabkan masalah besar apabila melaksanakan gudang data pada masa hadapan.
Dalam laporan Garnter asing yang terkenal mengenai produk data mart, produk risikan perniagaan tangkas dalam kuadran pertama termasuk QlikView, Tableau dan SpotView, yang kesemuanya adalah produk data mart pengkomputeran memori penuh dari segi data besar gergasi produk risikan perniagaan tradisional menimbulkan cabaran. Produk BI domestik bermula lewat. Produk risikan perniagaan tangkas yang terkenal termasuk PowerBI, Z-Suite Yonghong Technology, SmartBI, perisian risikan perniagaan FineBI, dll. Antaranya, Z-Data Mart Yonghong Technology ialah produk Pasaran data pengkomputeran memori panas. Maklumat Deon Domestik juga merupakan penyepadu sistem produk data mart.
Pengurusan Gudang Data
Pengurusan keselamatan dan keistimewaan data penjejakan; data;Menyalin, membahagi dan mengedarkan data;Sandaran dan pemulihan;Pengurusan storan.
Sistem penerbitan maklumat
Menghantar data dalam gudang data atau data lain yang berkaitan ke lokasi atau pengguna yang berbeza. Sistem penerbitan maklumat berasaskan web adalah cara paling berkesan untuk menangani capaian berbilang pengguna.
Alat Akses
Sediakan cara untuk pengguna mengakses gudang data. Terdapat alat pertanyaan dan pelaporan data;
Untuk lebih banyak pengetahuan berkaitan, sila lawati ruangan Soalan Lazim!
Atas ialah kandungan terperinci Apakah ciri-ciri cemerlang gudang data berbanding pangkalan data operasi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!