Pengantar Data Warehouse



Pembahasan Materi
  • Karakteristik Data Warehouse
  • Komponennya
  • Perbedaan Data Warehouse dengan Mart Data


Karakteristik 


  •  Berorientasi Subjek.

Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi) dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya

  •  Terintegrasi

Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). 

  • Memiliki dimensi waktu (Time variant)

Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse.
  •        Non-volatile

Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat ‘hanya-baca), Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan.

  • .      Ringkas

Jika diperlukan, data operasional dikumpulkan ke dalam ringkasan-ringkasan
  •     Granularity

Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi langsung dilakukan proses query. Pada data warehouse pada menganalisis harus memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-bulan.

  • Tidak ternormalisasi

Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat redundan.
Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.

Komponen





ource system adalah data source atau objek yang menjadi sumber data dari proses keseluruhan. Source sistem merupakan sistem OLTP yang berisi data yang ingin di muat ke dalam data warehouse. 

Online Transaction Processing (OLTP) adalah suatu sistem yang fungsi utamanya untuk menangkap dan menyimpan transaksi bisnis. data source system diuji menggunakan satu data profiler untuk dapat memahami karakteristik dari data.

Data profiler adalah suatu alat yang punya kemampuan untuk menganalisis data, seperti menemukan berapa banyak baris yang terdapat di dalam setiap tabel, berapa banyak baris yang mengandung nilai NULL, dan seterusnya

ETL adalah singkatan dari extract, transform, load. Fungsinya adalah melakukan ekstraksi dari data source, kemudian melakukan transformasi data, sebelum me-load-nya ke data store tujuan. Sistem ETL kemudian diintegrasikan, bertransformasi, dan memuat data ke dalam satu dimensional data store (DDS)

DDS adalah database yang menyimpan data dari data warehouse dengan format yang berbeda dibandingkan OLTP.

Data quality (DQ)untuk dilaporkan kemudian diperbaiki pada source sistem. Data yang buruk juga dapat secara otomatis terkoreksi atau di toleransi jika data tersebut berada pada batas tertentu

Metadata adalah satu database yang berisi informasi tentang struktur data, arti data, pemakaian data, aturan kualitas data, dan informasi lain seputar data

Sistem audit mencatat sistem operasi dan pemakaiannya ke dalam database metadata. Sistem audit menjadi bagian dari sistem ETL yang memonitor aktivitas operasional dari proses ETL dan mencatat statistik operasional mereka

Perbedaan Data Warehouse dengan Data Mart ??

  • Data warehouse merupakan gabungan dari beberapa data mart dan levelnya berada pada perusahaan atau organisasi.

  • Data mart merupakan bagian dari datawarehouse dan berada level departemen  pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses,  misalkan penjualan, maka hanya proses penjualan saja yang ditangani pada data mart.




http://opistation.wordpress.com/2013/10/15/karakteristik-data-warehouse/

http://aullyaarvianto.wordpress.com/2014/01/18/perbedaan-data-warehouse-dan-data-mart/

Komentar