Pembahasan Materi
- Karakteristik Data Warehouse
- Komponennya
- Perbedaan Data Warehouse dengan Mart Data
Karakteristik
- Berorientasi Subjek.
Data
warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas
peringkat tinggi) dalam perusahaan, Data warehouse adalah tempat penyimpanan
berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu
perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan,
konsumen, inventori, daln lain sebagainya
- Terintegrasi
Data
yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan
yang konsisten, format-format, struktur terkodekan, serta
karakteristik-karakteristik yang berhubungan, Sumber data yang ada dalam data
warehouse tidak hanya berasal dari database operasional (internal source)
tetapi juga berasal dari data diluar sistem (external source).
- Memiliki dimensi waktu (Time variant)
Data
yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin
digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse
menyimpan sejarah (historical data). Bandingkan dengan kebutuhan sistem
operasional yang hampir semuanya adalah data mutakhir! Waktu merupakan tipe
atau bagian data yang sangat penting didalam data warehouse.
- Non-volatile
Data
yang tersimpan dalam data warehouse diambil dari system operasional yang sedang
berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat
‘hanya-baca), Sekali masuk kedalam data warehouse, data-data, terutama data
tipe transaksi, tidak akan pernah di update atau dihapus (delete) Terlihat,
bahwa keempat karakteristik ini saling terkait kesemuanya harus
diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk
mendukung pengambilan-keputusan.
- . Ringkas
Jika
diperlukan, data operasional dikumpulkan ke dalam ringkasan-ringkasan
- Granularity
Pada
sistem operasional data dibuat secara real-time sehingga untuk mendapatkan
informasi langsung dilakukan proses query. Pada data warehouse pada
menganalisis harus memperhatikan level-of-detail misalkan perhari, ringkasan
perbulan, ringkasan per-tiga-bulan.
- Tidak ternormalisasi
Data
di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat
redundan.
Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.
Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.
Komponen
ource system adalah data source atau objek yang
menjadi sumber data dari proses keseluruhan. Source sistem merupakan sistem
OLTP yang berisi data yang ingin di muat ke dalam data warehouse.
Online Transaction Processing (OLTP) adalah
suatu sistem yang fungsi utamanya untuk menangkap dan menyimpan transaksi
bisnis. data source system diuji menggunakan satu data profiler untuk dapat
memahami karakteristik dari data.
Data profiler adalah suatu alat yang punya kemampuan
untuk menganalisis data, seperti menemukan berapa banyak baris yang terdapat di
dalam setiap tabel, berapa banyak baris yang mengandung nilai NULL, dan
seterusnya
ETL adalah singkatan dari extract, transform,
load. Fungsinya adalah melakukan ekstraksi dari data source, kemudian melakukan
transformasi data, sebelum me-load-nya ke data store tujuan. Sistem ETL
kemudian diintegrasikan, bertransformasi, dan memuat data ke dalam satu
dimensional data store (DDS)
DDS adalah database yang menyimpan data dari
data warehouse dengan format yang berbeda dibandingkan OLTP.
Data quality (DQ)untuk dilaporkan kemudian
diperbaiki pada source sistem. Data yang buruk juga dapat secara otomatis
terkoreksi atau di toleransi jika data tersebut berada pada batas tertentu
Metadata adalah satu database yang berisi
informasi tentang struktur data, arti data, pemakaian data, aturan kualitas
data, dan informasi lain seputar data
Sistem audit mencatat sistem operasi dan
pemakaiannya ke dalam database metadata. Sistem audit menjadi bagian dari
sistem ETL yang memonitor aktivitas operasional dari proses ETL dan mencatat
statistik operasional mereka
Perbedaan Data Warehouse dengan Data Mart ??
- Data warehouse merupakan gabungan dari beberapa data mart dan levelnya berada pada perusahaan atau organisasi.
- Data mart merupakan bagian dari datawarehouse dan berada level departemen pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses, misalkan penjualan, maka hanya proses penjualan saja yang ditangani pada data mart.
http://opistation.wordpress.com/2013/10/15/karakteristik-data-warehouse/
http://aullyaarvianto.wordpress.com/2014/01/18/perbedaan-data-warehouse-dan-data-mart/
Komentar
Posting Komentar