Cerita Hosting Administrator and Content Manager for ceritahosting.com

DATA WAREHOUSE(DWH)

6 min read

DATA WAREHOUSE

(E-Learning Series)

TOPIK-1:

Mengetahui Fundamental dari Data Warehouse

Sebelum bahasan dari topik Data warehouse, ada baiknya kita mengetahui terlebih dahulu dari definisi-definisi untuk pembahasan lanjutan.

Definisi basis data (database) adalah sbb:

  • Sekumpulan data store(bisa dalam jumlah besar) yang tersimpan dalam magnetic disk, optical disk, dan media penyimpan sekunder lainnya.
  • Sekumpulan program-program aplikasi umum yang mengeksekusi dan memproses data secara umum (hapus,cari,update,dll)
  • Basis data terdiri dari data yang di-share bagi banyak user dan memungkinkan penggunaan data yang sama pada waktu bersamaan oleh banyak user
  • Koleksi terpadu dari data-data yang saling berkaitan dari suatu enterprise.Misal. Basisdata Nilai Mahasiswa akan terdiri dari data-data seperti tabel Matakuliah, Dosen, Mahasiswa, Nilai, dll.


Definisi data:

Menurut berbagai kamus bahasa Inggris-Indonesia, data diterjemahkan sebagai istilah yang berasal dari kata “datum” yang berarti fakta atau bahan-bahan keterangan.

• Dari sudut pandang bisnis, data bisnis (business data) adalah deskripsi organisasi tentang sesuatu(resources) dan kejadian (transactions) yang terjadi (business data is an organization’s description of things (resources)and events (transactions) that it faces).

• Data adalah deskripsi dari sesuatu dan kejadian yang kita hadapi.

• Data adalah kenyataan yang menggambarkan suatu kejadian-kejadian dan kesatuan nyata. Kejadian adalah sesuatu yang terjadi pada saat tertentu. Kesatuan nyata adalah berupa suatu objek nyata seperti tempat, benda dan orang yang betul-betul ada dan terjadi.

Definisi Informasi:

• Menurut Gordon B. Davis dalam bukunya Management Informations System :

Conceptual Foundations, Structures, and Development menyebut informasi sebagai data yang telah diolah menjadi bentuk yang berguna bagi penerimanya dan nyata, berupa nilai yang dapat dipahami di dalam keputusan sekarang maupun masa depan.

• Menurut Barry E. Cushing dalam buku Accounting Information System and Business Organization, dikatakan bahwa informasi merupakan sesuatu yang menunjukkan hasil pengolahan data yang diorganisasi dan berguna kepada orang yang menerimanya.

• Menurut Robert N. Anthony dan John Dearden dalam buku Management Control

Systems, menyebut informasi sebagai suatu kenyataan, data, item yang menambah pengetahuan bagi penggunanya.

• Menurut Stephen A. Moscove dan Mark G. Simkin dalam bukunya Accounting

Information Systems : Concepts and Practise mengatakan informasi sebagai kenyataan atau bentuk-bentuk yang berguna yang dapat digunakan untuk pengambilan keputusan bisnis.

Kesimpulan:


Data adalah nilai yang mendeskripsikan dari suatu objek atau kejadian.


Informasi adalah hasil dari pengolahan data dalam bentuk yang lebih berguna dan lebih berarti bagi penerimanya yang menggambarkan suatu kejadian-kejadian

sehingga akan berguna untuk pengambilan keputusan.

Definisi Software / Perangkat Lunak :

• Kumpulan instruksi yang berfungsi untuk menjalankan suatu perintah, seperti

memberikan informasi tentang hardware, menentukan fungsi hardware, dan

menjalankan sistem.

• Seluruh komponen pengolahan data yang dapat membantu memecahkan masalah diluar dari perangkat hardware yang meliputi system design, program dan prosedur.

Gambaran umum tentang perangkat lunak antara lain :

1. Perintah (program computer) yang bila dieksekusi memberikan fungsi dan unjuk

kerja seperti yang diinginkan.

2. Struktur data yang memungkinkan program memanipulasi informasi secara

proporsional.

3. Dokumen yang menggambarkan operasi dan kegunaan program.

Berdasarkan jenisnya, software dibagi menjadi 3 yaitu :

1. Firmware (BIOS)

2. Sistem Operasi (Windows, Linux, Mac OS, dll)

3. Software Aplikasi (Photoshop, WinAmp, WinZip, Office, dll)

Siklus Informasi :

Siklus informasi adalah gambaran secara umum mengenai proses terhadap data sehingga menjadi informasi yang bermanfaat bagi pengguna. Informasi yang menghasilkan informasi berikutnya. Demikian seterusnya proses pengolahan data menjadi informasi.


  • Proses menghasilkan informasi harus melalui tahapan-tahapan yang dilakukan komputer sebagai teknologi informasi.
  • Tahapan-tahapan tersebut terdiri atas Input – Proses – Output yang disebut sebagai siklus proses informasi. Artinya, bila tahap telah sampai pada output maka output tersebut dapat dijadikan input kembali.
  • Dengan demikian dapat dikatakan bahwa informasi yang dihasilkan dapat pula dijadikan data kembali sebagai input untuk diproses selanjutnya.
  • Data dan informasi akan saling berkesinambungan sehingga membentuk suatu siklus yang disebut information cycle (siklus informasi).

Evolusi database


Saat ini Data Warehouse(DWH) banyak di diperlukan dan telah di implementasikan di berbagai perusahaan, seperti perusahaan yang bergerak di bidang Multi-finance(Pembiayaan), Banking, Financial technology(Fintech), distribusi.

  • Perusahaan Telekomunikasi: untuk mengamati jumlah transaksi yang terjadi
  • Perusahaan Keuangan: mendeteksi transaksi keuangan
  • Perusahaan Asuransi: mengidentifikasi layanan kesehatan, mana yang perlu diberikan asuransi dan mana yang tidak perlu.
  • Bidang Olahraga: menganalisa statistik permainan
  • Data warehouse diperlukan bagi para pengambil keputusan manajemen dari suatu organisasi/perusahaan.
  • Dengan adanya data warehouse, akan mempermudah pembuatan aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data warehouse adalah khusus untuk membuat suatu database yang dapat digunakan untuk mendukung proses analisa bagi para pengambil keputusan.

Pada materi pembelajaran kali ini, mari kita pelajari apa itu Data warehouse(DWH), tujuan dan segala aspek terkait data warehouse(DWH).

Pengertian data warehouse menurut para ahli :

  • Menurut Ralph Kimbali, data warehouse adalah suatu sistem yang mengekstrak, melakukan pembersihan, menyesuaikan diri serta mengirimkan sumber data pada suatu data penyimpanan dimensional dan selanjutnya memberi dukungan pada implementasi query serta analisa dalam rangka pengambilan keputusan.
  • Menurut Vivek Gupta (System Services Group, 1997), pengertian data warehouse adalah sistem yang terstruktur dan berskala besar yang berguna untuk menganalisa data statis yang sudah ditransformasikan dari berbagai aplikasi sumber asalnya supaya sesuai dengan struktur bisnis, terkumpul dalam jangka waktu lama, direprentasikan pada terminologi bisnis serta terpadu agar kudah dalam menganalisa.
  • Menurut Elmasri & Navathe (2004), data warehouse adalah kumpulan yang berasal dari informasi yang memiliki keunggulan yang sama (sama baiknya). Data warehouse memiliki perbedaan utama dalam karakteristik yang lebih menekankan pada aplikasi pendukung keputusan. Definisi ini menganggap bahwa data warehouse mempunyai karakteristik yang tidak sama dengan sistem pendukung operasional yang lain.
  • Bill Inmon (1996), menyatakan bahwa data warehouse merupakan dasar dari proses pengambilan keputusan. Bill Inmon disebut-sebut sebagai Bapak Data Warehouse.
  • Poe (1996) menyatakan bahwa data warehouse merupakan basis data analisa yang hanya bisa dibaca serta dipergunakan sebagai bahan pada sistem pendukung keputusan. Pemikiran Poe sejalan dengan Bill Inmon yang memandang bahwa data warehouse  sebagai dasar pada sistem pengambilan keputusan.
  • Eckerson, Wayne W menyatakan bahwa data warehouse merupakan penempatan data yang sudah diuraikan yang beraal dari database operasional, eksternal serta database lain dari organisasi.
  • Malik, Shadan (2005), menyatakan bahwa data warehouse merupakan tempat penyimpanan data historikal yang diorganisasikan berdasarkan pada subyek untuk pengambilan keputusan pada organisasi. Data warehouse mem-fasilitasi pada kegiatan, antara lain Data Mining dan mendukung pengambilan keputusan.
  • Wikipedia: suatu sistem komputer untuk mengarsipkan dan menganalisis data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Pada umumnya suatu organisasi menyalin informasi dari sistem operasionalnya (seperti penjualan dan SDM) ke gudang data menurut jadwal teratur, misalnya setiap malam atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan kueri kompleks dan analisis (contohnya data mining) terhadap informasi tersebut tanpa membebani sistem yang operasional.



  • Data Mart

Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan.

  • On-Line Analytical Processing(OLAP)

Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar.

  • On-Line Transaction Processing(OLTP)

Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.

  • Dimension Table

Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).

  • Fact Table

Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.

  • DSS (Decission Support System )

Merupakan sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.

  • ETL(Extracting, Transforming, Loading) kumpulan proses menyiapkan data dari operational source untuk data. ETL  adalah fase pemrosesan data dari sumber data masuk ke dalam data warehouse.

Tugas dari data warehouse:

1. Pembuatan laporan

Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.

2. On-Line Analytical Processing (OLAP)

Dengan adanya data warehouse,semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat.

OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda.

3. Data mining

Data mining merupakan proses untuk menggali(mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.

4. Proses informasi executive

Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi target informative bagi user.

Sumber Data Warehouse

Terdapat beberapa strategi yang dapat digunakan oleh suatu organisasi untuk dapat membuat suatu data warehouse.

  1. Virtual Data Warehouse dibuat dengan cara:
  • Menginstal kumpulan akses data, direktori data dan fasilitas manajemen proses,
  • Training user
  • Monitor bagaimana data warehouse digunakan
  • Dari pemakaian actual, membuat suatu physical data warehouse untuk mendukung permintaan yang banyak.
  1. Membangun copy dari data operasional dari satu system operasional dan memungkinkan data warehouse dari sekumpulan tool untuk mengakses informasi. Strategi ini mempunyai keuntungan yaitu sederhana dan cepat. Sayangnya, jika data yang ada berkualitas jelek dan akses ke data tersebut kurang baik, maka pendekatan ini akan menimbulkan masalah yang signifikan.
  2. Memilih populasi user berdasarkan nilai dari perusahaan dan melakukan analisa persoalan, pertanyaan dan kebutuhan akses data mereka. Berdasarkan kebutuhan ini, prototype data warehouse dibangun dan dipopulasikan sehingga user dapat bereksperimen dan memodifikasi requirement mereka. Sekali terbentuk persetujuan tentang kebutuhan mereka, kemudian data dapat diambil dari database operasional yang ada dalam perusahaan ataupun dari data source yang lain dan diload kedalam data warehouse. Jika diperlukan, tool untuk mengakses informasi dapat memungkinkan user untuk mendapatkan akses untuk mengambil data menggunakan tool favorit mereka atapun untuk memperkenankan pembuatan dari informasi multi-dimensi yang berperforma tinggi menggunakan datawarehouse sebagai dasarnya.

Tidak ada pendekatan untuk membangun suatu data warehouse yang dapat sesuai dengan kebutuhan setiap perusahaan. Kebutuhan setiap perusahaan berbeda satu sama lain sebagaimana konteks dari perusahaan tersebut. Sejak teknologi data warehouse berkembang hanya pendekatan praktislah yang berkembang sebenarnya.

Keuntungan implementasi Data warehouse(DWH):

Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah.

  • Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
  • Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
  • Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
  • Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
  • Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.

Pustaka

Connolly, Thomas., Begg, Carolyn (2005). Database System: A practical Approach to Design, Implementation and management, 4th Ed. Pearson Education, England.
Darmawikarta, Djoni. Dimensional Data Warehousing with MySQL. BrainySoftware. ISBN 0-9752128-2-6

Avatar
Cerita Hosting Administrator and Content Manager for ceritahosting.com

Sistem Informasi Management-Dukungan SIM terhadap kualitas produk dan jasa

TOPIK PERKULIAHAN: Dukungan SIM terhadap kualitas produk dan jasa Definisi: Pengertian Kualitas Produk  Kualitas produk adalah kondisi fisik, fungsi dan sifat suatu produk baik...
Avatar Cerita Hosting
7 min read

PENGANTAR ARTIFICIAL INTELLIGENCE (AI)

  KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)   Definisi: Kecerdasan buatan atau Artificial Intelligence (AI) adalah simulasi dari kecerdasan yang dimiliki oleh manusia yang dimodelkan di...
Avatar Cerita Hosting
3 min read

PERKEMBANGAN SISTEM INFORMASI DI DALAM PERUSAHAAN

MATERI PERKULIAHAN PERKEMBANGAN SISTEM INFORMASI DI DALAM PERUSAHAAN Sistem informasi manajemen atau SIM (bahasa Inggris: management information system, MIS) adalah: Sistem perencanaan bagian dari...
Avatar Cerita Hosting
2 min read

Leave a Reply

Your email address will not be published. Required fields are marked *