Sabtu, 18 Oktober 2014

RESUME STAR SCHEMA

STAR SCHEMA
·         Dibawah ini akan menjelaskan kelbihan dan kekurangan dari star schema.
Kelebihan :
1.      Cenderung mudah dipahami karena modelnya yang lebih sederhana
2.      Memudahkan mencari isi karena kesederhanaannya
3.      Proses query lebih cepat pada saat proses OLAP
Kekurangan :
1.      Ukuran data lebih besar karena ada data yang disimpan ulang
2.      Maintenance dan update lebih sulit

·         Data Marks adalah bagian dari data warehouse
·         Fact Table             : Data Transaksi
·         Dimension Table   : Data Master (mempunyai 1 primary key dan beberapa attribute)
·         Fungsi ETL juga dapat mengurangi redundansi
·         Kesimpulan                       :

 Schema dan Snowflake Schema lebih cepat Snowflake karena kebutuhannya disendirikan dan querynya lebih kompleks.

·         Pemahaman AGREGASI :

Bila mengagregat data, Anda mengelompokkan data berdasarkan atribut, seperti produk, harga, wilayah, atau tanggal, lalu menentukan rumus yang berfungsi pada semua data dalam grup. Misalnya, bila membuat total selama setahun, Anda membuat agregasi. Jika kemudian rasio tahun ini lebih dari tahun sebelumnya dan ditampilkan sebagai persentase, agregasi tersebut memiliki tipe berbeda.

Untuk memperjelas mekanisme pengelompokan, kita gunakan contoh tabel P berikut, yang bisa
anda dapatkan dengan menggunakan SQL query pada halaman terakhir bagian ini:




1.      Penggunaan fungsi agregasi tanpa pengelompokan berarti melakukan agregasi dari seluruh data. SELECT max(thnakademik) as thnambilterakhir FROM P (akan mengambil tahunakademik terbesar yaitu '2004/2005')

2.      Penggunaan fungsi agregasi dengan pengelompokan berdasar pada kolom berarti melakukan pengelompokan dengan aturan dasar record-record yang memiliki nilai sama untuk kolom tersebut sebagai satu kelompok, dan bila nilai kolom pengelompokan tidak sama maka berada kelompok yang berbeda. Selanjutnya agregasi akan dilakukan untuk masing-masing kelompok data.

      ( a )  Agregasi berdasar satu kolom
             SELECT max(thnakademik), nilai FROM P GROUP BY nilai

       akan membentuk kelompok seperti gambar di bawah ini:




       sehingga hasil dari query di atas adalah:



Sumber :


Sabtu, 11 Oktober 2014

PERUBAHAN DARI DATABASE MENJADI STAR/SNOWFLAKE SCHEMA PADA PENJUALAN “TOKO BUKU XYZ”


A.    GAMBAR TABEL














   



B. CUBE

Dengan cube data menjadi lebih mudah untuk dimanipulasi. Setiap sumbu cube mewakili dimensi-dimensi. Terdapat measure yaitu nilai quantitative database yang ingin kita analisa. Biasanya measure berupa nilai penjualan, biaya, budget dan sejenisnya. Measure dihitung berdasarkan dimensi-dimensi dari cube. Misalkan kita ingin meganalisa penjualan buku, total penjualan (sebagai measure) untuk suatu jenis buku tertentu (dimensi) pada lokasi / toko buku yang berbeda-beda (lokasi dapat dipilih sesuai dengan kebutuhan seperti negara, propinsi dll) pada suatu periode waktu tertentu (hari, minggu, bulan,tahun, kuartal).





C. STAR SCHEMA




D. SNOWFLAKE SCHEMA

Model snowflake merupakan perluasan dari star dimana ia juga mempunyai satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel  dimensi utama. Model snowflake ini hampir sama seperti teknik normalisasi


Senin, 06 Oktober 2014

Analisa Skema Data Warehouse pada Penjualan Produk dan Penerapan Dalam Studi Kasus Divisi Greenscope Energy – PT. Tustika Nagata Surabaya


Membuat star schema.

Pada tahapan ini akan dilakukan perancangan star schema dan Desain Extract, Transformation, Loading (ETL) dikarenakan data warehouse menggunakan model data dimensional atau sering disebut sebagai star schema. Star schema mempunyai dua bagian, yaitu tabel fakta dan tabel dimensi. Setelah star schema dibuat maka proses selanjutnya adalah melakukan proses ETL dari database operasional ke database data warehouse. Sebelum proses ETL ini diproses harus dibuat dulu desain untuk proses ETL-nya.