Perancangan dan Implementasi Data Warehouse Penjualan (Studi Kasus: Northwind Sample Database)
on
p-ISSN: 2301-5373
e-ISSN: 2654-5101
Jurnal Elektronik Ilmu Komputer Udayana
Volume 10, No 1. August 2021
Perancangan dan Implementasi Data Warehouse Penjualan (Studi Kasus: Northwind Sample Database)
Muhammad Firdaus Zulkarnaina1, Ni Putu Novia Ardiyantia2, I Wayan Wijaya Kusuma Sandia3, I Dewa Ngurah Tri Hendrawana4, Ida Bagus Made Mahendra a5
aInformatics Department, Udayana University South Kuta, Badung, Bali, Indonesia 1[email protected] 2[email protected] 3[email protected] 4[email protected] 5[email protected]
Abstract
Complex analysis is essential for corporate decision-making. The data warehouse is considered more effective to support the analysis process, design, and business decision-making. Usually, a company will build a data warehouse to store operational data that is useful in the business analysis process, so the information that the company wants can be prevalent more easily. The study will arrange a design and implementation of the data warehouse, which uses the Northwind database as its source. For the warehouse data storage, a nine-step design technique and the purification software are used to implementing the process. The design and implementation will form a sales fact chart containing information that use to help the company's business analyses and decisions, which in this study is visualized using a Microsoft Power Business Intelligence application.
Keywords: Data warehouse, Pentaho Data Integration, Northwind, Nine-Step Design Methodology, Microsoft Power Business Intelligence
-
1. Pendahuluan
Data warehouse adalah gudang data yang di dalamnya menyimpan berbagai macam informasi baik yang terstruktur ataupun tidak terstruktur. Pertama kali diperkenalkan oleh William Harvey Inmon, data warehouse tumbuh pesat pada tahun 1990 serta menjadi paradigma baru dalam teknologi informasi. Menurut Inmon, W.H, data warehouse didefinisikan sebagai sekumpulan data yang memiliki enam buah sifat atau karakteristik berupa berorientasi subjek (subject oriented), terintegrasi (integrated), berorientasi pada proses (process oriented), time variant, dapat diakses dengan mudah (accessible) dan bersifat non-volatile[1]. Data warehouse secara efisien digunakan oleh organisasi industri dalam proses bisnisnya untuk melakukan analisa, perencanaan dan pengambilan keputusan bisnis suatu perusahaan. Umumnya perusahaan menyalin data yang bersumber dari sistem operasionalnya seperti data dari database penjualan barang ke gudang data. Selanjutnya, data tersebut akan diberikan query yang kompleks dan di analisis sehingga dapat memperoleh informasi yang diinginkan perusahaan.
Pada tahun 2018, Pratama dan Pradipta melakukan penelitian mengenai desain dan implementasi data warehouse pada Toko Mekarsari untuk memprediksi penjualan produk toko dan menggunakan tools Talend Open Studio Business Inteligence untuk proses ETL. Penelitian tersebut memberikan hasil bahwa penerapan data warehouse pada sebuah usaha penjualan dapat membantu pemilik dalam proses pengambilan keputusan mengenai barang yang akan dijual pada bulan selanjutnya dan mempersiapkan stok yang lebih banyak untuk produk-produk tertentu. Dengan adanya data warehouse, data historis pada suatu usaha dapat diolah menjadi suatu infomasi yang membantu pemiliki toko untuk mengambil keputusan terkait pengadaan stok barang pada suatu produk dan tumpukan produk di gudang bisa dihindari [2].
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Pada tahun 2020, Pratama dan Widhiasih melaksanakan penelitian mengenai perancangan data warehouse pada Orba Express menggunakan tools Pentaho. Penelitian ini bertujuan untuk memprediksi penjualan produk sehingga dapat digunakan untuk pengambilan keputusan dan analisis. Pada penelitian ini didapatkan hasil berupa waktu penjualan produk, jenis produk yang dijual dan jumlah produk yang terjual pada Orba Express selama bulan Januari sampai dengan bulan Desember tahun 2018. Adanya perancangan data warehouse pada Orba Express dapat membantu pemilik usaha untuk menentukan jumlah persediaan produk yang pada toko setiap bulannya [3].
Pada penelitian ini, penulis akan melakukan penelitian mengenai perancangan dan implemetasi data warehouse penjualan pada suatu perusahaan. Pada penelitian ini, penulis menggunakan studi kasus pada database northwind yang diperoleh dari situs https://docs.yugabyte.com/latest/sample-data/northwind/. Database northwind merupakan data dari salah satu perusahaan yang berada di Amerika Serikat serta bergerak pada industri impor-ekspor produk makanan dan minuman. Databse ini memiliki 77 tipe produk, beberapa diantaranya yaitu soft drinks, coffees, teas, desserts, candies, sweet breads, cheeses, crackers, pasta, fish dan sebagainya. Produk-produk tersebut dimasukkan ke dalam 8 kategori besar yaitu beverage, condiments, confections, dairy product, grains/cereal, meat/poultry, produce dan seafood. Perusahaan ini melaksanakan impor produk dari beberapa negara yang terletak di benua Amerika, Eropa, dan Asia dengan jumlah importir sebanyak 29 perusahaan. Selain itu, perusahaan ini memiliki pelanggan sebanyak 91 perusahaan yang juga tersebar di beberapa negara seperti Jerman, Meksiko, Inggris, Swedia, Jerman, Spanyol, dan Prancis.
Adanya penerapan data warehouse pada database northwind, dapat membantu perusahaan dalam menganalisis data yang sebelumnya masih menggunakan sistem database operasional dan juga mengintegrasikan data yang akan memudahkan perusahaan untuk memahami informasi yang terkandung di dalam data tersebut. Sehingga informasi yang diperoleh dapat digunakan oleh perusahaan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan dan pemasok produk. Selain itu, adanya penggunaan data warehouse pada perusahaan tersebut dapat meringankan kinerja dari sistem database operasional yang digunakan dalam transaksi bisnis atau operasional perusahaan.
-
2. Metode Penelitian
-
2.1. Metode Pengumpulan Data
-
Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder, tahapannya meliputi studi literatur untuk mendapatkan teori sebagai acuan pembuatan penelitian dan untuk data yang diujikan menggunakan Northwind sample database yang didapatkan dari situs yugabyteDB. Dalam Northwind sample database terdiri dari beberapa tabel data. Tabel data meliputi:
-
1. Tabel products
-
2. Tabel customers
-
3. Tabel orders
-
4. Tabel employees
-
5. Tabel suppliers
-
6. Tabel shippers
-
7. Tabel order_details
-
8. Tabel categories
-
9. Tabel employeeterritories
-
10. Tabel region
-
11. Tabel territories
Terdapat beberapa data yang ada didalam masing-masing tabel, antara lain sebagai berikut: a. Tabel Products
Pada tabel ini terdiri dari 77 baris data yang terdiri dari 10 kolom yang meliputi: ProductID, ProductName, SupplierID, CategoryID, QuantityPerUnit, UnitPrice, UnitsinStock, UnitsOnOrder, ReorderLevel dan Discounted.
b.
Gambar 1. Tabel products
Tabel customers
Pada tabel ini terdiri dari 91 baris data yang terdiri dari 11 kolom yang meliputi: cutomerID, CompanyName, ContactName, ContactTitle, Address, City, Region, PostalCode, Country, Phone dan Fax.
Gambar 2. Tabel customers
c.
Tabel orders
Pada tabel ini terdiri dari 830 baris data yang terdiri dari 14 kolom yang meliputi: OrderID, CustomerID, EmployeeID, OrderDate, RequiredDate, ShippedDate, ShipVia, Freight, ShipName, ShipAddress, ShipCity, ShipRegion, ShipPostalCode dan ShipCountry.
Gambar 3. Tabel orders
d.
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Tabel employees
Pada tabel ini terdiri dari 9 baris data yang terdiri dari 19 kolom yang meliputi: EmployeeID, LastName, FirstName, Title, TitleOfCourtesy, BirthDate, HireDate, Address, City, Region, PostalCode, Country, HomePhone, Extension, Photo, Notes, ReportsTo, PhotoPath dan Salary.
IhOJ-US-JU UiriMW ιaft-u⅜uιuuwιuι
Iiiffl-OS-Mm-Iiom hhm-iii-o? ∞∙nπ∙oc
Gambar 4. Tabel employees
'SSi-OS-rSMiKiOtl 'SS3-05-B <»00:00 ⅛⅛nπτ
1055-03-04 M:W:09 1903-10-17 00:00:00
1063-07-02 00:W:00 1093-10-17 00:00:00 Houie
e.
Tabel suppliers
Pada tabel ini terdiri dari 29 baris data yang terdiri dari 12 kolom yang meliputi: supplierID, CompanyName, ContactName, ContactTitle, Address, City, Region, PostalCode, Country, Phone, Fax dan HomePage.
Gambar 5. Tabel suppliers
f.
Tabel shippers
Pada tabel ini terdiri dari 3 baris data yang terdiri dari 3 kolom yang meliputi: ShipperID, CompanyName dan Phone.
I=T → ▼ ShipperID CompanyName Phone
O ⅛/ Edit >c Copy Q Delete 1 Speedy Express (503) 555-9831 □ f⅛^Edit >c Copy φ Delete 2 UnitedPackage (503)555-3199 O ⅛? Edit ⅜c Copy Q Delete 3 Federal Shipping (503) 555-9931
-
g. Tabel order_details
Pada tabel ini terdiri dari 2155 baris data yang terdiri dari 5 kolom yang meliputi: OrderID, ProductID, UnitPrice, Quantity dan Discount
4—“T → ▼ |
OrderID |
ProductID |
UnitPrice |
Quantity |
Discount |
O Z Edit >« Copy Q Delete |
10248 |
11 |
14.0000 |
12 |
0 |
O Z Edit ⅜c Copy 0 Delete |
10248 |
42 |
9.8000 |
10 |
0 |
O l±7 Edit ⅜i Copy Q Delete |
10248 |
72 |
34.8000 |
5 |
0 |
□ Z Edit ⅜c Copy 0 Delete |
10249 |
14 |
18.6000 |
9 |
C |
O Z Edit >■ Copy Q Delete |
10249 |
51 |
42.4000 |
40 |
0 |
O Z Edit >c Copy @ Delete |
10260 |
41 |
7.7000 |
10 |
0 |
O Z Edit >« Copy Q Delete |
10260 |
51 |
42.4000 |
35 |
0 |
Gambar 7. Tabel order_details
-
h. Tabel categories
Pada tabel ini terdiri dari 8 baris data yang terdiri dari 4 kolom yang meliputi: CategoryID, CategoryName, UnitPrice, Quantity dan Discount
<-τ→ |
^ CategoryID |
CategoryName |
Description |
Picture | ||
□ |
Z Edit |
Jc Copy ^ Delete |
1 |
Beverages |
Softdrinks, coffees, teas, beers, and ales |
[BLOB-9.9 KiB] |
□ |
t. Edit |
Jc Copy ^ Delete |
2 |
Condiments |
Svzeet and savory sauces, relishes, spreads, and se.. |
[BLOB-11.8 KiB] |
□ |
ZEdit |
Jc Copy 0 Delete |
3 |
Confections |
Desserts, candies, and sweet breads |
[BLOB-11.7 KiB] |
□ |
l. Edit |
Jc Copy @ Delete |
4 |
Dairy Products |
Cheeses |
[BLOB - 9.5 KiB] |
□ |
ZEdit |
Je Copy ^ Delete |
5 |
GrainsZCereaIs |
Breads, crackers, pasta, and cereal |
[BLOB-11.8 KiB] |
□ |
t. Edit |
Jc Copy ^ Delete |
6 |
MeatZPouItry |
Prepared meats |
[BLOB-11.0 KiB] |
□ |
ZEdit |
Jn Copy 0 Delete |
7 |
Produce |
Dried fruit and bean curd |
[BLOB -12.0 KiB] |
□ |
l. Edit |
Jc Copy ^ Delete |
8 |
Seafood |
Seaweed and fish |
[BLOB-11.8 KiB] |
Gambar 8. Tabel categories
-
i. Tabel employeeterritories
Pada tabel ini terdiri dari 49 baris data yang terdiri dari 2 kolom yang meliputi: EmployeeID dan TerritoryID.
□ |
* Edit |
⅜c Copy ^ Delete |
EmpIoyeeID 1 |
TerritoryID 06897 |
□ |
ZEdit |
>c Copy @ Delete |
1 |
19713 |
□ |
Z≡dit |
⅛c Copy 0 Delete |
2 |
01581 |
□ |
Z≡dit |
>c Copy @ Delete |
2 |
01730 |
Gambar 9. Tabel employeeterritories
-
j. Tabel region
Pada tabel ini terdiri dari 4 baris data yang terdiri dari 2 kolom yang meliputi: RegionID dan RegionDescription.
▼ RegionID RegionDescription
□ |
Z Edit |
⅜c Copy |
Q Delete |
1 |
Eastern |
□ |
ZEdit |
⅜c Copy |
0 Delete |
2 |
Westerns |
□ |
Z≡d't |
⅜c Copy |
0 Delete |
3 |
Northern |
□ |
Z≡dit |
>c Copy |
0 Delete |
4 |
Southern |
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)
-
k. Tabel territories
Pada tabel ini terdiri dari 53 baris data yang terdiri dari 3 kolom yang meliputi: TerritoryID, TerritoryDescription dan RegionID.
Gambar 11. Tabel territories
On Line Analytical Processing (OLAP) adalah sebuah sistem atau teknologi yang digunakan untuk melakukan visualisasi data dalam representasi yang berbeda-beda dan dapat digunakan untuk mendukung proses analisis data [1]. OLAP dapat digunakan untuk memilih secara selektif dan melihat data dari sudut pandang yang berbeda-beda. Data pada OLAP disimpan dalam basis data multidimensi. Jika pada basis data relasional terdiri dari dua dimensi, maka pada basis data multidimensi terdiri dari banyak dimensi yang dapat dipisahkan oleh OLAP menjadi beberapa sub atribut. Data multidimensi memiliki atribut tersendiri untuk bisa dikelola dalam OLAP. Terdapat tiga atribut diantaranya yaitu [4]:
-
a) Dimensi (Dimension) adalah suatu atribut yang di tinjau.
-
b) Pengukur (Measurment) adalah besaran yang dapat diukur mengacu pada irisan antara dimensi yang di tinjau.
-
c) Kalkulasi (Hasil Pengukuran) adalah nilai dari measurement
Di dalam OLAP terdiri dari beberapa operasi yang bisa dilakukan, antara lain sebagai berikut:
-
a) Roll-Up (Konsolidasi)
Operasi roll-up digunakan untuk menaikkan tingkat hirarki konsep data, semakin naik hirarki konsep data, maka data yang disajikan akan semakin ringkas
-
b) Drill-Down
Operasi drill-down merupakan operasi yang digunakan untuk menurunkan tingkat hirarki konsep data, semakin turun hirarki konsep data, maka data yang disajikan akan semakin rinci atau detail
-
c) Slice dan Dice
Operasi slice digunakan untuk memilih satu dimensi dari data multidimensi atau data kubus sedangkan operasi Dice digunakan untuk memilih dua atau lebih dimensi sehingga menghasilkan bagian dari data kubus
-
d) Pivot
Operasi pivot merupakan operasi visualisasi data dengan cara memutar koordinat data yang digunakan untuk menyediakan tampilan data dalam representasi yang berbeda
-
2.3. Perancangan Data Warehouse
Metode perancangan gudang data yang digunakan dalam penelitian ini menggunakan metode Nine-Step Design Methodology. Di dalam metode Nine-Step Design Methodology terdiri dari beberapa langkah, antara lain:
-
1. Analisis Kebutuhan
Analisis kebutuhan informasi pada perancangan data warehouse untuk prediksi penjualan produk menggunakan data dari Northwind Sample Database yang di dalamnnya berisi informasi produk, pelanggan, kategori produk, supplier produk, dan data transaksi pelanggan.
-
2. Memilih Proses (Choosing The Process)
Tahap ini bertujuan untuk menentukan proses bisnis dari perusahaan yang ingin membangun data warehouse. Berdasarkan informasi yang diperoleh dari analisis kebutuhan. Proses bisnis yang terjadi pada penelitian ini meliputi:
-
a. Penjualan produk (Ekspor Produk)
-
b. Pembelian produk (Impor Produk)
-
3. Memilih Grain (Choosing The Grain)
Tahap ini bertujuan untuk memilih grain yang digunakan sebagai dasar sebelum membuat tabel fakta atau tabel fakta. Berdasarkan proses bisnis yang ditentukan, grain yang dipilih pada penelitian ini adalah quantity product atau jumlah produk yang di beli customer.
-
4. Mengidentifikasi dan Penyesuaian Dimensi (Identifying and Conforming The Dimensions)
Tahap ini bertujuan untuk mengidentifikasi dan memilih dimensi yang berhubungan dengan tabel fakta. Dari hasil identifikasi, maka tabel dimensi yang berhubungan dengan tabel fakta meliputi:
-
a. Dimensi Customer
Dimensi customer merupakan customer yang melakukan pembelian produk. Grain yang berhubungan dengan dimensi ini adalah customer yang melakukan pembelian produk. b. Dimensi Produk
Dimensi produk merupakan produk yang tersedia di Northwind Sample Database. Grain yang berhubungan dengan dimensi ini adalah jumlah produk yang dibeli, c. Dimensi Order
Dimensi Order merupakan data transaksi tersimpan dalam database. Grain yang berhubungan dengan dimensi ini adalah jumlah transaksi yang terjadi.
-
5. Memilih Fakta (Choosing The Fact)
Gambar 12 Model Tabel Fakta
Tahap ini bertujuan untuk memilih tabel fakta atau tabel fakta berdasarkan grain yang sudah ditentukan sebelumnya. Setelah mendapatkan grain, maka tabel fakta yang dipilih adalah tabel fakta penjualan. Model tabel fakta dapat dilihat pada pada gambar 12.
Pada gambar 12, model tabel fakta yang digunakan adalah model skema bintang (Star Schema). Dikatakan skema bintang karena hubungan tabel fakta dan tabel dimensi menyerupai bintang. Keuntungan dari skema ini yaitu dapat meningkatkan kinerja data warehouse, pemrosesan query yang lebih efisien, dan waktu respon yang cepat.
-
6. Menyimpan pre-Calculation dalam Tabel Fakta (Storing Pre-Calculation in The Tabel fakta)
Agregasi pada tabel fakta penjualan adalah total jumlah produk yang di beli berdasarkan waktu (hari, bulan dan tahun). Pre-Calculation yang ada dalam tabel fakta yaitu revenue dari penjualan.
-
7. Melengkapi Tabel Dimensi (Rounding Out The Dimension Tables)
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Tahap ini bertujuan untuk melengkapi atribut yang ada dalam masing-masing tabel dimensi. Pada tabel dimensi yang sebelumnya telah ditentukan, masing-masing tabel dimensi memiliki atribut sebagai berikut:
Tabel 1 Dimensi Customer
Field |
Size |
Keterangan |
Customer_sk |
integer(5) |
Nomor identitas customer |
CompanyName |
varchar(40) |
Nama perusahaan atau usaha customer |
ContactName |
varchar(30) |
Nama customer pada daftar kontak perusahaan |
ContactTitle |
varchar(30) |
Jabatan customer |
City |
varchar(15) |
Kota tinggal customer |
Region |
varchar(15) |
Wilayah tinggal customer |
Country |
varchar(15) |
Negara tinggal customer |
Tabel 2 Dimensi Produk
Field |
Size |
Keterangan |
ProductSK |
integer(11) |
Nomor identitas produk |
ProductName |
varchar(40) |
Nama produk |
QuantityPerUnit |
varchar(20) |
Kuantitas pembelian produk per unit |
UnitPrice |
double |
Harga satuan produk |
UnitsInStock |
integer(11) |
Jumlah stok produk tersedia |
UnitsInOrder |
integer(11) |
Jumlah unit produk yang di pesan customer |
Discontinued |
tinyint(1) |
Diskon harga produk |
CompanyName |
varchar(40) |
Nama perusahaan supplier produk |
ContactName |
varchar(30) |
Nama kontak supplier produk |
City |
varchar(15) |
Kota tinggal supplier produk |
Country |
varchar(15) |
Negara tinggal supplier produk |
CategoryName |
varchar(15) |
Kategori dari masing-masing produk |
Tabel 3 Dimensi Order
Field |
Size |
Keterangan |
Order_SK |
integer(11) |
Nomor identitas transaksi |
OrderDate |
datetime |
Tanggal produk dibeli customer |
ShippedDate |
datetime |
Tanggal produk dikirimkan ke customer |
Freight |
double |
Jumlah biaya pengiriman produk ke customer |
ShipName |
varchar(40) |
Nama perusahaan pengiriman |
ShipCity |
varchar(15) |
Kota perusahaan pengiriman |
ShipRegion |
varchar(15) |
Wilayah perusahaan pengiriman |
ShipCountry |
varchar(15) |
Negara perusahaan pengiriman |
ProductID |
integer(11) |
Nomor identitas produk yang dibeli customer |
UnitPrice |
double |
Harga satuan produk yang dibeli customer |
Quantitiy |
integer(11) |
Jumlah produk yang dibeli customer |
-
8. Pemilihan Durasi Database (Choosing The Duration of Database)
Tahap ini bertujuan untuk memilih durasi waktu yang digunakan dalam perancangan data warehouse yang akan dibangun. Dalam perancangan ini, durasi waktu yang digunakan selama tiga tahun terakhir yaitu dari tahun 1996-1998.
-
9. Melacak Perubahan Dari Dimensi
Atribut yang terdapat pada tabel dimensi bisa saja mengalami perubahan yang dinamis. Perubahan tersebut terjadi karena adanya proses ETL pada database penelitian.
g SupplierlD: ∣Mζ11∣
i Cornpanytlame: vaπΛar(40) 9 CootactNaine: varc⅛∣t30)
IcwtaaTiKivarcnariMi
.ι Aderess varchar(60)
i City: Waictiari 15j
a Regon vκθB∣fH)
■ PosteiCwis: va∣aw(∙0)
J Country: varchart15∣
∣ Phone . Warehaι(24 J
l Pax : varcħar(24)
i HomePage: mccurriest
Q2&.u' categories
a CategoryiD ∣ ιnt(iι ∣
. CategoryMame: varchar(15) a Description: meoiumtext a Picture: Iongtjlob
Gambar 13 Skema Database Northwind
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)
Di dalam penelitian ini penulis menggunakan lima tabel data dari database northwind. Tabel-tabel tersebut diantaranya tabel products, categories, supplier, orders, orders details dan customer. Kemudian tabel-tabel tersebut direlasikan sehingga membentuk sebuah skema database. Selanjutnya skema database ini akan dianalisis untuk merancang skema data warehouse penjualan. Untuk skema database northwind ditunjukkan pada gambar 13.
Gambar 14 Skema Data warehouse
Berdasarkan analisis dari skema database northwind, penulis merancang sebuah skema untuk data warehouse penjualan yang ditunjukkan pada gambar 14. Di dalam skema tersebut terdapat satu fact tabel dengan nama fact penjualan yang merupakan representasi dari jumlah transaksi penjualan yang terdapat pada database northwind berdasarkan tabel dimensi customer, tabel dimensi order dan tabel dimensi product. Di dalam tabel dimensi juga menyimpan beberapa atribut yang terkait. Fact tabel penjualan akan menyimpan agregasi/kalkulasi dari jumlah barang yang terjual pada perusahaan dan pendapatan yang dihasilkan dari penjualan produk perusahaan. Sehingga dari hasil kalkulasi tersebut, dapat diperoleh informasi yang dapat membantu perusahaan.
Proses ETL ini merupakan proses integrasi data dari berbagai sumber data untuk menghasilkan sudut pandang tunggal terhadap semua data yang diintegrasikan tersebut. Pada aktivitas ini, terdapat tahapan proses yang harus dilakukan, yaitu
-
1) Extraction: pemilahan dan pengambilan data dari satu atau lebih sumber data.
-
2) Cleansing: pembersihan data untuk meyakinkan validitas, kualitas, dan konsistensi antar data
serta penghilangan duplikasi data.
-
3) Transformation: penyesuaian data manakala terjadi integrasi data dari berberapa sumber agar sesuai dengan target data warehouse.
-
4) Loading: pemuatan data ke dalam target data warehouse.
Proses integrasi data pada penelitian ini menggunakan aplikasi Pentaho Data Integration (PDI). Komponen utama dari PDI ini adalah mesin integrasi data berupa perangkat lunak yang mampu menginterpretasi dan mengeksekusi suatu tugas. Tipe objek yang dipergunakan berupa transformation. Transformasi ini bersifat data-oriented dan digunakan untuk mengekstraksi, mentransformasikan, dan memuat data. Transformasi berisi sekumpulan langkah (steps), dimana setiap step merupakan suatu operasi pada satu atau beberapa record streams. Dari satu step ke step lainnya dihubungkan oleh penghubung yang disebut sebagai hop. Suatu hop diilustrasikan sebagai sebuah pipa penghubung yang akan mengalirkan record dari satu step ke step lainnya. Sebagai contoh akan dipaparkan proses ETL tabel dimensi dim_orders dan tabel fakta
fact_penjualan pada star schema penjualan produk. Tipe perubahan yang digunakan pada atribut dimensi data warehouse pada Northwind Sample Database yaitu membuat data baru, berikut atribut tersebut.
Tabel 4 Perubahan Atribut Dimensi
Dimensi |
Atribut yang berubah |
Dimensi produk |
Product_ID |
Dimensi customer |
Customer_ID |
Dimensi order |
Order_ID |
Skema proses ETL tabel dim_orders digambarkan pada gambar 15. Bagian input transformasi ini mendapatkan data dari dua tabel sumber dari database yaitu order dan tabel order_detail. Hal ini dimaksudkan agar memungkinkan dilakukannya proses drill-down dan roll-up pada perspektif daerah asal. Proses transformasi diawali dengan langkah stream lookup, untuk melakukan proses lookup table antara tabel order dan tabel order_detail. Kemudian dilanjutkan dengan langkah select order field yang akan menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai tabel dim_orders. Tahap terakhir adalah memuat data hasil proses transformasi ke dalam tabel dimensi dim_orders.
Gambar 16 Proses ETL Tabel Dimensi Order
Gambar 15 Proses ETL Tabel Dimensi Customer
Orders
Gambar 17 Proses ETL tabel fakta penjualan
Proses ETL untuk tabel fact_penjualan melibatkan beberapa langkah lookup table pada seluruh tabel dimensinya untuk mengisikan foreign key pada tabel fakta, serta memerlukan transform calculator untuk melakukan perhitungan nilai revenue penjualan sebelum dilakukan proses selected value. Sebelum langkah pemuatan data ke dalam tabel fakta, dilakukan suatu proses untuk mengubah field yang memiliki nilai null menjadi angka nol (0), karena nilai null tidak diperkenankan menjadi suatu field kunci. Proses ETL pada tabel fakta penjualan yang memiliki 1 buah tabel fakta dan 3 tabel dimensi seperti pada skema data warehouse yang telah dirancang, diilustrasikan pada gambar 17.
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) 3.4 Penerapan Aplikasi Business Intelligence
Hasil dari data warehouse yang dibangun akan divisualisasikan menggunakan aplikasi business intelligence. Pada penelitian ini akan digunakan aplikasi Microsoft Power BI desktop yang merupakan aplikasi analitik untuk menganalisa data. Microsoft Power BI dapat digunakan sebagai tool visualisasi data yang terdapat pada database ataupun data warehouse. Untuk melakukan proses visualisasi, akan dilakukan proses pengambilan data dari sumber data dengan menggunakan fitur ‘get data’ pada tampilan awal saat membuka aplikasi ataupun yang terdapat pada ribbon. Ada berbagai pilihan pada saat proses get data, diantaranya yaitu sumber data berupa file, database, power flatform, azure, online service dan lainnya [5]. Pada penelitian ini digunakan MySQL database sebagai sumber data.
Kemudian akan muncul kotak dialog untuk memasukkan informasi berupa nama database yang akan dipilih serta server MySQL yang digunakan. Setelah itu akan muncul daftar tabel yang terdapat pada database, centang database yang diperlukan kemudian klik ‘load’ untuk memasukkan data tabel tersebut ke aplikasi Microsoft Power BI. Setelah data berhasil dimuat, maka proses visualisasi data dapat dilakukan.
Visualisasi data yang digunakan pada penelitian ini ialah berupa teks dan grafik, yang akan ditampilkan dalam bentuk dashboard. Pada penelitian ini dibuat dua buah dashboard, yaitu dashboard kuantitas order dan dashboard pendapatan yang dapat dilihat pada gambar 18 dan 19. Pada gambar 18, yaitu dashboard kuantitas order terdapat informasi mengenai 10 negara sebagai tujuan pengiriman dengan jumlah order terbanyak, 10 perusahaan dengan jumlah order terbanyak, jumlah order berdasarkan waktu, jumlah order pada setiap kategori yang ada, dan 10 produk dengan jumlah order terbanyak.
Gambar 19 memuat dashboard pendapatan yang memiliki informasi mengenai jumlah pendapatan yang diperoleh oleh perusahaan. Informasi yang disajikan pada dashboard pendapatan ini ialah informasi tentang 10 produk dengan penjualan teratas, 10 negara sebagai tujuan pengiriman teratas berdasarkan total pendapatan, 10 perusahaan dengan total pembelian teratas, total penjualan yang didapatkan pada setiap kategori, dan total pendapatan berdasarkan waktu.
Gambar 18 Dashboard kuantitas order
Gambar 19 Dashboard pendapatan
-
4. Conclusion
Berdasarkan hasil penelitian mengenai analisis desain dan implementasi data warehouse penjualan pada Northwind Sample Database, maka penulis dapat mengambil kesimpulan sebagai berikut:
-
1) Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder dengan tahapan studi literatur untuk mendapatkan teori sebagai acuan pembuatan penelitian dan untuk data yang diujikan menggunakan northwind sample database yang didapatkan dari situs yugabyteDB.
-
2) Proses integrasi data warehouse menggunakan konsep ETL dengan bantuan Pentaho Data Integration.
-
3) Setelah melakukan integrasi data, analisis dilakukan dengan menggunakan query untuk mendapatkan informasi dari database data warehouse yang telah diimplementasikan.
-
4) Desain dan implementasi data warehouse yang telah dilakukan dapat membantu perusahaan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan dan pemasok produk.
References
-
[1] D. Subuh and W. Yasman, “Implementasi Data warehouse Dan Penerapannya Pada Toko
Magnifique Clothes Dengan Menggunakan Tools Pentaho,” Pros. SENIATI, pp. 29–36, 2019.
-
[2] I. P. A. E. Pratama and I. G. A. Pradipta, “Desain dan Implementasi Data warehouse untuk
Prediksi Penjualan Produk Pada Toko Mekarsari,” J. Teknol. Inf. dan Terap., vol. 05, no. 1, pp. 65–71, 2018, doi: https://doi.org/10.25047/jtit.v5i1.81.
-
[3] N. P. N. D. Widhiasih and I. P. A. E. Pratama, “PERANCANGAN DATA WAREHOUSE UNTUK
PREDIKSI PENJUALAN PRODUK PADA ORBA EXPRESS MENGGUNAKAN PENTAHO,” J. Sains dan Sist. Inf., vol. 3, no. 2, pp. 43–48, 2020.
-
[4] A. Syam and A. R. Manga, “Sistem Tracer Study Alumni Fakultas Ilmu Komputer Universitas
Muslim Indonesia Menggunakan Metode on-Line Analitycal Processing (Olap),” Ilk. J. Ilm., vol. 9, no. 1, pp. 86–90, 2017, doi: 10.33096/ilkom.v9i1.114.86-90.
-
[5] S. Meza, A. Ricky, and Derisma, “Pengembangan Model Business Intelligence Manajemen
Rumah Sakit untuk Peningkatan Mutu Pelayanan,” J. Chem. Inf. Model., vol. 4, no. 1, pp. 125– 129, 2017.
Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)
This page is intentionally left blank
188
Discussion and feedback