p-ISSN: 2301-5373

e-ISSN: 2654-5101

Jurnal Elektronik Ilmu Komputer Udayana

Volume 10, No 1. August 2021

Perancangan dan Implementasi Data Warehouse Penjualan (Studi Kasus: Northwind Sample Database)

Muhammad Firdaus Zulkarnaina1, Ni Putu Novia Ardiyantia2, I Wayan Wijaya Kusuma Sandia3, I Dewa Ngurah Tri Hendrawana4, Ida Bagus Made Mahendra a5

aInformatics Department, Udayana University South Kuta, Badung, Bali, Indonesia 1[email protected] 2[email protected] 3[email protected] 4[email protected] 5[email protected]

Abstract

Complex analysis is essential for corporate decision-making. The data warehouse is considered more effective to support the analysis process, design, and business decision-making. Usually, a company will build a data warehouse to store operational data that is useful in the business analysis process, so the information that the company wants can be prevalent more easily. The study will arrange a design and implementation of the data warehouse, which uses the Northwind database as its source. For the warehouse data storage, a nine-step design technique and the purification software are used to implementing the process. The design and implementation will form a sales fact chart containing information that use to help the company's business analyses and decisions, which in this study is visualized using a Microsoft Power Business Intelligence application.

Keywords: Data warehouse, Pentaho Data Integration, Northwind, Nine-Step Design Methodology, Microsoft Power Business Intelligence

  • 1.    Pendahuluan

Data warehouse adalah gudang data yang di dalamnya menyimpan berbagai macam informasi baik yang terstruktur ataupun tidak terstruktur. Pertama kali diperkenalkan oleh William Harvey Inmon, data warehouse tumbuh pesat pada tahun 1990 serta menjadi paradigma baru dalam teknologi informasi. Menurut Inmon, W.H, data warehouse didefinisikan sebagai sekumpulan data yang memiliki enam buah sifat atau karakteristik berupa berorientasi subjek (subject oriented), terintegrasi (integrated), berorientasi pada proses (process oriented), time variant, dapat diakses dengan mudah (accessible) dan bersifat non-volatile[1]. Data warehouse secara efisien digunakan oleh organisasi industri dalam proses bisnisnya untuk melakukan analisa, perencanaan dan pengambilan keputusan bisnis suatu perusahaan. Umumnya perusahaan menyalin data yang bersumber dari sistem operasionalnya seperti data dari database penjualan barang ke gudang data. Selanjutnya, data tersebut akan diberikan query yang kompleks dan di analisis sehingga dapat memperoleh informasi yang diinginkan perusahaan.

Pada tahun 2018, Pratama dan Pradipta melakukan penelitian mengenai desain dan implementasi data warehouse pada Toko Mekarsari untuk memprediksi penjualan produk toko dan menggunakan tools Talend Open Studio Business Inteligence untuk proses ETL. Penelitian tersebut memberikan hasil bahwa penerapan data warehouse pada sebuah usaha penjualan dapat membantu pemilik dalam proses pengambilan keputusan mengenai barang yang akan dijual pada bulan selanjutnya dan mempersiapkan stok yang lebih banyak untuk produk-produk tertentu. Dengan adanya data warehouse, data historis pada suatu usaha dapat diolah menjadi suatu infomasi yang membantu pemiliki toko untuk mengambil keputusan terkait pengadaan stok barang pada suatu produk dan tumpukan produk di gudang bisa dihindari [2].

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Pada tahun 2020, Pratama dan Widhiasih melaksanakan penelitian mengenai perancangan data warehouse pada Orba Express menggunakan tools Pentaho. Penelitian ini bertujuan untuk memprediksi penjualan produk sehingga dapat digunakan untuk pengambilan keputusan dan analisis. Pada penelitian ini didapatkan hasil berupa waktu penjualan produk, jenis produk yang dijual dan jumlah produk yang terjual pada Orba Express selama bulan Januari sampai dengan bulan Desember tahun 2018. Adanya perancangan data warehouse pada Orba Express dapat membantu pemilik usaha untuk menentukan jumlah persediaan produk yang pada toko setiap bulannya [3].

Pada penelitian ini, penulis akan melakukan penelitian mengenai perancangan dan implemetasi data warehouse penjualan pada suatu perusahaan. Pada penelitian ini, penulis menggunakan studi kasus pada database northwind yang diperoleh dari situs https://docs.yugabyte.com/latest/sample-data/northwind/. Database northwind merupakan data dari salah satu perusahaan yang berada di Amerika Serikat serta bergerak pada industri impor-ekspor produk makanan dan minuman. Databse ini memiliki 77 tipe produk, beberapa diantaranya yaitu soft drinks, coffees, teas, desserts, candies, sweet breads, cheeses, crackers, pasta, fish dan sebagainya. Produk-produk tersebut dimasukkan ke dalam 8 kategori besar yaitu beverage, condiments, confections, dairy product, grains/cereal, meat/poultry, produce dan seafood. Perusahaan ini melaksanakan impor produk dari beberapa negara yang terletak di benua Amerika, Eropa, dan Asia dengan jumlah importir sebanyak 29 perusahaan. Selain itu, perusahaan ini memiliki pelanggan sebanyak 91 perusahaan yang juga tersebar di beberapa negara seperti Jerman, Meksiko, Inggris, Swedia, Jerman, Spanyol, dan Prancis.

Adanya penerapan data warehouse pada database northwind, dapat membantu perusahaan dalam menganalisis data yang sebelumnya masih menggunakan sistem database operasional dan juga mengintegrasikan data yang akan memudahkan perusahaan untuk memahami informasi yang terkandung di dalam data tersebut. Sehingga informasi yang diperoleh dapat digunakan oleh perusahaan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan dan pemasok produk. Selain itu, adanya penggunaan data warehouse pada perusahaan tersebut dapat meringankan kinerja dari sistem database operasional yang digunakan dalam transaksi bisnis atau operasional perusahaan.

  • 2.    Metode Penelitian

    • 2.1.    Metode Pengumpulan Data

Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder, tahapannya meliputi studi literatur untuk mendapatkan teori sebagai acuan pembuatan penelitian dan untuk data yang diujikan menggunakan Northwind sample database yang didapatkan dari situs yugabyteDB. Dalam Northwind sample database terdiri dari beberapa tabel data. Tabel data meliputi:

  • 1.  Tabel products

  • 2.  Tabel customers

  • 3.  Tabel orders

  • 4.  Tabel employees

  • 5.  Tabel suppliers

  • 6.  Tabel shippers

  • 7.  Tabel order_details

  • 8.  Tabel categories

  • 9.  Tabel employeeterritories

  • 10. Tabel region

  • 11. Tabel territories

Terdapat beberapa data yang ada didalam masing-masing tabel, antara lain sebagai berikut: a. Tabel Products

Pada tabel ini terdiri dari 77 baris data yang terdiri dari 10 kolom yang meliputi: ProductID, ProductName, SupplierID, CategoryID, QuantityPerUnit, UnitPrice, UnitsinStock, UnitsOnOrder, ReorderLevel dan Discounted.

b.


Gambar 1. Tabel products


Tabel customers

Pada tabel ini terdiri dari 91 baris data yang terdiri dari 11 kolom yang meliputi: cutomerID, CompanyName, ContactName, ContactTitle, Address, City, Region, PostalCode, Country, Phone dan Fax.

Gambar 2. Tabel customers


c.


Tabel orders

Pada tabel ini terdiri dari 830 baris data yang terdiri dari 14 kolom yang meliputi: OrderID, CustomerID, EmployeeID, OrderDate, RequiredDate, ShippedDate, ShipVia, Freight, ShipName, ShipAddress, ShipCity, ShipRegion, ShipPostalCode dan ShipCountry.

Gambar 3. Tabel orders


d.


Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Tabel employees

Pada tabel ini terdiri dari 9 baris data yang terdiri dari 19 kolom yang meliputi: EmployeeID, LastName, FirstName, Title, TitleOfCourtesy, BirthDate, HireDate, Address, City, Region, PostalCode, Country, HomePhone, Extension, Photo, Notes, ReportsTo, PhotoPath dan Salary.

IhOJ-US-JU UiriMW ιaft-u⅜uιuuwιuι

Iiiffl-OS-Mm-Iiom hhm-iii-o? ∞∙nπ∙oc

Gambar 4. Tabel employees


'SSi-OS-rSMiKiOtl 'SS3-05-B <»00:00 ⅛⅛nπτ

1055-03-04 M:W:09 1903-10-17 00:00:00

1063-07-02 00:W:00 1093-10-17 00:00:00 Houie

e.


Tabel suppliers

Pada tabel ini terdiri dari 29 baris data yang terdiri dari 12 kolom yang meliputi: supplierID, CompanyName, ContactName, ContactTitle, Address, City, Region, PostalCode, Country, Phone, Fax dan HomePage.

Gambar 5. Tabel suppliers


f.


Tabel shippers

Pada tabel ini terdiri dari 3 baris data yang terdiri dari 3 kolom yang meliputi: ShipperID, CompanyName dan Phone.

I=T → ▼ ShipperID CompanyName Phone

O ⅛/ Edit >c Copy Q Delete 1 Speedy Express (503) 555-9831 □ f⅛^Edit >c Copy φ Delete 2 UnitedPackage (503)555-3199 O ⅛? Edit ⅜c Copy Q Delete 3 Federal Shipping (503) 555-9931

  • g.    Tabel order_details

Pada tabel ini terdiri dari 2155 baris data yang terdiri dari 5 kolom yang meliputi: OrderID, ProductID, UnitPrice, Quantity dan Discount

4—“T →              ▼

OrderID

ProductID

UnitPrice

Quantity

Discount

O Z Edit >« Copy Q Delete

10248

11

14.0000

12

0

O Z Edit ⅜c Copy 0 Delete

10248

42

9.8000

10

0

O l±7 Edit ⅜i Copy Q Delete

10248

72

34.8000

5

0

□ Z Edit ⅜c Copy 0 Delete

10249

14

18.6000

9

C

O Z Edit >■ Copy Q Delete

10249

51

42.4000

40

0

O Z Edit >c Copy @ Delete

10260

41

7.7000

10

0

O Z Edit >« Copy Q Delete

10260

51

42.4000

35

0

Gambar 7. Tabel order_details

  • h.    Tabel categories

Pada tabel ini terdiri dari 8 baris data yang terdiri dari 4 kolom yang meliputi: CategoryID, CategoryName, UnitPrice, Quantity dan Discount

<-τ→

^ CategoryID

CategoryName

Description

Picture

Z Edit

Jc Copy ^ Delete

1

Beverages

Softdrinks, coffees, teas, beers, and ales

[BLOB-9.9 KiB]

t. Edit

Jc Copy ^ Delete

2

Condiments

Svzeet and savory sauces, relishes, spreads, and se..

[BLOB-11.8 KiB]

ZEdit

Jc Copy 0 Delete

3

Confections

Desserts, candies, and sweet breads

[BLOB-11.7 KiB]

l. Edit

Jc Copy @ Delete

4

Dairy Products

Cheeses

[BLOB - 9.5 KiB]

ZEdit

Je Copy ^ Delete

5

GrainsZCereaIs

Breads, crackers, pasta, and cereal

[BLOB-11.8 KiB]

t. Edit

Jc Copy ^ Delete

6

MeatZPouItry

Prepared meats

[BLOB-11.0 KiB]

ZEdit

Jn Copy 0 Delete

7

Produce

Dried fruit and bean curd

[BLOB -12.0 KiB]

l. Edit

Jc Copy ^ Delete

8

Seafood

Seaweed and fish

[BLOB-11.8 KiB]

Gambar 8. Tabel categories

  • i.    Tabel employeeterritories

Pada tabel ini terdiri dari 49 baris data yang terdiri dari 2 kolom yang meliputi: EmployeeID dan TerritoryID.

* Edit

⅜c Copy ^ Delete

EmpIoyeeID

1

TerritoryID

06897

ZEdit

>c Copy @ Delete

1

19713

Z≡dit

⅛c Copy 0 Delete

2

01581

Z≡dit

>c Copy @ Delete

2

01730

Gambar 9. Tabel employeeterritories

  • j.    Tabel region

Pada tabel ini terdiri dari 4 baris data yang terdiri dari 2 kolom yang meliputi: RegionID dan RegionDescription.

▼ RegionID RegionDescription

Z Edit

⅜c Copy

Q Delete

1

Eastern

ZEdit

⅜c Copy

0 Delete

2

Westerns

Z≡d't

⅜c Copy

0 Delete

3

Northern

Z≡dit

>c Copy

0 Delete

4

Southern

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)

  • k.    Tabel territories

Pada tabel ini terdiri dari 53 baris data yang terdiri dari 3 kolom yang meliputi: TerritoryID, TerritoryDescription dan RegionID.

Gambar 11. Tabel territories

  • 2.2.    OLAP (On Line Analytical Processing)

On Line Analytical Processing (OLAP) adalah sebuah sistem atau teknologi yang digunakan untuk melakukan visualisasi data dalam representasi yang berbeda-beda dan dapat digunakan untuk mendukung proses analisis data [1]. OLAP dapat digunakan untuk memilih secara selektif dan melihat data dari sudut pandang yang berbeda-beda. Data pada OLAP disimpan dalam basis data multidimensi. Jika pada basis data relasional terdiri dari dua dimensi, maka pada basis data multidimensi terdiri dari banyak dimensi yang dapat dipisahkan oleh OLAP menjadi beberapa sub atribut. Data multidimensi memiliki atribut tersendiri untuk bisa dikelola dalam OLAP. Terdapat tiga atribut diantaranya yaitu [4]:

  • a)    Dimensi (Dimension) adalah suatu atribut yang di tinjau.

  • b)    Pengukur (Measurment) adalah besaran yang dapat diukur mengacu pada irisan antara dimensi yang di tinjau.

  • c)    Kalkulasi (Hasil Pengukuran) adalah nilai dari measurement

Di dalam OLAP terdiri dari beberapa operasi yang bisa dilakukan, antara lain sebagai berikut:

  • a)    Roll-Up (Konsolidasi)

Operasi roll-up digunakan untuk menaikkan tingkat hirarki konsep data, semakin naik hirarki konsep data, maka data yang disajikan akan semakin ringkas

  • b)    Drill-Down

Operasi drill-down merupakan operasi yang digunakan untuk menurunkan tingkat hirarki konsep data, semakin turun hirarki konsep data, maka data yang disajikan akan semakin rinci atau detail

  • c)    Slice dan Dice

Operasi slice digunakan untuk memilih satu dimensi dari data multidimensi atau data kubus sedangkan operasi Dice digunakan untuk memilih dua atau lebih dimensi sehingga menghasilkan bagian dari data kubus

  • d)    Pivot

Operasi pivot merupakan operasi visualisasi data dengan cara memutar koordinat data yang digunakan untuk menyediakan tampilan data dalam representasi yang berbeda

  • 2.3.    Perancangan Data Warehouse

Metode perancangan gudang data yang digunakan dalam penelitian ini menggunakan metode Nine-Step Design Methodology. Di dalam metode Nine-Step Design Methodology terdiri dari beberapa langkah, antara lain:

  • 1.    Analisis Kebutuhan

Analisis kebutuhan informasi pada perancangan data warehouse untuk prediksi penjualan produk menggunakan data dari Northwind Sample Database yang di dalamnnya berisi informasi produk, pelanggan, kategori produk, supplier produk, dan data transaksi pelanggan.

  • 2.    Memilih Proses (Choosing The Process)

Tahap ini bertujuan untuk menentukan proses bisnis dari perusahaan yang ingin membangun data warehouse. Berdasarkan informasi yang diperoleh dari analisis kebutuhan. Proses bisnis yang terjadi pada penelitian ini meliputi:

  • a.  Penjualan produk (Ekspor Produk)

  • b.  Pembelian produk (Impor Produk)

  • 3.    Memilih Grain (Choosing The Grain)

Tahap ini bertujuan untuk memilih grain yang digunakan sebagai dasar sebelum membuat tabel fakta atau tabel fakta. Berdasarkan proses bisnis yang ditentukan, grain yang dipilih pada penelitian ini adalah quantity product atau jumlah produk yang di beli customer.

  • 4.    Mengidentifikasi dan Penyesuaian Dimensi (Identifying and Conforming The Dimensions)

Tahap ini bertujuan untuk mengidentifikasi dan memilih dimensi yang berhubungan dengan tabel fakta. Dari hasil identifikasi, maka tabel dimensi yang berhubungan dengan tabel fakta meliputi:

  • a. Dimensi Customer

Dimensi customer merupakan customer yang melakukan pembelian produk. Grain yang berhubungan dengan dimensi ini adalah customer yang melakukan pembelian produk. b. Dimensi Produk

Dimensi produk merupakan produk yang tersedia di Northwind Sample Database. Grain yang berhubungan dengan dimensi ini adalah jumlah produk yang dibeli, c. Dimensi Order

Dimensi Order merupakan data transaksi tersimpan dalam database. Grain yang berhubungan dengan dimensi ini adalah jumlah transaksi yang terjadi.

  • 5.    Memilih Fakta (Choosing The Fact)

Gambar 12 Model Tabel Fakta

Tahap ini bertujuan untuk memilih tabel fakta atau tabel fakta berdasarkan grain yang sudah ditentukan sebelumnya. Setelah mendapatkan grain, maka tabel fakta yang dipilih adalah tabel fakta penjualan. Model tabel fakta dapat dilihat pada pada gambar 12.

Pada gambar 12, model tabel fakta yang digunakan adalah model skema bintang (Star Schema). Dikatakan skema bintang karena hubungan tabel fakta dan tabel dimensi menyerupai bintang. Keuntungan dari skema ini yaitu dapat meningkatkan kinerja data warehouse, pemrosesan query yang lebih efisien, dan waktu respon yang cepat.

  • 6.    Menyimpan pre-Calculation dalam Tabel Fakta (Storing Pre-Calculation in The Tabel fakta)

Agregasi pada tabel fakta penjualan adalah total jumlah produk yang di beli berdasarkan waktu (hari, bulan dan tahun). Pre-Calculation yang ada dalam tabel fakta yaitu revenue dari penjualan.

  • 7.    Melengkapi Tabel Dimensi (Rounding Out The Dimension Tables)

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) Tahap ini bertujuan untuk melengkapi atribut yang ada dalam masing-masing tabel dimensi. Pada tabel dimensi yang sebelumnya telah ditentukan, masing-masing tabel dimensi memiliki atribut sebagai berikut:

Tabel 1 Dimensi Customer

Field

Size

Keterangan

Customer_sk

integer(5)

Nomor identitas customer

CompanyName

varchar(40)

Nama perusahaan atau usaha customer

ContactName

varchar(30)

Nama customer pada daftar kontak perusahaan

ContactTitle

varchar(30)

Jabatan customer

City

varchar(15)

Kota tinggal customer

Region

varchar(15)

Wilayah tinggal customer

Country

varchar(15)

Negara tinggal customer

Tabel 2 Dimensi Produk

Field

Size

Keterangan

ProductSK

integer(11)

Nomor identitas produk

ProductName

varchar(40)

Nama produk

QuantityPerUnit

varchar(20)

Kuantitas pembelian produk per unit

UnitPrice

double

Harga satuan produk

UnitsInStock

integer(11)

Jumlah stok produk tersedia

UnitsInOrder

integer(11)

Jumlah unit produk yang di pesan customer

Discontinued

tinyint(1)

Diskon harga produk

CompanyName

varchar(40)

Nama perusahaan supplier produk

ContactName

varchar(30)

Nama kontak supplier produk

City

varchar(15)

Kota tinggal supplier produk

Country

varchar(15)

Negara tinggal supplier produk

CategoryName

varchar(15)

Kategori dari masing-masing produk

Tabel 3 Dimensi Order

Field

Size

Keterangan

Order_SK

integer(11)

Nomor identitas transaksi

OrderDate

datetime

Tanggal produk dibeli customer

ShippedDate

datetime

Tanggal produk dikirimkan ke customer

Freight

double

Jumlah biaya pengiriman produk ke customer

ShipName

varchar(40)

Nama perusahaan pengiriman

ShipCity

varchar(15)

Kota perusahaan pengiriman

ShipRegion

varchar(15)

Wilayah perusahaan pengiriman

ShipCountry

varchar(15)

Negara perusahaan pengiriman

ProductID

integer(11)

Nomor identitas produk yang dibeli customer

UnitPrice

double

Harga satuan produk yang dibeli customer

Quantitiy

integer(11)

Jumlah produk yang dibeli customer

  • 8.    Pemilihan Durasi Database (Choosing The Duration of Database)

Tahap ini bertujuan untuk memilih durasi waktu yang digunakan dalam perancangan data warehouse yang akan dibangun. Dalam perancangan ini, durasi waktu yang digunakan selama tiga tahun terakhir yaitu dari tahun 1996-1998.

  • 9.    Melacak Perubahan Dari Dimensi

Atribut yang terdapat pada tabel dimensi bisa saja mengalami perubahan yang dinamis. Perubahan tersebut terjadi karena adanya proses ETL pada database penelitian.

  • 3.    Hasil dan Pembahasan

    • 3.1    Skema Database Northwind

      SiIpCountry: varcħarl5



g SupplierlD: Mζ11

i Cornpanytlame: vaπΛar(40) 9 CootactNaine: varc⅛t30)

IcwtaaTiKivarcnariMi

.ι Aderess varchar(60)

i City: Waictiari 15j

a Regon vκθBfH)

■ PosteiCwis: vaaw(∙0)

J Country: varchart15

Phone . Warehaι(24 J

l Pax : varcħar(24)

i HomePage: mccurriest

Q2&.u' categories

a CategoryiD ιnt(iι

. CategoryMame: varchar(15) a Description: meoiumtext a Picture: Iongtjlob

Gambar 13 Skema Database Northwind

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)

Di dalam penelitian ini penulis menggunakan lima tabel data dari database northwind. Tabel-tabel tersebut diantaranya tabel products, categories, supplier, orders, orders details dan customer. Kemudian tabel-tabel tersebut direlasikan sehingga membentuk sebuah skema database. Selanjutnya skema database ini akan dianalisis untuk merancang skema data warehouse penjualan. Untuk skema database northwind ditunjukkan pada gambar 13.

  • 3.2    Skema Data Warehouse

Gambar 14 Skema Data warehouse

Berdasarkan analisis dari skema database northwind, penulis merancang sebuah skema untuk data warehouse penjualan yang ditunjukkan pada gambar 14. Di dalam skema tersebut terdapat satu fact tabel dengan nama fact penjualan yang merupakan representasi dari jumlah transaksi penjualan yang terdapat pada database northwind berdasarkan tabel dimensi customer, tabel dimensi order dan tabel dimensi product. Di dalam tabel dimensi juga menyimpan beberapa atribut yang terkait. Fact tabel penjualan akan menyimpan agregasi/kalkulasi dari jumlah barang yang terjual pada perusahaan dan pendapatan yang dihasilkan dari penjualan produk perusahaan. Sehingga dari hasil kalkulasi tersebut, dapat diperoleh informasi yang dapat membantu perusahaan.

  • 3.3    Proses ETL (Extract, Transformation, Loading)

Proses ETL ini merupakan proses integrasi data dari berbagai sumber data untuk menghasilkan sudut pandang tunggal terhadap semua data yang diintegrasikan tersebut. Pada aktivitas ini, terdapat tahapan proses yang harus dilakukan, yaitu

  • 1)  Extraction: pemilahan dan pengambilan data dari satu atau lebih sumber data.

  • 2)  Cleansing: pembersihan data untuk meyakinkan validitas, kualitas, dan konsistensi antar data

serta penghilangan duplikasi data.

  • 3)    Transformation: penyesuaian data manakala terjadi integrasi data dari berberapa sumber agar sesuai dengan target data warehouse.

  • 4) Loading: pemuatan data ke dalam target data warehouse.

Proses integrasi data pada penelitian ini menggunakan aplikasi Pentaho Data Integration (PDI). Komponen utama dari PDI ini adalah mesin integrasi data berupa perangkat lunak yang mampu menginterpretasi dan mengeksekusi suatu tugas. Tipe objek yang dipergunakan berupa transformation. Transformasi ini bersifat data-oriented dan digunakan untuk mengekstraksi, mentransformasikan, dan memuat data. Transformasi berisi sekumpulan langkah (steps), dimana setiap step merupakan suatu operasi pada satu atau beberapa record streams. Dari satu step ke step lainnya dihubungkan oleh penghubung yang disebut sebagai hop. Suatu hop diilustrasikan sebagai sebuah pipa penghubung yang akan mengalirkan record dari satu step ke step lainnya. Sebagai contoh akan dipaparkan proses ETL tabel dimensi dim_orders dan tabel fakta

fact_penjualan pada star schema penjualan produk. Tipe perubahan yang digunakan pada atribut dimensi data warehouse pada Northwind Sample Database yaitu membuat data baru, berikut atribut tersebut.

Tabel 4 Perubahan Atribut Dimensi

Dimensi

Atribut yang berubah

Dimensi produk

Product_ID

Dimensi customer

Customer_ID

Dimensi order

Order_ID

Skema proses ETL tabel dim_orders digambarkan pada gambar 15. Bagian input transformasi ini mendapatkan data dari dua tabel sumber dari database yaitu order dan tabel order_detail. Hal ini dimaksudkan agar memungkinkan dilakukannya proses drill-down dan roll-up pada perspektif daerah asal. Proses transformasi diawali dengan langkah stream lookup, untuk melakukan proses lookup table antara tabel order dan tabel order_detail. Kemudian dilanjutkan dengan langkah select order field yang akan menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai tabel dim_orders. Tahap terakhir adalah memuat data hasil proses transformasi ke dalam tabel dimensi dim_orders.

Gambar 16 Proses ETL Tabel Dimensi Order

Gambar 15 Proses ETL Tabel Dimensi Customer

Orders

Gambar 17 Proses ETL tabel fakta penjualan

Proses ETL untuk tabel fact_penjualan melibatkan beberapa langkah lookup table pada seluruh tabel dimensinya untuk mengisikan foreign key pada tabel fakta, serta memerlukan transform calculator untuk melakukan perhitungan nilai revenue penjualan sebelum dilakukan proses selected value. Sebelum langkah pemuatan data ke dalam tabel fakta, dilakukan suatu proses untuk mengubah field yang memiliki nilai null menjadi angka nol (0), karena nilai null tidak diperkenankan menjadi suatu field kunci. Proses ETL pada tabel fakta penjualan yang memiliki 1 buah tabel fakta dan 3 tabel dimensi seperti pada skema data warehouse yang telah dirancang, diilustrasikan pada gambar 17.

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database) 3.4 Penerapan Aplikasi Business Intelligence

Hasil dari data warehouse yang dibangun akan divisualisasikan menggunakan aplikasi business intelligence. Pada penelitian ini akan digunakan aplikasi Microsoft Power BI desktop yang merupakan aplikasi analitik untuk menganalisa data. Microsoft Power BI dapat digunakan sebagai tool visualisasi data yang terdapat pada database ataupun data warehouse. Untuk melakukan proses visualisasi, akan dilakukan proses pengambilan data dari sumber data dengan menggunakan fitur ‘get data’ pada tampilan awal saat membuka aplikasi ataupun yang terdapat pada ribbon. Ada berbagai pilihan pada saat proses get data, diantaranya yaitu sumber data berupa file, database, power flatform, azure, online service dan lainnya [5]. Pada penelitian ini digunakan MySQL database sebagai sumber data.

Kemudian akan muncul kotak dialog untuk memasukkan informasi berupa nama database yang akan dipilih serta server MySQL yang digunakan. Setelah itu akan muncul daftar tabel yang terdapat pada database, centang database yang diperlukan kemudian klik ‘load’ untuk memasukkan data tabel tersebut ke aplikasi Microsoft Power BI. Setelah data berhasil dimuat, maka proses visualisasi data dapat dilakukan.

Visualisasi data yang digunakan pada penelitian ini ialah berupa teks dan grafik, yang akan ditampilkan dalam bentuk dashboard. Pada penelitian ini dibuat dua buah dashboard, yaitu dashboard kuantitas order dan dashboard pendapatan yang dapat dilihat pada gambar 18 dan 19. Pada gambar 18, yaitu dashboard kuantitas order terdapat informasi mengenai 10 negara sebagai tujuan pengiriman dengan jumlah order terbanyak, 10 perusahaan dengan jumlah order terbanyak, jumlah order berdasarkan waktu, jumlah order pada setiap kategori yang ada, dan 10 produk dengan jumlah order terbanyak.

Gambar 19 memuat dashboard pendapatan yang memiliki informasi mengenai jumlah pendapatan yang diperoleh oleh perusahaan. Informasi yang disajikan pada dashboard pendapatan ini ialah informasi tentang 10 produk dengan penjualan teratas, 10 negara sebagai tujuan pengiriman teratas berdasarkan total pendapatan, 10 perusahaan dengan total pembelian teratas, total penjualan yang didapatkan pada setiap kategori, dan total pendapatan berdasarkan waktu.

Gambar 18 Dashboard kuantitas order

Gambar 19 Dashboard pendapatan

  • 4.    Conclusion

Berdasarkan hasil penelitian mengenai analisis desain dan implementasi data warehouse penjualan pada Northwind Sample Database, maka penulis dapat mengambil kesimpulan sebagai berikut:

  • 1)    Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder dengan tahapan studi literatur untuk mendapatkan teori sebagai acuan pembuatan penelitian dan untuk data yang diujikan menggunakan northwind sample database yang didapatkan dari situs yugabyteDB.

  • 2)    Proses integrasi data warehouse menggunakan konsep ETL dengan bantuan Pentaho Data Integration.

  • 3)    Setelah melakukan integrasi data, analisis dilakukan dengan menggunakan query untuk mendapatkan informasi dari database data warehouse yang telah diimplementasikan.

  • 4)    Desain dan implementasi data warehouse yang telah dilakukan dapat membantu perusahaan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan dan pemasok produk.

References

  • [1]    D. Subuh and W. Yasman, “Implementasi Data warehouse Dan Penerapannya Pada Toko

Magnifique Clothes Dengan Menggunakan Tools Pentaho,” Pros. SENIATI, pp. 29–36, 2019.

  • [2]    I. P. A. E. Pratama and I. G. A. Pradipta, “Desain dan Implementasi Data warehouse untuk

Prediksi Penjualan Produk Pada Toko Mekarsari,” J. Teknol. Inf. dan Terap., vol. 05, no. 1, pp. 65–71, 2018, doi: https://doi.org/10.25047/jtit.v5i1.81.

  • [3]    N. P. N. D. Widhiasih and I. P. A. E. Pratama, “PERANCANGAN DATA WAREHOUSE UNTUK

PREDIKSI PENJUALAN PRODUK PADA ORBA EXPRESS MENGGUNAKAN PENTAHO,” J. Sains dan Sist. Inf., vol. 3, no. 2, pp. 43–48, 2020.

  • [4]    A. Syam and A. R. Manga, “Sistem Tracer Study Alumni Fakultas Ilmu Komputer Universitas

Muslim Indonesia Menggunakan Metode on-Line Analitycal Processing (Olap),” Ilk. J. Ilm., vol. 9, no. 1, pp. 86–90, 2017, doi: 10.33096/ilkom.v9i1.114.86-90.

  • [5]    S. Meza, A. Ricky, and Derisma, “Pengembangan Model Business Intelligence Manajemen

Rumah Sakit untuk Peningkatan Mutu Pelayanan,” J. Chem. Inf. Model., vol. 4, no. 1, pp. 125– 129, 2017.

Zulkarnain, Ardiyanti, Sandi, Hendrawan and Mahendra Perancangan dan Implementasi Data warehouse Penjualan (Studi Kasus: Northwind Sample Database)

This page is intentionally left blank

188