Jurnal Elektronik Ilmu Komputer Udayana

Volume 12, No 2. November 2023

p-ISSN: 2301-5373

e-ISSN: 2654-5101

Desain dan Implementasi Data Warehouse Penjualan pada Chinook Sample Database

Gusti Ngurah Deva Wirandana Putraa1, Cokorda Pramarthab2

aInformatics Department, Mathematics and Science Faculty, Udayana University South Kuta, Badung, Bali, Indonesia

bNet-Centric Computing Laboratory, Udayana University, Bali, Indonesia 1[email protected] 2[email protected]

Abstract

The company's decision making is very important for analysis. With the data warehouse can support the process of analysis, design, and business decision making of the company. The company stores operational data that is useful in the business analysis process into a data warehouse. This study will develop the design and implementation of a data warehouse using the Chinook Sample Database as the source. Used Nine-Step Design Methodology to design the data warehouse and through the ETL (Extract, Transformation, Loading) process. The results form a Dashboard that is visualized with Tableau according to a sales fact chart that contains information used to assist the company's business analysis and decisions.

Keywords: Business Intelligence, Data Warehouse, Chinook, Tableau, Nine-Step Design Methodology

  • 1.   Pendahuluan

Menurut salah satu tokoh penting di dalam perkembangan dunia teknologi informasi, khususnya dibidang data warehouse, yaitu Willian Harvey Inmon (W.H. Inmon, 1970) atau lebih dikenal dengan Bill Inmon mendefinisikan data warehouse sebagai sekumpulan data yang memiliki enam buah sifat atau karakteristik berupa berorientasi subjek (subject oriented), terintegrasi (integrated), berorientasi pada proses (process oriented), time variant, dapat diakses dengan mudah (accessible), dan bersifat non-volatile [1]. Biasanya, organisasi industri menggunakan data warehouse untuk melakukan analisa, perencanaan dan pengambilan keputusan bisnis dalam menjalankan proses bisnisnya di suatu perusahaan [2]. Proses bisnis merupakan elemen yang sangat penting dalam membedakan satu perusahaan maupun organisasi satu dengan lainnya, sehingga organisasi tersebut dapat bersaing dengan kompetitornya [3]. Perusahaan akan menyalin data dari penjualan barang ke gudang data atau data yang bersumber dari sistem operasional lainnya, lalu data tersebut akan di analisis dan diberikan query yang kompleks sehingga perusahaan dapat memperoleh informasi sesuai yang diinginkan.

Pada tahun 2019, Darmawan Subuh dan Wita Yasman melakukan penelitian mengenai implementasi data warehouse dan penerapannya pada Toko Magnifique Clothes dengan menggunakan tools Pentaho untuk melihat kondisi penjualannya. Penelitian tersebut memberikan hasil bahwa dengan dibangunnya data warehouse penjualan, maka penyampaian informasi yang terkait dapat dilakukan dengan mudah dan lebih fleksibel. Data warehouse dapat digunakan oleh pemilik toko dalam melihat perkembangan keuntungan dan penjualan yang terjadi setiap minggu, bulan dan tahun, sehingga pemilik dapat melakukan analisis terhadap penyampaian informasi yang sudah disajikan dalam bentuk grafik atau dashboard. Informasi yang disajikan dari data warehouse penjualan dapat dipergunakan untuk membantu pemilik toko dalam proses evaluasi, perencanaan dan pemasaran barang yang laku terjual, juga membantu toko dalam mencermati tren barang yang diminati konsumen setiap bulan atau tahunnya. Data warehouse ini dapat dikembangkan dengan penambahan data-data baru, sehingga data warehouse yang ada menjadi tempat penyimpanan dan penyampaian informasi penjualan secara periodik. Data warehouse dan dashboard aplikasi dapat dibangun berkelanjutan untuk pengembangan ke depannya Toko Magnifique Clothes agar menambah proses lain selain data penjualan, misalnya data pembelian barang ke distributor atau yang lainnya [4].

Pada tahun 2021, I Putu Indie Surya Jayadia, Made Rusdinda Hartania, Wayan Yogi Astira, dan Putu Risky Andreana melakukan penelitian mengenai implementasi data warehouse menggunakan Pentaho BI di Hartaning House Homestay. Penelitian ini bertujuan untuk memperoleh informasi,

Putra and Pramartha

Desain dan Implementasi Data Warehouse Penjualan pada Chinook Sample Database memberikan prediksi, dan saran, serta kesimpulan yang dapat diberikan berupa penentuan promosi pada tipe kamar yang ada pada Hartaning House. Pada penelitian ini didapatkan hasil bahwa data warehouse bermanfaat diimplementasikan dalam segala bidang yang dimiliki salah satunya dalam bidang bisnis pariwisata. Data warehouse tidak hanya menjadi gudang data namun dapat digunakan sebagai pembuatan suatu laporan analisis data dengan efisien. Pentaho Business Intelligence dapat digunakan sebagai salah satu solusi yang bermanfaat dalam pembuatan report total penyewaan seluruh jenis kamar pada Hartaning House [5].

Pada penelitian ini, penulis akan melakukan sebuah penelitian pada suatu perusahaan mengenai desain dan implementasi data warehouse penjualan. Studi kasus yang digunakan oleh penulis pada penelitian ini yaitu database Chinook yang diperoleh dari situs https://docs.yugabyte.com/preview/sample-data/chinook/. Database Chinook merupakan data dari salah satu perusahaan yang bergerak di bidang industri penjualan produk media digital yang terletak di Amerika Serikat. Perusahaan ini menjual 2 tipe produk media yaitu berupa audio dan video. Produk-produk tersebut dimasukkan ke dalam 18 playlist yang diantaranya yaitu music, movies, tv shows, audiobooks, classical, dan lainnya. Perusahaan ini sudah memiliki sebanyak 59 pelanggan yang tersebar di beberapa negara karena produk pada perusahaan ini dapat dibeli secara global dan dari mana saja.

Dengan adanya penerapan data warehouse pada database Chinook, maka dapat membantu perusahaan dalam menganalisis data yang sebelumnya masih menggunakan sistem database operasional. Selain itu, juga dapat membantu perusahaan dalam mengintegrasikan data yang akan memudahkan perusahaan untuk memahami informasi yang terkandung di dalam data tersebut sehingga perusahaan dapat memperoleh informasi yang bisa digunakan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan dan pemasok produk dalam suatu perusahaan. Dengan adanya penggunaan data warehouse pada perusahaan tersebut, maka diharapkan dapat meringankan kinerja dari sistem database operasional yang digunakan dalam operasional perusahaan atau transaksi bisnis perusahaan.

  • 2.    Metode Penelitian

    2.1.  Metode Pengumpulan Data

Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder, dimana tahapannya meliputi studi literatur untuk mendapatkan teori sebagai acuan dalam pembuatan penelitian. Data yang diuji menggunakan Chinook Sample Database ini didapatkan dari situs yugabyteDB.

Pada Chinook Sample Database terdiri dari beberapa tabel data, antara lain tabel Album, tabel Artist, tabel Customer, tabel Employee, tabel Genre, tabel Invoice, tabel InvoiceLine, tabel MediaType, tabel Playlist, tabel PlaylistTrack, dan tabel Track. Terdapat beberapa data yang ada di dalam masing-masing tabel, antara lain sebagai berikut:

  • a.    Tabel Album

Pada tabel ini terdiri dari 347 baris data yang terdiri dari 3 kolom yang meliputi: AlbumId, Title, dan ArtistId.

Gambar 1. Tabel Album

  • b.    Tabel Artist

Pada tabel ini terdiri dari 275 baris data yang terdiri dari 2 kolom yang meliputi: ArtistId dan Name.

Gambar 2. Tabel Artist

  • c.    Tabel Customer

Pada tabel ini terdiri dari 59 baris data yang terdiri dari 13 kolom yang meliputi: CustomerId, FirstName, LastName, Company, Address, City, State, Country, PostalCode, Phone, Fax, Email, dan SupportRepId.

Gambar 3. Tabel Customer

  • d.    Tabel Employee

Pada tabel ini terdiri dari 8 baris data yang terdiri dari 15 kolom yang meliputi: ProductID, EmployeeId, LastName, FirstName, Title, ReportsTo, BirthDate, HireDate, Address, City, State, Country, PostalCode, Phone, Fax, Email

Gambar 4. Tabel Employee

  • e.    Tabel Genre

Pada tabel ini terdiri dari 25 baris data yang terdiri dari 2 kolom yang meliputi: GenreId dan Name.

Genreld Name

  • 1        Rock

  • 2       Jazz

  • 3        Metal

  • 4        Alternative & Punk

  • 5       Rock And Roll

  • 6        Blues

  • 7         Latin

  • 8       Reggae

  • 9       Pop

  • 10      Soundtrack

Gambar 5. Tabel Genre

  • f.    Tabel Invoice

Pada tabel ini terdiri dari 412 baris data yang terdiri dari 9 kolom yang meliputi: InvoiceId, CustomerId, InvoiceDate,, BillingAddress, BillingCity, BillingState, BillingCountry, BillingPostalCode, dan Total.

Invoiceld

Customerld

InvoiceDate ∙ 1

BiIIingAddress

BiIIingCity

BillingState

BiIIingCountry

BillingPostaICode

Total

412

58

2013-12-22 00:00:00

12,Community Centre

Delhi

NULL

India

110017

1 99

411

44

2013-12-14 00:00:00

Porthaninkatu 9

Helsinki

NULL

Finland

00530

13.86

410

35

2013-12-09 00:00:00

Rua dos Campeoes Europeus de Viena. 4350

Porto

NULL

Portugal

NULL

8.91

409

29

2013-12-06 00:00:00

796 Dundas Street West

Toronto

ON

Canada

M6J 1V1

5.94

408

25

2013-12-05 00:00:00

319 N. Frances Street

Madison

Wl

USA

53703

3.96

406

21

2013-12-04 00:00:00

801 W 4th Street

Reno

NV

USA

89503

1.98

407

23

2013-12-04 00:00:00

69 Salem Street

Boston

MA

USA

2113

1.98

405

20

2013-11-21 00:00:00

541 Del MedioAvenue

Mountain View

CA

USA

94040-111

0.99

404

6

2013-11-13 00:00:00

Rilska 3174/6

Prague

NULL

Czech Republic

14300

25.86

403

56

2013-11-08 00:00:00

307 Macacha Giiemes

Buenos Arres

NULL

Argentina

1106

8.91

402

50

2013-11-05 00:00:00

C/ San Bernardo 85

Madrid

NULL

Spain

28015

5.94

401

46

2013-11-04 00.00.00

3 Chatham Street

Dublin

Dublin

Ireland

NULL

3.96

Gambar 6. Tabel Invoice

  • g.    Tabel InvoiceLine

Pada tabel ini terdiri dari 2.240 baris data yang terdiri dari 5 kolom yang meliputi: InvoiceLineId, InvoiceId, TrackId, UnitPrice, dan Quantity.

InvoiceLineId Invoiceld Trackld UnitPrice Quantity

1

1           2

0.99       1

2

1

4

0.99       1

3

2

6

0.99       1

4

2

8

0.99       1

5

2

10

0.99       1

6

2

12

0.99       1

7

3

16

0.99       1

8

3

20

0.99       1

9

3

24

0.99       1

10

3

28

0.99       1

Gambar 7. Tabel InvoiceLine

  • h.    Tabel MediaType

Pada tabel ini terdiri dari 5 baris data yang terdiri dari 2 kolom yang meliputi: MediaTypeId dan Name.

MediaTypeId Name

  • 1            MPEG audio file

  • 2             Protected AAC audio file

  • 3            Protected MPEG-4 video file

  • 4            Purchased AAC audio file

  • 5             AAC audio file

  • i.    Tabel Playlist

Pada tabel ini terdiri dari 18 baris data yang terdiri dari 2 kolom yang meliputi: PlaylistId dan Name.

Gambar 9. Tabel Playlist

  • j.    Tabel PlaylistTrack

Pada tabel ini terdiri dari 8.715 baris data yang terdiri dari 2 kolom yang meliputi: PlaylistId dan TrackId.

Playlistld Trackld

1

12

13

14

15

1

17

1

19

1

Gambar 10. Tabel PlaylistTrack

  • k.    Tabel Track

Pada tabel ini terdiri dari 3.503 baris data yang terdiri dari 9 kolom yang meliputi: TrackId, Name, AlbumId, MediaTypeId, GenreId, Composer, Milliseconds, Bytes, dan UnitPrice.

Gambar 11. Tabel Track

  • 2.2.    OLAP (On Line Analytical Processing)

OLAP merupakan suatu proses komputer yang dapat memungkinkan para penggunanya dengan mudah dan selektif dalam memilih dan melihat data dari sudut pandang yang berbeda-beda. Data pada OLAP disimpan dalam basis data multidimensi. Pada basis data multidimensi terdiri dari banyak dimensi yang dapat dipisahkan oleh OLAP menjadi beberapa sub atribut. Berbeda dengan basis data relasional yang hanya terdiri dari dua dimensi [1]. Data multidimensi memiliki tiga atribut untuk bisa dikelola dalam OLAP diantaranya yaitu [6]:

  • a.    Dimensi (Dimension) adalah suatu atribut yang di tinjau.

  • b.    Pengukur (Measurement) adalah besaran yang dapat diukur mengacu pada irisan antara dimensi yang di tinjau.

  • c.    Hasil Pengukuran/Kalkulasi (Calculation) adalah nilai dari measurement

  • 2.3.    Perancangan Data Warehouse

Perancangan data warehouse yang digunakan dalam penelitian ini menggunakan metode Nine-Step Design Methodology yang di dalamnya terdiri dari beberapa langkah, antara lain:

  • 1.    Analisis Kebutuhan

Analisis kebutuhan informasi pada perancangan data warehouse untuk prediksi penjualan produk menggunakan data dari Chinook Sample Database yang di dalamnya berisi informasi pelanggan, data transaksi pelanggan, track, album, artis, genre, dan playlist.

  • 2.    Memilih Proses (Choosing the Process)

Pada tahap ini bertujuan untuk menentukan proses bisnis dari perusahaan yang ingin membangun data warehouse. Berdasarkan informasi yang diperoleh dari analisis kebutuhan, proses bisnis yang terjadi pada penelitian ini adalah penjualan produk.

  • 3.    Memilih Grain (Choosing the Grain)

Pada tahap ini bertujuan untuk memilih grain yang digunakan sebagai dasar sebelum membuat tabel fakta (fact table). Berdasarkan proses bisnis yang ditentukan, grain yang dipilih pada penelitian ini adalah unit price atau harga produk yang dibeli customer.

  • 4.    Mengidentifikasi dan Penyesuaian Dimensi (Identifying and Conforming the Dimensions)

Pada tahap ini bertujuan untuk mengidentifikasi dan memilih dimensi yang berhubungan dengan tabel fakta. Dari hasil identifikasi, maka tabel dimensi yang berhubungan dengan tabel fakta meliputi:

  • a.    Dimensi Customer

Dimensi Customer merupakan pembelian produk yang dilakukan oleh customer. Grain yang berhubungan dengan dimensi ini adalah customer yang melakukan pembelian produk.

  • b.    Dimensi Track

Dimensi Track merupakan produk yang tersedia di Chinook Sample Database. Grain yang berhubungan dengan dimensi ini adalah jumlah produk/track yang dibeli, a. Dimensi Invoice

Dimensi Invoice merupakan data transaksi tersimpan dalam database. Grain yang berhubungan dengan dimensi ini adalah jumlah transaksi yang terjadi.

  • 5.    Memilih Fakta (Choosing the Fact)

Tahap ini bertujuan untuk memilih tabel fakta (fact table) berdasarkan grain yang sudah ditentukan sebelumnya. Setelah mendapatkan grain, maka tabel fakta yang dipilih adalah tabel

Gambar 12. Model Tabel Fakta

Pada gambar 12 menggunakan model tabel fakta yaitu model skema bintang (Star Schema). Skema bintang ini memiliki hubungan tabel fakta dan tabel dimensi menyerupai bintang. Skema ini memiliki keuntungan yaitu dapat meningkatkan kinerja data warehouse, pemrosesan query yang lebih efisien, dan waktu respon yang cepat.

  • 6.    Menyimpan pre-Calculation dalam Tabel Fakta (Storing Pre-Calculation in the Fact Table)

Agregasi pada tabel fakta penjualan adalah total jumlah produk yang dibeli berdasarkan waktu (hari, bulan dan tahun). Pre-Calculation yang ada dalam tabel fakta yaitu revenue dari penjualan.

  • 7.    Melengkapi Tabel Dimensi (Rounding Out the Dimension Tables)

Pada tahap ini bertujuan untuk melengkapi atribut yang ada dalam masing-masing tabel dimensi. Pada tabel dimensi yang sebelumnya telah ditentukan, masing-masing tabel dimensi memiliki atribut sebagai berikut:

Table 1. Dimensi Track

Field

Size

Keterangan

SK_Track

integer(11)

Nomor identitas track

TrackName

varchar{200)

Nama track

AIbumTitIe

varchar(160)

Judul album pad a track

ArtistName

varchar(120)

Nama artis pada track

GenreName

varchar(120)

Nama genre pad a track

PIayIistName

varchar(120)

Nama playlist pad a track

UnitPrice

decimal(10,2)

Harga satuan track


Table 2. Dimensi Customer

Field

Size

Keterangan

SK_Customer

integer(11)

Nomor identitas customer

CustomerName

varchar(60)

Nama customer

Company

varchar(80)

Nama perusahaan customer

City

varchar(40)

Kota tinggal customer

Country

varchar(40)

Negara tinggal customer


Table 3. Dimensi Invoice

Field

Size

Keterangan

SKJnvoice

integer(11)

Nomor identitas invoice

InvoiceDate

datetime

Tanggal track dibeli customer

BiIIingCity

varchar(40)

Kota tempat pembelian

BiIIingCountry

varchar(40)

Negara tempat pembelian

UnitPrice

decimal(10,2)

Harga satuan track

Quantity

decimal(10,2)

Jumlah produk yang dibeli


  • 8.    Pemilihan Durasi Database (Choosing the Duration of Database)

Tahap ini bertujuan untuk memilih durasi waktu yang digunakan dalam perancangan data warehouse yang akan dibangun. Dalam perancangan ini, durasi waktu yang digunakan selama lima tahun terakhir yaitu dari tahun 2009-2013.

  • 9.    Melacak Perubahan Dari Dimensi

Atribut yang terdapat pada tabel dimensi bisa saja mengalami perubahan yang dinamis. Perubahan tersebut terjadi karena adanya proses ETL pada database penelitian.

  • 3.   Hasil dan Pembahasan

    • 3.1.    Skema Database Chinook

      Dalam penelitian ini, penulis menggunakan sembilan tabel data dari database Chinook. Tabel-tabel tersebut diantaranya yaitu: tabel invoice, invoiceline, track, playlist, album, playlisttrack, genre, artist, dan customer. Tabel-tabel tersebut kemudian direlasikan sehingga membentuk sebuah skema database. Selanjutnya skema database ini akan dianalisis untuk merancang skema data warehouse penjualan.


      Bo chinoo ■ track

      @ Trackld : int(11)

      = Name : varchar(200)

      # Albumld : int(11)



      • #    MediaTypeId: iπt(11)

      • #    Genreld: lnt(11)

      = Composer: varchar(220)

      • #    Milliseconds : lnt(11)

      • #    Bytes : int(11)

      • #    UnitPrice : decimal(10,2)


      Bo cιinook album S Albumld : lnt(11) © Title : Varcfiar(IGO) # Artistld: int(11)


      Bo playlist

      @ Playlistld: int(11) D Name : varchar(120)

      Bo playlisttrack

      ⅛ Playlistld : lπt(11)

      0 Trackld : int(11)

      Jo invoiceiine

      0 InvoiceLineId : int(11)

      # Invoiceld: int(11)

      # Trackld: int(11)

      # UnitPrice : decimal(10,2)

      H Quantity : int(11)



      Bo


      invoice


      0 Invoiceld : int(11)

      • # Customerld: int(11)

      H InvoiceDate : datetime

      © EiIIingAddress: varchar(70)

      = BiIIingCity: varchar(40)

      =ι BiIIingState : varchar(40)

      = BiIIingCountry: varchar(40)

      =ι BillingPostaICode : varchar(10)

      # Total: decimal(10,2)


      Q⅛ :     genre

      ' ⅛ Genreld : int(11) g Name: varchar(120)


      Bo artist

      ' ® Artistld : int(11) =ι Name: varchar(120)


      Bo customer

      ' 0 Customerld : int(11)

      =ι FirstName: varchar(40)

      LastName: varchar(20)

      =ι Company : varchar(80)

      = Address: varchar(70)

      = City: varchar(40)

      © State: varchar(40)

      = Country : varchar(40)

      =ι PostaICode: varchar(10)

      = Phone : varchar(24)

      = Fax: varchar(24)

      © Email: varchar(60)

      # SupportRepId: int(11)


    • 3.2.    Skema Data Warehouse

Gambar 14. Skema Data Warehouse

Berdasarkan analisis dari skema database Chinook, penulis merancang sebuah skema untuk data warehouse penjualan. Terdapat satu fact tabel di dalam skema tersebut dengan nama fact penjualan yang merupakan representasi dari jumlah transaksi penjualan yang terdapat pada database Chinook yang berdasarkan tabel dimensi customer, tabel dimensi track dan tabel dimensi invoice. Selain itu, di dalam tabel dimensi juga menyimpan beberapa atribut yang terkait. Fact penjualan akan menyimpan agregasi/kalkulasi dari jumlah barang yang terjual pada perusahaan dan pendapatan yang dihasilkan dari penjualan produk perusahaan. Sehingga dari hasil kalkulasi tersebut, dapat diperoleh informasi yang dapat membantu perusahaan.

  • 3.3.    Proses ETL (Extract, Transformation, Loading)

Proses ETL ini merupakan proses integrasi data dari berbagai sumber data untuk menghasilkan sudut pandang tunggal terhadap semua data yang diintegrasikan tersebut. Pada aktivitas ini, terdapat tahapan proses yang harus dilakukan, yaitu

  • 1.    Extraction merupakan pemilahan dan pengambilan data dari satu atau lebih sumber data.

  • 2.    Cleansing merupakan pembersihan data untuk meyakinkan validitas, kualitas, dan konsistensi antar data serta penghilangan duplikasi data.

  • 3.    Transformation merupakan penyesuaian data manakala terjadi integrasi data dari beberapa sumber agar sesuai dengan target data warehouse.

  • 4.    Loading merupakan pemuatan data ke dalam target data warehouse.

Proses integrasi data pada penelitian ini menggunakan aplikasi Pentaho Data Integration (PDI). Komponen utama dari PDI ini adalah mesin integrasi data berupa perangkat lunak yang mampu menginterpretasi dan mengeksekusi suatu tugas. Tipe objek yang dipergunakan yaitu berupa transformation dimana transformasi ini bersifat data-oriented dan digunakan untuk mengekstraksi, mentransformasikan, dan memuat data. Transformasi berisi sekumpulan langkah (steps), dimana setiap step merupakan suatu operasi pada satu atau beberapa record streams. Dari satu step ke step lainnya dihubungkan oleh penghubung yang disebut sebagai hop. Suatu hop diilustrasikan sebagai sebuah pipa penghubung yang akan mengalirkan record dari satu step ke step lainnya.

Proses ETL pada penelitian ini arsitektur data warehouse menggunakan Single DDS (DDS Tunggal) karena aliran data sederhana yang hanya terdiri dari dua data store yaitu stage dan DDS.

Gambar 15. Proses ETL Tabel Dimensi Customer

Skema proses ETL pada tabel dim_customer digambarkan pada gambar 15. Input transformasi ini mendapatkan data dari tabel sumber dari database yaitu tabel customer. Lalu dilakukan step concat untuk menggabungkan field FirstName dan LastName. Kemudian ditambahkan step add sequence untuk membuat field sk_customer. Setelah itu dilanjutkan dengan step select values untuk menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai dengan tabel dim_customer. Terakhir, melakukan step tabel output untuk proses load dengan nama tabel dim_customer pada database baru yaitu dw_chinook.

Gambar 16. Proses ETL Tabel Dimensi Invoice

Skema proses ETL pada tabel dim_invoice digambarkan pada gambar 16. Input transformasi ini mendapatkan data dari dua tabel sumber dari database yaitu tabel invoice dan tabel invoiceline. Lalu dilakukan step stream lookup untuk menggabungkan proses join pada kedua tabel. Kemudian ditambahkan step add sequence untuk membuat field sk_invoice. Setelah itu dilanjutkan dengan step select values untuk menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai dengan tabel dim_invoice. Terakhir, melakukan step tabel output untuk proses load dengan nama tabel dim_invoice pada database baru yaitu dw_chinook.

Gambar 17. Proses ETL Tabel Dimensi Track

Skema proses ETL pada tabel dim_track digambarkan pada gambar 17. Input transformasi ini mendapatkan data dari beberapa tabel sumber dari database yaitu tabel album, tabel artist, tabel track, tabel playlisttrack, tabel playlist dan tabel genre. Lalu dilakukan beberapa step stream lookup untuk menggabungkan proses join tabel album dan artist dan juga tabel playlisttrack dan tabel playlist. Selain itu tabel genre dilakukan step select values untuk mendapatkan field genre. Kemudian ditambahkan step add sequence untuk membuat field sk_track. Ketika semua sudah disiapkan maka bisa dilakukan beberapa kali step stream lookup untuk menggabungkan semua field. Setelah itu dilanjutkan dengan step select values untuk menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai dengan tabel dim_track. Terakhir, melakukan step tabel output untuk proses load dengan nama tabel dim_track pada database baru yaitu dw_chinook.

Gambar 18. Proses ETL Tabel Fakta Penjualan

Setelah beberapa tabel dimensi sudah selesai, sekarang untuk tabel fact_penjualan dilakukan stream lookup dari beberapa tabel dimensi tersebut. Dengan bantuan hasil join dari tabel invoice dan invoiceline maka dapat dilakukan proses stream lookup karena field pada tabel tersebut bisa digunakan sebagai lookup field. Lalu dilanjutkan dengan ditambahkan step calculator untuk mendapatkan field revenue yang merupakan kalkulasi hasil perkalian dari field unit price dan quantity dari penjualan. Setelah itu dilanjutkan dengan step select values untuk menata field hasil proses sebelumnya, pemilihan field yang akan disimpan serta pemberian nama field sesuai dengan tabel fact_penjualan. Terakhir, melakukan step tabel output untuk proses load dengan nama tabel fact_penjualan pada database baru yaitu dw_chinook.

  • 3.4.    Penerapan Aplikasi Business Intelligence

Hasil dari data warehouse yang dibangun akan divisualisasikan menggunakan aplikasi business intelligence. Pada penelitian ini akan digunakan aplikasi Tableau yang merupakan aplikasi analytic untuk menganalisa data. Tableau dapat digunakan sebagai tool visualisasi data yang terdapat pada database ataupun data warehouse. Untuk melakukan proses visualisasi, akan dilakukan proses pengambilan data dari sumber data. Pada penelitian ini digunakan MySQL database sebagai sumber data. Setelah data berhasil dimuat, maka proses visualisasi data dapat dilakukan.

Visualisasi data yang digunakan pada penelitian ini ialah berupa teks dan grafik, yang akan ditampilkan dalam bentuk dashboard. Pada penelitian ini dibuat satu buah dashboard, yaitu dashboard pendapatan yang dapat dilihat pada gambar 19.

Gambar 19 memuat dashboard pendapatan yang memiliki informasi mengenai jumlah pendapatan yang diperoleh oleh perusahaan. Informasi yang disajikan pada dashboard pendapatan ini ialah informasi tentang 10 track dengan penjualan teratas, 10 negara sebagai tujuan pengiriman teratas berdasarkan total pendapatan, 10 perusahaan dengan total pembelian teratas, total penjualan yang didapatkan pada setiap genre, dan total pendapatan berdasarkan waktu.

  • 4.   Kesimpulan

Berdasarkan hasil penelitian mengenai analisis desain dan implementasi data warehouse penjualan pada Chinook Sample Database, maka penulis dapat mengambil kesimpulan sebagai berikut:

  • 1)    Pengumpulan data yang digunakan pada penelitian ini didapatkan dengan cara sekunder dengan tahapan studi literatur untuk mendapatkan teori sebagai acuan pembuatan penelitian dan untuk data yang diujikan menggunakan Chinook Sample Database yang didapatkan dari situs yugabyteDB.

  • 2)    Proses integrasi data warehouse menggunakan konsep ETL (Extract, Transformation, Load) dengan bantuan Pentaho Data Integration (PDI).

  • 3)    Setelah melakukan integrasi data, analisis dilakukan dengan menggunakan query untuk mendapatkan informasi dari database data warehouse yang telah diimplementasikan.

  • 4)    Desain dan implementasi data warehouse yang telah dilakukan dapat membantu perusahaan dalam proses pencarian data dan pengambilan keputusan yang terkait dengan penjualan.

  • 5)    Data warehouse tidak hanya menjadi gudang data namun dapat digunakan sebagai pembuatan suatu laporan analisis data dengan efisien.

Referensi

  • [1]    I. P. A. E. Pratama, Handbook Data Warehouse Teori Dan Praktik Berbasiskan Open Source. Bandung: Informatika Bandung, 2018.

  • [2]    M. F. Zulkarnain, N. P. N. Ardiyanti, I. W. W. K. Sandi, I. D. N. T. Hendrawan, I. B. M. Mahendra, “Perancangan dan Implementasi Data Warehouse Penjualan (Studi Kasus: Northwind Sample Database)” Jurnal Elektronik Ilmu Komputer Udayana (JELIKU), vol. 10, no. 1, p. 175, 2021.

  • [3]    Pramartha, C. and N.P.S.H. Mimba, Udayana University International Student Management: A Business Process Reengineering Approach. ComTech: Computer, Mathematics and Engineering Applications, 2020. 11(2): p. 57-64.

  • [4]    D. Subuh and W. Yasman, “Implementasi Data warehouse Dan Penerapannya Pada Toko Magnifique Clothes Dengan Menggunakan Tools Pentaho,” Pros. SENIATI, p. 29–36, 2019.

  • [5]    I. P. I. S. Jayadi, M. R. Hartani, W. Y. Astira, P. R. Andrean, I. B. M. Mahendra, “Implementasi Data Warehouse Menggunakan Pentaho BI di Hartaning House Homestay” Jurnal Elektronik Ilmu Komputer Udayana (JELIKU), vol. 10, no. 1, p. 153-161, 2021.

  • [6]    A. Syam and A. R. Manga, “Sistem Tracer Study Alumni Fakultas Ilmu Komputer Universitas Muslim Indonesia Menggunakan Metode On-Line Analytical Processing (OLAP),” Ilk. J. Ilm., vol. 9, no. 1, p. 86–90, 2018.

This page is intentionally left blank

334