Desain dan Implementasi Data Warehouse Penjualan Pada Database Sample Northwind Menggunakan Tools Tableau
on
JNATIA Volume 1, Nomor 1, November 2022
Jurnal Nasional Teknologi Informasi dan Aplikasinya
Desain dan Implementasi Data Warehouse Penjualan Pada Database Sample Northwind Menggunakan Tools Tableau
I Putu Bagus Merta Sentanaa1, Ida Bagus Gede Dwidasmaraa2
aInformatics Department, Udayana University South Kuta, Badung, Bali, Indonesia 1[email protected] 2[email protected]
Abstract
Many corporate is using data warehouse as a place to store the operational data that has a purpose to support analytical and business decision making processes. Data warehouse have an ability to integrate and analyze data which are considered complex in order to support the analytical process and business decision-making of a company. The study will conduct a design and implementation of the data warehouse which uses the Northwind Database Sample as its main data sources. The process of designing the data warehouse, will use a methodology called Nine Step Design Methodology and Tableau desktop as its software to implement and visualize the data warehouse itself.
Keywords: Data Warehouse, Tableau, Northwind, NineStep Methodology, Gudang Data.
Data warehouse merupakan kumpulan data yang memiliki sifat subject oriented, integrated, nonvolatile, dan time variant, dengan tujuan sebagai salah satu acuan dalam proses pengambilan keputusan bisnis. Data warehouse merupakan sebuah solusi untuk pemrosesan data atau informasi yang berasal dari sumber data lain namun saling terkait yang kemudian akan diintegrasikan sehingga menjadi satu data warehouse. Data yang sudah diolah pada data warehouse dapat ditinjau dalam melakukan analisis secara akurat, efektif dan efisien.
Penelitian sebelumnya, membahas mengenai Perancangan dan Implementasi Data Warehouse Penjualan (Studi Kasus: Norhtwind Sample Database). Tujuan dari penelitian tersebut adalah untuk mengimplementasikan penggunaan data warehouse sehingga dapat menghasilkan informasi yang berguna untuk membantu analisis dan pengambilan keputusan bisnis perusahaan. Pada penelitian ini menggunakan star schema untuk data modelling, Pentaho sebagai alat untuk proses ETL, Microsoft Power BI sebagai alat visualisasi data hasil analisis. proses perancangan data warehouse pada penelitian ini menggunakan metode NineStep Design Methodology [1].
Penelitian sebelumnya yang membahas mengenai Perancangan Data Warehouse untuk Data Transaksi Penjualan Menggunakan Schema Snowflake Studi Kasus: Online Market Dataset. Tujuan dari penelitian tersebut adalah untuk melakukan perancangan data warehouse untuk data transaksi online market sehingga dapat menjadi informasi penjualan produk-produk yang menjadi trend atau wilayah yang paling banyak melakukan pembelian untuk kemajuan bisnis. Penelitian tersebut menggunakan schema snowflake untuk data modelling, tools Cloudera sebagai database server, Talend sebagai tool sebagai media proses ETL, dan Tableau sebagai tool untuk visualisasi data dan melakukan analisis [2].
Pada penelitian kali ini, penulis akan melakukan penelitian mengenai perancangan dan implementasi data warehouse penjualan menggunakan studi kasus pada Northwind sampel database yang diperoleh dari situs yugabyteDB. Northwind sampel database merupakan data dari perusahaan yang bergerak di bidang ekspor impor di Amerika Serikat. Data yang terkandung di dalam database tersebut sebanyak 77 jenis produk yang kemudian dikategorikan ke dalam 8 jenis produk yaitu beverage, condiments, confections, dairy product, grains/cereal, meat/poultry, produce dan seafood. Penerapan data warehouse pada database sampel northwind dapat memberikan gambaran mengenai proses analisa data dan integrasi data yang diharapkan dapat
membantu suatu perusahaan dalam mengolah informasi atau data yang dimiliki sehingga memudahkan proses pencarian data dan pengambilan keputusan terkait proses penjualan produk serta memudahkan proses transaksi bisnis pada suatu perusahaan.
Proses pengumpulan data yang dilakukan pada penelitian ini meliputi studi literatur sebagai acuan dalam melaksanakan penelitian. Sedangkan untuk data yang digunakan sebagai data uji merupakan database sampel dari Northwind yang diperoleh dari situs yugabyteDB. Berdasarkan data yang diperoleh, terdapat 11 buah tabel yang masing-masing merepresentasikan model bisnis ekspor dan impor pada sampel database. Penelitian ini berfokus pada data penjualan dari database sampel northwind, oleh karena itu berdasarkan hasil analisis maka penulis menggunakan 5 buah tabel sebagai acuan, tabel tersebut diantaranya tabel product, tabel suppliers, tabel order, tabel order_details, dan tabel customers. Berikut merupakan rincian data pada masing-masing tabel:
Tabel ini merepresentasikan produk yang diperjualbelikan pada database. Tabel product ini terdiri dari 77 baris data dan 10 kolom yang meliputi product_id, product_name, category_id, quantity_per_unit, unit_price, unit_in_stock, units_in_order, reorder_level, discounted.
-
Gambar 1. Tabel product
Tabel ini suppliers terdiri dari 29 baris data dan 12 kolom yang meliputi supplier_id, company_name, contact_name, contact_title, address, city, region, postal_code, country, phone, fax, home_page.
*“ corτ>paπyjιsrτw J aκ ContacLname T! a» contacLtit∣e____ Tll “‘address__________^l'*c⅛^^!∣*re9ion^ψ''p⅛a∣∏l*'wuιjylψ"p^^ ____Tll ** homepage
1 |
Exotic Liquids |
Charlotte Cooper |
Purchasing Manager |
49 Gilbert St |
London !NULL] |
EC14SD |
UK |
(171) 555-2222 | |||
2 |
New OrieansCajun Delights |
Shelley Burke |
Order Administrator |
P.0. Box 78934 |
New Orleans |
LA |
70117 |
USA |
(100) 555-4822 |
INULL1 |
#CAJUN.HTM# |
3 |
Grandma Kelly s Homestead |
Regina Murphy |
Sales Representative |
707 Oxford Rd. |
Ann Arbor |
Ml |
48104 |
USA |
(313) 555-5735 |
(313) 555-3349 | |
Tokyo Traders |
YOShi Nagase |
Marketing Manager |
9-8 Sekimai Musashino-shi |
Tokyo |
[NULL] |
100 |
Iapan |
(03) 3555-5011 |
[NULL] |
[NULL] | |
5 |
Cooperatiw de Quesos 'Las Cacras |
Antonio del Valle Saa Export Administrator |
Calle del Rosal 4 |
Oviedo |
Asturias |
33007 |
Spain |
(98)598 76 54 | |||
6 |
Mayumi's |
Mayum∣ Ohno |
Marketing Representative |
92 Setsuko Cħιro-ku |
Osaka |
I'I Il |
545 |
Japan |
(06)431-7877 |
Mayumi's (on the V | |
Pavlova, Ltd. |
Ian Devling |
Marketing Manager |
74 Rose St Moonie Ponds |
Melbourne |
Victoria |
3058 |
Australia |
(03)444-2343 |
(03) 444-6588 | ||
8 |
Specialty Biscuits. Ltd. |
Peter Wilson |
Sales Representative |
29 King's Way |
Manchester |
[NULL] |
M14GSD |
UK |
(161)555-4448 |
[NULL] | |
9 |
PB Knackebrod AB |
Lars Peterson |
Sales Agent |
Kaloadagatan 13 |
Gbteborg |
S-345 67 |
Sweden |
031-987 65 43 |
031-987 65 91 | ||
10 |
Refrescos Americanas LTDA |
Carlos Diaz |
Marketing Manager |
Av. das Americanas 12.890 |
Sao Paulo |
[NULL] |
5442 |
Brazil |
(11)555 4640 |
[NULL] |
[NULL] |
11 |
Heli SiiBwaren GmbH & Co. KG |
Petra Winkler |
Sales Manager |
TiergartenstraBe 5 |
Berlin |
10785 |
Germany |
(010) 9984510 | |||
12 |
Plutzer Lebensmitteigroemarkte AG |
Martin Bein |
International Marketing Mgr, |
Bogenallee 51 |
Frankfurt |
[NULL] |
60439 |
Germany |
(069) 992755 |
Plutzer (on the Wo | |
13 |
Nord-Ost-Fisch Handelsgesellschaft |
Sven Petersen |
Coordinator Foreign Markets |
Frahmredder 112a |
Cuxhaven |
27478 |
Germany |
(04721)8713 |
(04721)8714 | ||
14 |
Formaggi Fortini s.r.1. |
Elio Rossi |
Sales Representative |
Viale Dante, 75 |
Ravenna |
[NULLl |
48100 |
Italy |
(0544) 60323 |
(0544) 60603 |
≠FORMAG6I.HTM* |
15 |
Norske Meiener |
Beate Vileid |
Marketing Manager |
Hatlevegen S |
Sandvika |
1320 |
Norway |
(0)2-953010 | |||
16 |
Bigfoot Breweries |
Cheryl Saylor |
Regional Account Rep. |
3400 - 8th Avenue Suite 210 |
Bend |
OR |
97101 |
USA |
(503) 555-9931 | ||
17 |
Svensk SjbfOda AB |
Michael BjQm |
Sales Representative |
Brovallavigen 231 |
Stockholm |
S-123 45 |
Sweden |
08-123 45 67 | |||
18 |
Auxjoyeux ecclesiasriques |
Guylene Nodier |
Sales Manager |
203, Rue des Francs-Bourgec Paris |
75004 |
France |
(1) 03.83.00.68 |
(1) 03.83.00.62 |
INULll | ||
19 |
New England Seafood Cannery |
Robb Merchant |
Wholesale Account Agent |
Order Processing Dept 2100 Boston |
MA |
02134 |
USA |
(617) 555-3267 |
(617)555-3389 | ||
ZO |
Leka Trading |
Chandra Leka |
Owner |
471 Serangoon Loop, Suite * Singapore |
0512 |
Singapore |
555-8787 |
'M.∣ I | |||
21 |
Lyngbysiid |
Niels Petersen |
Sales Manager |
Lyngbysiid Fiskebakken 10 |
Lyngby |
2900 |
Denmark |
43844108 |
43844115 | ||
22 |
Zaanse Snoepfabnek |
Dirk Luchte |
Accounting Manager |
Verkoop Rijnweg 22 |
Zaandam |
[NULL] |
9999 22 |
Netherlands |
(12345) 1212 |
(12345) 1210 |
[NULL] |
23 |
Karkki Oy |
Anne Heikkonen |
Product Manager |
Valtakatu 12 |
Lappeenranta |
53120 |
Finland |
(953) 10956 | |||
24 |
G'day, Mate |
Wendy Mackenzie |
Sales Representative |
170 Prince Edward Parade H∣ Sydney |
NSW |
2042 |
Australia |
(02) 555-5914 |
(02) 555-4873 |
G day Mate (on Uh | |
25 |
Ma Maison |
Jean-Guy Lauzon |
Marketing Manager |
2960 Rue St Laurent |
Montreal |
Quebec |
H1J1C3 |
Canada |
(514) 555-9022 |
INlII 11 |
Gambar 2. Tabel suppliers
Tabel order terdiri dari 830 baris data dan 14 kolom yang meliputi order_id, customer_id, employee_id, order_date, required_date, shipped_date, ship_via, freight, ship_name, ship_address, ship_city, ship_region, ship_postal_code dan ship_country.
.ιorder.id ^! mcCustomerJd'i! 1 ^employeeJd TJ Oorder date TJ S req j red date '! ® shipped cate ,il∣j^sniρ.via ,Ujj" freight U ’” ship name ^^ ",csħiρ address TI∣ “<snip_city T^j ∙ws∏∣ρjeg∣dn
1 |
10,248 |
EI VlNtr |
SW |
1996-07-04 |
1996-08-01 |
1996-07-16 |
3 B |
32.380001068 |
Vins eτ a∣coo∣s Cries 59 rue de IAbbaye |
Reims | ||
2 |
10.249 |
B TOMSP |
60 |
1996-07-05 |
1996-08-16 |
1996-07-10 |
1 0 |
11.609999657 |
Toms Spezialitaten |
Luisenstr. 48 |
Mtlnster |
(NULL] |
3 |
10.250 |
B HANAR |
4 B |
1996-07-08 |
1996-08-05 |
1996 07-12 |
2 B |
65830001831 |
Ha∏ar∣ Cames |
Rua do Paςa 67 |
RiodeJaneiro |
RJ |
10,251 |
B VKTE |
30 |
1996-07-08 |
1996-08-05 |
1996-07-15 |
1 0 |
41.340000153 |
Victuailles en stock |
2, rue du Commerce |
Lyon |
[NULL] | |
S |
10.252 |
B SUPRD |
4 B |
1996-07-09 |
1996 08 06 |
1996-07-11 |
2 B |
51299999237 |
Suprfmes df∣ices |
Boulevard Tirou. 255 |
Charleroi | |
6 |
10.253 |
u’ HANAR |
30 |
1996-07-10 |
1996-07-24 |
1996-07-16 |
2 B |
58.169998169 |
Hanari Carnes |
Rua do Paςo. 67 |
Rio de Janeiro |
RJ |
10,254 |
B CHOPS |
50 |
1996-07-11 |
1996-08-08 |
1996-07-23 |
2 B |
22.979999542 |
Chop-suey Chinese |
Hauptstr 31 |
Bern | ||
8_ |
10,255 |
u,RICSU |
90 |
1996-07-12 |
1996-08-09 |
1996-07-15 |
30 |
148.330001831 |
Richter Supermarkt Starenweg 5 |
Geneve | ||
10 |
10,257 |
u' HILAA |
40 |
1996-07-16 |
1996-08-13 |
1996-07-22 |
30 |
81.910003662 |
weιιιπgι□n ιmpoπa HlLARION-ABastos |
rtuaoαιvιercauo1ιz Isesenoe Carrera 22 con Ave. Carlo San Cristdbal |
Tachira | |
11 |
10,258 |
ri ERNSH |
1 B |
1996-07-17 |
1996-08-14 |
1996 07 23 |
1B |
140.509994507 |
Ernst Handel |
Kirchgasse 6 |
Graz | |
12 |
10.259 |
B CENTC |
40 |
1996-07-16 |
1996-08-15 |
1996-07-25 |
3u' |
325 |
Centro Comercial M Sierras de Granada 9993 |
Mexico D.F. | ||
10.260 |
B OTTlIC |
40 |
1996-07-19 |
1996-08-16 |
1996-07-29 |
1B |
55.090000153 |
Ottilies Kaseladen |
Mehrbeimerstr. 369 |
Koln | ||
10.261 |
UQUfDf |
1996-07-19 |
1996-08-16 |
1996-07-30 |
2B |
3.049999952 |
Que Deitoa |
Rua OaPanificadora, 12 |
Rio de Janeiro |
RJ | ||
15 |
10,262 |
B RATTC |
80 |
1996-07-22 |
1996-08-19 |
1996-07-25 |
3 B |
48290000916 |
Rattlesnake Canyon 2817 Mitton Dr. |
Albuquerque |
NM | |
I ∙ |
10.263 |
B ERNSH |
9 u' |
1996-07-23 |
1996-08-20 |
1996-07-31 |
3 B |
146.059997559 |
Ernst Handel |
Kirchgasse 6 |
G*? 7 | |
17 |
10.264 |
B FOLKO |
60 |
1996 07-24 |
1996-08-21 |
1996 08-23 |
3 B |
3.670000076 |
Folkocti fa HB |
Akergatan 24 |
Bracke | |
13 |
10.265 |
B BlONP |
20 |
1996-07-25 |
∣996-O8-22 |
1996-08-12 |
1B |
55279998779 |
Blondel p⅛e et Wli |
24. place KWber |
Strasbourg | |
19 |
10.266 |
B WARTH |
3 0 |
1996-07-26 |
1996-09-06 |
1996-07-31 |
3 B |
25.729999542 |
Wartian Herkku |
Tarikatu 38 |
Oulu | |
20 |
10.267 |
B FRANK |
40 |
1996-07-29 |
1996-08-26 |
1996-08-06 |
1 B |
208.580001831 |
Frankenversand |
Berliner Riatz 43 |
Munchen | |
21 |
10.268 |
B GROSR |
80 |
1996-07-30 |
1996-08-27 |
1996-08-02 |
30 |
66290000916 |
GROSELLA-Restaur |
5i Ave. Los Palos Grandes Caracas |
DF |
Gambar 3. Tabel order
Tabel order detail terdiri dari 2155 baris data dan 5 kolom yang meliputi order_id, product_id, unit_price, quantity, discount.
1¾ orderjd ^+ |
1⅛productjd ^+ |
123unit_price ^X 1123 quantity ^+ |
123 discount H | ||
1 |
10,248 e? |
11 E? |
14 |
12 |
0 |
2 |
10,248 E? |
42 ET |
9.800000191 |
10 |
0 |
3 |
10,248 e? |
72 e? |
34.799999237 |
5 |
0 |
4 |
10,249 e? |
14e? |
18.600000381 |
9 |
0 |
5 |
10,249 E? |
51 E? |
42.400001526 |
40 |
0 |
6 |
10,250 e? |
41 e? |
7.699999809 |
10 |
0 |
7 |
10,250 e? |
51 e? |
42.400001526 |
35 |
0.150000006 |
8 |
10,250 e? |
65 e? |
16.799999237 |
15 |
0.150000006 |
9 |
10,251 e? |
22 e? |
16.799999237 |
6 |
0.050000001 |
10 |
10,251 e? |
57 e? |
15.600000381 |
15 |
0.050000001 |
11 |
10,251 e? |
65 e? |
16.799999237 |
20 |
0 |
12 |
10,252 e? |
20 e? |
64.800003052 |
40 |
0.050000001 |
13 |
10,252 e? |
33 e? |
2 |
25 |
0.050000001 |
14 |
10,252 e? |
60 e? |
27.200000763 |
40 |
0 |
15 |
10,253 ET |
31 Ef |
10 |
20 |
0 |
16 |
10,253 e? |
39 e? |
14.399999619 |
42 |
0 |
17 |
10,253 e? |
49 E? |
16 |
40 |
0 |
18 |
10,254 E? |
24 E? |
3.599999905 |
15 |
0.150000006 |
19 |
10,254 e? |
55 e? |
19.200000763 |
21 |
0.150000006 |
20 |
10,254 e? |
74 E? |
8 |
21 |
0 |
21 |
10,255 E? |
2 Ef |
15.199999809 |
20 |
0 |
22 |
10,255 e? |
16E? |
13.899999619 |
35 |
0 |
Gambar 4. Tabel order_details
Tabel ini terdiri dari 91 baris data dan 11 kolom yang meliputi customer_id, company_name, contact_name, contact_title, address, city, region, postal_code, country, phone, fax.
Gambar 5. Tabel customers
-
2.2. Nine Steps Design Methodology
Terdapat 9 langkah yang dapat dilakukan untuk membangun sebuah data warehouse dengan baik yang dikenal dengan nine-step design methodology (Kimball & Ross., 2010). Apabila kesembilan langkah tersebut dilaksanakan secara sistematis dapat menghasilkan data warehouse yang baik. Pada penerapannya sendiri terdapat sembilan tahapan yang dapat dilakukan, antara lain sebagai berikut:
-
a. Choose the Process
Tahapan yang bertujuan untuk memilih proses atau kegiatan bisnis suatu perusahaan yang dapat menjawab pertanyaan-pertanyaan penting terkait dengan bisnis tersebut.
-
b. Choose the Grain
Tahapan yang berfungsi untuk menentukan data yang akan direpresentasikan oleh sebuah tabel fakta. Setelah menentukan grain dari tabel fakta maka dapat ditentukan tabel dimensi yang lain yang berhubungan dengan tabel fakta tersebut.
-
c. Identify and Conform the Dimensions
Tahapan untuk mengidentifikasi dan menghubungkan tabel dimensi dengan tabel fakta. Tabel dimensi merupakan kumpulan sudut pandang yang penting untuk menggambarkan fakta yang terdapat pada tabel fakta itu sendiri.
-
d. Choose the Facts
Tahapan untuk menentukan measure yang dibutuhkan pada tabel fakta atau informasi yang dibutuhkan pada tabel fakta.
-
e. Store Precalculations in the Fact Table
Tahapan perhitungan pada suatu atribut yang penting serta yang akan disimpan pada database.
-
f. Round Out the Dimension Tables
Tahapan untuk memberikan deskripsi lengkap yang memuat informasi terstruktur mengenai atribut-atribut pada tabel dimensi.
-
g. Choose the Duration of the Database
Tahapan yang bertujuan untuk memilih durasi waktu yang dipilih terhadap data-data yang akan dimasukkan ke dalam data warehouse.
-
h. Determine the Need toTrack Slowly changing Dimensions
Tahapan yang berfungsi untuk menentukan tipe dasar dari perubahan dimensi seperti menulis ulang atribut, membuat record baru pada dimensi dan membuat atribut alternatif.
-
i. Decide the Physical Design
Tahapan yang berfungsi untuk melakukan perancangan fisik dari data warehouse serta menentukan masalah-masalah yang memiliki kemungkinan untuk muncul pada perancangan fisik.
-
2.3. On Line Analytical Processing (OLAP)
Online Analytical Processing (OLAP) umumnya digunakan untuk proses pemilihan data secara selektif dan melalui sudut pandang yang beragam. Data pada OLAP akan disimpan dalam basis data multidimensi. Data multidimensi sendiri memiliki beberapa atribut, diantaranya yaitu atribut dimensi (dimension) sebagai atribut yang akan ditinjau, atribut pengukur (measurement) sebagai besaran yang dapat diukur berdasarkan irisan antara atribut dimensi, dan atribut kalkulasi sebagai nilai dari pengukuran.
Pada proses OLAP sendiri terdapat beberapa tahapan yang dapat dilakukan, antara lain sebagai berikut:
-
a. Roll-Up
Tahapan yang berfungsi untuk meningkatkan hirarki konsep data. Hal tersebut dikarenakan apabila tingkat hirarki konsep data terus meningkat maka data yang akan dihasilkan akan lebih ringkas.
-
b. Drill-Down
Tahapan ini bertujuan untuk menurunkan tingkat hirarki konsep data. Hal tersebut dikarenakan apabila tingkat konsep data terus menurun maka data yang data yang dihasilkan akan semakin mendetail.
-
c. Slice & Dice
Tahapan ini bertujuan untuk memilih satu dimensi dari data multidimensi atau data kubus serta memilih dua atau lebih dimensi untuk menghasilkan bagian dari data kubus.
-
d. Pivot
Tahapan ini berfungsi sebagai operasi visualisasi data untuk menampilkan tampilan data dalam representasi yang beragam.
Arsitektur yang digunakan dalam perancangan data warehouse pada penelitian ini merupakan single dimensional data store (DDS). Pada arsitektur DDS tunggal, data dapat disimpan dalam satu dimensi. DDS sendiri terdiri dari satu atau beberapa dimensi data mart, yang dimana merupakan sekelompok tabel fakta terkait dan tabel dimensi yang sesuai dengan kegiatan bisnis yang dipilih. Keuntungan dari arsitektur ini yaitu struktur arsitektur yang lebih sederhana dari arsitektur lainnya, hal tersebut dikarenakan data dari stage akan langsung dimuat pada data dimensi, tanpa melewati setiap jenis store.
Gambar 6. Arsitektur DDS Tunggal
Metode perancangan yang digunakan untuk membangun data warehouse pada penelitian ini adalah menggunakan metode nine-step design methodology. Berikut merupakan tahapan dalam melakukan perancangan data warehouse:
-
a. Analisis dan Pengumpulan Kebutuhan
Proses pengumpulan data pada perancangan data warehouse untuk prediksi penjualan produk menggunakan data sampel dari database northwind, yang dimana data yang digunakan pada penelitian ini merupakan data produk, pelanggan, kategori produk, supplier, serta transaksi jual beli.
-
b. Memilih Proses (Choosing the process)
Pada tahapan ini akan ditentukan proses bisnis dari perusahaan yang ingin dibangun pada data warehouse. Berdasarkan tujuan dan analisis dari proses pengumpulan kebutuhan, maka berikut merupakan proses bisnis yang dipilih pada penelitian ini:
-
• Penjualan Produk
-
• Pembelian Produk
-
c. Memilih Grain (Choosing the Grain)
Tahap ini bertujuan untuk memilih grain yang digunakan sebagai acuan dalam membuat tabel fakta berdasarkan proses bisnis yang ditentukan. Pemilihan grain dalam penelitian ini adalah quantity product.
-
d. Identifikasi dan Penyesuaian Dimensi
Tahap untuk mengidentifikasi dan memilih dimensi yang berhubungan dengan tabel fakta. Dari hasil identifikasi, maka tabel dimensi yang berhubungan dengan tabel fakta meliputi: • Dimensi Customer
Dimensi yang berfokus pada pembelian produk dari pelanggan, yang dimana hal tersebut termasuk juga grain dari dimensi ini.
-
• Dimensi Produk
Dimensi yang berfokus pada produk di dalam database northwind, yang dimana grain dari dimensi ini adalah jumlah produk yang dibeli.
-
• Dimensi Order
Dimensi ini merupakan kumpulan data transaksi yang tersimpan dalam database northwind, yang dimana hal tersebut termasuk juga grain dari dimensi ini.
-
e. Memilih Fakta (Choosing the Fact)
Gambar 7. Model Tabel Fakta
Proses pemilihan tabel fakta berdasarkan grain yang sudah ditentukan sebelumnya yang dimana ditentukan tabel penjualan sebagai tabel fakta. Pada gambar 6, merupakan model data yang dibangun menggunakan skema star, dengan tujuan agar meningkatkan kinerja data warehouse dan pemrosesan query yang lebih efisien dan efektif.
-
f. Menyimpan Pre-calculation pada tabel Fakta
Perhitungan agregasi pada tabel fakta penjualan berdasarkan jumlah produk terjual berdasarkan waktu, yang menghasilkan data total penjualan pada tabel fakta.
-
g. Melengkapi Tabel Dimensi
Tabel 1. Dimensi Customer
Field |
Size |
Keterangan |
City |
varchar(15) |
Kota tinggal customer |
CompanyName |
varchar(40) |
Nama perusahaan atau usaha customer |
ContactName |
varchar(30) |
Nama customer pada daftar kontak perusahaan |
ContactTitle |
varchar(30) |
Jabatan customer |
Country |
varchar(15) |
Negara tinggal customer |
CustomerID |
integer(5) |
Nomor identitas customer |
Region |
varchar(15) |
Wilayah tinggal customer |
Tabel 2. Dimensi Produk
Field |
Size |
Keterangan |
CategoryName |
varchar(15) |
Kategori dari masing-masing produk |
City |
varchar(15) |
Nama perusahaan supplier produk |
CompanyName |
varchar(40) |
Nama perusahaan atau usaha customer |
ContactName |
varchar(30) |
Nama kontak supplier produk |
Country |
varchar(15) |
Negara tinggal supplier produk |
Discontinued |
tinyint(1) |
Diskon harga produk |
ProductID |
integer(11) |
Nomor identitas produk |
ProductName |
varchar(40) |
Nama Produk |
QuantityPerUnit |
varchar(20) |
Kuantitas pembelian produk per unit |
UnitPrice |
double |
Harga satuan produk |
UnitsInStock |
integer(11) |
Jumlah stok produk tersedia |
UnitsOnOrder |
integer(11) |
Jumlah unit produk yang dipesan customer |
Tabel 3. Dimensi Order
Field |
Size |
Keterangan |
Freight |
double |
Jumlah biaya pengiriman produk ke customer |
OrderID |
integer(11) |
Nomor identitas transaksi |
OrderDate |
datetime |
Tanggal produk dibeli customer |
ProductID |
integer(11) |
Nomor identitas produk yang dibeli customer |
Quantity |
integer(11) |
Jumlah produk yang dibeli customer |
ShipCity |
varchar(15) |
Kota perusahaan pengiriman |
ShipCountry |
varchar(15) |
Negara perusahaan pengiriman |
ShipName |
varchar(40) |
Nama perusahaan pengiriman |
ShippedDate |
datetime |
Tanggal produk dikirimkan ke customer |
ShipRegion |
varchar(15) |
Wilayah perusahaan pengiriman |
UnitPrice |
double |
Harga satuan produk yang dibeli customer |
-
h. Pemilihan Durasi Basis Data
Bertujuan untuk memilih durasi waktu terkait data set pada database northwind yang akan digunakan untuk membangun data warehouse. Penulis menggunakan data selama tiga tahun terakhir yaitu dari tahun 1996 hingga 1998.
-
i. Melacak Perubahan dari Dimensi
Proses ini bertujuan untuk memonitoring perubahan terhadap atribut yang terdapat pada tabel dimensi yang terjadi karena adanya proses Extraction, Transformation, Loading (ETL) pada database.
3.
3.1.
Hasil dan Pembahasan
Skema Database Northwind
Gambar 8. Database Northwind
Pada penelitian ini penulis memutuskan untuk menggunakan lima tabel data dari database northwind yang terkait dengan proses bisnis pada penelitian ini. Tabel tersebut diantaranya meliputi tabel products, categories, orders, suppliers, order_details dan customer. Setelah tabel tersebut membentuk relasi satu sama lain maka selanjutnya skema database akan dianalisis dengan tujuan untuk merancang skema dari data warehouse yang akan dibangun.
0∙ DataWarehouse(Northwind)
Gambar 9. Skema Data Warehouse
Dari hasil analisis skema data base northwind, dirancang sebuah skema data warehouse untuk penjualan yang ditunjukkan pada gambar… . Pada skema tersebut terdapat fact_penjualan yang menjadi representasi hasil penjualan berdasarkan tabel dim_costumers, dim_orders, dan dim_products. fact_penjualan akan menyimpan informasi hasil dari perhitungan barang yang terjual pada perusahaan dan perhitungan pendapatan yang akan digunakan untuk membantu perusahaan.
Extract, Transformation, Loading merupakan proses integrasi data dari berbagai sumber data untuk menghasilkan perspektif yang berbeda terhadap masing-masing data yang telah diintegrasikan. Pada proses ETL ini terdapat beberapa tahapan, diantaranya:
-
a. Extraction
Proses pemilahan dan pengambilan data dari satu atau lebih sumber data.
-
b. Cleansing
Proses pembersihan data untuk memastikan kualitas, dan konsistensi antar data serta mengatasi adanya duplikasi data.
-
c. Transformation
Proses penyesuaian data ketika terjadinya integrasi data dari beberapa sumber agar sesuai dengan rancangan data warehouse.
-
d. Loading
Proses Pemuatan data ke dalam data warehouse itu sendiri menggunakan tools Tableau Prep Builder. Tipe objek yang digunakan berupa transformation. Transformasi ini bersifat data-oriented dan digunakan untuk mengekstraksi, mentransformasi dan memuat data. Transformasi ini berupa sekumpulan langkah yang merupakan suatu operasi pada satu atau beberapa record streams. Dari satu langkah ke langkah lain dihubungkan dengan hop atau penghubung yang mengalirkan record dari satu langkah ke langkah lain. Sebagai contoh skema proses ETL tabel dim_orders yang digambarkan pada Gambar 10. Bagian input dari transformasi ini mendapatkan data dari dua tabel yaitu orders dan tabel order_details. Proses transformasi diawali dengan langkah stream lookup terhadap tabel orders dan order_details, yang kemudian dilanjutkan dengan dengan memilih order field yang akan menata hasil field proses sebelumnya. hasil pemilihan field dan proses transformasi akan disimpan pada tabel dimensi dim_orders. Proses ETL pada tabel fakta penjualan memiliki 3 buah tabel dimensi yaitu dim_orders, dim_products, dan dim_customer serta 1 buah tabel fakta seperti skema yang sudah dirancang, terlihat pada Gambar 10.
Gambar 10. Proses ETL
Data warehouse yang telah dibangun dalam penelitian ini kemudian akan divisualisasikan menggunakan aplikasi business intelligence. pada penelitian ini, penulis
menggunakan aplikasi Tableau Desktop. Tableau Desktop merupakan aplikasi yang digunakan untuk menganalisa dan memvisualisasikan data. untuk melakukan visualisasi, akan dilakukan proses pengambilan data dari sumber data baik melalui file atau dengan mengintegrasikannya dengan server. Pada penelitian ini, penulis mengintegrasikan server dari Postgre sebagai sumber data.
Proses pengambilan data diawali dengan mengaktifkan server Postgre, kemudian akan dilanjutkan dengan menginput data server beserta username dan password pada Tableau Desktop. Setelah itu load, maka database dari Postgre akan terintegrasi dengan Tableau.
Visualisasi data pada penelitian ini berupa teks dan grafik yang ditampilkan pada dashboard. Dalam penelitian ini, dibentuk sebuah dashboard yaitu dashboard pendapatan seperti pada gambar 9. Pada dashboard tersebut terdapat informasi pendapatan dari beberapa aspek berupa supplier, negara pembeli, kategori, produk, dan juga waktu dalam satuan tahun.
Gambar 11. Visualisasi Dashboard Pendapatan
Berdasarkan hasil penelitian mengenai rancangan dan implementasi data warehouse penjualan pada Northwind Sample Database, maka penulis dapat mengambil kesimpulan sebagai berikut:
-
1) Tahapan Pengumpulan data yang digunakan pada penelitian ini merupakan tahapan studi literatur sebagai teori acuan dalam penelitian dan data uji sebagai studi kasus yang diperoleh dari situs yugabyteDB.
-
2) Proses integrasi data warehouse menggunakan konsep ETL dengan bantuan Tableau Prep Builder.
-
3) Perancangan dan implementasi data warehouse yang telah dilakukan dapat membantu perusahaan sebagai salah satu pertimbangan dalam proses pengambilan keputusan bisnis terkait dengan transaksi penjualan produk.
Referensi
-
[1] M.F.Zulkarnain, N.P.N.Ardiyanti, I.W.W.K.Sandi, I.D.N.T.Hendrawan, I.B.M.Mahendra, “Perancangan Dan Implementasi Data Warehouse Penjualan (Studi Kasus: Northwind Sample Database) ”, J. Elektronik Ilmu Komputer Udayana., vol. 10, no. 1, pp. 175 - 188, 2021.
-
[2] I.R.Marbun, R.Somya, “Perancangan Data Warehouse untuk Data Transaksi Penjualan Menggunakan Schema Snowflake Studi Kasus : Online Market Dataset”, SEMINAR NASIONAL Dinamika Informatika 2021 Universitas PGRI Yogyakarta, pp. 87 - 91, 2021.
-
[3] B.K.Easterita, I. Arwani, D.E.Ratnawati, “Pengembangan Data Warehouse dan Data Analytichal Processing (OLAP) untuk Analisa Data Artikel Pada Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK)”, J. Sistem Informasi, Teknologi Informasi, Edukasi Sistem Informasi., vol.1, no.1, pp.12 - 22, 2020.
-
[4] I. P. A. E. Pratama and I. G. A. Pradipta, “Desain dan Implementasi Data warehouse untuk Prediksi Penjualan Produk Pada Toko Mekarsari”, J. Teknol. Inf. dan Terap., vol. 05, no. 1, pp. 65–71, 2018
-
[5] T.Asroni, B. Arimbi, S. Riyadi, “Implementing of Data Warehouse Data Alumni using Single Dimensional Data Store Method”, Journal of Physics Conference Series 1471, 2020.
Halaman ini sengaja dibiarkan kosong
632
Discussion and feedback