Evaluasi Kinerja Rate-Distortion Dengan Penerapan Teknik Pembangkitan Side Information Pada Codec Wyner-Ziv Video Coding
on
B-010
Prosiding Conference on Smart-Green Technology in Electrical and Information Systems
Bali, 14-15 November 2013
Evaluasi Kinerja Rate-Distortion Dengan Penerapan Teknik Pembangkitan Side Information Pada Codec Wyner-Ziv Video Coding
Anak Agung Ayu Putri Ardyanti Magister Teknik Elektro Universitas Udayana Denpasar, Indonesia putri.ardyanti@unud.ac.id
I Made Oka Widyantara Lab. Sistem Telekomunikasi, Jurusan Teknik Elektro Universitas Udayana Denpasar, Indonesia oka.widyantara@unud.ac.id
Linawati
Jurusan Teknik Elektro Universitas Udayana Denpasar, Indonesia linawati@unud.ac.id
Abstrak—Wyner-Ziv Video Coding (WZVC) adalah paradigma baru dalam pengkodean video, dimana, ekploitasi korelasi temporal video dilakukan sepenuhnya di dekoder. Sasarannya adalah menurunkan kompleksitas enkoder, dengan menggeser teknik estimasi dan kompensasi gerak ke sisi dekoder. Skema umum WZVC adalah mendekodekan frame dari enkoder, dengan membangkitkan side information (SI) di dekoder. Semakin akurat frame SI yang yang dihasilkan untuk sebuah frame yang dikirimkan oleh enkoder, maka kinerja rate-distortion (RD) codec WZVC akan semakin baik. Saat ini telah dikembangkan dua codec WZVC dengan metode pembangkitan SI berbeda yaitu codec DISCOVER dan codec WZVC-EM. Codec DISCOVER menerapkan metode bidirectional motion-compensated frame interpolation (B-MCFI), dimana sebuah frame SI diperoleh dengan estimasi dan kompensasi gerak dua frame referensi yang tersedia di dekoder. Sedangkan codec WZVC-EM menerapkan metode pembelajan medan gerak secara iteratif berbasis pada algoritma Expectation-Maxization (EM). Metode ini akan memperbaharui medan gerak secara iteratif untuk meningkatkan akurasi soft SI. Paper ini akan mengevaluasi kinerja RD kedua codec tersebut pada struktur group of picture (GOP) berbeda. Sasarannya adalah untuk memperoleh kerangka kerja codec WZVC yang efisien untuk dikembangkan lebih lanjut. Hasil evaluasi menunjukan bahwa kinerja RD codec WZVC-EM lebih baik untuk ukuran GOP lebih besar dari dua.
Kata Kunci—Side Information, Wyner-Ziv Video Coding, Codec DISCOVER, Codec WZVC-EM, Estimasi dan kompensasi gerak.
-
I. PENDAHULUAN
Perkembangan digital khususnya bidang video saat ini mengalami kemajuan yang sangat pesat mulai aplikasi video on demand sampai tv streaming. Pengkodean video konfensional seperti H.26x dan MPEG.x berbasis pengkodean prediktif dimana enkoder bekerja lebih tinggi daripada dekoder. Metode ini sangat cocok untuk media penyimpanan digital dan video streaming karena sumber aplikasi dikodekan
sekali di enkoder dan didekodekan beberapa kali. Namun dalam aplikasinya metode ini tidak cocok untuk pengkodean video yang diterapkan seperti pada wireless video surveillance, wireless PC camera, dimana seluruh aplikasi seperti ini menginginkan kinerja enkoder menjadi ringan. Munculah teknik pengkodean video berdasarkan teori informasi Slepian-Wolf (SW) [1] dan Wyner-Zip (WZ) [2] yaitu Distributed Video Coding [3] yang sering disebut juga dengan DVC [1] [2]. Teorema ini menawarkan solusi dimana kinerja enkoder menjadi lebih rendah dengan memindahkan efisiensi medan gerak ke dekoder. Pengkodean sumber terdistribusi inilah yang menjadi dasar dari pengembangan Wyner-Ziv Video Coding (WZVC). WZVC menerapkan teorema WZ dengan pembangkitan SI di dekoder. Dengan skema ini, enkoder hanya mengirimkan informasi yang terbatas yang tentang sebuah frame untuk menurunkan kapasitas bit transmisi. Selanjutnya, dekoder akan mendekodekan frame video dengan membangkitkan SI, yaitu skema estimasi dan kompensi gerak menggunakan hanya frame-frame yang telah didekodekan sebelumnya di dekoder sebagai frame referensi. Semakin akurat SI yang dihasilkan, maka semakin baik kinerja rate-distortion (RD) codec WZVC.
Sebagai usaha untuk merealisasikan sebuah codec WZVC praktikal beberapa kelompok peneliti telah mengajukan berapa rancangan codec WZVC. Codec pertama diusulkan [3][4][5] dan dikenal sebagai codec (coder dekoder) WZVC Stanford. Codec ini menerapkan teknik motion compensation interpolation/extrapolation (MCI/E) untuk membangkitkan SI, menggunakan dua frame referensi di dekoder. Codec ini tidak sepenuhnya praktikal, karena menggunakan frame referensi yang disediakan langsung di dekoder.
Untuk meningkatkan kinerja RD codec WZVC, beberapa codec WZVC telah diusulkan dalam literature seperti codec DISCOVER [6] dan WZVC-EM [7]. Kedua codec menggunakan kerangka kerja codec WZVC Stanford, tetapi dengan metode pembangkitan SI yang berbeda. Codec DISCOVER menerapkan metode Bidirectional Motion-Compensated Frame Interpolation (B-MCFI), dimana sebuah frame SI diperoleh dengan estimasi dan kompensasi gerak dua frame referensi yang tersedia di dekoder. Sedangkan codec WZVC-EM menerapkan metode
pembelajaran medan gerak secara iteratif berbasis pada algoritma Expectation-Maxization (EM). Metode ini akan memperbaharui medan gerak secara iteratif untuk meningkatkan akurasi soft SI.
Perbedaan metode SI yang digunakan untuk mendesain codec WZVC menunjukan bahwa parameter utama untuk meningkatkan kinerja codec WZVC adalah bagaimana mendapatkan sebuah metode pembangkitan SI yang efisien. Oleh karena itu, paper ini akan mengevaluasi lebih lanjut penerapan metode pembakitan SI ini dengan membandingkan kinerja RD kedua codec pada ukuran GOP yang berbeda. Sampai saat ini belum ada literatur yang mengkaji evaluasi kinerja RD kedua codec tersebut. Sasarannya adalah akan diperoleh sebuah kerangka kerja codec WZVC yang efisien untuk dikembangkan lebih lanjut.
Selanjutnya, paper in diorganisasikan sebagai berikut: Bab 2 menjelaskan tentang state of the art codec WZVC, Bab 3 menjelaskan tentang pembangkitan SI pada codec WZVC DISCOVER dan WZVC-EM, Bab 4 membahas tentang Kinerja RD kedua codec tersebut, dan akhirnya Bab 5 adalah kesimpulan dari paper ini.
-
II. STATE OF THE ART wzvc
-
2.1 Pengkodean Sumber Terdistribusi
-
Teori pengkodean sumber terdistribusi ditujukan untuk pengkodean dua atau lebih sekuen random dependen secara terdistribusi. Setiap sumber dienkodekan secara independen dan bitstreamnya dikirim ke dekoder tunggal untuk decoding secara gabungan. untuk mengkompres dua sumber dependen secara statistik, laju enkoding minimum R yang dibutuhkan untuk memulihkan kedua sumber tanpa kesalahan di dekoder gabungan, oleh teori informasi Shannon rekonstruksi lossless dari X dan Y dinyatakan dengan Rx ≥ H(X). Dimana teorema Informasi menegaskan bahwa ketika R memenuhi R ≥ Rx + Ry ≥ H(X, Y), X dan Y dapat direkonstruksi dengan akurat di dekoder, selama kedua sumber tersebut saling berkorelasi dan laju bit total R lebih besar dari entropy gabungan H(X,Y). Sebuah pertanyaan muncul apakah memungkinkan untuk memulihkan dua sekuen dependen ini dengan probabilitas kesalahan rekonstruksi kecil menggunakan laju bit RX < H(X) atau RY < H(Y).
Gambar 1 Skema enkoding independen dan dekoding gabungan untuk dua sumber [1]
Slepian dan Wolf [1] telah mempelajari persoalan pada Gambar 1 dan ini merupakan studi pertama tentang Pengkodean Sumber Terdistribusi. Kombinasi laju bit yang
mungkin dari RX dan RY untuk merekonstruksi X dan Y dengan probabilitas error kecil, dinyatakan dengan:
Rχ ≥ H ( XY)
(1)
RY ≥ H(YX)
Rχ + RY ≥ H (X, Y)
(2)
(3)
Konsep pengkodean Wyner-Ziv (WZ) [1] sangat cocok diterapkan pada aplikasi pengkodean video. Dalam literatur pengkodean video dikenal sebagai Wyner-Ziv Video Coding (WZVC). Dalam kasus ini, beberapa frame sekuen video dienkodekan Wyner-Ziv, sedangkan frame sisa dienkodekan menggunakan standar pengkodean citra/video tradisional seperti JPEG atau H.264. Dekoder, dengan menggunakan frame-frame yang dikodekan secara tradisional kemudian membangkitkan estimasi frame sekarang melalui teknik interpolasi/ektrapolasi frame. Frame ini yang kemudian digunakan dalam proses dekoding frame WZ sekarang (dienkodekan WZ).
Teorema SW [1] dan WZ [2] yang sudah sangat dikenal, dalam Teori Informasi menegaskan bahwa adalah mungkin untuk mengkompres dua sinyal dependen secara statistik dengan cara terdistribusi (enkoding terpisah, dekoding gabungan) menggunakan laju bit yang serupa seperti yang digunakan dalam sistem di mana sinyal dienkodekan dan didekodekan secara bersama-sama (gabungan), seperti pada pengkodean sumber tradisional (gambar 1).
Wyner dan Ziv [2] telah mempelajari kasus khusus pada pengkodean SW yang berkaitan dengan laju bit di koordinat (H(X|Y), H(Y)), di Gambar 2. Kasus khusus ini berkaitan dengan pengkodean sumber sekuen X dengan mempertimbangkan sekuen Y, dikenal sebagai side information (SI), tersedia di dekoder (Gambar 2) dalam banyak literatur dikenal sebagai kompresi lossy dengan dekoder SI. Disebut kompresi lossy karena Wyner dan Ziv mempertimbangkan distorsi (D) rata-rata yang dapat diterima, diantara sekuen X dan versi dekodenya (X’).
Gambar 2 Kompresi lossy dengan side information [2]
Pada Gambar 2 dapat dilihat dimana X adalah sekuen yang akan dienkodekan sehingga disebut sebagai informasi utama, dan Y disebut side information adalah dianggap tersedia di dekoder.
-
2.2 Codec WZVC Domain Transform
Berdasarkan pengkodean sumber terdistribusi, sebuah codec WZVC praktikal domain transform pertama kali dikembangkan di Stanford University [5]. Solusi pengkodean ini dikenal dengan Wyner-Ziv video Coding (WZVC) Stanford.

Gambar 3 Arsidektur WZVC Stanford [5]
Seperti ditunjukan pada Gambar 3, codec WZVC Stanford pada prosedur encoding frame WZ di domain transform dilakukan dengan mentransformasi DCT dan kuantisasi frame WZ. Teknik pengkodean kanal Turbo code diterapkan untuk pembangkitan bit parity dari bitplane indek kuantisasi. Bit parity ini nantinya akan dikirim ke dekoder secara bertahap untuk memperbaiki error dalam SI. Dimana control laju dibentuk di dekoder dengan saluran umpan balik, dekoder meminta kembali bit parity jika prosedur dekoding tidak berhasil mengestimasi frame WZ.
-
III. PEMBANGKITAN side information pada codec WZVC
Sebagai usaha meningkatkan kinerja RD codec WZVC Stanford, beberapa desain codec WZVC baru telah diusulkan, dengan fokus utama perbaikan pada metode pembangkitan SI. codec DISCOVER [6] menerapkan teknik B-MCFI dan WZVC-EM [7]. metode pembelajaran tanpa supervisi medan gerak berbasis pada algoritma EM. Detail algoritma pembangkitan SI di kedua codec tersebut dijeaskan pada subbab berikut.
-
3.1 WZVC DISCOVER
Pada codec WZVC DISCOVER, pembangkitan SI menggunakan metode bidirectional motion-compensated frame interpolation (B-MCFI) berbasis blok yang dikembangkan oleh [8]. Metode menggunakan dua frame referensi yaitu satu frame temporal sebelumnya (XB) dan frame temporal berikutnya (XF).

fM∏Mek 7h4∏ul
Irtra Decoder
⅛2M∕ΛVC
Intra Lncixler
X » Kι'y l ri∏⅜<
Gambar 4 Arsidektur codec WZVC DISCOVER [9]

Gambar 5 Kerangka kerja interpolasi frame untuk pembuatan SI [10]
Kerangka kerja interpolasi frame untuk pembangkitan SI seperti yang ditunjukkan pada gambar diatas dapat dijelaskan sebagai berikut [10]:
-
• Algoritma Forward Motion Estimation
Algoritma pencocokan blok digunakan untuk mengestimasi medan gerak antara frame XB dan frame XF dimana jumlah vektor gerak, kedua frame X B dan XF akan di low pass filter (LPF) terlebih dahulu sebelum dicocokkan. Algoritma Forward Motion Estimation (FME) menggunakan kriteria matching mean absolute difference (MAD) berdasarkan pada cost function (CF) minimal dan dinyatakan sebagai [10]:
(Vχ, Vy ) = argmin CF (dχ, dy) ; dχ = [-M, M ]; dy = [-M, M ] dx,dy
MAD ( dχ, dy ) = -1 ∑ XF ( x, y)-XB ( χ + dχ, y + dy )∣ N (x,y)∈B
-
• Bidirectional Motion Estimation (BME)
Algoritma BME diterapkan untuk memperbaiki
(4)
(5)
vektor-
vektor gerak pada blok sekarang di frame interpolasi Y sebelumnya dan berhubungan dengan blok-blok tetangga terdekatnya yang telah diperoleh pada prosedur FME dan dirumuskan sebagai berikut[10]:
(xι, yι ) = ( xi, yi)+MV (Bi) (6)
(x2, y 2 )=( xi, yi)-MV (Bi) (7)
-
• Spatial Motion Smoothing
Algoritma spatial motion smoothing diterapkan untuk menurunkan jumlah vektor gerak yang salah dengan membandingkan motion vektor yang salah dengan medan gerak yang sebenarnya pada codec DISCOVER menggunakan weighted median vector filter dengan formula sebagai berikut[10]:
NN
Σ wj Ixwvmf - xjl ≤Σ wjlx,- j (8) j=1 j=1
Pemilihan bobot dibentuk selaras dengan error dinyatakan sebagai:
= MSE ( xc, B)
j = MSE ( xj, B)
prediksi,
(9)
Mean square error (MSE) menyatakan matching yang telah berhasil antara blok sekarang B di frame XF dan blok di frame
XB yang dikompensasi dengan vektor xc dan xj. Pada area sekitar hidung terdapat kesalahan interpolasi medan gerak, karena vektor-vektor gerak hanya meminimalkan MSE antara frame-frame Key tetapi tidak menyatakan medan gerak yang sebenarnya. Kesalahan interpolasi medan gerak pada Gambar selanjutnya dihaluskan dengan weighted vector median filter menggunakan vektor-vektor gerak tetangga sebagai faktor bobot.

Gambar 6 Frame #7 dari sekuen video Foreman (a) dengan (b) tanpa spatial motion smoothing [11]
-
• Bidirectional Motion Compensation
Setelah vektor-vektor akhir telah diperoleh, frame interpolasi Y dibentuk dengan bidirectional motion comensation. Diasumsikan bahwa interval waktu antara frame Key XB dengan frame interpolasi Y adalah sama dengan interval waktu antara frame interpolasi Y dengan frame Key XF, sehingga setiap frame Key memiliki bobot yang sama (1/2), ketika estimasi gerak dibentuk .
-
3.2 Codec WZVC-EM
Varodayan dkk [12] mengajukan desain codec WZVC dengan skema pembangkitan SI menggunakan metode pembelajaran medan gerak tanpa supervisi berbasis algoritma EM, dan dikenal sebagai codec WZVC-EM. Seperti ditunjukan pada Gambar 7, untuk mengkodekan frame WZ, dekoder membentuk skema pembelajaran gerak tanpa supervisi (unsupervised) menggunakan bitstream frame WZ secara langsung dan satu frame SI yang sudah didekodekan sebelumnya. Medan gerak yang dihasilkan selanjutnya digunakan untuk membangkitan soft SI. Detail kerangka kerja codec WZVC-EM dapat dijelaskan sebagai berikut :
Gambar 7 Arsidektur codec WZVC berbasis EM domain transform [12]
-
• Pada enkoder, frame Key (Y di kodekan dan ditransmisikan dengan pengkodean konvensional JPEG. Enkoding frame WZ (X) dilakukan secara independen dari frame Y. Enkoder Wyner-Ziv mentransformasi frame X ke dalam koefisien DCT berbasis blok k × k (X), dimana k adalah juga ukuran pencocokan blok pada estimator gerak. Koefisien-koefisien transform (XT) kemudian dikuantisasi menjadi indek-indek kuantisasi (XTQ), menggunakan tabel kuantisasi rekomendasi JPEG. Indek-indek koefisien terkuantisasi XTQ dikomunikasikan ke dekoder menggunakan LDPC code [12].
-
• Pada sisi dekoder, piksel-piksel dari Y tidak digunakan secara langsung karena sistem lossless bekerja dalam domain transform. Oleh karenanya, Y di DCT berbasis blok k x k, yang menghitung transform seluruh blok k x k di seluruh pergeseran piksel. Dengan cara ini, koefisien-koefisien transform dari setiap kandidat gerak dari Y tersedia di : estimator gerak dan model probabilitas, untuk memperoleh soft SI (ψ). Akhirnya, indek-indek koefisien kuantisasi dari X, dipulihkan dari sistem lossless, direkonstruksi di pusat binbin kuantisasinya (centroid reconstruction) dan ditransformasi balik untuk menghasilkan frame rekonstruksi X .
Pada gambar 7, bagian yang diarsir adalah bagian penerapan algoritma EM dalam codec WZVC-EM dan secara detail dijelaskan sebagai berikut:
-
• Model
Menurut [7] : model distribusi probabilitas posterior dekoder dari sumber X berbasis pada parameter soft estimate dekoder LDPC θ untuk menghitung distribusi probabilitas posteriori dari M adalah:
Papp {M }≡ P {M ∣y, S; θ}
∞ P{M}P{Y,SM;θ}
(12)
dengan step kedua hukum Bayes. Bentuk ini menegaskan sebuah bentuk solusi iteratif EM.
-
• Algoritma E-step
E-step memperbaharui distribusi M yang telah diestimasi dengan mengacu parameter θ. Secara sedehana estimasi M dilakukan di vektor gerak berbasis blok M(u,v) dan S diabaikan. Pada ukuran blok k, setiap blok k-×-k dari θ(t1 dibandingkan dengan setiap Y, pada blok co-located dan sekitarnya pada range pencarian gerak tetap. Untuk sebuah blok θ(u,v)(t-1) dengan piksel kiri atas dilokasikan di (u,v), distribusi pada pergeseran M(u,v) diperbaharui dan dinormalisasikan [7]:
Pp { Mu, v } := ^ { Mu, v } P {Y u, v)+ Muv IMu, v ; C’} (13)
dimana Y(u,v)+Mu,v adalah blok k-×-k dengan piksel kiri atas di ((u,v)+Mu,v) dan P{Y(u,v)+Muv|Mu,v;θu,v(t-1)} adalah probabilitas pengamatan Y(u,v)+Mu,v dimana vektor Mu,v dari Xu,v (diparameterkan oleh θu,v(t-1)) .
Secara umum, probabilitas bahwa pencampuran SI memiliki nilai ω di pixel (i,j) adalah:
ψ(t\i, j, ω ) = ∑ Papp {Mi j = m} P {X (i, j ) = ω M. ^ = m, Y} m
= ∑ Pp {Mi, 1 = m} Pz {ω - Y (i, j)} m
(14)
dimana pZ(z) adalah probability mass function (pmf) dari noise additive independen Z, dan Ym adalah frame rekonstruksi sebelumnya terkompensasi pada m konfigurasi gerak.
Persamaan 14 menunjukan bahwa penjumlahan bobot meliputi seluruh versi pergeseran dari Y.. Selama seluruh distribusi M(i,j) diperoleh, maka operasi pencampuran
memungkinkan seluruh kandidat dari proses pergeseran berkontribusi secara partial untuk soft SI, ψ(i,j).
Model blok kandidat ini membatasi ketergantungan statistik (soft matching) antara x[i] dan Ŷ(u,v)[i,mi] dengan parameter Laplacian (σ), sehingga :
ζl
ε
l ζ 0 + ζ 1 +........+ ζ 2 m -1
dimana,
(15)
ζl =


jika0 ≤ l ≤2m-1
jika0 ≤ l≤ 2m
(16)
-
• Algoritma M-step
Pada M-step, dekoder LDPC memperbaharui θ menggunakan ψ yang telah dibangkitkan menggunakan metode joint bitplane LDPC decoding [13].
θ(t) := arg max P{Y, S, θ}
Θ
= arg max ∑ P^p {M = m } P {Y, S∖M = m, θ} Θ
(17)
Sebelum dinormalisasi pada ω∈ {0,......,2d-1}, θ(t dihitung
sebagai:
θ(t) (i, j,ω) := ψ(t) (i, j,ω)∏(α<t^"g"] (1 -α<t))1ω*=0J (18)
g=1
dimana ωg merupakan bit ke-g dalam Gray mapping dari nilai luminance ω dan 1[.] merupakan fungsi indikator. M-step juga membangkitkan hard estimate Xˆ dengan mengambil satu nilai yang paling mungkin untuk setiap piksel yang sesuai dengan θ.
X (i, j ) = argmax mθ (i, j, ω) (19)
dengan iterasi melalui M-step dan E-step, dekoder LDPC meminta bit-bit syndrome tambahan jika estimasi tidak konvergen. Algoritma berhenti ketika hard estimate Xˆ menghasilkan syndrome yang identik dengan S.
-
IV. Hasil Dan Pembahasan
Pada bagian ini akan dibahas evaluasi kinerja RD codec WZVC DISCOVER dan WZVC-EM, masing-masing dengan menerapkan metode pembangkitan SI yang berbeda dimana telah dipaparkan pada bab sebelumnya. Pembahas kinerja RD dilihat dari hasil kedua codec yaitu codec dilihat dari hasil GOP 2, 4 dan 8 dari video Foreman (sequen video ini dijadikan video percobaan oleh [8] dan [10]). Video Foreman sendiri merupakan contoh video dengan gerak cepat.
Secara umum codec WZVC DISCOVER pada gambar 8 (a) menunjukkan penurunan kinerja RD terlihat dari penurunan grafik dengan menggunakan GOP ukuran 2, 4 dan 8. Hal ini menunjukkan bahwa teknik B-MCFI masih belum dapat berjalan dengan baik ketika GOP lebih besar dari 2 dimana korelasi temporal dengan pergerakkan cepat untuk Foreman belum mampu diestimasi. Jarak temporal frame
referensi berubah jauh sehingga sulit untuk diperkirakan frame selanjutnya yang terdapat di frame WZ.

(a)
(b)
Gambar 8 Performa RD GOP 2 Foreman : (a) WZVC DISCOVER [8] dan
(b) WZVC-EM [10]
Gambar 8 (b) WZVC-EM menunjukkan bahwa terjadi peningkatan grafik pada GOP ukuran lebih dari 2, pada hal ini peningkatan ini disebabkan oleh medan gerak yang terus diperbaharui (interaktif) dan motion field yang diperbaiki terus menerus. Teknik pembelajaran tanpa supervisi medan gerak ini melakukan perbaikan estimasi medan gerak secara kontinyu sehingga frame SI kompensasi (soft SI) mampu mendekati frame WZ. Kondisi ini menyebabkan codec WZVC-EM mampu meningkatkan kinerja RD terutama pada ukuran GOP lebih besar dibandingkan codec WZVC DISCOVER.
-
V. Kesimpulan
Paper ini telah memaparkan dan menjelaskan skema berbeda pada pembangkitan soft SI yang digunakan pada setiap codec WZVC, mulai dari metode Motion-Compesated Frame Interpolation/ Extrapolation (MCFI/E) pada codec WZVC Stanford, Bidirectional Motion-Compensated Frame Interpolation (B-MCFI) pada codec DISCOVER, sampai skema pembelajaran tanpa supervisi medan gerak pada codec WZVC-EM. Teknik pembelajaran tanpa supervisi medan gerak melakukan perbaikan estimasi medan gerak secara terus-menerus sehingga frame SI kompensasi (soft SI) mampu mendekati frame WZ. Kondisi ini menyebabkan codec WZVC-EM mampu meningkatkan kinerja RD terutama pada ukuran GOP lebih besar dibandingkan codec WZVC Discover.
Semakin akurat Soft SI semakin identik dengan frame WZ, dalam paper ini dapat diketahui bahwa pada codec
WZVC DISCOVER dengan mengunakan metode Bidirectional Motion-Compensated Frame Interpolation (B-MCFI) hanya mampu bekerja baik pada GOP 2, hal ini menyebabkan enkoder bekerja lebih banyak dibandingkan Codec WZVC-EM. Dari hasil ini, pengembangan codec WZVC sebaiknya diarahkan pada sistem pembelajaran di SI yang nantinya akan mampu memperbarui medan gerak awal untuk menghasilkan medan gerak baru untuk menambah kinerja RD dan mengurangi beban di enkoder.
Referensi
-
[1] Slepian, D. dan Wolf, J.K., “Noiseless Coding of Correlated Information Sources”, IEEE Transaction Information Theory, Vol. IT-19, No.4, hal. 471– 480, Jul.1973.
-
[2] Wyner, A.D. dan Ziv, J., “The Rate-Distortion Function for Source Coding with Side Information at the Dekoder”, IEEE Transaction. Information Theory, Vol. IT-22, No. 1, hal. 1–10, Jan.1976.
-
[3] Girod, B., Aaron, A., Rane, S., dan Monedero, D.R., “Distributed Video Coding”, Proceedings of IEEE, Spscial Issue on Advances in Video Coding and Delivery, Vol. 93, No. 1, hal. 71-83, Jan. 2005.
-
[4] Aaron, A., Zhang, R., dan Girod, B.,“Wyner-Ziv Coding of Motion Video”, Asilomar Conference on Signals, Systems and Computer, Pacific Grove, USA, Vol. 1, hal. 240-244, 3-6 Nov. 2002
-
[5] Aaron, A., Rane, S., Setton, E. dan Girod, B.,“Transform Domain Wyner-Ziv Codec for Video“, Proceedings of SPIE in Visual Communications and Image Processing, San Jose, California, USA, Vol. 5308, hal. 520–528, Jan.2004.
-
[6] Artigas, X., Ascenso, J., Dalai, M., Klomp, S., Kubasov, D. dan Ouaret, M. , “The DISCOVER Codec: Architecture, Techniques and Evaluation”, Proceedings of Picture Coding Symposium, Lisbon, Portugal, 2007.
-
[7] Varodayan, D.,”Adaptive Distributed Source Coding”, Desertasi Ph.D. Stanford University, 2010.
-
[8] Kubasov, D., Nayak, J. dan Guillemot, C., “Optimal Reconstruction in Wyner-Ziv Video Coding with Multiple Side Information”, Proceedings of IEEE International Workshop Multimedia Signal Processing, Chania, Greece, hal. 183-186, 2007.
-
[9] Pereira,F., Ascenso, J., Brites, C., “ Studying the GOP Size Impact on the Performance of Feedback Channel-based Wyner-Ziv Video Codec”, IEEE Pacific Rim Symposium on Image Video and Technology, Santiago, Chile, December 2007.
-
[10] Ascenso, J., Brites, C. dan Pereira, F. “Content Adaptive Wyner-Ziv Video Coding Driven by Motion Activity, Proceedings of IEEE International Conference Image Processing”, Atlanta, Georgia, 2006.
-
[11] Ascenso, J., Brites, C. dan Pereira, F. (2005), “Improving Frame Interpolation with Spatial Motion Smoothing for Pixel Domain Distributed Video Coding“, Proceedings of EURASIP Conference Speech Image Processing, Multimedia Commuication Services, Smolenice, Slovak Republic, 2005.
-
[12] Varodayan, D., Chen, D., Flierl, M. dan Girod, B., “Wyner-Ziv Coding of Video with Unsupervised Motion Vector Learning”, EURASIP Signal Processing: Image Communication Journal, Special Issue on Distributed Video Coding, Vol. 23, No. 5, hal. 369-378, Jun.2008.
-
[13] Varodayan, D., Mavlankar, A., Flierl, M. dan Girod, B. (2006), “Distributed Coding of Random Dot Stereogram with Unsupervised Learning of Disparity”, Proceedings of IEEE International Workshop Multimedia Signal Processing, hal. 5-8
108
ISBN: 978-602-7776-72-2 © Universitas Udayana 2013
Discussion and feedback