Phương pháp giảm thời gian dự đoán nội khung trong chuẩn mã hóa video H.266/Versatile Video Coding

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.19 MB, 5 trang )

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

Phương Pháp Giảm Thời Gian Dự Đốn Nội
Khung Trong Chuẩn Mã Hóa Video
H.266/Versatile Video Coding
Nguyễn Quang Sang1, Bùi Thanh Hương1,2, Đinh Triều Dương1, Hồng Văn Xiêm1
1

Khoa Điện tử Viễn thơng, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội
2
Khoa Công nghệ thông tin, Trường Đại học Xây dựng
Email:

Abstract— Vào năm 2020, tiêu chuẩn mã hóa video
H.266/Versatile Video Coding (VVC) đã được ISO và
ITU-T thông qua. Để đạt được hiệu năng mã hóa cao
nhất, mơ hình mã hóa video này đã được nghiên cứu và
tích hợp nhiều kỹ thuật mã hóa mới. Trong đó, đối với
phương pháp dự đốn nội khung, số lượng chế độ dự
đoán được tăng lên 67 chế độ. Mặc dù biến đổi
Hadamard được sử dụng giúp làm giảm độ phức tạp tính
tốn nhưng so với tiêu chuẩn mã hóa video H.265/High
Efficiency Video Coding (HEVC), thời gian xử lý của
VVC vẫn còn rất cao. Trong bài báo cáo này, chúng tôi
đề xuất một phương pháp làm giảm độ phức tạp tính
tốn cho q trình dự đốn nội khung của mơ hình mã
hóa video VVC bằng cách giảm số lượng ứng viên trong
tập các chế độ dự đoán. Kết quả cho thấy, phương pháp
đề xuất giúp làm giảm trung bình từ 26.67% đến 28.47%
thời gian xử lý.

Coding (HEVC) [2], ở cùng một mức chất lượng, tiêu
chuẩn mã hóa video H.266/VVC có thể tiết kiệm tới
hơn 40% lượng bit tiêu thụ [3].
Để đạt được hiệu năng mã hóa cao, nhiều kỹ thuật
mới đã được nghiên cứu và tích hợp vào bộ mã hóa
H.266/VVC. Hình 1 dưới đây mơ tả sự khác biệt về các
kỹ thuật được sử dụng trong HEVC và VVC. Bên cạnh
việc áp dụng cấu trúc phân chia khối hình đa dạng (cây
phân chia nhị phân, tam phân, tứ phân - QTMT) ở tất
cả các cấu hình mã hóa, riêng với mã hóa dự đốn nội
khung, có thể kể đến số lượng chế độ dự đoán tăng lên
67 (so với 35 chế độ ở HEVC), và một số kỹ thuật mở
rộng được áp dụng như kỹ thuật đa đường tham chiếu
(multiple-reference line – MRL), kỹ thuật chia nhỏ
khối nội khung (intra sub-partition – ISP), kỹ thuật sao
chép khối nội khung (intra block copy – IBC). Tuy
nhiên, các kỹ thuật này khiến cho bộ mã hóa có độ
phức tạp tính tốn cao, gây ra độ trễ lớn trong q trình
truyền – nhận dữ liệu. Cũng theo số liệu tại báo cáo [3],
thời gian xử lý của VVC cao hơn HEVC tới hơn 30
lần.

Keywords- H.266/Versatile Video Coding, dự đoán nội
khung, lựa chọn hướng dự đoán.

I.

GIỚI THIỆU

Với sự phát triển của cơng nghệ sản xuất thiết bị

ghi hình và màn hình hiển thị trong những năm trở lại
đây, các ứng dụng video liên tục được nâng cao chất
lượng để tăng tính trải nghiệm cho người dùng. Ngày
nay, chúng ta có thể xem được những video với tốc độ
khung hình cao hiển thị chuyển động được mượt mà
hơn, video độ phân giải lớn (HD, Full-HD, 2K, 4K…)
cho hình ảnh sắc nét hơn, video 360o để ghi lại hình
ảnh góc rộng… Tuy nhiên, với những loại hình video
này chất lượng cao này, thách thức đặt ra cho các hệ
thống truyền thông đa phương tiện là lượng dữ liệu vô
cùng lớn trong khi băng thơng và khả năng lưu trữ của
thiết bị cịn nhiều hạn chế.
Để giải quyết các vấn đề cấp thiết trên, từ năm
2015, các tổ chức uy tín trên thế giới đã bắt đầu nghiên
cứu mơ hình mã hóa video thế hệ mới mang tên
H.266/Versatile Video Coding (VVC) [1]. Mơ hình mã
hóa video thế hệ mới này đã được chính thức thơng qua
như một tiêu chuẩn mã hóa video vào tháng 7 năm
2020. Các kết quả thử nghiệm chỉ ra rằng, so với tiêu
chuẩn mã hóa video H.265/High Efficiency Video

ISBN 978-604-80-5958-3

VVC intra

HEVC intra

MRL

QT

QTMT

35 chế độ
dự đốn

67 chế độ
dự đốn

ISP
IBC
...

Hình 1. Các kỹ thuật được áp dụng cho chế độ dự đoán nội
khung trong HEVC và VVC

Trong các kỹ thuật nêu trên, có thể thấy việc tăng
số lượng chế độ dự đốn từ 35 lên 67 ảnh hưởng trực
tiếp đến việc cải thiện hiệu năng nhưng cũng là nguyên
nhân khiến độ phức tạp mã hóa tăng lên đáng kể. Việc
giảm thời gian xử lý cho dự đốn nội khung ln là bài
tốn gây ra nhiều thách thức cho các nhà nghiên cứu

135

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

khi vừa phải giảm thiểu được độ phức tạp tính tốn,
vừa phải đảm bảo được hiệu năng mã hóa khơng bị ảnh

hưởng. Thơng qua việc phân tích đặc trưng về kích
thước và mối quan hệ giữa các khối hình lân cận, bài
báo cáo này đề xuất một phương pháp giảm thời gian
mã hóa cho chế độ dự đốn nội khung trong mơ hình
mã hóa video H.266/VVC bằng cách giảm số lượng
hướng dự đốn của khối hình.
Bài báo cáo được trình bày theo cấu trúc gồm 4
phần. Phần 1 giới thiệu tổng quan về mục đích và động
lực nghiên cứu. Phần 2 trình bày chi tiết về chế độ dự
đốn nội khung trong mơ hình mã hóa video
H.266/VVC và các nghiên cứu giảm thời gian mã hóa
liên quan. Trong phần 3 của bài báo cáo, chúng tơi mơ
tả về thuật tốn được đề xuất. Các kết quả kiểm thử và
kết luận được trình bày lần lượt trong phần 4 và 5.
II.

đốn góc rộng cho khối hình có tỉ lệ Chiều Rộng /
Chiều cao bằng 1/2 và 2.
Bảng I: Các hướng bị thay thế trong chế độ dự đốn góc
rộng

Tỉ lệ Chiều Rộng
/Chiều Cao (W/H)
W / H = 16
W/H=8
W/H=4
W/H=2
W/H=1
W / H = 1/2
W / H = 1/4

W / H = 1/8
W / H = 1/16

DỰ ĐOÁN NỘI KHUNG TRONG H.266/VVC
VÀ CÁC NGHIÊN CỨU LIÊN QUAN

Các hướng bị thay thế
Hướng 12, 13,14,15
Hướng 12, 13
Hướng 2,3,4,5,6,7,8,9,10,11
Hướng 2,3,4,5,6,7,
Hướng 61,62,63,64,65,66
Hướng
57,58,59,60,61,62,63,64,65,66
Hướng 55, 56
Hướng 53, 54, 55, 56

A. Dự đoán nội khung trong mơ hình mã hóa video
H.266/VVC
Tiêu chuẩn mã hóa video H.266/VVC được nghiên
cứu và chuẩn hóa nhằm hướng tới việc có thể mã hóa
các video độ phân giải cao (Full-HD, 2K, 4K, …), nên
kích thước khối hình tối đa cho phép lên tới 128×128.
Do đó, số lượng chế độ dự đoán trong dự đoán nội
khung của VVC lên tới 67 chế độ, bao gồm chế độ
Planar, chế độ DC và 65 hướng trong chế độ dự đoán
theo hướng (Angular Mode) [4]. Hình 2 mơ tả các chế
độ và hướng dự đoán nội khung trong VVC. Các
hướng được ký hiệu bởi mũi tên màu đen là các hướng
giống với hướng trong HEVC. Các hướng được ký

hiệu bởi mũi tên màu đỏ là các hướng mới được bổ
sung trong VVC.

Hình 3: Ví dụ về dự đốn góc rộng trong VVC

Để giảm thời gian xử lý cho bộ mã hóa, biến đổi
Hadamard [5] đã được sử dụng như một phép biến đổi
thay thế và ước lượng chi phí RD (RDCost). Các chế
độ dự đốn có giá trị tổng sai khác sau biến đổi
(SATD) nhỏ nhất sẽ được bộ mã hóa chọn để tính tốn
chi phí RD và đưa ra quyết định lựa chọn chế độ dự
đốn cho khối hình hiện tại. Cụ thể, quy trình lựa chọn
chế độ mã hóa trong VVC được tiến hành theo các
bước sau:
Bước 1: Tính tốn tổng giá trị tuyệt đối sai khác sau
biến đổi (SATD) cho chế độ Planar, DC và các hướng
giống với HEVC (có mũi tên màu đen trong Hình 2),
sử dụng biến đổi Hadamard như công thức (1)
(1)
* TH T
SATD =
j TH * y − y

0: Planar
1: DC



(

org

pred

)

Trong đó: TH là ma trận biến đổi Hadamard, yorg là
giá trị pixel gốc, ypred là giá trị pixel dự đoán, THT là ma
trận chuyển vị của TH.
Bước 2: Lựa chọn N hướng có SATD nhỏ nhất (N
phụ thuộc vào kích thước khối hình) và các hướng bên
cạnh nó (là các hướng mới trong VVC, có mũi tên màu
đỏ trong Hình 2) để thêm vào tập các ứng viên.
Bước 3: Thêm các hướng có xác suất cao nhất cho
dự đoán (Most Probable Mode – MPM) để thêm vào
tập các ứng viên. Các hướng này là các hướng có tần

Hình 2: Các chế độ dự đốn nội khung trong VVC

Đối với các khối có dạng hình chữ nhật (N×N,
2N×2N, N×2N, N×3N…), VVC cho phép thay đổi vị
trí giữa các hướng để kết quả dự đoán được tối ưu nhất.
Tùy vào tỉ lệ Chiều Rộng / Chiều Cao của khối hình mà
các hướng dự đốn được thay thế khác nhau (Bảng I).
Chế độ này gọi là dự đoán góc rộng (Wide-angle intra
prediction). Hình 3 là một ví dụ sử dụng chế độ dự

ISBN 978-604-80-5958-3

i

136

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

suất xuất hiện nhiều nhất khi dự đốn các khối hình lân
cận.
Bước 4: Tính RDcost cho tập các ứng viên dựa vào
cơng thức (2) và (3)
2
(2)

VVC sử dụng cấu trúc cây phân chia tứ phân kết
hợp nhị phân và tam phân nên cho phép khối hình mã
hóa có kích thước dao động từ 4×4 đến 128×128. Đối
với các khối hình có kích thước từ 8×8 trở xuống, giá
trị các điểm ảnh trong khối hình khơng có nhiều sự
thay đổi.

SSD =  i j ( yorg − y pred )
RDCost = SSD+  × R

Bảng II: Tần suất được chọn của các chế độ dự đốn nội
khung

(3)

Chuỗi video

Trong đó SSD là tổng bình phương sai khác (Sum
Square Different), yorg là giá trị pixel gốc, ypred là giá trị
pixel dự đoán, λ là hằng số Lagrange, R là lượng bit
cần để mã hóa.
Chế độ dự đốn được bộ mã hóa lựa chọn là chế độ
có giá trị RDCost nhỏ nhất.
B. Các nghiên cứu giảm thời gian mã hóa cho dự
đốn nội khung trong H.266/VVC

BasketballPass
BlowingBubbles
BQSquare
RaceHorses

22
37
22
37
22
37
22
37

Planar
30.32
30.53
28.93
21.92
24.32
12.19

35.26
29.96

DC

Angular

17.96
24.83
16.99
26.49
14.67
26.36
18.87
24.41

51.73
44.64
54.08
51.59
61.01
61.46
45.87
45.63

TB.
Angular
0.10
0.09
0.11

0.10
0.12
0.12
0.09
0.09

Từ các phân tích và nhận định trên, chúng tơi đề
xuất thuật toán giảm thời gian dự đoán nội khung trong
H.266/VVC gồm các bước sau:
Bước 1: Kiểm tra kích thước khối hình cần mã hóa.
Nếu kích thước khối hình nhỏ hơn hoặc bằng 8×8, thay
đổi tập các chế độ dự đốn và tiến hành tính tốn
RDCost theo các bước đã nêu trong phần II.A. Tập các
chế độ dự đoán gồm: {Planar, DC, 2, 18, 34, 50, 66}.
Trong đó, chế độ Planar và DC là 2 chế độ có xác suất
được lựa chọn nhiều nhất; hướng số 18 và 50 là các
hướng theo chiều dọc và chiều ngang; hướng số 2, 34,
66 là hướng dự đốn tới các góc của khối hình (Hình
3). Nếu kích thước khối hình lớn hơn 8×8, chuyển sang
bước 2.
Bước 2: Thu thập thông tin về chế độ dự đốn nội
khung của các khối hình lân cận ở các vị trí phía trên,
bên trái, góc trên bên trái, góc trên bên phải để thêm
vào tập các ứng viên. Tiếp tục bổ sung các chế độ
Planar, chế độ DC và các chế độ liền kề vào các ứng
viên. Ví dụ, các chế độ của các khối hình lân cận là {a,
b, c, d} thì tập các ứng viên là {Planar, DC, a-1, a,
a+1, b-1, b, b+1, c-1, c, c+1, d-1, d, d+1}.
Bước 3: Tính tốn giá trị SATD sau khi biến đổi
Hadamard với các chế độ thu được ở bước 2.

Bước 4: Chọn ra 2 chế độ có giá trị SATD nhỏ nhất
và các chế độ trong tập MPM để tính tốn giá trị
RDCost.
Bước 5: Lựa chọn chế độ có giá trị RDCost nhỏ
nhất và kết thúc quá trình dự đoán.

Kể từ khi bắt đầu được triển khai xây dựng bộ mã
hóa vào năm 2015, các nghiên cứu giảm thời gian mã
hóa cho dự đốn nội khung liên tục được công bố.
Tác giả Naima Zouidi và cộng sự đề xuất phương
pháp giảm số lượng chế độ dự đốn tại cơng bố [6].
Dựa vào hệ số lượng tử và độ sâu phân chia nhị phân
của khối hình, bộ mã hóa sẽ đưa ra một danh sách N
chế độ dự đoán nhất định (N<35), qua đó giảm thời
gian tính tốn trong q trình biến đổi Hadamard.
Tác giả Yamei Chen [7] và cơng sự đề xuất phương
pháp kết thúc sớm quá trình lựa chọn chế độ dự đoán
bằng cách sắp xếp lại tập các chế độ dự đoán được lựa
chọn sau khi biến đổi Hadamard. Trong q trình tính
tốn RDCost, nếu giá trị RDCost của chế độ hiện tại
lớn hơn một giá trị ngưỡng cho trước thì quá trình lựa
chọn chế độ dự đoán dừng lại.
III. ĐỀ XUẤT PHƯƠNG PHÁP GIẢM THỜI
GIAN DỰ ĐỐN NỘI KHUNG TRONG VVC
Như đã trình bày ở phần I, việc tăng số lượng chế độ
dự đoán từ 35 lên 67 là nguyên nhân chính làm tăng
thời gian xử lý trong q trình dự đốn nội khung của
bộ mã hóa.
Để giải quyết bài tốn giảm thời gian mã hóa cho
chuẩn mã hóa video H.266/VVC, chúng tơi đề xuất

thuật tốn lựa chọn tập các ứng viên cho dự đoán nội
khung dựa trên đặc tính về kích thước khối hình và
thơng tin từ các khối hình lân cận.
Trước hết, chúng tơi thống kê ở phía giải mã tần suất
được chọn của các chế độ dự đoán được lựa chọn và
nhận thấy chế độ Planar và chế độ DC có tần suất xuất
hiện lớn nhất. Kết quả khảo sát 4 chuỗi video được
thống kê tại Bảng II. Có thể nhận thấy, tần suất chế độ
Planar được chọn dao động từ 12.19% đến 35.26%. tần
suất chế độ DC được chọn dao động từ 14.67% đến
26.49%. Đối với chế độ dự đoán theo hướng (hướng số
2 đến hướng số 67), tần suất được lựa chọn dao động từ
44.64% đến 61.46% (trung bình tần suất mỗi hướng từ
0.09% đến 0.12%).

ISBN 978-604-80-5958-3

QP

34

50

66

18
0: Planar
1: DC

2

Hình 3: Các chế độ dự đốn cho khối hình nhỏ hơn hoặc
bằng 8×8

137

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thơng và Cơng nghệ Thơng tin (REV-ECIT2021)

Trong đó, TO là thời gian xử lý của bộ mã hóa gốc,
TP là thời gian xử lý của bộ mã hóa sử dụng phương
pháp đề xuất.

Bắt Đầu

Bảng III: Các chuỗi video kiểm thử

Kích thước
Khối hình <= 8×8

Sai
Thu thập chế độ dự
đốn của các khối
hình lân cận

Đúng

Tập các chế độ dự
đốn gồm: {Planar,
DC, 2, 18, 34, 50,
66}.

Thêm các chế độ
Planar, DC và các chế
độ liền kề vào tập ứng
viên

Biến đổi Hadamard

Tốc độ
khung hình

Số khung
hình mã
hóa

BasketballPass

416×240

50 Hz

500

BQSquare

416×240

60 Hz

600

BlowingBubbles

416×240

50 Hz

500

RaceHorsesD

416×240

30 Hz

300

BasketballDrill

832×480

50 Hz

100

BQMall

832×480

60 Hz

100

PartyScene

832×480

50 Hz

100

RaceHorsesC

832×480

30 Hz

100

FourPeople

1280×720

60 Hz

100

Johnny

1280×720

60 Hz

100

Kimono

1920×1080

24 Hz

100

ParkScene

1920×1080

24 Hz

100

Bảng IV: Cấu hình phần cứng

Chọn 2 chế độ có
SATD nhỏ nhất và các
chế độ MPM

Tìm kiếm chế độ
dự đoán tốt nhất
theo các bước

trong phần II.A

Độ phân giải

Chuỗi video

Bộ vi xử lý

Tính tốn giá trị
RDCost

Đưa ra chế độ dự
đốn tốt nhất

RAM

Intel®
Core™
@2.7 GHz
8 GB

i7-4800MQ

Hệ điều hành

Window 10, 64-bit

Mơi trường

Microsoft Visual Studio 2017

Community

Các chuỗi video được kiểm thử 2 lần trong cùng một
điều kiện và môi trường. Các kết quả về thời gian mã
hóa của các chuỗi video được thu thập bằng cách lấy
trung bình thời gian mã hóa sau 2 lần chạy.

Kết Thúc

Thông số BDBR [9] được sử dụng để đánh giá về
mặt hiệu năng của bộ mã hóa. Thơng số này cho biết
lượng bit tiết kiệm khi đánh giá ở cùng mức chất lượng

Hình 4: Thuật tốn giảm thời gian dự đoán nội khung trong
H.266/VVC

B. Kết quả kiểm thử
IV.

Bảng V thống kê kết quả kiểm thử so sánh giữa
phương pháp đề xuất với bộ mã hóa video H.266/VVC
gốc.

MÔ PHỎNG VÀ ĐÁNH GIÁ KẾT QUẢ

A. Điều kiện kiểm thử
Phương pháp đề xuất được thực thi trên phần mềm
tham chiếu VVC Test Model 14 (VTM 14) [8], sử
dụng cấu hình mã hóa All-Intra (AI) ở 4 mức hệ số
lượng tử (QP) 22, 27, 32, 37.

Hình 5 cho biết kết quả lựa chọn chế độ dự đoán nội
khung Planar (các khối hình được đánh dấu bằng hình
vng và hình chữ nhật), chế độ dự đốn nội khung DC
(các khối hình được đánh dấu bằng hình trịn và hình
elip) khi sử dụng mơ hình mã hóa video gốc (Hình 5a)
và khi sử dụng phương pháp đề xuất (Hình 5b) với hệ
số lượng tử QP = 22. Kết quả được thu thập bằng phần
mềm Elecard StreamEye [10].

Các chuỗi video kiểm thử, môi trường kiểm thử
được thống kê cụ thể ở Bảng III và Bảng IV.
Mức độ giảm thiểu về thời gian xử lý của bộ mã hóa
được tính theo cơng thức (4):

T =

TP − TO
100%
TO

ISBN 978-604-80-5958-3

Từ bảng kết quả cho thấy phương pháp đề xuất giúp
tiết kiệm thơi gian ở tất cả các chuỗi video kiểm thử,
trung bình giảm từ 26.67% đến 28.47% thời gian mã
hóa. Đặc biệt đối với hai chuỗi video Kimono và

(4)

138

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

ParkScene (độ phân giải Full-HD) cho kết quả tiết
kiệm từ 29.35% đến 43.42% thời gian mã hóa. Trong
khi đó, lượng bit mã hóa trung bình giảm 0.07% khi so
sánh ở cùng mức chất lượng. Có thể giải thích việc tiết
kiệm lượng bit mã hóa là do trong q trình ước lượng
RDCost bằng biến đổi Hadamard, việc giảm số lượng
chế độ dự đoán trong tập các ứng viên đã giúp loại bỏ
đi một số chế độ gây ra sai lệch trong quá trình ước
lượng.

nâng cao chất lượng khung hình tái tạo sau giải mã
[12], tích hợp vào mơ hình mã hóa video liên lớp
SVVC [13], đồng thời áp dụng các kỹ thuật học máy,
học sâu tiên tiến để cải thiện hiệu quả của thuật toán.
VI.

Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa
học và công nghệ Quốc gia (NAFOSTED) trong đề tài
mã số 102.01-2020.15.

Bảng V: Kết quả giảm thời gian mã hóa (∆T) khi sử dụng
phương pháp đề xuất
∆T
Chuỗi video

TÀI LIỆU THAM KHẢO
[1]

BDBR

QP 22

QP 27

QP 32

QP 37

Trung
bình

BasketballPass

-23.63

-23.88

-24.75

-23.43

-23.92

-0.08

BQSquare

-24.72

-27.50

-29.19

-30.14

-27.89

-0.19

BlowingBubbles

-24.70

-26.29

-28.11

-28.36

-26.86

-0.07

RaceHorsesD

-24.39

-26.48

-26.88

-26.08

-25.96

-0.03

BasketballDrill

-19.68

-21.85

-24.95

-21.28

-21.94

-0.12

BQMall

-24.75

-26.08

-27.36

-26.96

-26.29

-0.08

PartyScene

-24.61

-26.90

-28.43

-28.87

-27.20

-0.12

RaceHorsesC

-27.41

-28.19

-29.62

-28.39

-28.40

-0.02

FourPeople

-23.59

-24.28

-24.41

-23.57

-23.96

-0.05

Johnny

-24.88

-22.92

-20.86

-17.65

-21.58

0.06

Kimono

-38.22

-38.73

-33.71

-29.35

-35.00

-0.04

ParkScene

-39.48

-41.51

-43.42

-43.41

-41.95

-0.07

Trung bình

-26.67

-27.88

-28.47

-27.29

-27.58

-0.07

[2]

[3]

[4]

[5]

[6]

[7]

[8]

a) Bộ mã hóa VVC gốc

b) Phương pháp đề xuất

[9]

Hình 5: Kết quả lựa chọn chế độ dự đốn Planar và DC
cho khung hình thuộc chuỗi video BasketballPass với hệ số
lượng tử QP = 22

V.

[10]
[11]

KẾT LUẬN

Trong bài báo này, chúng tơi trình bày và phân tích
q trình lựa chọn hướng dự đốn nội khung trong
chuẩn mã hóa video H.266/VVC, đồng thời đề xuất
một phương pháp giúp làm giảm thời gian mã hóa nội
khung bằng cách giảm số lượng ứng viên chế độ dự
đoán. Kết quả kiểm thử cho thấy thời gian mã hóa của
tồn bộ quá trình giảm trung bình từ 26.67% đến
28.47%. Hướng nghiên cứu tiếp theo của chúng tôi dự
kiến sẽ kết hợp phương pháp này với các phương pháp
đã được nhóm nghiên cứu đề xuất trước đó nhằm giảm
thời gian xử lý cho quá trình phân chia khối hình [11],

ISBN 978-604-80-5958-3

LỜI CẢM ƠN

[12]

[13]

139

B. Bross, J. Chen, J. -R. Ohm, G. J. Sullivan and Y. -K. Wang,
“Developments in International Video Coding Standardization
After AVC, With an Overview of Versatile Video Coding
(VVC),” in Proceedings of the IEEE, 2020.
G. J. Sullivan, J. Ohm, W. Han and T. Wiegand, “Overview of
the High Efficiency Video Coding (HEVC) Standard,” in
IEEE Transactions on Circuits and Systems for Video
Technology, vol. 22, no. 12, pp. 1649-1668, Dec. 2012.
F. Bossen, et al. , “AHG report: Test model software
development (AHG3),” in document JVET-X0003, 24th JVET
Meeting, by teleconference, 6–15 Oct. 2021.
A. Browne, J. Chen, Y. Ye and S. H. Kim, “Algorithm
description for Versatile Video Coding and Test Model 14
(VTM 14),” in document JVET-W2002, 23rd JVET Meeting,
by teleconference, 7–16 Jul. 2021.
W. K. Pratt, J. Kane and H. C. Andrews, "Hadamard transform
image coding," in Proceedings of the IEEE, vol. 57, no. 1, pp.
58-68, Jan. 1969.
N. Zouidi, F. Belghith, A. Kessentini and N. Masmoudi, "Fast

intra prediction decision algorithm for the QTBT structure," in
IEEE International Conference on Design & Test of Integrated
Micro & Nano-Systems (DTS), Gammarth-Tunis, Tunisia,
2019.
Y. Chen, L. Yu, H. Wang, T. Li, S. Wang, “A novel fast intra
mode decision for versatile video coding,” in Journal of Visual
Communication and Image Representation, vol. 71, pp.
102849, Aug. 2020.
VVCSoftware_VTM.
[Online].
Available:
/>G. Bjontegaard, “Calculation of average PSNR differences
between RD curves,” in document VCEG-M33, 13th ITU-T
VCEG Meeting, VCEG, Austin, TX, USA, Apr. 2001.
StreamEye.
[Online].
Available:
/>Xiem HV, Sang NQ, Minh DB, Minh DN and Duong DT,
"Fast QTMT for H.266/VVC Intra Prediction using EarlyTerminated Hierarchical CNN model," in 2021 International
Conference on Advanced Technologies for Communications
(ATC), HoChiMinh City, Vietnam, 2021.
Xiem HV and Hung NH, "Enhancing Quality for VVC
Compressed Videos with Multi-Frame Quality Enhancement
Model," in 2020 International Conference on Advanced
Technologies for Communications (ATC), Nha Trang,
Vietnam, 2020.
Xiem HV, Sangand F. Pereira, "Versatile Video Coding Based
Quality Scalability With Joint Layer Reference," in IEEE
Signal Processing Letters, vol. 27, pp. 2079-2083, 2020.

Phương pháp giảm thời gian dự đoán nội khung trong chuẩn mã hóa video H.266/Versatile Video Coding

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về