Tải bản đầy đủ (.docx) (95 trang)

ĐỒ ÁN HEVC : MÃ HÓA VIDEO HEVC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.06 MB, 95 trang )

1

MỞ ĐẦU
Những tiến bộ trong kĩ thuật nén Video đã giúp chúng ta truyền tải
được nhiều điểm ảnh hơn thông qua các kênh bị hạn chế về băng thơng và
đóng góp một phần khơng nhỏ trong q trình phát triển nhanh chóng của
những cơng nghệ sử dụng video. Với việc chúng ta ngày càng đạt được hiệu
quả mã hóa video cao hơn, các ứng dụng phân giải cao và tinh vi cũng ngày
càng phổ biến rộng rãi hơn. Tiêu chuẩn mã hóa video hiệu suất cao H265 hay
cịn được gọi là HEVC đã ra đời vào tháng 1 năm 2013 và đã đưa ra rất nhiều
cải tiến so với những tiêu chuẩn mã hóa Video trước đó. HEVC khơng những
cải thiện được hiệu suất mã hóa so với người tiền nhiệm H264 mà HEVC cịn
cung cấp những tính năng khác như giải quyết được những yêu cầu về công
suất và thông lượng cho các ứng dụng video hiện tại và cả trong tương lai.
Mặc dù hiện nay HEVC vẫn là một cơng nghệ mới và cịn chưa được áp dụng
rộng rãi, tuy nhiên với những ưu điểm của mình, chắc chắn HEVC sẽ ngày
càng phổ biến và được áp dụng trong những ứng dụng giải trí video trong
tương lai.
Đồ án này sẽ mô tả về cấu trúc cũng như những thuật toán được sử
dụng trong tiêu chuẩn HEVC. Đồ án sẽ bao gồm 3 chương:
Chương 1: Giới thiệu về chuẩn mã hóa video HEVC
Chương 2: Các kĩ thuật được sử dụng trong HEVC
Chương 3: Cấu trúc phần cứng bộ giải mã và bộ mã hóa HEVC
Bằng sự nghiên cứu của bản thân và sự giúp đỡ của thầy giáo Tiến Sĩ
Nguyễn Trung Tấn, Trung Tâm Kĩ Thuật Viễn Thông, Khoa Vô Tuyến Điện
Tử, Học VIện Kĩ thuật Quân sự em đã hoàn thành đồ án đúng thời hạn. Do
thời gian làm đồ án có hạn và trình độ cịn nhiều hạn chế nên sẽ khơng thể
tránh khỏi những thiếu sót. Em rất mong sẽ nhận được sự đóng góp của thầy
cơ cũng như các bạn học viên khác để hồn thiện thêm đồ án này. Em xin
chân thành cảm ơn thầy giáo Tiến Sĩ Nguyễn Trung Tấn cùng các thầy cô



2

khác trong khoa Vô Tuyến Điện Tử, các bạn học viên lớp CHKTDTK26A,
trường Học viện Kĩ thuật Quân sự đã tạo điều kiện giúp đỡ em trong thời gian
qua.

Hà Nội, Ngày.....Tháng.....Năm 2106
Học viên thực hiện

Ngô Anh Minh


3

CHƯƠNG 1
GIỚI THIỆU VỀ CHUẨN MÃ HÓA HEVC
1.1. Tổng quan về kĩ thuật mã hóa video
1.1.1. Nhu cầu thực tế của các kĩ thuật mã hóa video
Ngày nay, nhu cầu truyền tải và lưu trữ video ngày càng trở nên phổ biến
hơn trong xã hội. Trước đây, nếu chúng ta đã hài lịng với việc xem những
video có độ phân giải 720p hay 1080p thì hiện nay nhu cầu đó càng tăng lên
với sự xuất hiện của các chuẩn video 2K, 4K và thậm chí là 8K. Tuy nhiên
chất lượng hình ảnh càng cao thì yêu cầu về dung lượng lưu trữ cũng như khả
năng truyền tải hình ảnh cũng tăng theo. Vì vậy để thuận tiện cho việc lưu trữ
và truyền tải hình ảnh, các kĩ thuật nén video ra đời. Có rất nhiều cách để nén
video, nhưng thơng thường cách phổ biến nhất đó chính là làm giảm chất
lượng hình ảnh xuốngmức chấp nhận được để làm giảm dung lượng video.
Các kĩ thuật nén video tiên tiến hiện nay sử dụng các kĩ thuật mã hóa hiện đại
để làm giảm phần dư trong dữ liệu video.


Hình 1.1. Mơ hình mã hóa Video
1.1.2. Lịch sử phát triển của kĩ thuật mã hóa video
Bắt đầu kể từ những năm 1990, sự phát triển các tiêu chuẩn mã hóa
video đã được chia thành hai nhánh song song bao gồm: liên lạc video thời
gian thực và phân phối hoặc phát sóng các nội dung video. Vào năm 1984,


4

tiêu chuẩn mã hóa video số đầu tiên đã được cơng bố dưới cái tên ITU-T
H.120 “Bộ mã hóa và giải mã cho hội nghị truyền hình sử dụng truyền dẫn
nhóm số sơ cấp”. Nó được thiết kế cho các ứng dụng hội nghị truyền hình ở
tiêu chuẩn SD với tốc độ bit vào khoảng 1.5-2 Mbit/s nhưng nó vẫn chưa đạt
được các tiêu chí cần thiết để áp dụng cho các ứng dụng phát sóng khác. Các
khái niệm cơ bản bao gồm cấu trúc mã hóa DPCM và “bổ sung có điều kiện”,
với nội dung từ hình ảnh trước đó được sao chép tới hình ảnh hiện tại trừ
trường hợp nội dung khác nhau quá nhiều. Các bảng mã chiều dài thay đổi
(VLC) được sử dụng để mã hóa các phần tử cú pháp. Mặc dù không được sử
dụng nhiều nhưng H.120 vẫn còn tồn tại trong một số ứng dụng cho tới ngày
hơm nay.
Sau đó một tiêu chuẩn mã hóa video khác khá thành cơng đã ra đời mang
tên ITU-T H.261 “bộ mã hóa và giải mã video cho các dịch vụ nghe nhìn tại p
x 64 kbit/s”. H.261 được ban hành vào năm 1988 và được thiết kế để vận
hành ISDN với tốc độ trong khoảng 40 kbit/s tới 2 Mbits/s. So với H.120, nó
cung cấp một hiệu suất mã hóa được cải thiện và hỗ trợ nhiều các tốc độ bit
hơn. H.261 cũng là tiêu chuẩn mã hóa video đầu tiên dựa trên kế hoạch mã
hóa video lai. Nó bao gồm các khối cơ sở của tồn bộ các tiêu chuẩn mã hóa
video thành cơng trong hiện tại. Phần lớn cải thiện về hiệu suất nén của H.261
so với H.120 là do dự đoán bù chuyển động được thực hiện tại độ chính xác

mẫu.
Song song với q trình phát triển của ITU-T H.261, nhóm các chun
gia về ảnh động MPEG cũng bắt đầu quá trình phát triển một tiêu chuẩn mã
hóa video cho việc phân bố và quảng bá video. Vào 1993, MPEG-1 “Công
nghệ thông tin – mã hóa các hình ảnh động và âm thanh đi kèm cho phương
tiện lưu trữ số lên tới 1.5 Mbit/s – Phần 2: Video” (ISO/IEC 11172-2) được
phát hành. Lõi công nghệ của tiêu chuẩn này dựa trên kế hoạch mã hóa lai và
tương tự với H.261, MPEG-1 được thiết kế để giải quyết sự cần thiết của việc
phân phối thay vì liên lạc video. Ngồi các cơng cụ được giới thiệu trong


5

ITU-T H.261, tiêu chuẩn này thêm vào kĩ thuật bù chuyển động song hướng
và độ chính xác bán mẫu cho bù chuyển động. Nó cũng bao gồm các kì vọng
để kích hoạt tìm kiếm thuận/ngược nhanh trong dịng video. Chất lượng hình
ảnh giải mã tại tốc độ bit cao hơn và có thể đạt được các chỉ tiêu cho các băng
VHS thời bấy giờ. MPEG-1 còn được phát triển xa hơn thành MPEG-2 “Cơng
nghệ thơng tin – Mã hóa chung cho các hình ảnh động và âm thanh đi kèm –
Phần 2: Video”, cái được phát hành vào năm 1995. Phần mở rộng chủ yếu của
MPEG-2 là hỗ trợ mã hóa các phần tử video xen kẽ. Nhờ đó, mã hóa số của
truyền hình SD đã được hỗ trợ tốt. Ngồi ra, MPEG-2 cịn là tiêu chuẩn mã
hóa video đầu tiên chứa các công cụ cho khả năng mở rộng khơng gian và tái
tạo. Ngồi ra MPEG-2 cũng được phát hành bởi ITU với tên gọi H.262 và do
đó, có thể coi nó là tiêu chuẩn mã hóa video chung đầu tiên của hai tổ chức
tiêu chuẩn hóa ITU-T và MPEG.
Vào 1996, ITU-T phát hành H.263 “Mã hóa video cho truyền thông tốc
độ bit thấp”. H.263 được thiết kế cho các ứng dụng hội nghị truyền hình với
tốc độ bit cực thấp và nó vượt trội hơn hẳn tất cả các tiêu chuẩn mã hóa video
trước đó đo nó giới thiệu những cơng cụ mã hóa nâng cao cũng như thiết kế

VLC cải thiện. Trong vài năm, H.263 được mở rộng thành H.263+ và H.263+
+ giới thiệu một tập hợp lớn các cơng cụ mã hóa tăng cường hiệu quả hoạt
động cũng như hiệu suất nén như khả năng chống lỗi, phân mảnh dữ liệu...
Song song với việc ITU-T phát triển xa hơn H.263, MPEG cũng phát
triển MPEG-4 “Công nghệ thơng tin – mã hóa các đối tượng âm thanh–thị
giác – Phần 2: Thị giác” Tiêu chuẩn này nhắm tới việc trở thành tiêu chuẩn đa
phương tiện tích hợp tổng qt và phiên bản đầu tiên của nó được cơng bố
vào năm 1999. Để biểu diễn thông tin thị giác, tiêu chuẩn này bao gồm việc
mã hóa video có dạng chữ nhật thơng thường các các hình ảnh tĩnh. Sau này,
nó cịn hỗ trợ cho việc mã hóa các đối tượng có hình dạng bất kì và các nội
dung tổng hợp. Các ban mở rộng sau này của MPEG-4 còn thêm vào bù


6

chuyển động tồn thể và độ chính xác chuyển động phần tư mẫu với bộ lọc
nội suy được cải thiện.
Cùng sự gia tăng các nội dung video qua Internet, một tiêu chuẩn mã hóa
video mới với hiệu suất nén cao cần được nghiên cứu và do đó tiêu chuẩn
“Mã hóa video tiên tiến” H.264 ra đời vào năm 2003. Đây là một tiêu chuẩn
mã hóa có hiệu suất nén rất cao và trở thành cơng cụ mã hóa video rộn rãi
nhất trên thế giới cho đến thời điểm hiện tại. Vào năm 2010, các báo cáo cho
thấy tới 66% số lượng video được xem trên những trang web đều được mã
hóa với H.264.

Hình 1.2. Lịch sử phát triển các tiêu chuẩn mã hóa video
Ngày nay, với sự phổ biến của các nội dung video định dạng HD hoặc
UHD, chuẩn H.264 đã khơng cịn đáp ứng đủ với nhu cầu người sử dung. Do
đó, chuẩn mã hóa video H.265 hay cịn được gọi là HEVC (High Efficiency
Video Coding – Mã hóa video hiệu suất cao) đã ra đời. Đây là sự kế thừa và

nâng cấp của giao thức mã hóa video tiên tiến H264. So với H264 thì
H265/HEVC có thể cung cấp cùng một chất lượng video nhưng với tốc độ bit
chỉ bằng một nửa. HEVC có thể thích nghi nhanh hơn với đa hiện diện, đa hội
nghị và rất nhiều các ứng dụng video có độ phân giải cao và rất cao khác nữa.
Mặc dù hiện tại các nhà sản xuất vẫn còn dè dặt khi sử dụng HEVC nhưng


7

chắc chắn HEVC sẽ nhanh chóng trở thành một giao thức nén video phổ biến
trong tương lai.
1.2. Giới thiệu về chuẩn mã hóa video HEVC
1.2.1 Lịch sử ra đời và phát triển HEVC
Tiêu chuẩn mã hóa video HEVC chính là sự đúc kết những kinh nghiệm
mã hóa video trong bốn thập kỉ nghiên cứu và ba thập kỉ tiêu chuẩn hóa quốc
tế của rất nhiều các tổ chức trên thế giới.
Năm 2004, nhóm chuyên gia mã hóa video (VCEG) ITU-T đã bắt đầu
các nghiên cứu về các công nghệ tiên tiến có thể tạo ra các chuẩn nén video
mới. Vào tháng 10 năm 2004, một vài kĩ thuật khác nhau để cải thiện cho
chuẩn H.264 đã được khảo sát. Vào tháng 1 năm 2005, tại cuộc họp tiếp theo
của VCEG, VCEG đã bắt đầu thiết kế một chủ để có tên “Những vùng kĩ
thuật trọng yếu” (KTA) để nghiên cứu sâu hơn về vấn đề này. Một phần mềm
mã nền mang tên mã nền KTA được thiết lập để đánh giá những đề xuất đó.
Phần mềm KTA được dựa theo phần mềm tham chiếu mơ hình chung (JM)
mà được phát triển bởi đội phát triển video chung của MPEG và VCEG cho
H.264. Rất nhiều các công nghệ đề xuất bổ sung đã được tích hợp vào phần
mềm KTA và được thử nghiệm rất nhiều lần trong hơn bốn năm. MPEG và
VCEG đã thành lập một nhóm hợp tác chung về mã hóa video (JCT-VC) để
phát triển tiêu chuẩn HEVC
Mục tiêu chính của các nghiên cứu này là tạo ra một tiêu chuẩn nén

video hoàn toàn mới hoặc tạo ra một phần mở rộng cho H264. Ban đầu dự án
có tên là H.265 và H.NGVC và sau đó đã được đổi tên thành HEVC vào năm
2010.
Yêu cầu chính của NGVC là khả năng giảm tốc độ bit so 50% nhưng vẫn
có chất lượng hình ảnh tương đường với H.264 với độ phức tạp tính tốn
trong phạm vi từ 0.5 tới 3 lần. Tức là NGVC có thể làm giảm tốc độ bit 25%
với độ phức tạp tính tốn giảm 50% tuy nhiên vẫn nhận được hình ảnh với


8

chất lượng tương đương H264 hoặc tốc độ bit giảm nhiều hơn nữa với độ
phức tạp tăng lên một chút.
Nhóm chuyên gia ảnh động ISO/IEC đã bắt đầu một dự án tương tự vào
2007 và đặt tên dự án là mã hóa video hiệu quả cao. Vào tháng 7/2007, các
chuyên gia đã nhất trí rằng mục tiêu của dự án là sẽ làm giảm tốc độ bit 50%
so với tiêu chuẩn trước đó là AVC. Các tính tốn ban đầu được thực hiện với
một vài chỉnh sửa bộ mã hóa phần mềm tham chiếu KTA bởi VCEG. Vào
tháng 7/2009, các kết quả thử nghiệm cho thấy độ giảm tốc độ bit đã bằng
20% so với AVC và kết quả đó là động lực để MPEG hợp tác với VCEG trong
quá trình hồn thiện tiêu chuẩn HEVC.
Vào tháng 1 năm 2010, một kêu gọi đều xuất về công nghệ nén video
được đề ra bởi VCEG và MPEG. Tính tới tháng 4 năm 2010 thì đã có tổng
cộng 27 đề xuất hồn chỉnh đã được đệ trình. Các đánh giá cho thấy một vài
đề xuất có thể đạt được chất lượng video tương đương AVC với tốc độ bit
giảm đi một nửa trong rất nhiều các trường hợp thử nghiệm, với cái giá phải
trả là độ phức tạp tính tốn tăng từ hai tới mười lần. Một vài đề xuất khác thì
lại đạt được các kết quả chất lượng chủ quan và tốc độ bit khá tốt cùng với độ
phức tạp tính tốn thấp hơn so với phần mềm mã hóa tham chiếu AVC. Tại
cuộc họp đó thì cái tên HEVC đã chính thức được lựa chọn. Vào cuộc họp thứ

3 vào tháng 10 năm 2010 thì rất nhiều cơng cụ mã hóa và cấu hình cho HEVC
đã được thơng qua.
Vào 25/01/2013, ITU thông báo rằng HEVC đã bước đầu được thông
qua trong q trình thơng qua thay thế (APP) ITU-T.
Vào 13/04/2013 HEVC/H.265 được chấp thuận là một tiêu chuẩn ITU-T.
Tiêu chuẩn sau đó đã được chính thức phát hành bởi ITU-T vào 07/06/2013
và bởi ISO/IEC vào 25/11/2013.


9

Vào 11/07/2014, MPEG thông báo rằng ấn bản thứ 2 của HEVC sẽ bao
gồm ba phần mở rộng hoàn chỉnh là phần mở rộng đa điểm, phần mở rộng
phạm vi và phần mở rộng quy mô.
Vào 29/10/2014 phiên bản 2 của HEVC/H.265 được chấp thuận là một
tiêu chuẩn của ITU-T. Sau đó nó đã được phát hành chính thức vào
12/01/2015
Vào 29/04/2015, phiên bản thứ 3 của HEVC/ H.265 đã được chấp thuận
là một tiêu chuẩn của ITU-T.

Hình 1.3. Lịch sử phát triển của HEVC
1.2.2. Cấu trúc khối HEVC
Chuẩn HEVC được thiết kế dựa trên nguyên tắc mã hóa video lai dựa
trên cơ sở chia khối. Theo nguyên tắc này, trước hết một hình ảnh được phân
chia thành các khối và sau đó mỗi khối được dự đốn bằng cách sử dụng dự
đốn nội hình ảnh hoặc dự đốn liên hình ảnh. Trong khi các phương pháp
trước đây chỉ sử dụng các mẫu giải mã trong cùng một hình ảnh làm mẫu
tham chiếu thì HEVC sử dụng các khối chuyển vị của các hình ảnh đã được
giải mã làm mẫu tham chiếu. Dự đốn liên hình ảnh thường được sử dụng để
bù cho chuyển động của các đối tượng trong thế thế giới thực giữa các hình

ảnh của một chuỗi video, nó cũng được gọi là dự đốn bù chuyển động. Trong
khi dự đốn nội hình ảnh khai thác độ dư thừa không gian giữa các khối lân


10

cận trong một bức ảnh, dự đoán bù chuyển động sử dụng một số lượng lớn độ
dư thừa thời gian giữa các hình ảnh. Trong cả hai trường hợp, các lỗi dự đốn
kết quả mà được hình thành bởi việc so sự khác biệt giữa khối ban đầu và
khối dự đoán sẽ được truyền đi bằng cách sử dụng mã hóa biến đổi. Mã hóa
biến đổi sẽ khai thác độ dư thừa không gian bên trong một khối và bao gồm
một biến đổi tuyến tính giải tương quan, lượng tử hóa vơ hướng của các hệ số
biến đổi và mã hóa entropy của các mức hệ số chuyển đổi kết quả.

Hình 1.4. Sơ đồ khối của một bộ mã hóa HEVC với bộ giải mã đi kèm
Hiệu quả mã hóa mà một chuẩn mã hóa video lai có thể đạt được phụ
thuộc vào một vài khía cạnh thiết kế như là sử dụng các bộ lọc nội suy cho sự
nội suy mẫu con, hiệu quả của mã hóa entropy hoặc là các kĩ thuật lọc lặp
vòng. Tuy nhiên cơ sở chính cho việc cải tiến từ thế hệ này sang thế hệ khác
thường là do việc tăng số lượng khả năng hỗ trợ cho mã hóa một hình ảnh hay
một khối mẫu. Điều đó bao gồm tăng độ chính xác của vector chuyển động,


11

linh hoạt hơn trong việc chọn thứ tự mã hóa hình ảnh, mở rộng tập hợp các
hình ảnh tham chiếu khả dụng, tăng số lượng chế độ dự đoán nội bộ, tăng số
lượng dự đoán vector chuyển động, tăng số lượng kích thước biến đổi hỗ trợ
cũng như tăng kích thước khối cho dự đoán bù chuyển động.
Do sức mạnh tính tốn liên tục được cải tiến nên các chuẩn mã hóa video

mới hơn cũng hỗ trợ tập hợp tùy chọn mã hóa lớn hơn. Trong q trình phát
triển, HEVC sẽ càng ngày càng tỏ rõ ưu thế vì việc mã hóa các định dạng
video độ nét cao và cực cao ngày càng trở nên quan trọng hơn. Để đáp ứng
với những độ phân giải cao như vậy thì rất cần thiết để hỗ trợ kích thước khối
lớn hơn cho cả dự đốn bù chuyển động và mã hóa chuyển đổi. Tuy nhiên để
phù hợp với việc phân vùng khối tới các thuộc tính cục bộ của các hình ảnh,
cũng rất quan trọng trong việc hỗ trợ các kích thước khối nhỏ. Cả 2 mục tiêu
đều được đề cập trong HEVC bằng cách giới thiệu khái niệm phân vùng khối
theo cấp bằng cách sử dụng cú pháp cây tứ phân đơn giản và thống nhất
nhưng hiệu quả. Thêm vào đó, khái niệm phân vùng khối dựa theo cây tứ
phân này cho phép ứng dụng thuật toán tỉa cây nhanh tối ưu trong bộ mã hóa
để xác định cách phân vùng khối tốt nhất theo giá trị tốc độ bit-biến dạng
Lagrangian [2]
Trong tồn bộ các tiêu chuẩn mã hóa video trước đây của ITU-T và
ISO/IEC, mỗi hình ảnh của chuỗi video được phân thành các khối vĩ mô. Mỗi
khối vĩ mô bao gồm một khối 16x16 mẫu luma. Nếu định dạng mẫu chroma
4:2:0 được sử dụng thì khối vĩ mơ sẽ bao gồm 2 khối 8x8 mẫu chroma. Khối
vĩ mô được coi như là đơn vị xử lý cơ bản của các tiêu chuẩn này. Với mỗi
khối vĩ mô của một hình ảnh, một chế độ mã hóa được chọn bởi bộ mã hóa.
Chế độ mã hóa khối vĩ mơ được lựa chọn sẽ xác định rằng toàn bộ các mẫu
của khối vĩ mơ được dự đốn bởi dự đốn nội hình ảnh hay dự đốn bù
chuyển động. Chuẩn HEVC được thiết kế để cung cấp hiệu suất mã hóa vượt
trội so với người tiền nhiệm H264 cho toàn bộ các ứng dụng mã hóa video
hiện có. Trong khi tăng kích thước khối được hỗ trợ lớn nhất là có lợi với các


12

video có độ phân giải cao, việc này lại có thể có tác động bất lợi với hiệu suất
mã hóa của video có độ phân giải thấp, đặc biệt nếu các bộ mã hóa ít phức tạp

được sử dụng mà khơng có khả năng đánh giá tồn bộ các chế độ phân vùng
con hỗ trợ. Vì lí do đó, HEVC có một cơ chế linh hoạt cho phân vùng hình
ảnh video thành các đơn vị xử lý cơ bản với các kích thước có thể thay đổi.
Trong HEVC, mỗi hình ảnh được phân vùng thành các CTB hình vng sao
cho số CTB là như nhau đối với cả các thành phần hình ảnh luma và chroma
(giả sử khơng dùng định dạng video đơn sắc). Do đó mỗi CTB mẫu luma
cùng với 2 CTB mẫu chroma tương ứng và cú pháp liên quan tới các khối
mẫu được gộp lại thành CTU. CTU thể hiện đơn vị xử lý cơ bản trong HEVC
và nó có ý nghĩa tương tự như khối vĩ mơ trong các chuẩn mã hóa video trước
đó. CTB luma bao phủ một khu vực hình vng gồm 2Nx2N mẫu luma.
Trong định dạng mẫu chroma 4:2:0 , mỗi CTB chroma bao phủ một khu vực
2N-2x2N-1 mẫu chroma tương ứng với một trong 2 phần tử chroma. Tham số
N được truyền trên tập hợp tham số chuỗi và có thể dược chọn bởi bộ mã hóa
với các giá trị N bằng 4, 5 hoặc 6, tương ứng với kích thước CTU là 16x16,
32x32 và 64x64 mẫu luma. Kích thước CTU lớn hơn thơng thường sẽ cung
cấp hiệu suất mã hóa tốt hơn, nhưng cũng có thể làm tăng trễ mã hóa/giải mã,
dung lượng bộ nhớ cần thiết, và yêu cầu tính tốn phức tạp hơn của bộ xử lý
mã hóa. Bộ mã hóa có quyền tự do lựa chọn kích thước CTU mà cung cấp sự
bù trừ tốt nhất cho ứng dụng mà nó hướng tới. Để minh họa, hình 1.5 miêu tả
sự phân vùng của một hình ảnh 720p thành các khối vĩ mơ 16x16 và các CTU
64x64. Có thể thấy rằng mỗi khối vĩ mô 16x16 chỉ bảo phủ một khoảng rất
nhỏ của hình ảnh, nhỏ hơn rất nhiều vùng mà có thể miêu tả bằng cùng các
tham số chuyển động.
Với các chuẩn mã hóa video trước đây của ITU-T và ISO/IEC, một khối
vĩ mô không chỉ sử dụng để phân vùng hình ảnh video mà cịn thể hiện đơn vị
xử lý mà từ đó chế độ mã hóa được chọn bởi bộ mã hóa. Với mỗi khối vĩ mơ,
nó được lựa chọn để tất cả các mẫu của các khối luma và chroma tương ứng


13


được truyền sử dụng mã hóa liên hình ảnh hay dự đốn nội hình ảnh. Ngồi
ra, trong cả mã hóa nội hình ảnh và liên hình ảnh, một khối vĩ mơ có thể được
chia thành các khối nhỏ hơn cho mục đích dự đốn và báo hiệu các tham số
dự đốn.
Trong HEVC, đơn vị xử lý cơ bản có thể lớn như một khối 64x64 mẫu
luma. Một ứng dụng trực tiếp của cú pháp khối vĩ mô H264 tới đơn vị cây mã
hóa của HEVC có thể gây ra vài vấn đề. Một măt, chọn giữa dự đốn nội hình
ảnh và dự đoán bù chuyển động cho các khối lớn sẽ gây bất lợi với tỉ lệ tốc độ
bit-độ biến dạng. Tại lát P và B, hầu hết các mẫu có thể được dự đốn chính
xác sử dụng dự đốn bù chuyển đơng. Chỉ với một số ít các mẫu, mã hóa nội
hình ảnh mới có lợi hơn về tốc độ-biến dạng. Nếu tiêu chuẩn cho phép lựa
chọn giữa dự đốn bù chuyển động và mã hóa nội hình ảnh chỉ trên bậc của
đơn vị cây mã hóa thì sẽ xuất hiện những mất mát lớn trong hiệu suất mã hóa.
Thực tế thì việc cho phép lựa chọn giữa mã hóa nội hình ảnh và mã hóa liên
hình ảnh tại các đơn vị nhỏ hơn một khối vĩ mô 16x16 có thể tăng hiệu suất
mã hóa. Mặt khác, với việc cho phép các cấu trúc khối mịn như vậy cho dự
đoán bù chuyển động như trong H264, khái niệm các chế độ khối vĩ mô và
khối vĩ mô con cần được mở rộng. Ngồi ra, nếu kích thước biến đổi khơng
thể thay đổi trong một khối cây mã hóa, bộ mã hóa khơng thể thích nghi với
các thơng số cục bộ trong một hình ảnh video.


14

Hình 1.5 Phân vùng một hình ảnh 720p thành các khối vĩ mơ và các đơn vị
cây mã hóa: (a) Trong các chuẩn mã hóa trước HEVC; (b) Trong HEVC

Để khác phục những vấn đề tiềm ẩn trên, một đơn vị xử lý khác được gọi
là đơn vị mã hóa (CU) được giới thiệu trong HEVC. Một CTU có thể được

chia thành nhiều CU có kích thước khác nhau. Để thực hiện múc đích đó, mỗi
CTU bao gồm một cấu trúc cây tứ phân hay còn được gọi là cây mã hóa để
quy định việc phân chia CTU thành CU. Tương tự như CTU, CU bao gồm
một khối vuông các mẫu luma, 2 khối mẫu chroma tương ứng (cho các định
dạng video không đơn sắc) và cú pháp liên quan tới những khối mẫu đó.
Những mảng mẫu luma và chroma chứa trong CU được gọi là khối mã hóa
(CB).


15

Hình 1.6. Tám chế độ phân vùng CU thành các PU
Với mỗi CU, chế độ dự đoán được báo hiệu bên trong dịng bit. Chế độ
dự đốn chỉ ra rằng CU được mã hóa sử dụng dự đốn nội hình ảnh hay dự
đốn bù chuyển động. Nếu mã hóa nội hình ảnh được chọn, một trong 35 chế
độ dự đốn nội bộ không gian hỗ trợ sẽ được chọn cho CB luma và được báo
hiệu bên trong dòng bit. Nếu kích thước CU tối thiểu được xác định trong tập
hợp tham số chuỗi thì CB luma có thể được phân tích thành bốn khối con
vng có kích thước như nhau. Độc lập với kích thước CU, một chế độ dự
đốn chroma nội bộ riêng lẻ được lựa chọn cho một CU và được báo hiệu
trong dòng bit. Chế độ dự đoán chroma nội bộ được áp dụng cho cả các CB
chroma và có thể được lựa chọn từ năm ứng viên, với mỗi ứng viên biển diễn
một chế độ nội dự đoán được lựa chọn cho CB luma khối nội luma đầu tiên.
Nếu một CU được mã hóa sử dụng dự đốn liên hình ảnh, các CB luma
và chroma có thể được chia thêm thành các khối dự đoán (PB). Một khối dự
đoán là một khối các mẫu luma hoặc một thành phần chroma mà sử dụng
cùng các tham số chuyển động cho dự đoán bù chuyển động. Các tham số
chuyển động bao gồm số lượng các giả thuyết chuyển động (bằng một hoặc
hai) cũng như chỉ mục hình ảnh tham chiếu và vector chuyển động cho mỗi
giả thuyết chuyển động. Với cả hai CB chroma của một CU, cùng sự phân



16

chia như cho CB luma được sử dụng. PB luma và các PB chroma cùng với
các cú pháp có liên quan sẽ tạo thành một đơn vị dự đoán (PU). Với mỗi PU,
một tập hợp riêng lẻ của tham số chuyển động được báo hiệu trong dòng bit,
thứ được sử dụng cho dự đoán bù chuyển động của PB luma và các PB
chroma. HEVC hỗ trợ tám chế độ khác nhau cho việc phân vùng CU thành
các PU và được mơ tả trong hình 1.6
Việc hỗ trợ thêm các chế độ cho phân vùng khối hình ảnh thành các khối
con sử dụng cho dự đoán bù chuyển động thường cung cấp khả năng tăng
hiệu suất mã hóa. Tuy nhiên khả năng này chỉ có thể được khai thác nếu một
bộ mã hóa đánh giá được số lượng đáng kể các chế độ phân vùng được hỗ trợ.
Mặt khác, mào đầu cú pháp có liên quan tới số lượng gia tăng các chế độ thực
tế có thể làm giảm .CE. nếu so sánh với việc hỗ trợ số lượng nhỏ hơn các chế
độ. Tập hợp các chế độ phân vùng được hỗ trợ trong HEVC được chọn để có
một sự bù trừ hợp lý. Thêm vào đó, HEVC cung cấp khả năng vơ hiệu hóa
chế độ phân vùng bất đối xứng thông qua một mã phần tử cú pháp trong tập
hợp tham số chuỗi (SPS). Nếu các chế độ này bị vơ hiệu hóa, mã hóa entropy
của chế độ phân vùng được thay đổi sao cho các chế độ phân vùng cịn lại có
thể được báo hiệu với ít bit hơn. Tính năng này đặc biệt hữu dụng cho các bộ
mã hóa ít phức tạp mà khơng có đủ tài ngun tính tốn để đánh giá tồn bộ
các chế độ phân vùng có thể có.
1.2.3 Một số cải tiến của HEVC
HEVC mang lại rất nhiều các cải tiền so với các tiêu chuẩn mã hóa trước
đó. Một số các cải tiền của HEVC bao gồm:
• Tồn bộ q trình mã hóa: các nhà thiết kế bộ mã hóa được cho phép
mã hóa video sử dụng bất kì tiêu chí tìm kiếm và quyết định nào họ chọn miễn là định dạng đầu ra của họ phù hợp với các đặc điểm kĩ thuật định dạng
của tiêu chuẩn. Điều này đặc biệt bao gồm các ưu tiên có liên quan của các

đặc tính dịng bit khác nhau – tiêu chuẩn cho phép bộ mã hóa được thiết kế


17

chủ yếu cho độ phức tạp thấp, hiệu suất mã hóa cao, sự phục hồi tốt cho mất
mát dữ liệu, tối thiểu hóa trễ liên lạc thời gian thực…
• Rất nhiều khía cạnh của q trình giải mã: khi thể hiện với một dịng
bit đã được mã hóa đầy đủ và không lỗi, tiêu chuẩn yêu cầu bộ giải mã tạo ra
các giá trị dữ liệu hình ảnh được giải mã rõ ràng tại một số giai đoạn xử lý
như là “đầu ra” lý thuyết của chúng; tuy nhiên, nó khơng u cầu bộ giải mã
sử dụng chính xác cùng các bước xử lý theo thứ tự sản xuất dữ liệu đó.
• Mất mát dữ liệu và phát hiện hư hỏng và hồi phục: Tiêu chuẩn không
quản lý việc mà bộ giải mã sẽ làm nếu nó được trình bày với một dữ liệu
video không đầy đủ hoặc bị hư hỏng. Tuy nhiên trong các sản phẩm thế giới
thực, đối phó với các đầu vào khơng hồn hảo là một yêu cầu căn bản.
• Các chức năng bổ sung: các thao tác như truy cập ngẫu nhiên và đổi
kênh, các thao tác “chế độ mưu mẹo” như chuyển tiếp nhanh và quay lại mịn,
và các hàm khác như nối dòng bit đều vượt ra ngoài phạm vi của tiêu chuẩn
để cho phép các sản phẩm sử dụng dữ liệu đã mã hóa theo cách chúng chọn.
• Tiền xử lý, hậu xử lý và hiển thị: Thay đổi có chủ ý của dữ liệu đầu vào
bộ mã hóa và hậu xử lý điều chỉnh hình ảnh hậu giải mã được cho phép vì bất
kể lý do nào mà người thiết kế lựa chọn, và cách mà video được thể hiện sau
cùng (bao gồm các khía cạnh chủ chốt như độ chính xác của hoán màu) là
trách nhiệm của riêng mỗi sản phẩm.
Những cải tiến trên của HEVC là do HEVC đã sử dụng rất nhiều cơng cụ
mã hóa có hiệu quả bao gồm:
• Đơn vị cây mã hóa (CTU): HEVC thay thế các khối vĩ mô 16x16 điểm
ảnh bằng các đơn vị cây mã hóa, thứ sử dụng các cấu trúc khối lớn hơn có thể
lên tới 64x64 mẫu và có thể phân vùng hình ảnh thành các cấu trúc có kích

thước thay đổi tốt hơn. Kích thước khối càng lớn thì hiệu suất mã hóa sẽ càng
cao.


18

• Các cơng cụ xử lý song song: HEVC sử dụng hai công cụ xử lý song
song bao gồm xếp ngói và xử lý song song đầu sóng. Q trình xếp ngói sẽ
cho phép hình ảnh được chia thành các vùng dạng hình chữ nhật và có thể
được giải mã/mã hóa một cách độc lập với nhau. Cịn q trình xử lý song
song đầu sóng diễn ra khi một lát được chia thành các hàng CTU với hàng
đầu tiên được giải mã như bình thường nhưng các hàng sau đó thì có quyết
định được dựa trên hàng trước nó. Chi tiết về các cơng cụ xử lý này có thể tìm
thấy trong [1]
• Mã hóa Entropy: HEVC sử dụng thuật tốn mã hóa số học nhị phân
thích nghi theo thuộc tính (CABAC) cũng tương tự như CABAC trong H264,
tuy nhiên CABAC trong HEVC được thiết kế cho một thông lượng cao hơn
trong khi vẫn duy trì được hiệu suất nén cao hơn cho các kích thước khối
biến đổi lớn hơn.
• Nội dự đoán : HEVC vạch rõ 33 chế độ hướng cho nội dự đoán so với
8 chế độ hướng sử dụng trong H264. Ngồi ra HEVC cũng có thêm chế độ
nội dự đoán DC và các chế độ dự đoán phẳng. Chế độ dự đoán DC tạo ra một
giá trị trung bình bằng cách lấy trung bình các mẫu tham chiếu và có thể được
sử dụng cho các mặt phẳng. Các chế độ dự đốn phẳng trong HEVC thì hỗ trợ
tồn bộ các kích thước khối có trong HEVC trong khi chế độ dự đoán phẳng
trong H264 được giới hạn tới kích thước khối 16x16 điểm ảnh. Các chế độ
nội dự đoán sử dụng dữ liệu từ các khối dự đốn hàng xóm mà đã được giải
mã trước đó từ cùng một hình ảnh.
• Bù chuyển động: Với q trình nội suy các vị trí mẫu phân số, HEVC
sử dụng ứng dụng riêng biệt của một quá trình nội suy bán mẫu một chiều với

một bộ lọc 8 nút hoặc một quá trình nội suy phần tư mẫu với một bộ lọc 7 nút
trong khu H263 sử dụng một quá trình gồm 2 giai đoạn mà giai đoạn đầu xác
định các giá trị tại các vị trí bán mẫu sử dụng một quá trình nội suy 6 nút một
chiều riêng biệt và tiếp đó là q trình làm trịn nguyên rồi áp dụng quá trình


19

nội suy tuyến tính giữa các giá trị tại các vị trí bán mẫu gần đó để tạo ra các
giá trị tại các vị trí phần tư mẫu. Độ chính xác của HEVC đã được tăng cường
do bộ lọc nội suy dài hơn và loại trừ được lỗi làm tròn trung gian.
• Dự đốn vector chuyển động: HEVC cho phép 2 chế độ vector chuyển
động là dự đoán vector chuyển động nâng cao (AMVP) và chế độ sát nhập.
AMVP sử dụng dữ liệu từ hình ảnh tham chiếu và cũng có thể sử dụng dữ liệu
từ các khối dự đốn liền kề. Chế độ sát nhập thì cho phép các vector chuyển
động được xác định từ các khối dự đoán hàng xóm. Chế độ dự đốn trong
HEVC cũng tương tự các chế độ “bỏ qua” và “trực tiếp” trong H264 nhưng
với hai cải tiến. Thứ nhất là HEVC sử dụng thông tin chỉ số để lựa chọn một
trong một vài ứng viên khả dụng. Cải tiến thứ hai là HEVC sử dụng thơng tin
từ danh sách hình ảnh tham chiếu và chỉ mục hình ảnh tham chiếu.
• Bộ lọc giải khối: Bộ lọc giải khối cũng tương tự như thứ được sử dụng
trong H264 nhưng với thiết kế đơn giản hơn và cũng hỗ trợ cho các quá trình
song song tốt hơn. Trong HEVC, bộ lọc giải khối chỉ áp dụng cho các lưới
8x8 mẫu trong khi ở H264 là lưới 4x4 mẫu. Do bộ lọc giải khối sử dụng lưới
8x8 mẫu nên nó khơng gây ra các sự sụt giảm đáng kể nào mà lại đem tăng
cường đánh kể cho các quá trình song song vì bộ lọc giải khối không gây ra
các tương tác tầng với các tiến trình khác. Một thay đổi khác là HEVC chỉ
cho phép ba chiều dài bộ lọc giải khối từ 0 tới 2. HEVC cũng yêu cầu bộ lọc
giải khối trức tiên phải áp dụng lọc ngang cho các cạnh dọc tới hình ảnh và
chỉ sau đó, nó áp dụng lọc dọc cho các cạnh ngang tới hình ảnh. Điều này cho

phép nhiều q trình song song có thể được sử dụng cho bộ lọc giải khối.
Bảng 1.1. Các cải tiến của HEVC so với AVC
Cơng cụ
Đơn vị mã hóa cơ sở

AVC
Khối vĩ mô 16x16, khối

HEVC
Khối 8x8, 16x16, 32x32,

siêu vĩ mô 16x32 cho

64x64

mã hóa xen kẽ


20

Liên dự đốn

Nội dự đốn
Kích thước biến đổi

Hình vng, hình chữ

Hình vng, hình chữ

nhật đối xứng


nhật đối xứng và bất đối

Tối đa 9+4 chế độ
4x4, 8x8, hai giai đoạn

xứng
Tối đa 33+2 chế độ
4x4, 8x8, 16x16, 32x32

16x16

và các phiên bản không

vuông
Loại biến đổi
DCT
DCT hoặc DST
Lọc lặp vòng
Lọc giải khối
Lọc giải khối và SAO
Mã hóa Entropy
CABAC và CAVLC
Chỉ CABAC
• Bộ bù thích nghi mẫu (SAO): Bộ lọc bù thích nghi mẫu được áp dụng
sau bộ lọc giải khối và được thiết kế để cho phép việc tái cấu trúc các biên độ
tín hiệu gốc tốt hơn bằng các áp dụng các độ bù được lưu trữ trong bảng tra
cứu trong dòng bit. Bộ lọc SAO có thể bị vơ hiệu hoặc áp dụng theo một
trong hai chế độ: chế độ bù cạnh hoặc chế độ bù băng. Chế độ bù cạnh vận
hành bằng cách so sánh giá trị của một mẫu tới hai trong số tám hàng xóm của

nó sử dụng mổ rrong bốn mơ hình hướng Gradient. Dựa trên sự so sánh với
hai hàng xóm đó, mẫu sẽ được phân loại vào một trong năm loại: nhỏ nhất,
lớn nhất, một cạnh với mẫu có giá trị thấp hơn, một cạnh với mẫu có giá trị
cao hơn, hoặc đơn điệu. Với mỗi trong bốn loại đầu tiên, một độ bù sẽ được
áp dụng. Chế độ bù băng áp dụng một độ bù dựa trên biên độ của một mẫu
đơn lẻ. Một mẫu được phân loại bởi biên độ của nó tới 32 băng. Các độ bù
được xác định cho bốn băng liên tiếp trong 32 băng, vì trong các khu vực
phẳng, các biên độ mẫu có xu hướng được gom lại trong một khoảng nhỏ. Bộ
lọc SAO được thiết kế để cải thiện chất lượng hình ảnh, làm giảm nhiễu băng
và nhiễu vịng.
1.2.4 Hiệu suất mã hóa HEVC
Thiết kế của hầu hết các tiêu chuẩn mã hóa Video chủ yếu nhắm vào
mục tiêu là có hiệu suất mã hóa cao nhất. Hiệu suất mã hóa là khả năng mã


21

hóa video với tốc độ bít thấp nhất có thể trong khi vẫn duy trì được mức độ
chất lượng video hợp lý. Có hai cách để xác định hiệu suất mã hóa video, đó
là sử dụng các số liệu khách quan như tỉ lệ đỉnh tín hiệu-tới-tạp âm (PSNR)
hoặc sử dụng các đánh giá chủ quan về chất lượng video [1]. Trong đó việc
đánh giá chủ quan chất lượng video được coi là cách quan trọng nhất để xác
định rằng tiêu chuẩn mã hóa video có phù hợp hay khơng.
Bảng 1.2. So sánh độ giảm tốc độ bit trung bình của HEVC so với H264
Tiêu chuẩn mã

Độ giảm tốc độ bit trung bình so với H264
480p
720p
1080p

4K UHD

hóa Video
HEVC
52%
56%
62%
64%
Các lợi ích mà HEVC mang lại tới từ việc sử dụng các kích thước đơn vị
cây mã hóa lớn hơn. Với các đơn vị cây mã hóa càng lớn thì hiệu suất mã hóa
càng tăng trong khi thời gian mã hóa lại giảm đi so với H264. Điều này đã
được chứng minh bằng các phép thử PSNR với bộ mã hóa HEVC HM-8.0.
Ngoài ra HEVC cũng được so sánh với H264 về các đánh giá chủ quan. Video
đã được thực hiện mã hóa cho các ứng dụng giải trí và bốn tốc độ bit khác
nhau đã được tạo ra cho chín chuỗi video thử nghiệm. Thử nghiệm đánh giá
chủ quan này đã được thực hiện sớm hơn phép so sánh PSNR do đó nó sử
dụng phiên bản cũ hơn của HEVC, thứ mà có hiệu suất hơi chậm hơn một
chút. Và độ giảm tốc độ bít sau đó được xác định dựa trên điểm số đánh giá
trung bình của rất nhiều các khán giả. Và độ giảm tốc độ bit chủ quan tổng thể
cho HEVC so với H264 đã được xác định là 49.3%.
Như vậy, dù ta có sử dụng phương háp đánh giá đỉnh PSNR hay đánh giá
chủ quan chất lượng hình ảnh thì HEVC cũng cung cấp một độ giảm tốc độ
bit khoảng 50% so với người tiền nhiệm H264 [4]
1.2.5 Triển khai và ứng dụng HEVC trong thực tế
Từ khi ra đời cho đến nay, mặc dù HEVC vẫn chưa thể thay thế hoàn
toàn H264 tuy nhiên với những ưu điểm về hiệu suất mã hóa của mình,


22


HEVC cũng đã được ứng dụng rất nhiều trong thực tế bởi rất nhiều các hãng
công nghệ lớn trên thế giới.
Vào 29/02/2012, Qualcomn mô tả một bộ giải mã HEVC chạy trên một
chiếc máy tính bảng chạy hệ điều ành Android với chíp hai nhân SNAPdragon
S4 1.5 GHz, thể hiện cùng một chất lượng hình ảnh nội dung video được mã
hóa bởi H264 và HEVC song song với nhau. Trong buổi trình chiếu đó thì
HEVC cho thấy đã giảm được 50% tốc độ bit so với H264.
Vào 03/04/2013, ATEME công bố triển khai mã nguồn mở cỗ máy phần
mềm HEVC đầu tiên dựa trên bộ giải mã HEVC mở và một trình chạy video
GPAC. Bộ giải mã này hỗ trợ hồ sơ chính của HEVC và có thể giải mã video
1080p tại 30 fps sử dụng một CPU đơn nhân.
Vào 23/07/2013, MulticoreWare tạo ra mã nguồn khả dụng cho thư viện
mã hóa HEVC.
Vào 08/08/2013, cơng ty điện thoại và điện báo Nippon phát hành bộ mã
hóa phần mềm SDK HEVC-1000 hỗ trợ độ phân giải lên tới 8k và tốc độ
khung lên tới 120 fps.
Vào 14/11/2013, các nhà phát triển DivX đưa ra thông tin về hiệu suất
giải mã HEVC sử dụng CPU Intel i7 tại 3.5 GHz (CPU có 4 lõi và 8 luồng).
Bộ giải mã DivX 10.1 Beta có thể làm việc với 210.9 fps tại 720p, 101.5 fps
tại 1080p và 29.6 fps tại 4K.
Vào 18/12/2013, ViXS Systems tạo SoC Xcode 6400, SoC đầu tiên hỗ
trọ hồ sơ Main 10 của HEV.
Vào 05/04/2014 Công ty eBrisk Video và coongty Altera giới thiệu bộ
mã hóa HEVC tăng tốc FPGA có thể mã hóa video 4Kp60/10 bit thời gian
thực.
Vào 13/08/2014, Ittiam Systems giới thiệu bộ mã hóa và giải mã H265
thế hệ thứ ba hỗ trợ chế độ 4:2:2 12 bit


23


Vào 05/09/2014, hiệp hội đĩa Blu-Ray công bố đĩa Blu-Rau 4K hỗ trợ
video HEVC 4K tại 60 fps,, không gian 2020 màu, khoảng động cao và độ
sâu màu 10 bit. Đĩa Blu-Ray 4K này có tốc độ dữ liệu thấp nhất là 50 Mbits/s
và có thể bao gồm hỗ trợ cho các đĩa có dung lượng 66/100 GB.
Vào 18/09/2014, Nvidia ra mắt GeForce GTX 980(GM204) và GTX
970(GM204), những sản phẩm bao gồm Nvidia NVENC, bộ mã hóa phần
cứng HEVC đầu tiên trên thế giới nằm trong một card màn hình rời.
Vào 31/10/2014, Microsoft xác nhận rằng Window 10 sẽ hỗ trợ HEVC
Vào 03/12/2014, hệ điều hành Android Lollipop được phát hành và có
hỗ trợ HEVC sử dụng phần mềm của Ittiam Systems.
Vào 05/01/2015, ViXS Systems công bố Xcode 6800, SoC đầu tiên hỗ
trợ hồ sơ Main 12 của HEVC.
Vào 05/01/2012, Nvidia cơng bố chính thức SoC Tegra X1 với bộ giải
mã phần cứng cố định và đầy đủ chức năng cho HEVC.
Vào 22/01/2015, Nvideo phát hành GeForce GTX 960(GM206), bộ giải
mã phần cứng HEVC cố định và đầy đủ chức năng đầu tiên dành cho một
card màn hình rời.
Vào 27/01/2015, trình xem phim VLC media phiên bản 2.2.0 được phát
hành với hỗ trợ đầy đủ cho việc chơi các video HEVC. Các phiên bản tương
ứng trên các hệ điều hành Android và iOS cũng có khả năng chơi các video
HEVC.
Vào 31/03/2015, VITEC cơng bố MGW ACE, bộ mã hóa HEVC di động
dựa trên phần cứng 100% đầu tiên.
Vào 05/08/2015, Intel phát hành các sản phẩm Skylake với khả năng giải
mã/mã hóa cố định và đầy đu cho hồ sơ chính/8 bit và giải mã lai/không gian
cho hồ sơ Main 10/10 bit.


24


Vào 20/08/2015, Nvidia ra mắt GeForce GTX 950 (GM206), cái bao
gồm bộ giải mã phần cứng HEVC cố định và đầy đủ như trong GTX 960

Hình 1.7. Tình trạng hỗ trợ phần cứng cho HEVC
Vào 11/04/2016, hỗ trợ HEVC đầy đủ được thông báo trên phiên bản
MythTV mới nhất (0.28)
Vào 27/05/2016, Nvidia ra mắt GeForce GTX 1080 (GP104), cái bao
gồm bộ giải mã phần cứng cố định và đầy đủ cho hồ sơ HEVC Main 10 và
Main 12. Ngoài ra các mẫu GPU tiếp theo của Nvidia cũng bao gồm bộ giải
mã phần cứng này.
1.3. Tổng kết chương 1
Như vậy, chúng ta có thể thấy rằng, HEVC đã mang đến những cải thiện
vượt bậc so với người tiền nhiệm của nó H264, nhất là về hiệu suất mã hóa.
Trong thời đại bùng nổ về nhu cầu giải trí như hiện nay thì HEVC chính là
một giải pháp tốt để triển khai những dịch vụ video chất lượng cao như truyền
hình 4K, 8K, đa hiện diện, đa hội nghị... và rất nhiều những ứng dụng tiêu
dùng khác. Ngoài ra HEVC cũng tỏ ra hữu ích đối với người tiêu dùng trong
việc lưu trữ những video chất lượng cao và cực cao.


25

CHƯƠNG II
CÁC KĨ THUẬT ĐƯỢC SỬ DỤNG TRONG HEVC
2.1. Dự đốn nội hình ảnh và dự đốn liên hình ảnh
2.1.1. Dự đốn nội hình ảnh
Nội dự đốn của HEVC bao gồm ba bước: xây dựng mảng mẫu tham
chiếu, dự đoán mẫu, và hậu xử lý. Tất cả ba bước này được thiết kế để đạt
được hiệu quả mã hóa cao trong khi tối thiểu hóa những u cầu tính tốn

trong cả mã hóa và giải mã. Những phương pháp nội dự đốn HEVC có thể
được phân thành hai hạng mục. Hạng mục đầu tiên gồm 33 phương pháp dự
đốn góc và chúng cung cấp bộ mã hóa và giải mã cấu trúc mơ hình chính xác
cùng các cạnh định hướng. Hạng mục thứ 2 được gọi là dự đoán phẳng và dự
đoán DC, chúng cung cấp các bộ dự đoán khả năng ước lượng nội dung hình
ảnh mịn.
2.1.1.1. Tạo chuỗi tham chiếu
a) Sự thay thế mẫu tham chiếu:
Một vài hoặc tồn bộ các mẫu tham chiếu có thể khơng khả dụng cho
việc dự đoán. Trong trường hợp cực đoan với khơng có mẫu tham chiếu nào
khả dụng, tồn bộ các mẫu tham chiếu được thay thế bởi một giá trị mẫu
trung bình danh định cho một độ sau bit cho trước. Nếu có ít nhất một mẫu
tham chiếu được đánh dấu là khả dụng cho nội dự đoán, các mẫu tham chiếu
không khả dụng được thay thế bằng cách sử dụng các mẫu tham chiếu khả
dụng. Các mẫu tham chiếu không khả dụng được thay thế bằng cách quét các
mẫu tham chiếu theo chiều kim đồng hồ và sử dụng những giá trị mẫu khả
dụng mới nhất cho các mẫu khơng khả dụng.
b) Q trình lọc của các mẫu tham chiếu:
Các mẫu tham chiếu sử dụng bởi nội dự đoán HEVC được lọc có điều
kiện bởi một bộ lọc mịn tương như được thực hiện trong nội dự đoán 8x8 của


×