CÔNG NGHỆ THOẠI IP
Bài 12: Công nghệ truyền Video
trên mạng IP
Sự phát triển về truyền Video qua Internet
• Hiện nay, với sự cạnh tranh khốc liệt yêu cầu có được các hình
ảnh và âm thanh thông tin trực tiếp cho thấy cần thiết việc phát
triển công nghệ truyền Video qua Internet.
• Với sự phát triển của hạ tầng mạng viễn thông và công nghệ nén
video, audio dẫn đến việc truyền dẫn tín hiệu truyền hình trực
tiếp qua mạng Internet (bao gồm IPSAT, Wifi, 3G, 4G…).
• Có nhiều công nghệ nâng cao chất lượng kỹ thuật đối với thiết bị
truyền dẫn chuyên dụng qua mạng Internet
Ứng dụng truyền tải video IP
Truyền hình trực tiếp
Quá trình thu và truyền dữ liệu Video
• Tín hiệu Video được thu trực tiếp tại hiện trường bằng Camera,
được mã hóa để đạt hệ số nén cao nhất.
• Tín hiệu được đóng gói bao gồm Video+Audio+Mã sửa lỗi sẽ được
truyền trực tiếp tới Video Server.
• Từ Video Server, tín hiệu mã hóa được định tuyến tới các bộ giải
mã của người dùng.
Pixels trong ảnh số
• Mỗi pixel là một dấu chấm nhỏ duy nhất của màu sắc đại diện cho
một phần của hình ảnh,
• Ảnh được tạo thành bởi hàng nghìn hoặc hàng triệu những điểm
nhỏ, mỗi điểm là một pixel.
• Một pixel tương tự như khái niệm về một kí tự đơn trên một
trang văn bản hoặc một byte dữ liệu đơn trên ổ đĩa cứng của máy
tính.
• Một pixel không mang quá nhiều chi tiết. Tuy nhiên, khi một pixel
được kết hợp với hàng ngàn hoặc hàng triệu pixel khác, một bức
ảnh rất thực tế có thể được tạo thành
Nguyên tắc tạo hình ảnh trên màn hình
• Trong một màn hình CRT, mỗi pixel là một nhóm nhỏ tập hợp
các điểm chất phốt pho, các điểm phốt pho phát sáng khi đụng
độ bởi một bọt electron (hoặc tia cathode) .
• Đối với màu sắc TV, pixels nhỏ nhất được tạo thành bởi ba điểm
màu khác nhau: xanh dương - đỏ - xanh lá
• Màn hình Plasma sửa dụng các bọt electron và phốt pho giống
như CRT , ngoại trừ các pixel có nguồn bọt microscopic của nó .
Trường video và khung hình
• Bất kì ai đã từng xem phim sử dụng máy chiếu đều biết rằng
phim chứa một chuỗi các ảnh tĩnh.
• Mỗi ảnh khá khác nhau so với ảnh trước nó và khi các ảnh được
chiếu cho khán giả trong sự nối tiếp nhau một cách nhanh gọn.
• Người xem sẽ cảm nhận được các ảnh đang chuyển động (do đó
thuật ngữ quen thuộc là motion pictures).
• Các ảnh trong máy quay phim được ghi lại ở tốc độ 24fps.
Hiện Video lên màn hình
• Để thực hiện viện hiện Video, chức năng quét (Scanning)
đúng cách , đồng bộ chính xác. Một chút trước khi các dữ
liệu chính trong mỗi dòng quét ngang là một xung đồng bộ.
• Tín hiệu video cũng chứa các dòng ngang có định dạng một
cách đặc biệt được gọi là đồng bộ dọc, nó biểu thị các dòng
ngang là dòng đầu tiên được vẽ trên màn hình.
Kỹ thuật nén Video
• Tín hiệu video sau khi được số hoá 8 bit có tốc độ 216 Mb/s.
• Để có thể truyền, tín hiệu video số cần phải được nén trong khi
vẫn phải đảm bảo chất lượng. Kỹ thuật “nén video số” loại bỏ đi
các thông tin dư thừa như:
• Dư thừa không gian giữa các pixel;
• Dư thừa thời gian do các ảnh liên tiếp nhau;
• Dư thừa do các thành phần màu biểu diễn từng pixel có
độ tương quan cao
• Dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít
với xác suất xuất hiện không đều nhau;
Tiêu chuẩn MPEG
• MPEG có xuất xứ từ Moving Picture Experts Group (Nhóm các
chuyên gia điện ảnh) ra đời hồi năm 1988 nhằm phát triển các
tiêu chuẩn về cái vụ nén phim số (digital video) và âm thanh số
(digital audio).
• Các tiêu chuẩn mà MPEG đưa ra khá đa dạng, cung cấp video có
chất lượng cao hơn các định dạng video số thông thường
• Hiện nay, trên thế giới có sử dụng rộng rãi 3 chuẩn MPEG-1,
MPEG-2 và MPEG-4
Nguyên lý nén MPEG
Chuẩn nén MPEG-1
• MPEG-1 là chuẩn của VideoCD và đĩa CD-I (Compact Disc –
interactive, đĩa CD tương tác).
• MPEG-1 là mã hoá tín hiệu Audio-Video với tốc độ khoảng
1.5Mb/s và lưu trữ trong đĩa CD với chất lượng tương đương
VHS.
• MPEG-1 cho video có độ phân giải 353x240 pixels với tốc độ 30
khuôn hình một giây (fps).
Chuẩn nén MPEG-2
• MPEG-2 chia thành hai cấp là DVD Video và SuperVCD
(SVCD).
• MPEG-2 cũng được dùng trong truyền hình kỹ thuật số.
• MPEG-2 cho video có độ phân giải 720x480 và 1280x720 pixel với
tốc độ 60fps và âm thanh đạt chất lượng AudioCD.
Chuẩn nén MPEG-4
• MPEG-4 là chuẩn thuật toán đồ họa và video dựa trên hai chuẩn
MPEG-1, MPEG-2 và công nghệ QuickTime của Apple.
• Nhờ có kích thước nhỏ hơn và tốc độ truyền tải thấp hơn, MPEG4 có thể truyền qua một băng thông hẹp hơn, có thể trộn video với
text, đồ họa, các lớp 2D và 3D động,... Nó đã được tổ chức ISO
công nhận vào tháng 10-1998.
• MPEG-4 dùng rộng rãi trong truyền hình trên mạng Internet.
Cấu trúc dòng Bít MPEG Video
Các loại ảnh (frame) trong chuẩn MPEG
• Bao gồm các loại ảnh I, ảnh P, ảnh B
Ảnh I (Intra Pictures)
• Ảnh I : được mã hóa mà không có sự so sánh tham khảo các ảnh
khác, dùng trong nén trong ảnh.
• Ảnh I chứa tất cả các thông tin cần thiết để tái tạo lại ảnh sau giải
mã, nên tỷ lệ nén các ảnh I tương đối thấp.
• Ảnh I là điểm nút quan trọng phục vụ việc truy cập vào một đoạn
Video.
Ảnh P (Predicted Pictures):
• Ảnh P được mã hoá từ ảnh I và ảnh P trước đó, nhờ sử dụng các
thuật toán dự đoán bù chuyển động.
• Các ảnh P có thể được sử dụng như là cơ sở dữ liệu cho việc dự
đoán ảnh tiếp theo.
• Do hạn chế của kỹ thuật bù chuyển động, số ảnh P giữa hai ảnh I
không thể quá lớn. Tỷ lệ nén của các ảnh P tương đối lớn so với tỷ
lệ nén các ảnh I.
Ảnh B (Bidirectionally Predicted Pictures)
• Ảnh B được mã hoá bới phép nội suy giữa các ảnh I và P ở trước
và sau đó.
• Vì không được sử dụng để mã hoá các ảnh tiếp theo, ảnh B không
sinh ra các lỗi ảnh trong quá trình mã hoá.
• Các ảnh B cho tỷ lệ nén cao nhất.
Xác định Vector chuyển động (Motion Estimation)
• Xác định vetor chuyển động được sử dụng để nén sự dư thừa về
thời gian, ví dụ như trong miền thời gian qua hai Frame liên tiếp.
• Việc xác định vetor chuyển động thực hiện phép phân tích giữa
hai frame liên tiếp và xác định những miền của hình ảnh có thay
đổi hay chuyển động giữa các ảnh.
• Nếu miền di chuyển theo một hướng xác định, thuật toán xác định
vetor chuyển động điều khiển quá trình giải mã để sử dụng các
mảnh (piece) của hình ảnh như trong ảnh dự đoán
Bù chuyển động
• Bù chuyển động thực hiện việc thiết lập lại các khung hình
(frame) trên cơ sở các Vector đã nhận được, dữ liệu khung hình
delta đã nhận (dữ liệu khác nhau giữa hai khung hình liên tiếp) và
hình ảnh đã mã hoá trước đó.
• Nếu dữ liệu được nhận, thì dòng khung hình được thiết lập lại
bằng việc cộng dữ liệu khung hình delta với dữ liệu từ khung hình
đã được giải mã trước đó trong vị trí riêng đã được chỉ dẫn bằng
Vector chuyển động đã nhận được.
Streaming Video
• Streaming video là giao thức cho phép truyền các dữ liệu VideoAudio trực tuyến tới người dùng, cho phép các phần mềm (media
player, web browser) truy cập và xem video từ các máy chủ theo
mô hình server/client
Các giao thức Streaming Video
• Một số giao thức streaming được xây dựng và phát
triển dành cho truyền Video-Audio trực tuyến.
• RTSP (Real Time Streaming Protocol): Giao thức do
IETF phát hành với giao thức RTP và RTCP.
• RTMP (Real Time Messaging Protocol) là giao thức
TCP được phát triển bởi Adobe
• MMS (Microsoft Media Services) được phát triển bởi
Microsoft dùng trong hệ thống Windows Media.
• RealNetworks cũng phát triển giao thức RealNetwork
Data Transport (RDT) để dùng cho cá giải pháp của
họ.
Giao thức RTSP
• RTSP được thiết kế để sử dụng giao tiếp giữa máy client và máy
streaming server.
• RTSP được sử dụng để thiết lập và điều khiển phiên giao dịch
giữa các máy tính (end points).
• RTSP bao gồm 2 thực thể là RTSP Server và RTSP Client
• Hiện thức trên browser rtsp://