Tải bản đầy đủ (.pdf) (22 trang)

Nghiên cứu, giả lập âm thanh 3D từ hai nguồn phát âm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.1 MB, 22 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG

NGUYÊN TRƯỜNG SƠN

NGHIÊN CỨU, GIÁ LẬP ÂM THANH 3D

TỪ HAI NGUON PHAT AM

CHUYEN NGANH: KY THUAT VIEN THONG MA SO: 60.52.02.08

TOM TAT LUẬN VAN THẠC SĨ KY THUAT

HA NỘI - 2015

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<small>Luận văn được hoàn thành tại:</small>

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG

Người hướng dẫn khoa học: TS. Nguyễn Ngọc Minh Phản biện 1: PGS. TS Trần Xuân Nam

<small>Phản biện 2: PGS. TS Vũ Văn Yêm</small>

<small>Luận văn sẽ được bảo vệ trước Hội đồng châm luận văn thạc sĩtại Học viện Cơng nghệ Bưu chính Viên thơng</small>

<small>Vào lúc: 15h15, ngày 20 tháng 9 năm 2015</small>

<small>Có thê tìm hiéu luận van tại:</small>

- Thư viện của Học viện Cơng nghệ Bưu chính Viễn thơng

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

LỜI MỞ ĐẦU

Ngày nay, khi nền kinh tế xã hội đang ngày càng phát triển, nhu cầu của con người cũng ngày càng tăng cao. Trong đó, nhu cầu giải trí là một nhu cầu thiết yếu. Cụ thể như nhu cầu có một rạp hát, rạp chiếu phim tại gia cũng là một điều không quá xa vời. Tuy nhiên, những thiết bi đồ sộ không phải lúc nào cũng phủ hop với tat cả mọi người, rất nhiều gia đình khơng thé đủ khơng gian cho những thiết bị cơng kénh, hay nếu có thì họ lại khơng

muốn phịng khách của mình dày đặc những dây dợ, hoặc đơn giản hơn, họ chỉ muốn

thưởng thức và rất ngại các thao tác căn chỉnh, sắp đặt hàng loạt các loại thiết bị. Đứng trước vấn đề này, việc nghiên cứu, xây dựng một hệ thống âm thanh 3D ảo có thể tạo ra những hiệu ứng như của một hệ thống âm thanh vòm thực sự, nhưng sử dụng ít loa và cáp hơn là rất hữu ích.

Xuất phát từ ý tưởng đó, đề tài mà em chọn đó là: “Nghiên cứu, giả lập âm thanh

3D từ hai nguồn phát âm”. Đề tài sẽ nghiên cứu các van đề tổng quan về audio, các phương thức xử lý tín hiệu âm thanh, các ứng dụng, hạn chế của việc xử lý âm thanh trong nghiên cứu khoa học va áp dụng vào đời sống hàng ngày. Van dé cụ thé trong đề tài này là việc nghiên cứu về âm thanh 3D ảo, tạo ra tín hiệu âm thanh 3D tác động lên người nghe

thông qua hai nguồn phát âm.

Với mục tiêu mô phỏng thành công hệ thống ở mức độ thí nghiệm. Từ đó có thé phat

triển đề tài dé có thé áp dụng được trong đời sống, phục vụ nhu cau giải trí của con người.

Mục tiêu xa vời hơn của đề tài đó là có thể áp dụng được trong lĩnh vực truyền thông thông

tin, giúp các cuộc gọi, video call... có chất lượng âm thanh thực tế nhất, giúp người nghe va

<small>goi có cảm giác đang ở trong cùng một không gian chứ không phải đang đàm thoại thông</small>

qua thiết bị di đông.

Từ việc xác định các đối tượng nghiên cứu, tìm hiểu các tài liệu tham khảo, đi sâu phân tích và xây dựng thuật tốn dé có thé mơ phỏng hệ thống mong muốn. Nội dung của

đồ án được chia thành ba phần:

Chương 1: Tổng quan về audio và xử lý tín hiệu âm thanh

<small>Chương 2: Xử lý âm thanh 3D ảo</small>

Chương 3: Xây dựng ứng dụng xử lý âm thanh 3D ảo sử dụng hai nguồn phát âm

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

TONG QUAN VE AUDIO VÀ XU LÝ TÍN HIỆU ÂM THANH

1.1. Âm thanh

<small>1.1.1. Định nghĩa</small>

Âm thanh là sóng cơ học có biên độ nhỏ mà thính giác con người có thê nhận biết được, cụ thê hơn đó chính là các dao động cơ học của các phần tử, nguyên tử hay các hạt làm nên vật chất và lan truyền trong vật chất như các sóng. Ví dụ: Sóng âm phát ra từ một nhánh âm thoa, một dây đàn, một mặt trống đang rung động. Mỗi âm đơn có một tần số

<small>Don vi của tân sô là Hertz (việt tat là Hz). Đơi với thính giác của con người, âm</small>

thanh thường là sự dao động trong dai tan số từ 20Hz — 20.000Hz. Những dao động cơ có

CHƯƠNG 1

tần số dưới 20Hz gọi là hạ âm, trên 20.000Hz gọi là siêu âm.

<small>Bang 1. 1 Dai tần số âm thanh</small>

<small>f < 20 Hz20 Hz < f < 20.000 Hz20.000 Hz < f</small>

<small>Hạ âm</small> Âm (nghe được) <small>Siêu âm</small>

1.1.2. Quá trình lan truyền của âm thanh

Trong khơng khí, âm thanh lan truyền ở đạng sóng dọc. Trong chất rắn, âm thanh lan

truyền ở dạng sóng ngang. Trong mơi trường chân khơng, âm thanh không truyền lan được.

Khi âm thanh di chuyên đụng vật cản sẽ tạo ra các phản ứng sau:

- Phản xạ: Là hiện tượng sóng khi lan truyền tới bề mặt tiếp xúc của hai mơi trường thì bị đổi hướng lan truyền và quay trở lại môi trường mà nó đã tới.

- Khúc xạ: Sóng bị lệch khi di chuyền qua vật cản.

- Chiết xa: Sóng bị tách ra nhiều sóng tần số khi di chuyên qua vật trong suốt. - Khuếch xạ: Sóng di chuyên qua khe hẹp tạo sóng khuếch đại.

- Nhiễu xạ: Sóng cùng chiều hay khác chiều di chuyển hướng vào nhau, giao thoa với

<small>nhau cho ra nhiêu sóng cộng hay nhiêu sóng trừ.</small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<small>1.1.3. Các đại lượng vật lý của âm thanh</small>

1.1.3.1. Tần số

Tần số của âm đơn là số lần dao động của khơng khí truyền dẫn âm trong một đơn vị

thời gian là 1 giây. Tần số biểu thị độ cao (pitch) của âm thanh. Tần số càng lớn thì âm thanh càng cao và ngược lại. Như đã nói ở trên don vi dé do tần số của âm thanh là Hertz (viết tắt là Hz).

1.1.3.2. Áp suất âm thanh

Áp suất âm thanh hay còn gọi là thanh áp. Âm thanh truyền lan đến đâu thì làm thay đổi áp suất khơng khí ở đó. Áp suất do âm thanh tạo thêm ra ở một điểm gọi là thanh áp ở

điểm đó.

Don vi đo thanh áp là bar. Một bar là thanh áp tác động lên một diện tích 1 cm? mot <small>lực là Idyn.</small>

1.1.3.3. Tốc độ dao động âm

Khi có tác động của sóng âm thanh, các phần tử khơng khí dao động xung quanh vị trí cân bang của nó. Tốc độ dao động của các phan tử khơng khí do tác động của âm thanh gọi là tốc độ dao động âm (ký hiệu là v/m/s/).

1.1.3.4. Công suất âm thanh

<small>La năng lượng âm thanh đi qua một diện tích S trong thời gian một giây.</small>

<small>1.1.3.5. Cường độ âm thanh</small>

Cường độ âm thanh I là công suất âm thanh đi qua một đơn vi diện tích là 1 cm’.

<small>1.1.4. Các đặc tính của âm thanh1.1.4.1. Độ cao của âm</small>

<small>Độ cao của âm là một đặc tính sinh lý của âm và nó phụ thuộc vào một đặc tính khác</small>

của âm là tần số. Những âm có tần số khác nhau, tạo nên cảm giác về các âm khác nhau:

Âm có tần số lớn hơn gọi là âm cao hay âm thanh; âm có tần số nhỏ gọi là âm thấp hay âm trằm.

<small>1.1.4.2. Độ mạnh (Intensity)</small>

Do biên độ dao động của vật thé quyết định. Biên độ dao động là trị số lớn nhất mà <small>dao động dat tới trong một nửa chu kì. Biên độ dao động cảng lớn, âm thanh càng vang to</small>

và ngược lại. Don vi do độ mạnh của âm thanh là decibel (viết tắt là dB).

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>1.1.4.3. Độ dài (Length)</small>

Do thời gian dao động của vật thể quyết định. Độ dài của âm thanh tạo nên sự tương

phản giữa các bộ phận của lời nói, là yếu tố tạo nên trọng âm, tạo nên các nguyên âm đối lập nhau về độ dài.

1.1.4.4. Âm lượng của âm (độ to của âm)

<small>- Năng lượng của âm</small>

- Âm lượng của âm

1.1.4.5. Âm sắc của âm (Timbre)

Phụ thuộc vào độ cao, độ dài và độ mạnh tham gia bố sung vào các thành phần kết cau của âm. Âm sắc chính là cái sắc thái riêng của từng âm.

<small>Việc nghiên cứu, giả lập âm thanh 3D cũng chính là xử lý âm thanh. Trong đó xử lý</small>

âm thanh bao gồm nhiều lĩnh vực khác nhau, và tất cả đều liên quan đến sự hiện diện của âm thanh đối với người nghe. Chúng bao gồm:

<small>(1) Tái tạo lai âm nhạc với độ trung thực cao (High fidelity music) như là âm thanh ởcác đĩa compact.</small>

<small>(2) Viễn thông thoại hoặc là các mạng điện thoại.</small>

(3) Tổng hợp thoại (Synthetic speech) mà ở đó các máy tính tạo và nhận dạng các

<small>mẫu thoại của con người.</small>

1.2. Các đặc điểm của hệ thống thính giác con người

Hệ thống thính giác con người — Tai người là một cơ quan cực kì phức tạp. Hình 1.1 minh họa những kết cau chính của tai người. Tai ngồi (outer ear) gồm có hai phần, vành tai

- lớp da và sụn. Cuối ống tai là một màng mỏng được gọi là màng nhĩ (tympanic

membrane) hay còn gọi là trống tai (ear drum). Các sóng âm thanh đập vào màng nhĩ và làm

<small>cho nó rung động.</small>

Tai giữa là một tập hợp các xương nhỏ có nhiệm vụ truyền những rung động của màng nhĩ tới Ốc tai (cochlea) hay còn gọi là tai trong (inner ear. Tai trong là một ống nhỏ có

chứa dung dich chat lỏng, có đường kính khoảng 2mm và dai khoảng 3 cm.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

mà. Pháthiện Pháthiệntẩn Pháthiện

<small>Xươngtại lầnsốcao sốtrungbinh — lần sốthắp</small>

Hình 1. 1 Sơ đồ chức năng của tai người

1.3. Su cảm thụ của tai người đối với âm thanh

<small>1.3.1. Ngưỡng nghe</small>

1.3.2. Mặt nạ tần số (frequency masking)

<small>1.3.3. Mặt na thời gian</small>

1.3.4. Các dải băng tần giới hạn

Thông thường, dải tần số âm thanh có thể được phân chia thành 24 băng tới hạn

(băng 25 thường được sử dụng cho các ứng dụng mã hóa). Hệ thống thính giác có thể được mơ tả như một băng lọc, gồm 25 bộ lọc thông dải chồng lấn nhau, trong dải tần từ 0 đến 20kHz. Trong thực tế, tai người khơng có khả năng biết phân biệt trong cùng một dải tần tới han do sự che tan sé.

<small>Bang 1. 2 Các băng tan tới hạn và độ rộng băng tan</small>

<small>Dai tan Tan số giới Tân số trung Tan số giới Độ rộng băng</small>

<small>hạn dưới (Hz) tâm (Hz) hạn trên (Hz) tân (Hz)</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<small>Dai tần Tân số giới Tân số trung Tân số giới Độ rộng băng</small>

<small>hạn dưới (Hz) tâm (Hz) hạn trên (Hz) tan (Hz)</small>

1.4. Cac yếu tố ảnh hưởng đến âm thanh

1.4.1. Sự suy giảm năng lượng trên đường truyền 1.4.2. Ảnh hưởng của thời tiết và khí hậu

1.4.3. Hiện tượng nhiễu xạ

1.4.4. Hiện tượng hấp thụ âm thanh

<small>1.4.5. Hiện tượng 4m vang</small>

<small>1.5.Tín hiệu âm thanh tương tự1.5.1. Định nghĩa</small>

Ở dạng gốc, tín hiệu âm thanh là tín hiệu tương tự (analog), tức là tín hiệu có đường biểu diễn tần số và biên độ liên tục. Tín hiệu âm thanh giống như nhiều tín hiệu điện được đặc trưng bởi tần số, bước sóng, chu kỳ, biên độ và vận tốc lan truyền (tốc độ âm thanh).

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<small>1.5.2.Sự chuyền doi của sóng âm thanh sang tín hiệu điện</small>

Đề thực hiện chun đổi tín hiệu âm thanh (dạng sóng) sang tín hiệu âm thanh dang điện thì ta sử dụng thiết bị chuyên đổi là Micro.

<small>1.5.3.1.6.</small>

Hệ số méo trường âm: Khi có micro với kích thước nhất định đặt trong trường âm <small>thanh thì trường âm sẽ bị méo.</small>

Độ nhạy của micro: Độ nhạy (N) là tỉ số giữa điện áp ở đầu ra lớn nhất khơng bị méo có thé đạt được của micro U (đo bang mV) và thanh áp p cần thiết tác động vào micro

(do bang N/m’) khi sóng âm thanh lan truyền theo hướng trục của micro.

Đặc tuyến tần số của micro: Đặc tuyến tần số là sự phụ thuộc độ nhạy của micro vào

tần số.

Đặc tuyến hướng (búp hướng) của micro

<small>Trở kháng</small>

<small>Tạp âm nội bộ</small>

Các đặc điểm của tín hiệu âm thanh tương tự

Tín hiệu âm thanh số

<small>Định nghĩa</small>

Ở dạng gốc, tín hiệu âm thanh (tín hiệu âm tan) là tín hiệu tương tự (analog) có biên độ biến đồi liên tục theo thời gian (tín hiệu analog là tín hiệu liên tục về thời gian và trị số).

<small>1.6.2.1.6.3.</small>

Ưu điểm của tín hiệu âm thanh số

Nhược điểm của tín hiệu âm thanh số

Chuyển đổi tín hiệu tương tự sang tín hiệu số

Quy trình số hóa tín hiệu cụ thể bằng các bước như sau: Lọc thông thấp đầu vào

Lẫy mẫu (sử dụng kỹ thuật PCM)

<small>Lượng tử hóa</small>

<small>Mã hóa</small>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

1.6.5. Bộ chuyển đổi A/D

- Bộ chuyên déi A/D có nhiệm vụ chuyền từ tín hiệu âm thanh tương tự sang tín hiệu âm thanh số.

1.6.6. Bộ chuyển đối D/A

- _ Các bộ chuyền đổi D/A có nhiệm vụ chun từ tín hiệu âm thanh số sang tín hiệu âm thanh tương tự dé từ đó kết nối với các thiết bị âm thanh dân dụng.

- Qua trình chuyền đổi được mơ tả bang sơ đồ khối sau:

<small>Chuyển đổi D/A Ï Lấy và giữ mẫu Bộ lọc thông thấp</small>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

CHƯƠNG 2

KHÁI NIEM HAM TRUYEN ĐẠT HRTF

2.1. Giới thiệu một số âm thanh

2.1.1. Âm thanh mono

2.1.2. Âm thanh Stereo

2.1.3. Âm thanh 3D

<small>Hiệu ứng âm thanh 3D là một nhóm các hiệu ứng âm thanh và các dao động âmthanh được tạo ra bởi các loa stereo, loa âm thanh vòm, loa mảng, hoặc tai nghe. Hiệu ứng</small>

này giúp con người không chỉ cảm nhận được nguồn âm thanh đến từ trước mặt mà nó sẽ tạo ra nguồn âm thanh sẽ đến từ bat cứ nơi nao trong không gian ba chiều, bao gồm cả phía sau, phía trên và phía dưới người nghe. Về ban chất, tác động của âm thanh 3D lên tai cũng

<small>giống như tác động của hình ảnh 3D đối với mắt.Tác dụng của âm thanh 3D:</small>

- Âm thanh 3D đóng góp vào sự nhận thức tồn diện của con người đối với mơi

- Âm thanh đóng một vai trò quan trọng như là một kênh kết nối những phản hồi đối với những hành động và tình huống mà người nghe khơng nhìn thấy được mà chỉ

<small>nghe được trong không gian.</small>

<small>2.2. Không gian âm thanh ảo</small>

2.2.1. Âm thanh ảo (Virtual audio)

Âm thanh ảo là một quá trình mới của cơng nghệ mã hóa âm thanh trong khơng gian 3 chiều, dién ra một cách thụ động hoặc thông qua tương tác với nhau. Âm thanh ảo không địi hỏi thiết bị giải mã đặc biệt, nó cung cấp một mơ hình chính xác về q trình nghe.

<small>2.2.1.1. Quá trình nghe chọn lọc</small>

Trong lĩnh vực âm thanh, quá trình nghe có chọn lọc là co sở dé giảm bớt các yếu tố “stress”. Q trình nghe có chọn lọc trong hệ thống thính giác của con người là khả năng mà

bộ não có thể điều chỉnh để nghe những tín hiệu âm thanh mong muốn và khơng nghe

những tín hiệu âm thanh khơng mong muốn trong mơi trường của người nghe.

Khi sử dụng công nghệ âm thanh ảo, người nghe có thé chọn lọc dé nghe rất nhiều âm thanh, âm thanh cô định hoặc âm thanh động mà khơng có sự nhầm lẫn. Âm thanh được

<small>mã hóa trong Virtual Audio cho phép não bộ con người làm những gì mà nó thường xun</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

làm trong tự nhiên: Đó là chọn dé nghe những thành phần khác nhau của tín hiệu âm thanh

<small>trong mơi trường người nghe.</small>

<small>2.2.1.2. Quá trình ghỉ lại Virtual audio</small>

Các quá trình co bản của việc sử dụng hệ thống xử lý Virtual Audio (VAPS — Virtual

audio processing system) trong khi ghi âm bao gồm việc gửi một nguồn đơn âm thông qua

một kênh của hệ thống xử lý Virtual Audio và sau đó sẽ định vị âm thanh trong khơng gian

Quy trình xử lý VAPS gồm 5 bước:

<small>- Quy trình SES</small>

<small>- Quy trình Mix SES</small>

<small>- Quá trình Mix — Plus SES</small>

<small>- Quy trình xử lý thứ 4 là Multi-Track.</small>

- Quá trình ghi âm trực tiếp Virtual Audio.

2.2.2. Các yếu tố cần nghiên cứu

Mục tiêu của việc thiết kế hệ thống âm thanh 3D liên quan đến các khái niệm về khd năng kiểm sốt và việc cảm nhận khơng gian âm thanh của người nghe.

Một hệ thống âm thanh 3D sử dụng các quá trình xử lý dé b6 sung hoặc thay thé các

thuộc tính đã ton tại ngay từ đầu trong các nguồn âm thanh nhất định. Các mô phỏng âm

thanh ảo dé bị ảnh hưởng được liệt kê trong một số ví dụ sau:

(1) Mơ tả lại các điều kiện có trong khơng gian âm thanh của người. Ví dụ như việc

<small>mô tả lại bản ghi âm của một nghệ sĩ violin được thực hiện trong mơi trường có</small>

tiếng vọng.

<small>(2) Tao ra các trải nghiệm hoàn toàn mới trong khơng gian. Ví dụ như việc mơ</small>

phỏng âm thanh phát ra từ nghệ sĩ chơi violin nhỏ đến mức như tiếng của một con ruồi và mô phỏng nghệ sĩ đó chơi nhạc trong một căn phịng có tường câm thạch và kích thước băng một sân vận động.

(3) Trải nghiệm tiếp theo là sử dụng tai nghe (headphone), ví dụ như người dùng hệ thống âm thanh 3D sẽ có cảm giác như đang di chuyên trên một chiếc xe ơ tơ đến

một nơi, sau đó đi ra đường phố mặc dù chỉ ngồi tại chỗ cảm nhận những âm

thanh đó. Hệ thống âm thanh 3D được thiết kế tạo điều kiện thuận lợi tốt nhất

cho người nghe dé có thé kiểm sốt được sự tương tác trong mơi trường trải

<small>nghiệm.</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

Các đường truyền từ người điều khiển đến người nghe được mô tả theo các mơ hình từ đơn giản đến phức tạp. Các mơ hình này xét đến cùng có liên quan đến: Nguồn âm,

phương tiện truyền dẫn và người nghe.

Trong nghiên cứu về tâm lý, mục đích của mơ hình này là dé minh họa các thao tác

của biến âm độc lập làm tăng các âm thanh ảo trong không gian. Trong hệ thống âm 3D,

mục đích của nó là làm rõ sự khác nhau giữa đặc điểm âm thanh ảo trong không gian của người điều khiển va âm thanh ảo trong không gian của người nghe.

2.3. Ham truyền đạt HRTF (Head - related Transfer Function)

2.3.1. Khái niệm về HRTF

Hàm truyền đạt HRTF là một hàm đặc trưng cho cach mà tai người có thể cảm nhận

được một âm thanh từ một điểm trong không gian; một cặp ham HRTF cho hai tai có thể được sử dung dé tổng hợp âm thanh đến từ một điểm cụ thé trong không gian. Đây là một chức năng chuyền giao, nó sẽ mơ tả cách mà âm thanh từ một điểm cụ thê trong khơng gian truyền đến tai (thường ở đầu ngồi cùng của ống tai).

Con người ước tính vị trí của một nguồn âm bằng cách lấy tín hiệu có nguồn gốc từ một tai (dau hiệu mono), và băng cách so sánh tín hiệu nhận được ở cả hai tai (dấu hiệu

khác biệt). Trong số các dấu hiệu khác biệt là sự khác biệt thời gian đến và cường độ khác

nhau. Các tín hiệu mono đến từ sự tương tác giữa các nguồn âm thanh và cơ thể con người, trong đó âm thanh gốc được sửa đối trước khi nó đi vào ống tai dé xử lý băng hệ thống thính giác. Những thay đơi mã hóa các vị trí nguồn, có thé được nắm bắt qua một đáp ứng xung có liên quan đến các vị trí nguồn và vị trí tai. Dap ứng xung này được gọi là HRIR (Head — related impulse response). HRIR đã được sử dụng để tạo ra âm thanh vòm ảo.

</div>

×