Tải bản đầy đủ (.docx) (22 trang)

PHÂN ĐOẠN TÍN HIỆU (TRÊN MIỀN THỜI GIAN) THÀNH TIẾNG NÓI VÀ KHOẢNG LẶNG DỰA TRÊN VIỆC áp DỤNG THUẬT TOÁN CHUẨN HOÁ VÀ TÍNH NĂNG LƯƠNG NGẮN HẠN STE(10 điểm))

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (800.68 KB, 22 trang )

Báo cáo bài tập lớn mơn học Xử lý tín hiệu số, HK1 năm học 2019-2020

PHÂN ĐOẠN TÍN HIỆU (TRÊN MIỀN THỜI GIAN) THÀNH
TIẾNG NÓI VÀ KHOẢNG LẶNG DỰA TRÊN VIỆC ÁP DỤNG
THUẬT TOÁN CHUẨN HOÁ VÀ TÍNH NĂNG LƯƠNG NGẮN
HẠN STE
(10 điểm kèm source code + hướng dẫn chi tiết)
Nhóm X, lớp HP: X
Điểm

Bảng phân cơng nhiệm vụ

Chữ ký của SV
(mỗi SV ký xác
nhận trước khi
nộp báo cáo)

LỜI CAM ĐOAN: Chúng tơi, gồm các sinh viên có chữ ký ở trên, cam đoan rằng báo cáo này
là do chúng tôi tự viết dựa trên các tài liệu tham khảo liệt kê ở cuối báo cáo. Các số liệu thực
nghiệm và mã nguồn chương trình nếu khơng chỉ dẫn nguồn tham khảo đều do chúng tôi tự làm.
Nếu vi phạm thì chúng tơi xin chịu trách nhiệm và tn theo xử lý của giáo viên hướng dẫn.
TÓM TẮT— Phân đoạn tín hiệu thành tiếng nói và khoảng lặng là một bài toán cần thiết
trong các ứng dụng thực tiễn ngày nay nhầm cung cấp các dịch vụ tốt cho đời sống và các cơng
trình nghiên cứu về tín hiệu âm thanh. Bài báo cáo này thực hiện việc phân đoạn tín hiệu
thành các khoảng lặng và tiếng nói bằng phương pháp chia nhỏ tín hiệu và chuẩn hố năng
lượng của tín hiệu dựa trên việc xử lí và thử nghiệm với 4 file tín hiệu với 2 mơi trường khác
nhau là phòng lab và phòng thu studio bao gồm : lab_male.wav, lab_female.wav,
studio_male.wav, studio_female.wav. Từ kết quả trong việc xử lí cho ta thấy độ hiệu quả của
thuật toán đúng sát với 2 môi trường thực nghiệm.



2

Nhóm , lớp HP:


3

I.

ĐẶT VẤN ĐỀ

Ngày nay, nhờ vào công cuộc cách mạng 4.0, tiếng nói khơng chỉ đơn thuần là cơng cụ giao
tiếp giữa con người, mà tiếng nói cịn được đem đi xử lí để áp dụng cho các ứng dụng trí
tuệnhân tạo xử lí giọng nói nhầm nâng cao đời sống của con người. Tuy nhiên một tín hiệu
âm thanh cơ bản khơng chỉ tiếng nói mà cịn xen lẫn vào đó là các khoảng lặng và các tạp âm
gây nhiễu làm cho việc phân biệt đâu là tiếng nói và đâu là tạp âm hay khoảng lặng cần loại
bỏ là bài toán cần giải quyết đầu tiên
Bài báo cáo này, chúng tơi đưa ra phương pháp xử lí phân biệt giữa tiếng nói và khoảng
lặng bằng phương pháp chia nhỏ tín hiệu âm thanh ra các mẫu có độ dài tín hiệu 10ms kết
hợp việc tính tốn năng lương của các thành phần của tín hiệu sau khi được chia nhỏ để tìm
ra ngưỡng chung để phân biệt được tiếng nói và khoảng lặng.
Bài báo cáo này có bố cục như sau: Phần II trình bày về cơ sở lý của các thuật toán và các
vấn đề liên quan đến việc phân đoạn tiếng nói dựa trên việc chia nhỏ tín hiệu ra các đoạn
có độ dài 10ms và tính năng lương của tín hiệu, từ đó tìm ra ngưỡng năng lương để phân
biệt giữa tiếng nói và khoảng lặng. Phần III trình bày mã nguồn cài đặt các thuật tốn. Phần
IV trình bày kết quả thực nghiệm mơ tả dữ liệu dùng để đánh giá độ chính xác của thuật
tốn, đưa ra các đánh giá định tính và định lượng, so sánh các thuật toán đã cài đặt với
nhau. Phần V trình bày kết luận, tóm lại các kết quả đã đạt được và đề xuất các hướng phát
triển và cải thiện trong tương lai.


LÝ THUYẾT XỬ LÝ TÍN HIỆU
TIẾNG NÓI VÀ CÁC THUẬT TỐN

II.

A.

Tiếng nói và biểu diễn tiếng nói dưới dạng tín hiệu


Định nghĩa âm thanh.

Là các dao động cơ học (biến đổi vị trí qua lại) của các phân tử, nguyên tử hay các hạt làm
nên vật chất và lan truyền trong vật chất như các sóng. Âm thanh, giống như nhiều sóng, được
đặc trưng bởi tần số, bước sóng, chu kỳ, biên độ và vận tốc lan truyền (tốc độ âm thanh).
Đối với thính giác của người, âm thanh thường là sự dao động, trong dải tần số từ khoảng
16 Hz đến khoảng 20 000 Hz, của các phân tử khơng khí, và lan truyền trong khơng khí, va đập
vào màng nhĩ, làm rung màng nhĩ và kích thích bộ não. Tuy nhiên âm thanh có thể được định
nghĩa rộng hơn, tuỳ vào ứng dụng, bao gồm các tần số cao hơn hay thấp hơn tần số mà tai người
có thể nghe thấy, khơng chỉ lan truyền trong khơng khí mà cịn truyền trong bất cứ vật liệu nào.
Trong định nghĩa rộng này, âm thanh là sóng cơ học và theo lưỡng tính sóng hạt của vật chất, sóng
này cũng có thể coi là dòng lan truyền của các hạt phonon, các hạt lượng tử của âm thanh.
Và thực chất tiếng nói cũng là âm thanh


4

Nhóm , lớp HP:




Biểu diễn âm thanh tiếng nói dưới dạng tín hiệu

Tín hiệu tiếng nói là tín hiệu tương tự, do đó khi biểu diễn tín hiệu tiếng nói trong mơi trường
tính tốn tín hiệu số, việc biểu diễn và lưu trữ sao cho không bị mất mát thông tin là vấn đề rất
quan trọng trong các hệ thống thơng tin sử dụng tiếng nói.
Việc xem xét các vấn đề xử lý tín hiệu tiếng nói trong các hệ thống này được dựa trên ba vấn
đề chính:
- Biểu diễn tín hiệu tiếng nói dạng số.
- Cài đặt các kỹ thuật xử lý tinh vi.
- Các lớp ứng dụng dựa trên kỹ thuật xử lý số tín hiệu.
Để áp dụng các phương pháp xử lý tín hiệu số cho tín hiệu tiếng nói chúng ta phải biểu diễn
tín hiệu tiếng nói dưới dạng rời rạc.

Biểu diễn tín hiệu tiếng nói

Biểu diễn dạng sóng

Biểu diễn dạng tham số

Các tham số của bộ máy
Các tham số kích thước
B.

Xử lí bài tốn
a)
1.

Các thuật tốn áp dụng


Chia nhỏ tín hiệu thành các khung có độ dài 10ms.
Từ tín hiệu lấy được, ta chia tín hiệu thành các khung(frames) khơng chồng lên
nhau, mỗi khung(frames) có độ dài là 10ms
Từ mỗi khung đã chia được, ta thu được số lượng mẫu trong mỗi khung(được dùng để tính
năng lượng ngắn hạn).


5

2.

Tính năng lượng ngắn hạn (Short-Term Energy).
Sau khi đã chia nhỏ tín hiệu, ta tiếp tục tính năng lượng ngắn hạn của mỗi khung
nhờ vào cơng thức
Trong đó : Ek : năng lượng ở khung thứ k
Nlk : vị trí mẫu đầu tiên của khung thứ k
Nrk : vị trí mẫu cuối cùng của khung thứ k

3.

Thuật toán chuẩn hoá tín hiệu bằng phương pháp phân phối chuẩn tắc
Vì dải biên độ của tín hiệu có giá trị khác nhau và khó có thể xác định ngưỡng
chung do đó ta áp dụng thuật toán chuẩn hoá chuẩn tắc để chuẩn hố dải biên độ mà
khơng phụ thuộc vào dải rộng biên độ.
Phân phối chuẩn là một trong các phân phối xác suất quan trọng nhất của toán
thống kê, phản ánh giá trị và mức độ phân bố của các dữ liệu đang nghiên cứu.

Trong đó:
X là biên chuẩn
à độ lệch tiêu chuẩn của E.

là giá trị trung bình của hàm E
4.

Thuật tốn chuẩn hố tín hiệu bằng chuẩn hố theo giá trị [0,1] (min, max)
Vì dải biên độ của tín hiệu có giá trị khác nhau và khó có thể xác định ngưỡng chung do đó
ta áp dụng thuật tốn chuẩn hoá theo giá trị min, max để chuẩn hoá dải biên độ mà không
phụ thuộc vào dải rộng biên độ.

Trong đó :
Emin : giá trị nhỏ nhất của năng lương
Emax: giá trị lớn nhất của năng lượng

b)

Sơ đồ khối chương trình xử lí bài tốn


6

Nhóm , lớp HP:

MÃ CHƯƠNG TRÌNH CÀI ĐẶT
CÁC THUẬT TỐN

III.

A.

Thuật tốn chuẩn hố tín hiệu bằng chuẩn hố theo giá trị [0,1]


clear all;
%----------------------- lab_female.wav -----------------------%doc va xu li du lieu tu file
[x,F] = audioread('lab_female.wav');% doc file
time = length(x)/F; %thoi gian cua tin hieu
T = 1/F; % Chu ki
nx= 0:T:time-T; % do dai thoi gian cua tin hieu
y = [-1 1];% truc y
%------------cau a ) chia tin hieu thanh cac khung co do dai 0.01s
%chia tin hieu thanh cac khung


7

frames = devideFrames( time);
%------------ cau b) tinh nang luong ngan han cua tin hieu o moi khung
% tinh so luong mau trong moi khung duoc chia o cau a
samples = devideSampleInFrames(x, frames);
%tinh nang luong ngan han cua tin hieu o moi khung
E = calcEnergy(x, samples, frames);% nang luong ngan han cua tin hieu cua tin hieu
% ve ham nang luong
nE = 1:1:length(E);% do dai cua ham nang luong
subplot(311); plot(nE,E); title('Ham nang luong E')
%------------ cau c) tim bien chuan cua doan TN&KL nho vao dai bien do tren cong cu wavesurfer
bound = [0.01 0.697 1.21 1.954 2.46 3.431 3.854 4.65 5.125 6.075 6.478 7.114 7.818 9.53];
subplot (312); plot(nx,x); title('Bien chuan cua tin hieu bang cong cu wavesurfer');
for i=1:length(bound)
a=[bound(i) bound(i)];
line(a,y,'Color','red','LineStyle','--');
end
%------------ cau d) tim nguong nang luong chuan hoa va bien chuan cua doan TN&KL nho vao

chuan hoa nang luong
% logarit co so 10 ham nang luong
Elog = log10(E);
Enormalize = nomalizeEnergy(Elog);% chuan hoa
Estandardnormalize = standardnormalizeEnergy(Elog);% chuan hoa phan phoi chuan tac N(0,1)
thresholds = 0.57;% nguong nang luong
%tim bien cua tieng noi va khoang lang cua nang luong da duoc chuan hoa voi nguong nang
luong thresholds
boundNorm = findBoundnorm(Enormalize,thresholds);
subplot(313); plot(nx,x); title('Bien chuan hoa bang chuan hoa nang luong');
for i = 1 : length(boundNorm)
line([boundNorm(i) boundNorm(i)],y,'Color','red','LineStyle','--');
end
%tinh sai so RMSE
rmse = calcRMSE(bound, boundNorm);

% ------ Cac ham cua chuong trinh
% tạo riêng từng function và bỏ code các function dưới đây
% Ham duoc su dung trong cau a
%ham chia khung
function [ frames ] = devideFrames( time )
z = mod(time,0.01);% tim do dai cua khung cuoi cung


8

Nhóm , lớp HP:

frames = linspace(0,time-z,round((time - z)/0.01));% n-1 khung dau tien la 0.01s va khung cuoi
cung thu n co t<0.01s

frames = [frames z];% ghep n-1 khung voi khung thu n
end
% ham duoc su dung trong cau b
%ham chia so mau trong moi khung
function [ samples ] = devideSampleInFrames( x, frames )
% tinh toan so luong mau trong cac khung
samplein1frame = floor(length(x)/length(frames));%so mau trong 1 khung cua n-1 khung dau
tien
sampleinlastframe = length(x) - (length(frames)-1)*samplein1frame;%so mau trong khung cuoi
cung thu n
samples = samplein1frame.*ones(1, length(frames)-1);% tao khung voi n-1 phan tu dau tien
samples = [samples sampleinlastframe];%ghep khung voi phan tu n cuoi cung
end
%ham tinh nang luong ngan han
function [ E ] = calcEnergy( x, samples, frames )
%tinh nang luong ngan han Short-Term Energy cua tin hieu
E = zeros(1, length(samples));%khoi tao ham nang luong ngan han
samplein1frame = floor(length(x)/length(frames)); % so luong phan tu cua 1 khung
for i = 1:(length(samples))
for j = 1:samples(i)
E(i) = E(i) + (x(j+(i-1)*samplein1frame)^2);
end
end
end
% ham duoc su dung trong cau d
%ham chuan hoa nang luong
function [ Enormalize ] = nomalizeEnergy( Elog )
%chuan hoa nang luong sau khi da duoc logarith co so 10
Enormalize = (Elog - min(Elog))/(max(Elog)-min(Elog));
end

%ham tim cac bien cua khoang lang & tieng noi
function [ boundNorm ] = findBoundNorm( Enorm, thresholds )
% tim cac vi tri khoang lang
unvoice = []; % mang unvoice chua vi tri cua cac khung co muc nang luong chuan hoa < nguong
nang luong thresholds
for i = 1 : length(Enorm)
if Enorm(i) < thresholds
unvoice = [unvoice i]; % them cac gia tri chua vi tri Enorm(i) < thresholds vao mang
end
end


9

% tim bien cua khoang lang va tieng noi
boundNorm = [];
temp = 1;
for i = 1 : length(unvoice)-1
if (unvoice(i+1) - unvoice(i)) ~= 1
if(i - temp >20) % neu do dai cua khoang lang > 20 (tuong duong voi 200ms)
boundNorm = [boundNorm unvoice(temp) unvoice(i)]; % them cac gia tri bien vao mang
boundNorm
temp = i+1;
else
temp = i+1;
end
end
if ( i == length(unvoice)-1)
boundNorm = [boundNorm unvoice(temp) unvoice(i)]; % them cac gia tri bien cuoi vao
mang boundNorm

end
end
boundNorm = boundNorm.*0.01; % quy doi ve dai luong thoi gian
end

B.

Thuật tốn chuẩn hố tín hiệu bằng phương pháp phân phối chuẩn
tắc

clear all;
%----------------------- lab_female.wav -----------------------%doc va xu li du lieu tu file
[x,F] = audioread('lab_female.wav');% doc file
time = length(x)/F; %thoi gian cua tin hieu
T = 1/F; % Chu ki
nx= 0:T:time-T; % do dai thoi gian cua tin hieu
y = [-1 1];% truc y
%------------cau a ) chia tin hieu thanh cac khung co do dai 0.01s
%chia tin hieu thanh cac khung
frames = devideFrames( time);
%------------ cau b) tinh nang luong ngan han cua tin hieu o moi khung
% tinh so luong mau trong moi khung duoc chia o cau a
samples = devideSampleInFrames(x, frames);
%tinh nang luong ngan han cua tin hieu o moi khung


10

Nhóm , lớp HP:


E = calcEnergy(x, samples, frames);% nang luong ngan han cua tin hieu cua tin hieu
% ve ham nang luong
nE = 1:1:length(E);% do dai cua ham nang luong
subplot(311); plot(nE,E); title('Ham nang luong E')
%------------ cau c) tim bien chuan cua doan TN&KL nho vao dai bien do tren cong cu wavesurfer
bound = [0.01 0.697 1.21 1.954 2.46 3.431 3.854 4.65 5.125 6.075 6.478 7.114 7.818 9.53];
subplot (312); plot(nx,x); title('Bien chuan cua tin hieu bang cong cu wavesurfer');
for i=1:length(bound)
a=[bound(i) bound(i)];
line(a,y,'Color','red','LineStyle','--');
end
%------------ cau d) tim nguong nang luong chuan hoa va bien chuan cua doan TN&KL nho vao
chuan hoa nang luong
% logarit co so 10 ham nang luong
Elog = log10(E);
Enormalize = nomalizeEnergy(Elog);% chuan hoa
Estandardnormalize = standardnormalizeEnergy(Elog);% chuan hoa phan phoi chuan tac N(0,1)
thresholds = 0.5;% nguong nang luong
%tim bien cua tieng noi va khoang lang cua nang luong da duoc chuan hoa voi nguong nang
luong thresholds
boundNorm = findBoundnorm(standardnormalizeEnergy,thresholds);
subplot(313); plot(nx,x); title('Bien chuan hoa bang chuan hoa nang luong');
for i = 1 : length(boundNorm)
line([boundNorm(i) boundNorm(i)],y,'Color','red','LineStyle','--');
end
%tinh sai so RMSE
rmse = calcRMSE(bound, boundNorm);

% ------ Cac ham cua chuong trinh
% tạo riêng từng function và bỏ code các function dưới đây

% Ham duoc su dung trong cau a
%ham chia khung
function [ frames ] = devideFrames( time )
z = mod(time,0.01);% tim do dai cua khung cuoi cung
frames = linspace(0,time-z,round((time - z)/0.01));% n-1 khung dau tien la 0.01s va khung cuoi
cung thu n co t<0.01s
frames = [frames z];% ghep n-1 khung voi khung thu n
end
% ham duoc su dung trong cau b
%ham chia so mau trong moi khung


11

function [ samples ] = devideSampleInFrames( x, frames )
% tinh toan so luong mau trong cac khung
samplein1frame = floor(length(x)/length(frames));%so mau trong 1 khung cua n-1 khung dau
tien
sampleinlastframe = length(x) - (length(frames)-1)*samplein1frame;%so mau trong khung cuoi
cung thu n
samples = samplein1frame.*ones(1, length(frames)-1);% tao khung voi n-1 phan tu dau tien
samples = [samples sampleinlastframe];%ghep khung voi phan tu n cuoi cung
end
%ham tinh nang luong ngan han
function [ E ] = calcEnergy( x, samples, frames )
%tinh nang luong ngan han Short-Term Energy cua tin hieu
E = zeros(1, length(samples));%khoi tao ham nang luong ngan han
samplein1frame = floor(length(x)/length(frames)); % so luong phan tu cua 1 khung
for i = 1:(length(samples))
for j = 1:samples(i)

E(i) = E(i) + (x(j+(i-1)*samplein1frame)^2);
end
end
end
% ham duoc su dung trong cau d
%ham chuan hoa nang luong
function [ Enormalize ] = nomalizeEnergy( Elog )
%chuan hoa nang luong sau khi da duoc logarith co so 10
Enormalize = (Elog - min(Elog))/(max(Elog)-min(Elog));
end
%ham tim cac bien cua khoang lang & tieng noi
function [ boundNorm ] = findBoundNorm( Enorm, thresholds )
% tim cac vi tri khoang lang
unvoice = []; % mang unvoice chua vi tri cua cac khung co muc nang luong chuan hoa < nguong
nang luong thresholds
for i = 1 : length(Enorm)
if Enorm(i) < thresholds
unvoice = [unvoice i]; % them cac gia tri chua vi tri Enorm(i) < thresholds vao mang
end
end
% tim bien cua khoang lang va tieng noi
boundNorm = [];
temp = 1;
for i = 1 : length(unvoice)-1
if (unvoice(i+1) - unvoice(i)) ~= 1
if(i - temp >20) % neu do dai cua khoang lang > 20 (tuong duong voi 200ms)


12


Nhóm , lớp HP:

boundNorm = [boundNorm unvoice(temp) unvoice(i)]; % them cac gia tri bien vao mang
boundNorm
temp = i+1;
else
temp = i+1;
end
end
if ( i == length(unvoice)-1)
boundNorm = [boundNorm unvoice(temp) unvoice(i)]; % them cac gia tri bien cuoi vao
mang boundNorm
end
end
boundNorm = boundNorm.*0.01; % quy doi ve dai luong thoi gian
end

IV.

KẾT QUẢ THỰC NGHIỆM

Mô tả dữ liệu dùng để đánh giá độ chính xác của các thuật tốn, đưa ra các đánh giá định
tính và định lượng, so sánh các thuật toán đã cài đặt với nhau và với các cài đặt (hoặc thuật tốn)
khác.
1.

Kết quả
A.




Thuật tốn chuẩn hố tín hiệu bằng phương pháp phân phối chuẩn tắc

File lab_female.wav


13



File lab_male.wav


14

Nhóm , lớp HP:



File studio_male.wav


15



File studio_female.wav


16


Nhóm , lớp HP:

B.



Thuật tốn chuẩn hố tín hiệu bằng chuẩn hoá theo giá trị [0,1]

Kết quả với file lab_female.wav


17



Kết quả với file lab_male.wav


18

Nhóm , lớp HP:



Kết quả file studio_male.wav


19




Kết quả file studio_female.wav


20

Nhóm , lớp HP:

2.

Bảng biểu kết quả

.
A.

Kết quả tính sai số RMSE khi sử dụng thuật tốn chuẩn hố tín hiệu bằng chuẩn
hố chuẩn tắc


0.0
1
0.0
1

0.6
97
0.7




0.0
1
0.0
1

0.9
27
0.9
3

File lab_female.wav
1.2
1
1.1
6

1.9
54
1.9
7

2.4
6
2.4
7

3.4
31
3.4

6

2.3
55
2.3
7

2.
7
2.
7

4.6
5
4.6
6

5.1
25
5.1
1

6.0
75
6.1
2

6.4
78
6.4

9

7.1
14
7.1
6

7.8
18
7.8
6

9.53
31
9.53

7.0
24
7.0
6

8.1
04
7.7
6

8.3
70
8.4
2


9.5
31
9.6
2

9.9
43
9.9
9

11.2
49
11.2
3

= 0.0271

File lab_male.wav
1.2
9
1.3
3

3.8
54
3.8
4

4.0

88
4.1
3

4.4 6.7
03
01
4.4 6.7
4
4
= 0.0535


21

File studio_male.wav



0.0
1
0.0
1

0.74 2.94 3.35 4.4
4
2
1
3
0.76 2.96 3.39 4.4

6

B.

0.588
0.59

8.0
4
8.0
4

2.135
2.15

2.494
2.55

4.29 4.91
4.25 4.91
= 0.0291

Kết quả tính sai số RMSE khi sử dụng thuật tốn chuẩn hố tín hiệu bằng chuẩn
hố theo giá trị [0,1]
File lab_female.wav



0.0
1

0.0
1

5.66 6.01 7.2
4
6
5
5.71 6.07 7.2
7
= 0.0317

File studio_female.wav



0.01
0.01

4.8
8
4.9
2

0.6
97
0.7

1.2
1
1.0

7

1.9
54
1.9
7

2.4
6
2.4
3

3.4
31
3.4
6

3.8
54
3.8
1

4.6 5.1
5
25
4.7 5.1

6.0
75
6.1

2

6.4
78
6.4
7

7.1
14
7.2
2

7.8
18
7.8
2

9.53
31
9.53

8.1
04
8.1
7

8.3
70
8.3
7


9.5
31
9.6
4

9.9
43
9.8
9

11.2
49
11.2
4

= 0.0534
File lab_male.wav



0.0
1
0.0
1

0.9
27
0.9
4



0.0
1
0.0
1

2.3
55
2.3
7

2.7 4.0
88
2.6 4.1
4
3

4.4 6.7
03
01
4.3 6.7
2
5
= 0.0513

File studio_male.wav

0.74 2.94 3.35 4.4
4

2
1
3
0.72 2.98 3.33 4.4
8


0.01

1.2
9
1.2
5

4.8
8
4.9
2

5.66 6.01 7.2
4
6
5
5.73 6.06 7.3
1
= 0.046

File studio_female.wav
0.588


2.135

2.494

7.0
24
6.9
9

4.29

4.91

8.0
4
8.0
4


22

Nhóm , lớp HP:

0.01

0.57

2.17

2.5


4.42 4.91
= 0.0557

V.

KẾT LUẬN

Qua bài báo cáo này, chúng em đã xây dựng được thuật toán xử lý tín hiệu theo kiểu ngắn hạn
bằng cách chia tín hiệu thành các khung với độ dài 10ms tính năng lượng ngắn hạn, áp dụng được
thuật tốn chuẩn hóa dữ liệu và thành cơng trong việc phân đoạn tiếng nói và khoảng lặng. Tuy
nhiên vẫn còn xảy ra sai số do ngưỡng lấy của chúng em vẫn cịn chưa chính xác và điều kiện môi
trường.

VI.

Drive forStudent

TÀI LIỆU THAM KHẢO



×