Tải bản đầy đủ (.pdf) (15 trang)

XỬ lý NGÔN NGỮ nói PHẦN NHẬN DẠNG TIẾNG nói rời rạc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (451.44 KB, 15 trang )

XửLýNgônNgữNói
ĐẠIHỌCQUỐCGIATHÀNHPHỐHỒCHÍMINH
TRƯỜNGĐẠIHỌCKHOAHỌCTỰNHIÊN
——————————
XỬLÝNGÔNNGỮNÓI
BÀITẬP2:NHẬNDẠNGTIẾNGNÓIRỜIRẠC
Giáoviên:PGS.TS.VŨHẢIQUÂN
Họvàênhọcviên:NguyễnBáCông
Mãsốhọcviên:0209480107
Ngành:Khoahọcmáytính–K19
NguyễnBáCôngKHMTK19
1
XửLýNgônNgữNói
I.Tổngquan
Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp               
(classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã                
được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng,                
chúng có thể là các từ, hoặc các âm vị. Nếu các mẫu này là bất biến và không thay                  
đổi thì công việc nhận dạng tiếng nói trở nên đơn giản bằng cách so sánh dữ liệu                
tiếng nói cần nhận dạng với các mẫu đã được học và lưu trữ trong bộ nhớ. Khó                
khăn cơ bản của nhận dạng tiếng nói đó là tiếng nói luôn biến thiên theo thời gian                
và có sự khác biệt lớn giữa tiếng nói của những người nói khác nhau, tốc độ nói,                
ngữ cảnh và môi trường âm học khác nhau. Xác định những thông tin biến thiên nào               
của tiếng nói là có ích và những thông tin nào là không có ích đối với nhận dạng                 
tiếng nói là rất quan trọng. Đây là một nhiệm vụ rất khó khăn mà ngay cả với các kỹ                  
thuật xác suất thống kê mạnh cũng khó khăn trong việc tổng quát hoá từ các mẫu               
tiếngnóinhữngbiếnthiênquantrọngcầnthiếttrongnhậndạngtiếngnói.
Cácnghiêncứuvềnhậndạngtiếngnóidựatrênbanguyêntắccơbản:
● Tín hiệu tiếng nói được biểu diễn chính xác bởi các giá trị phổ trong một              
khung thời gian ngắn (shortterm amplitude spectrum). Nhờ vậy ta có thể          
trích ra các đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các              


đặcđiểmnàylàmdữliệuđểnhậndạngtiếngnói.
● Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một dãy các              
ký hiệu ngữ âm. Do đó ý nghĩa của một phát âm được bảo toàn khi chúng ta                
phiênâmphátâmthànhdãycáckýhiệungữâm.
● Nhận dạng tiếng nói là một quá trình nhận thức. Thông tin về ngữ nghĩa             
(semantics) và suy đoán (pragmatics) có giá trị trong quá trình nhận dạng           
tiếngnói,nhấtlàkhithôngtinvềâmhọclàkhôngrõràng.
Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình               
Markovẩn,mạngnơron,…
NguyễnBáCôngKHMTK19
2
XửLýNgônNgữNói
Phát biểu bài toán: Sử dụng công cụ/thư viện HTK (Hidden Markov Model Toolkit)            
đểxâydựngcôngcụnhậndạngtiếngnói(TiếngViệt)rờirạctừngtừmột.
Hướng giải quyết: Trên thế giới đã có rất nhiều hệ thống nhận dạng tiếng nói đã               
và đang được ứng dụng rất hiệu quả như LVia Voice của IBM, Spoken Toolkit cua              
CSLU (Central of Spoken Language Understanding). Tuy nhiên ở bài trình bày này;           
trình bày về phương pháp sử dụng công cụ HTK (Hidden Markov Model Toolkit),            
bằng việc sử dụng đặc trưng MFCC (MelFrequency Ceptrums Coefficients) và mô          
hìnhMarkovẩn(HMM).
NguyễnBáCôngKHMTK19
3
XửLýNgônNgữNói
II.Cơsởlýthuyết
1.Tríchchọnđăctrưng
Tríchchọnđặctrưngtrongxửlýngônngữnóilàbiếnđổitừgiọngnóithô
thànhnhữngđặctrưngcủangườinói.Đặctrưngđượcsửdụngtrongbài
nàylàđặctrưngMFCC(MelFrequencyCepstralCoefficients),đặctrưng
MFCCthểhiệnhìnhtháicủacuốnghọng,…khitanói.
CácbướctríchchọnđặctrưngMFCC:gồm5bướccơbản

● Phânkhung(frameblocking):Chiatínhiệuđầuvàothànhcác
đoạnnhỏkhoảng20ms30ms.Phânkhungtínhiệumỗikhung
Nmẫu,haikhungkềnhaulệchMmẫu.
● Lấycửasổ(Windowing):Lấycửasổnhằmgiảmsựgiánđoạn
củatínhiệuởđầuvàcuốimỗikhungvừađượcchia(vídụ
dùngcủasởHamming,…).
● BiếnđổiFFT(FastFourierTransform):Chuyểnđổimỗikhung
vớiNmẫutừmiềnthớigiansangmiềntầnsố.
● BiếnđổisangthangđoMel(MelfrequencyWrapping)
● HệsốCepstrum(CepstrumCoefficients)
2.MôhìnhMarkovẩn(HMM)
a.MôhìnhMarkov
i.Cáckháiniệmcơbản
Mô hình Markov là mô hình dựa trên thống kê để mô hình hóa các tín              
hiệu dạng chuỗi (theo thời gian) được sử dụng rất tốt trong các lĩnh            
vựcnhậndạng.
Cáctínhiệudạngchuỗi:
○ Chữviếttay
○ Tínhiệuâmthanh,ánhsáng
○ ChuỗiDNA
○ …
Phânloạimôhìnhchuỗitrạngthái
● Môhìnhchuỗiđơnđịnh
NguyễnBáCôngKHMTK19
4
XửLýNgônNgữNói
Làmôhìnhcáctrạngtháitrongđóliênkếtchuyểntừtrạngthái
nàysangtrạitháikháclàhoàntoànxácđịnh.Vídụ:môhình
chuyểntrạngtháicủađèngiaothông(đỏxanhvàng)
● Môhìnhchuỗixácsuất

Là mô hình các trạng thái trong đó liên kết chuyển từ trạng thái            
này sang trại thái là 1 giá trị xác suất, sao cho tổng xác suất             
đầu ra từ 1 trạng thái tới tất cả các trạng thái khác bao gồm             
chínhnóluônlà100%.
Như vậy theo nguyên lý xác suất Bayes, xác suất mô hình ở           
trạng thái phụ thuộc vào xác suất tồn tại của tất cả trạng thái  q
i
           
trướcnó.q
j,j<i
ii.GiảthuyếtMarkov
● Xácsuấttại1trạngtháitrongmôhìnhMarkovchỉphụthuộc
vàotrạngtháitrướcnó
(q |q , q , , q ) P (q |q )P
t t−1

t−2
. 
1
= 
t t−1
● Dựatrênlýthuyếtxácsuấttrạngtháiđồngthời
(A, ) P(A|B)P (B)P B = 
● Xácsuấtchuỗitrạngtháiđượctính
(q , q , , q , q )P
1

2
 
t−1


t
P (q |q , q , , q )P(q , q , , q )= 
t t−1

t−2
. 
1 t−1

t−2
. 
1
= 
P (q |q )P(q |q ) P (q |q )P (q )= 
t t−1 t−1 t−2 2 1 1
iii.MôhìnhMarkov
MôhìnhMarkovđượcđịnhnghĩalà1môhìnhbaogồmcácthành
phần:
● Cáctrạngtháitrongmôhình
, 2, …, N1   
● Chuỗitrạngtháiquansátđược
, q , , q , , qq
1

2
 
t
 
T
● MatrậnchuyểnvịtrạngtháiAthểhiệnxácsuấtchuyểnvịtừ

trạngtháinàysangtrạngtháikhác
NguyễnBáCôngKHMTK19
5
XửLýNgônNgữNói
trongđó
P (q |q )1 ,a
ij
= 
j i
< i j < N
 0∀i,a
ij
>  j 
 1∀i∑
N
j=1
a
ij
= 
● Xácsuấtbanđầuπ
, π , , ππ
1

2
 
N
trongđó
 (q )1π
i
= P

i
< i < N
 1∀i∑
N
i=1
π
i
= 
TómgọnlạimôhìnhMarkovcóthểđượcgọilà1bộ (A, π)λ 
iv.VídụmôhìnhMarkov
Môhìnhnghiêncứuthờitiết
● Cáctrạngtháithờitiết:
Sun, Cloudy, Rain), N 3(    = 
● Xácsuấtbanđầu :π
π , π , π ) (1.0, 0.0, 0.0)(
Sun

Cloudy

Rain
=   
● MatrậnchuyểnvịtrạngtháiA:
b.MôhìnhMarkovẩn
■ Cáctrạngtháiẩn
MôhìnhMarkovđượctrìnhbàyởphầntrướctồntại1sốkhuyếtđiểm
NguyễnBáCôngKHMTK19
6
XửLýNgônNgữNói
trongtrườnghợptổngquát,khicáctrạngtháiquansátđượckhông
đồngthờilàcáctrạngtháimàmôhìnhđangthểhiện.Vớivídụmô

hìnhnghiêncứuthờitiếtđãnêu.Giảsửtrongtrườnghợpcáctrạng
tháichúngtaquansátđượckhôngphảilàcáctrạngtháithờitiếttrực
tiếpmàlàcáctrạngtháicủatảobiểnbaogồm[Soggy,Damp,
Dryish,Dry](vớicácthựcnghiệmchothấycáctrạngtháicủatảobiến
cóthểhiện1phầntrạngtháithờitiếttheo1xácsuấtnghiêncứubiết
trước),chúngtaphảinângcấpmôhìnhMarkovđểcóthểchứathêm
thôngtinnày.
Nhưvậy,môhìnhMarkovẩncóthểđượchìnhdungthôngquasơđồ
sau
Bêncạnhcácgiátrịxácsuấtkhởitạovàxácsuấtchuyểnvịtrạngthái
thờitiết,môhìnhcầnphảilưuthêmcácxácsuấttươngứngcủatrạng
tháitảobiểnquansátđượctươngứngvớitrạngtháithờitiếtcần
nghiêncứu.
■ MôhìnhMarkovẩnđượcđịnhnghĩabaogồm
● Cáctrạngtháinghiêncứutrongmôhình
, 2, …, N1   
NguyễnBáCôngKHMTK19
7
XửLýNgônNgữNói
● Cáctrạngtháiquansátđược
, 2, …, M1   
● Chuỗitrạngtháiquansátđược
, o, , o , , oo
1
  
t
 
T
● MatrậnchuyểnvịtrạngtháiAthểhiệnxácsuấtchuyểnvịtừ
trạngtháinàysangtrạngtháikhác

trongđó
P (q |q )1 ,a
ij
= 
j i
< i j < N
 0∀i,a
ij
>  j 
 1∀i∑
N
j=1
a
ij
= 
● Xácsuấtbanđầuπ
, π , , ππ
1

2
 
N
trongđó
 (q )1π
i
= P
i
< i < N
 1∀i∑
N

i=1
π
i
= 
● MatrậnchuyểnvịtrạngtháiBthểhiệnxácsuấtchuyểnvịtừ
trạngtháiquansátđượcsangtrạngtháinghiêncứu
trongđó
P (o |q )1 , 1b
ij
= 
j i
< i < N  < j < M
 0∀i,b
ij
>  j 
 1∀i∑
N
j=1
b
ij
= 
TómgọnlạimôhìnhMarkovẩncóthểđượcgọilà1bộ
.(A, B, π)λ  
NguyễnBáCôngKHMTK19
8
XửLýNgônNgữNói
c.3BàitoánMôhìnhMarkovẩn
VớimôhìnhMarkovẩnđượcnêu,ápdụngvàocácvấnđềthựctếlàmnảy
sinhra3bàitoánchínhsau:
Bàitoán1:Tínhđiểm(Evaluation)

Chotrướcchuỗiquansát tươngứngvớimôhìnho , , , }O = {
1
o
2
. o
T
,xácđịnhxácsuấttươngứngcóđiềukiện .(A, B, π)λ   (O|λ)P
Vídụkhônghìnhthức:
○ Chotrước2môhìnhthờitiết và cùngvới1chuỗiλ
Summer
λ
Winter
quansáttrạngtháitảobiển trongthờigian1tuần.ChúngtaO
cầnxácđịnhxemtuầnđượcquansátthuộcvềmôhìnhnào
tươngứngvớimùanàotrongnămbằngcáchtínhđiểmchuỗi
Ochocả2môhìnhvàchọnmôhìnhcóđiểmcaonhất.
Bàitoán2:Sokhớp(Matching)
Chotrướcchuỗiquansát tươngứngvớimôhìnho , , , }O = {
1
o
2
. o
T
,xácđịnhchuỗitrạngtháinghiêncứutươngứng(A, B, π)λ  
saochoxácsuấttương đạtcựcđại.q, , , }Q = { q
2
. q
T
(O|λ)P
Vídụkhônghìnhthức:

○ Chotrước2môhìnhthờitiết cùngvới1chuỗiquansáttrạngλ

tháitảobiển trongthờigian1tuần.ChúngtacầnxácđịnhO
xemtuầnđượcquansátthuộccóthờitiếtcụthểnhưthếnào.
Bàitoán3:Huấnluyện(Training)
Chotrướctậpchuỗiquansát xácđịnhcácthamsốO , , O }{
1
O
2
.
k
phùhợpchomôhình saochoxácsuấttươngứngcóđiều(A, B, π)λ  
kiện làcựcđại.(O |λ)P
i,i∈[1 k]
Vídụkhônghìnhthức:
○ Chotrướctập1chuỗiquansáttrạngtháitảobiển mỗituầnO
trongvòngnhiềutháng.Chúngtacầnxácđịnh1môhìnhthời
tiếttươngứngtạikhuvựcđósaochophùhợpnhấtvớichuỗi
quansátnày.
III.Thựcnghiệm
NguyễnBáCôngKHMTK19
9
XửLýNgônNgữNói
1.CácchứcnăngđượcsửdụngtrongcôngcụHTK
HTKcungcấpcáccôngcụchoviệcxâydựngmộtmôhìnhMarkovẩn(HMMs).
HMMscóthểdùngchocácbàitoánvớidữliệulàmộtchuỗitheothờigian,vàHTK
cũngcóthểsửdụngchocácbàitoándạngnày.Tuynhiên,HTKđượcthiếtkếchính
làphụcvụchocácbàitoánvềtiếngnói.Dướiđâylàmộtvàicôngcụcơbản
thườngđượcdùng:
○ HCopy

Copyvàthứchiệnviệcrúttríchđặctrưngtùythuộcvàofilecấuhình.
○ HCompV
Côngcụkhởitạothamsốchocáchàmphânbốxácsuấtcótrongtừngtrạng
tháicủamôhìnhMarkovẩntươngứngvớidữliệuhuấnluyện.
○ HRest
Côngcụhuấnluyệnmôhìnhbằngviệctínhtoán,ướclượnglạicácthamsố
củamôhình.
○ HParse
Côngcụchuyểnđổi(parse)từdữliệuđầuvàothànhdữliệutheoformat
HTK.
○ HVite
Côngcụsokhớp/nhậndạngvớiđầuvàolàdữliệucầnnhậndạng,vàtrảvề
môhìnhtốtnhất/khớpnhấtmànóthuộcvào.
○ HResults
Côngcụthốngkê,đánhgiákếtquảnhậndạng.
2.Chuẩnbịdữliệu
Dữliệuthựcnghiệmđượclấytừdữliệuthuâmtrênlab:
■ K22_SV34(250filestươngứng250câu)
a.Tậpdữliệuhuấnluyện(train)
200files
b.Tậpdữliệutest
Gồm327files,làcáctừđượctáchratừ50câu.
Chúngtacũngcầnchuẩnbịcácfilesauchoviệccàiđặtmôhinh:
NguyễnBáCôngKHMTK19
10
XửLýNgônNgữNói
Cácfilepromptstươngứngvớicácfileâmthanh(wav),
Filetừđiểnbaogồmtấtcảcáctừtrongbộdữliệuthựcnghiệm,
ChuẩnbịcácfilechoviệchuấnluyệnmôhìnhdùngcôngcụHTK:
■ proto(prototypemodel)

■ config
■ HCompV.cfg
■ HCopy.cfg
■ HERest.cfg
■ HVite.cfg
■ mktri.led
■ sil.hed
■ monophones0
■ monophones1
■ Cácfileperlscripts
3.Càiđặt
ChươngtrìnhđượcxâydựngdựavàocôngcụHTKvàcác“ActivePerl”
scripts.Dướiđâylàmôtảvềcáchchươngtrìnhđượccàiđặtcụthể.
Cấutrúcchươngtrình
Môhình
SửdụngHTKtoolkitđểxâydựngmôhìnhgồm:
● ModuleHuấnluyện
● ModuleNhậndạng
Đặctrưng:39đặctrưngMFCC_0_D_A,trongđó
● 0:12MFCCfeatures+(1)totalenergyintheframe,
● D:13“Deltacoefficients”(đạohàmbậc1củaMFCC),
NguyễnBáCôngKHMTK19
11
XửLýNgônNgữNói
● A:13“Accelerationcoefficients”(đạohàmbậc2củaMFCC)
MỗimộtâmtiếtlàmộtmôhìnhMarkovẩn
Sốtrạngthái:5
a.Huấnluyện
■ Tạofile"words.mlf"từfileprompts.txt
Perlpl\prompts2mlf.plwords.mlfprompts.txt

■ Tạo2file"phones0.mlf"và"phones1.mlf":phones0chỉcó"sil"nhưng
phones1cóthêm"sp"
HLEdl*ddict.txtiphones0.mlfmkphones0.ledwords.mlf
HLEdl*ddict.txtiphones1.mlfmkphones1.ledwords.mlf
■ RúttríchđặctrưngMFCC_0_D_A
perlpl\listwavmfc.pltrain\wavtrain\mfc.scp
HcopyCconfigStrain\mfc.scp
■ Tạofileliệtkêdữliệuhuấnluyện
perlpl\mkTrainFile.pltrain\mfctrain\train.scp
■ Bước2.Khởitạomôhình
HCompVADT1CHCompV.cfgf0.01mStrain\train.scpMhmm\hmm0proto
■ Bước3.Tạomôhìnhchuẩn
perlpl\mkMacrosFile.plhmm\hmm0\vFloorshmm\hmm0\macros
perlpl\mkHmmdefsFile.plhmm\hmm0\protomonophones0hmm\hmm0\hmmdefs
■ Bước4.Huấnluyện3vòng>hmm3
HERestADT1CHERest.cfgIphones0.mlft250.0150.01000.0Strain\train.scp
Hhmm\hmm0\macrosHhmm\hmm0\hmmdefsMhmm\hmm1monophones0
HERestADT1CHERest.cfgIphones0.mlft250.0150.01000.0Strain\train.scp
Hhmm\hmm1\macrosHhmm\hmm1\hmmdefsMhmm\hmm2monophones0
HERestADT1CHERest.cfgIphones0.mlft250.0150.01000.0Strain\train.scp
Hhmm\hmm2\macrosHhmm\hmm2\hmmdefsMhmm\hmm3monophones0
■ Bước5.Thêm“sp”vàodanhsáchmôhình
NguyễnBáCôngKHMTK19
12
XửLýNgônNgữNói
perlpl\makesp.plhmm\hmm3\hmmdefshmm\hmm4\hmmdefshmm\hmm3\macros
hmm\hmm4\macros
■ Bước6.Liênkếtsilsp
HHEdHhmm\hmm4\macrosHhmm\hmm4\hmmdefsMhmm\hmm5sil.hed
monophones1

■ Bước7.Huấnluyện2vònghmm5>hmm7
HERestADT1CHERest.cfgIphones1.mlft250.0150.01000.0Strain\train.scp
Hhmm\hmm5\macrosHhmm\hmm5\hmmdefsMhmm\hmm6monophones1
HERestADT1CHERest.cfgIphones1.mlft250.0150.01000.0Strain\train.scp
Hhmm\hmm6\macrosHhmm\hmm6\hmmdefsMhmm\hmm7monophones1
■ Bước8.Clone/copyphones1.mlf>aligned.mlf(xácđịnhcáchđọc
chínhchotừngtừ)
copyphones1.mlfaligned.mlf
■ Bước9.Huấnluyện2vòng>hmm9
HERestADT1CHERest.cfgIaligned.mlft250.0150.01000.0Strain\train.scpH
hmm\hmm7\macrosHhmm\hmm7\hmmdefsMhmm\hmm8monophones1
HERestADT1CHERest.cfgIaligned.mlft250.0150.01000.0Strain\train.scpH
hmm\hmm8\macrosHhmm\hmm8\hmmdefsMhmm\hmm9monophones1
■ Bước10.Tạotriphones
HLEdnph\triphones1l*iwintri.mlfmktri.ledaligned.mlf
perlpl\mkTriHed.plmonophones1ph\triphones1mktri.hed
HHEdBHhmm\hmm9\macrosHhmm\hmm9\hmmdefsMhmm\hmm10mktri.hed
monophones1
Huấnluyện2vòng>hmm12
HERestBCHERest.cfgIwintri.mlfsstatsStrain\train.scpHhmm\hmm10\macros
Hhmm\hmm10\hmmdefsMhmm\hmm11ph\triphones1
HERestBCHERest.cfgIwintri.mlfsstatsStrain\train.scpHhmm\hmm11\macros
Hhmm\hmm11\hmmdefsMhmm\hmm12ph\triphones1
■ Bước11.Liênphầnshare/chung
perlpl\mkFullList.plmonophones0fulllist
perlpl\mkTree.pl350monophones0tree.hed
HHEdBHhmm\hmm12\macrosHhmm\hmm12\hmmdefsMhmm\hmm13tree.hed
ph\triphones1>log
NguyễnBáCôngKHMTK19
13

XửLýNgônNgữNói
■ Bước12.Huấnluyện2vòng>hmm15(môhìnhcuốicùng)
HERestBCHERest.cfgIwintri.mlfsstatsStrain\train.scpHhmm\hmm13\macros
Hhmm\hmm13\hmmdefsMhmm\hmm14tiedlist
HERestBCHERest.cfgIwintri.mlfsstatsStrain\train.scpHhmm\hmm14\macros
Hhmm\hmm14\hmmdefsMhmm\hmm15tiedlist
b.Nhậndạng
■ Chuẩnbịdữliệukiểmthửđúng/truthfile
Perlpl\prompts2mlf.pltest\truth.mlftest\prompts.txt
■ Chuẩnbịdữliệunhậndạng
perlpl\listwavmfc.pltest\wavtest\mfc.scp
HCopyT1CconfigStest\mfc.scp
perlpl\mkTrainFile.pltest\mfctest\test.scp
■ Parsegramthànhwdnet
HParsegram.txtwdnet
■ Thựchiệnnhậndạng
HViteT1CHVite.cfgHhmm\hmm15\macrosHhmm\hmm15\hmmdefsS
test\test.scpitest\recout.mlfwwdnetp0.0s5.0gram_dict.txttiedlist
■ Thựchiệnthốngkêkếtquảnhậndạng
HResultsItest\truth.mlftiedlisttest\recout.mlf>test\result.txt
4.Kếtquả
Kếtquảđượcthốngkêdựatrêntậpdữliệutest:
■ K22_SV34(327mẫulàcáctừđượctáchratừ50câu)
======================HTKResultsAnalysis=======================
Date:SatJun0113:23:122013
Ref:test\truth.mlf
Rec:test\recout.mlf
OverallResults
SENT:%Correct=35.38[H=115,S=210,N=325]
WORD:%Corr=35.38,Acc=31.38[H=115,D=0,S=210,I=13,N=325]

==============================================================
IV.Kếtluận
Việc xây dựng một mô hình để nhận dạng tiếng nói (Tiếng Việt) rời rạc sử dụng công cụ                 
NguyễnBáCôngKHMTK19
14
XửLýNgônNgữNói
HTK được thực hiện khá suôn sẻ. Tuy nhiên kết quả thực nghiệm lại tương đối thấp               
(Corr=35.38,Acc=31.38).Nguyênnhâncóthểdo:
● Dữliệuhuấnluyệnít,khôngtổngquátđượcdữliệukiểmthử;
● Dữliệukiểmthử(test)đượctáchratừmộtcâuchochấtlượngkhôngtốt;
● Dữ liệu dùng để huấn luyện cũng như kiểm thử do tác giả đọc nghe không rõ, có                
cáctừđượcphátâmgầnnhưnhau;
● Môhìnhchưađủmạnh.
Hướngtiếpcậntrongthờigiantới:
● Thuthậpthêmnhiềudữliệu;
● Nângcấpmôhình(AdaptiveModel).
NguyễnBáCôngKHMTK19
15

×