i
TRNG I HC M TP. H CHÍ MINH
KHOA CÔNG NGH THÔNG TIN
TÊN TÀI:
“XÂY DNG H THNG PHN MM
IM DANH NG DNG NHN DIN
GING NÓI TING VIT”
Ngành: Khoa Hc Máy Tính
Hng chuyên ngành: C S D Liu
Sinh viên thc hin:
Lê Xuân Tin (MSSV: 0951012135)
Nguyn c Thng (MSSV: 0951010124)
GVHD: TS. Lê Xuân Trng
Tp. H Chí Minh, tháng 7 nm 2013
ii
NHN XÉT CA GIÁO VIÊN HNG DN
iii
NHN XÉT CA GIÁO VIÊN PHN BIN
iv
LI CM N
Chúng em xin chân thành cm n thy Lê Xuân Trng đã tn tình hng dn, giúp
đ, đng viên, đa ra nhng li khuyên b ích đ chúng em có th thc hin lun vn tt
nghip này. Thy luôn luôn khuyn khích chúng em tìm tòi, hc hi c gng to ra nhng
sn phm mang tính cht khoa hc nhiu hn, điu này góp phn làm cho đt nc ta
ngày càng phát trin hn. Tuy chúng em còn gp nhiu khó khn nhng thy v
n c gng
to điu kin tt nht cho chúng em sm kp hoàn thành lun vn tt nghip đúng thi
hn. Mt ln na, chúng em xin cm n và chúc sc khe thy. Bên cnh đó, chúng em
cng cm n khoa Công Ngh Thông Tin trng H M TP.HCM đã to ra mt môi
trng hc tp tt nht đ chúng em phát trin và nâng cao kin thc chuyên ngành, t đó
có th ng dng vào thc tin xã hi góp phn xây dng đt nc ta ngày càng phát trin.
v
MC LC
LI CM N iv
MC LC v
DANH MC CÁC THUT NG TING ANH VÀ CH VIT TT vii
DANH MC CÁC BNG viii
DANH MC CÁC HÌNH x
CHNG 1. TNG QUAN 1
1.1 GII THIU: 1
1.2 MC ÍCH CA TÀI: 2
1.3 PHNG PHÁP THC HIN: 2
1.4 ÓNG GÓP CA TÀI: 3
1.5 B CC CA BÁO CÁO: 3
CHNG 2. C S LÝ THUYT 4
2.1 NHN DIN GING NÓI: 4
2.1.1 KHÁI NIM C BN CA GING NÓI: 4
2.1.2 CÁC MÔ HÌNH NHN DIN GING NÓI 6
2.1.3 TI U HÓA VIC NHN DIN GING NÓI 8
2.2 S LC V WEB SERVICE: 9
2.2.1 KHÁI NIM V WEB SERVICE: 9
2.2.2 C IM CA WEB SERVICE: 9
2.2.3 KIN TRÚC SERVICES 11
2.2.4 CÁC THÀNH PH
N WEB SERVICES 12
2.3 S LC V H IU HÀNH ANDROID: 15
2.3.1 LCH S ANDROID: 15
2.3.2 ANDOIRD LÀ GÌ: 15
2.3.3 KIN TRÚC H IU HÀNH ANDROID: 15
2.3.4 TNG APPLICATION FRAMEWORK : 17
2.3.5 TNG APPLICATION : 18
2.3.6 CÁC THÀNH PHN TRONG PROJECT ANDROID: 18
2.3.7 CÁC THÀNH PHN C BN CA MT NG DNG ANDROID: 19
2.3.8 MÔI TRNG LP TRÌNH NG DNG ANDROID: 26
CHNG 3. THIT K VÀ CÀI
T 27
3.1 MÔ HÌNH HOT NG CA H THNG PHN MM IM DANH: 27
3.2 PHÂN TÍCH VÀ THIT K C S D LIU: 28
vi
3.2.1 MÔ HÌNH Ý NIM TRUYN THÔNG: 28
3.2.2 MÔ HÌNH Ý NIM D LIU: 29
3.2.3 MÔ HÌNH LOGIC D LIU: 30
3.2.4 MÔ HÌNH VT LÝ D LIU: 31
3.2.5 CÁC BNG D LIU: 32
3.3 XÂY DNG MÔ HÌNH NHN DIN GING NÓI: 43
3.3.1 CÁC THÀNH PHN C BN CA NHN DIN GING NÓI: 43
3.3.2 HUN LUYN MÔ HÌNH ÂM THANH 43
3.3.3 XÂY DNG MÔ HÌNH NGÔN NG 46
3.4 CÀI T 48
3.4.1
CÀI T PHÍA CLIENT 48
3.4.2 CÀI T PHÍA SERVER 52
3.4.3 HIN THC PHN MM QUN LÝ IM DANH SINH VIÊN: 54
3.5 THC NGHIM CHÍNH XÁC TRONG NHN DIN GING NÓI: 61
3.5.1 CHUN B D LIU GING NÓI: 61
3.5.2 THC NGHIM 62
CHNG 4. KT LUN 64
4.1 KT QU T C: 64
4.2 ÓNG GÓP MI VÀ HN CH CA TÀI: 64
4.2.1 ÓNG GÓP CA TÀI: 64
4.2.2 HN CH CU TÀI: 64
4.3 HNG PHÁT TRIN CA TÀI: 65
vii
DANH MC CÁC THUT NG TING ANH VÀ CH VIT TT
Acoustic model
Mô hình ngôn ng.
BEEP
Blocks Extensible Exchange Protocol.
Diphones
Âm v đôi.
Fillers
Các âm không phi li nói nh ting th, um, uh, ting ho,
HMM
Hidden Markov Model là mt mô hình thng kê vi các tham
s đu vào là không bit trc đ xác đnh các tham s đu ra
tng ng.
HTTP
Hypertext Transfer Protocol.
Language model
Mô hình ngôn ng.
Phonetic dictionary
T đin ng âm.
Quinphones
Âm v nm.
Reduction stable entities
Nhng thc th gim bt s n đnh.
ROC
Receiver Operating Curve.
Triphones
Âm v ba
Senone
Âm v
SOAP
Simple Object Access Protocol
Subphonetic
n v âm v ph
UDDI
Universal Description, Discovery, and Integration
Waveform
Sóng âm thanh đc hin th mt cách trc quan
WER
Word Error Rate là tn s các t b li
WSDL
Web Service Description Language
XML
eXtensible Markup Language
API
Applicaion Programming Interface
viii
DANH MC CÁC BNG
Bng 3.1 Danh sách các tác nhân ca MHYNDL 32
Bng 3.2 Danh sách các dòng thông tin ca MHYNDL 32
Bng 3.3 Danh sác các thc th ca mô hình ý nim d liu 33
Bng 3.4 Danh sách các liên kt ca thc th CoSo 33
Bng 3.5 Danh sách các thuc tính ca thc th CoSo 33
Bng 3.6 Danh sách các liên kt ca thc th DiemDanhSV 33
Bng 3.7 Danh sách các thuc tính ca thc th DiemDanhSV 34
Bng 3.8 Danh sách các liên kt ca thc th GiangVien 34
Bng 3.9 Danh sách các thuc tính ca thc th GiangVien 34
B
ng 3.10 Danh sách các liên kt ca thc th HocKy 34
Bng 3.11 Danh sách các thuc tính ca thc th HocKy 34
Bng 3.12 Danh sách các liên kt ca thc th Khoa 34
Bng 3.13 Danh sách các thuc tính ca thc th Khoa 34
Bng 3.14 Danh sách các liên kt ca thc th Lop 35
Bng 3.15 Danh sách các thuc tính ca thc th Lop 35
Bng 3.16 Danh sách các liên kt ca thc th MonHoc 35
Bng 3.17 Danh sách các thuc tính ca thc th MonHoc 35
Bng 3.18 Danh sách các liên kt ca thc th NamHoc 35
Bng 3.19 Danh sách các thuc tính ca thc th NamHoc 35
Bng 3.20 Danh sách các liên kt ca thc th PhongHoc 35
Bng 3.21 Danh sách các thuc tính ca thc th PhongHoc 36
Bng 3.22 Danh sách các liên kt ca thc th SinhVien 36
Bng 3.23 Danh sách các thuc tính ca thc th SinhVien 36
Bng 3.24 Danh sách các liên kt ca thc th TKB 36
Bng 3.25 Danh sách các thuc tính ca thc th TKB 36
Bng 3.26 Danh sách các liên kt ca mô hình ý nim d li
u 36
Bng 3.27 Danh sách các liên kt đn ca liên kt Ca 37
Bng 3.28 Danh sách các liên kt đn liên kt DangKy 37
Bng 3.29 Danh sách các liên kt đn liên kt Day 37
Bng 3.30 Danh sách các liên kt đn liên kt DD_TKB 37
Bng 3.31 Danh sách các liên kt đn liên kt DiemDanh 37
Bng 3.32 Danh sách các liên kt đn liên kt HK_NamHoc 38
Bng 3.33 Danh sách các thuc tính ca liên kt HK_NamHoc 38
ix
Bng 3.34 Danh sách các liên kt đn liên kt Hoc 38
Bng 3.35 Danh sách các liên kt đn liên kt o 38
Bng 3.36 Danh sách các liên kt đn liên kt Thuoc 38
Bng 3.37 Danh sách các liên kt đn liên kt Trong 38
Bng 3.38 Danh sách các bng ca mô hình vt lý d liu 39
Bng 3.39 Danh sách các liên kt đn liên kt Xep 40
Bng 3.40 Danh sách các thc th, các thuc tính và khoá 1 41
Bng 3.41 Danh sách các thc th, các thuc tính và khoá 42
Bng 3.42 Danh sách các mi liên h ca mô hình logic d liu 42
Bng 3.43 B
ng kt qu thc nghim ca 10 sinh viên 62
x
DANH MC CÁC HÌNH
Hình 2.1 Dng sóng âm thanh 5
Hình 2.2 Mô hình giao tip ca Web service 10
Hình 2.3 S đ kin trúc ca web service 11
Hình 2.4 Mô t SOAP đc s dng trong web service 13
Hình 2.5 Các thành phn ca WSDL 14
Hình 2.6 Kin trúc h điu hành Android 16
Hình 2.7 Cu trúc th mc ca mt d án Android 18
Hình 2.8 Cu trúc mt Activity Stack 20
Hình 2.9 Chu k hot đng ca mt Activity 21
Hình 2.10 Chu k sng ca mt Service 25
Hình 2.11 Cây phân cp ca giao din ngi dùng 26
Hình 3.1 Mô hình ho
t đng ca h thng 27
Hình 3.2 Mô hình ý nim truyn thông 28
Hình 3.3 Mô hình ý nim d liu 29
Hình 3.4 Mô hình logic d liu 30
Hình 3.5 Mô hình vt lý d liu 31
Hình 3.6 Các thành phn c bn ca mt h thng nhn din ging nói 43
Hình 3.7 Mô hình hot đng bên phía Client 48
Hình 3.8 Mô hình hot đng bên phía Server 53
Hình 3.9 Sinh viên m ng dng 54
Hình 3.10 Màn ch khi đang đng nhp vào phn mm 55
Hình 3.11 Sinh viên đang nhp thành công nhng ch
a đn c s hc 56
Hình 3.12 Sinh viên đang trong c s hc 57
Hình 3.13 Xem danh sách môn hc 58
Hình 3.14 Thi khoá biu chi tit ca môn hc 59
Hình 3.15 V trí sinh viên đang đng 60
Hình 3.16 Sinh viên đc theo dãy s kim tra sinh ngu nhiên 61
Hình 3.17 Biu đ kt qu thc nghm 63
Trang 1
CHNG 1. TNG QUAN
1.1 GII THIU:
Th h sau s ln lên, phát trin và s là ch nhân ca đt nc. Nu có đc mt môi
trng giáo dc tt, k lut tt thì sau này h s có đc công n vic làm tt và nh đó
kinh t ca đt nc s phát trin dn đn đt nc ngày càng phát trin. Nhng trong
môi trng giáo dc s có nhiu vn đ ny sinh đòi hi công vi
c qun lý ca nhng con
ngi làm giáo dc phi tht tt và vic ng dng công ngh vào thc tin đi sng s
giúp vic qun lý đc d dàng hn.
Hin nay theo đà phát trin ca th gii, công ngh ngày càng phát trin mnh, nhng
công c tiên tin ra đi h tr cho công vic, cho cuc sng ca con ngi giúp nhng
công vic ngày càng thun tin và d dàng h
n. Công ngh cao cng góp mt phn trong
vic h tr vic giáo dc. Máy chm thi trc nghim ra đi giúp cho vic chm đim các
bài trc nghim đc nhanh chóng, giáo viên không cn phài ngi bên nhng t phiu
trc nghim và đi chiu, kim tra các câu hi trc nghim lp đi lp li hàng gi, tn rt
nhiu thi gian. Thay vào đó nh có máy chm thi trc nghim, công vic c
a giáo viên
đc gim ti mt phn đáng k. ây là mt trong nhng vì d v vic ng dng công
ngh vào giáo dc.
Vi s phát trin ca công ngh nh hin nay thì giá thành ca đin thoi di dng
thông minh ngày càng gim phù hp vi túi tin ca đi đa s ngi dùng ph thông, vì
th vic mi sinh viên s dng mt chic đi
n thoi thông minh đ h tr vic hc tp
cng nh gii trí là mt điu tt yu.
Tính đn thi đim hin ti, công ngh nhn din ging nói đc áp dng ph bin
trong vic nhp liu nhanh hn, mt đon vn bn dài có th đc hoàn thành vi thi
gian ngn hn rt nhiu so vi nhp b
ng tay, khi cn tìm kim trên thit b di dng, thay
vì phi n tng phím trên đin thoi, điu này mt nhiu thi gian do hn ch v kích
thc ca đin thoi di đng, thì vic nhn din ging nói tr nên hu dng trong tình
hung này. Ngoài vic nhp liu nhanh hn, nhn din ging nói cng có th đc áp
dng đ xác thc nhân thân mt cách hi
u qu hn do mi ngi có mt ging nói khác
nhau.
Ti i hc Aoyama Gakuin, Nht Bn, các sinh viên nm th nht, sinh viên nm
th hai và các nhân viên ca trng đc phát mi ngi mt chic đin thoi thông minh
min phí. Mc đích ca vic này là đ to mt mng li thông tin di đng gia các sinh
viên và các giáo s. Bên cnh đó vic này cng là mt cách thun tin đ cho gi
ng viên
có th đim danh sinh viên mt cách hiu qu nht. Khi các sinh viên bc vào lp, thay
vì phi ghi tên vào t giy đim danh thì bây gi các sinh viên đn gin ch cn nhp mã
Trang 2
s sinh viên ca mình và s phòng hc vào chic đin thoi h đc phát. ng dng ca
h có s dng GPS đ tránh tình trng sinh viên nhà hoc ngoài lp đ đim danh.
Nhng vi hình thc này, các sinh viên có th d dàng cúp hc vì ch cn đa cho bn
mn chic đic thoi ca mình đ bn đó đn trng và đim danh h.
Vit Nam, vic chng tiêu cc trong hc tp và thi c ch đc chú trng các k
thi đu vào ca các trng i hc. Công tác qun lý sinh viên các trng i hc vn
còn lng lo. iu đó đã to k h cho nhng sinh viên li hc, ham chi tìm đn các
dch v “hc h, thi h” đang đc công khai qung bá rm r
trên nhng trang web
qung cáo, mng xã hi… trong nhng thi đim cn k mùa thi. Nn “hc h, thi h” là
nn tng dn đn các tiêu cc trong môi trng hc tp cng nh ngoài xã hi đã to điu
kin cho nhng ngi gi danh sinh viên đ thc hin các hành vi xu ging đng i
hc.
Vi quy ch hc tín ch các tr
ng i hc, Cao đng nc ta hin nay vic hc
tr nên d dàng, các sinh viên có th la chn mt s lng tín ch nht đnh đ hc trong
mt hc k và vì th mi sinh viên s có mt thi khóa biu riêng. Bên cnh nhng mt
tích cc ca quy ch hc tín ch thì vn còn có mt hn ch. Vì mi sinh viên có mt thi
khoá biu riêng nên vic qun lý các sinh viên s
tr nên khó khn hn.
T nhng thc trng trên, nhóm nghiên cu đã tin hành xây dng mt h thng phn
mm đim danh sinh viên bng ging nói đ h tr vic đim danh trong các trng i
hc áp dng hc ch tín ch.
1.2 MC ÍCH CA TÀI:
Xây dng mt h thng phn mm đim danh trên client – server. Client là các thit
b di đng chy h điu hanh Android, có ng dng nhn din ging nói và các công ngh
tiên tin nh h thng đnh v toàn cu (GPS), bn đ trc tuyn Google Maps. Server là
Webservice cùng vi h qun tr c s d liu SQL Server. H thng phn mm đim
danh này có th đc tri
n khai trong các trng i hc.
1.3 PHNG PHÁP THC HIN:
Lp trình Web service bên phía server bng ngôn ng C# trên môi trng Visual
Studio 2010.
Ly đa đim bng công ngh đnh v toàn cu GPS trên đin thoi di đng chy
trên h điu hành Android.
Xác đnh v trí ca thit b di đng và v trí ca đa đim hc bng Google Maps
Lp trình phn mm nhn din ging nói trên thit b di dng Android.
Trang 3
Xây dng mô hình âm thanh, mô hình ngôn ng cho vic nhn din ging nói s
dng b công c nhn din ging nói ca i hc Carnegie Mellon là Pocketsphinx.
Lp trình client – server, ly d liu GPS và xác thc bng ging nói trên thit b
client là đin thoi thông minh, sau đó d liu đc đa lên server và thao tác trên c s
d liu SQL Server.
Tin hành thc nghim t l nhn di
n và t l gi ging trong vic xác thc bng
nhn din ging nói đ tìm ra ngng sai s chp nhn đúng và ngng sai s không chp
nhn ca phn mm.
1.4 ÓNG GÓP CA TÀI:
V mt xã hi, lun vn này có th ng dng đ giúp gim thiu tình trng “hc h,
thi h” đang còn tn ti trong môi trng giáo dc i Hc hin nay nc ta.
V mt công ngh, lun vn xây dng đã xây dng h thng phn mm đim danh
sinh viên client – server, client là các thit b đin thoi di dng chy h điu hành
Android, server là webservice đc vit bng ngôn ng C#, phn xác thc danh tính đc
ng dng h thng nhn din ging nói. H thng có th đc áp dng vào thc tin đi
sng, c th là trong môi trng đào to, giáo dc. Thc nghim t l nhn din đ đa ra
ngng chp nhn đúng 100% là t 0.7 tr lên và ngng chp nhn sai 100% là t 0.3
tr xu
ng.
1.5 B CC CA BÁO CÁO:
Chng 1: Tng quan
Chng này nêu nhng ni dung tng quan, gii thiu, nêu mc đích ca đ tài, các
phng pháp thc hin, đóng góp ca đ tai và b cc ca báo cáo.
Chng 2: C s lý thuyt
Chng này nêu các lý thuyt c bn ca Web service, Android, GPS và nhn din
ging nói t đó làm c s đ thit k và cài đt h thng phn mm.
Chng 3: Thit k và cài đt
Chng này phân tích và thit k h thng , thit k các mô hình c s d liu, hun
luyn mô hình nhn din ging nói, các bc đ cài đt nhn din ging nói đ chy trên
đc thit b Android. Cài đt Webservice bên phía Server.
Chng 4: Kt lun
Chng này nêu lên nhng kt qu đt đc ca lun này, nhng đóng góp ca đ tài
v mt xã hi và v
mt công ngh. Mt s hn ch ca đ tài.
Trang 4
CHNG 2. C S LÝ THUYT
2.1 NHN DIN GING NÓI:
Khi mt ngi cn xác thc danh tính trên đin thoi, máy tính, tài khon ngân
hàng,… h cn xác thc thông qua mt khu. Nhng vic s dng mt khu có th d
dàng s dng các công c tiên tin đ dò tìm ra và vi kt qu tìm đc, ngi ta có th
gi danh ngi khác đ xâm nhp mt cách bt hp pháp. Công ngh nhn din ging nói
hin ti, hoc có th trong tng lai có th
s giúp vic xác đnh danh tính chun xác hn
do mi ngi có mt ging riêng bit nh du vân tay.
2.1.1 KHÁI NIM C BN CA GING NÓI:
Ging nói là mt hin tng phc tp và rt khó xác đnh đc cách nó đc cu
thành và cách nó đc lnh hi. Nhn thc thông thng là ging nói đc cu thành
bng các t, và mi t bao gm các âm t li nói. Thc ra thì li nói là mt quá trình
đng và có nhng phn không th phân bit đc mt cách rõ ràng.
Các mô t hin đi v li nói ch mc đ xác sut, vì th không có mt ranh gii
nht đnh gia các đn v đ biu din li nói hoc gia các t vi nhau. Xác sut đ nhn
din đc ging nói không bao gi chính xác mt cách tuyt đi vì th chúng ta rt khó
có th có mt h
thng có th nhn dng ging nói mt cách hoàn ho và đó là lý do
chúng ta chp nhp có sai s.
Li nói là mt lung âm thanh liên tc mà đó trng thái n đnh trn ln vi trng
thái thay đi không n đnh. Trong chui trng thái này, ngi ta có th đnh ngha các
lp ca âm thanh hoc âm v mt cách nhiu hoc ít hn. T đc hiu là đc xây dng
t các âm v
, nhng điu này có th không chính xác. Các thuc tính âm thanh ca mt
dng sóng (waveform) tng ng vi mt âm v có th khác nhau rt nhiu ph thuc vào
nhiu yu t - ng cnh âm v, ngi nói, cách nói,…
Hình 2.1 th hin dng sóng ca hai ch s “nm” và “sáu” đc ghi li t máy ghi
âm và hin th trên phn mm ghi âm ging nói trên máy tính.
Trang 5
Hình 2.1 Dng sóng âm thanh
Hin tng âm thanh trn ln vi nhau trong quá trình hình thành làm cho âm v rt
khác so vi biu din ca các quy tc tiêu chun. Nhng s chuyn tip gia các t thì
mang nhiu thông tin hn khu vc n đnh, chúng ta thng nói v diphones (âm v
đôi), đó là nhng phn ca các âm v gia hai âm v liên tip. Thnh thong ta còn nói v
subphonetic (đn v âm v ph) – là nhng trng thái ph
ca mt âm v. Thng có ba
hoc nhiu hn các khu vc có nhng tính cht khác nhau có th d dàng đc tìm thy.
Phn đu tiên ca âm v ph thuc vào âm v trc đó, phn gia n đnh, và phn
tip theo ph thuc vào âm v theo sau. ó là lý do ti sao thng có ba trng thái ca âm
v đc chn cho nhn din da vào mô hình HMM (Hidden Makov Model).
Mô hình markov n (HMM – Hidden Markov Model) là mt mô hình thng kê v
i
các tham s đu vào là không bit trc đ xác đnh các tham s đu ra tng ng. ây là
mô hình tính toán thng kê đc s dng rng rãi trong ngành tin - sinh hc.
Thnh thong các âm v đc xem xét v thuc tính. Có th có triphones (âm v ba)
hoc thm chí là quinphones (âm v nm). Nhng không ging nh các âm v đn và âm
v đôi, nó tng ng vi tm ngang nhau trong dng sóng nh là các âm v đn. Nó ch
khác cái tên. ó là lý do chúng ta g
i đi tng này là senone. Mt s ph thuc ca
senone trong thuc tính có th phc tp hn ch là thuc tính trái và thuc tính phi. Nó
có th là mt hàm phc tp đc đnh ngha bi cây quyt đnh, hoc bi mt s cách
khác.
Các âm v to ra đn v âm ph, ging nh âm tit. Thnh thong, âm tit đc đnh
ngha nh là mt “reduction-stable-entities” (nhng th
c th gim bt s n đnh). mô
t, khi li nói bt đu nhanh hn, âm v thng thay đi, nhng âm tit vn gi nguyên.
Hn na, các âm tit còn có liên quan đn ng điu. Có nhiu cách khác nhau đ xây
dng các t ph - da trên nn tng hình thái hc ca hình thái ngôn ng phong phú hoc
nn tng âm v. Các t ph thng s dng trong nhn di
n ging nói qua t vng.
Trang 6
Các t ph xut phát t các t. Các t thì rt quan trng trong nhn din ging nói vì
nó thu hp các t hp ca các âm v mt cách đáng k. Ví d: nu có 40 âm v và trung
bình mi t có 7 âm v, s là 40^7 t. Tuy nhiên đi vi nhng ngi có trình đ hc vn
cao thì h rt him khi s dng hn 20 ngàn t, điu này làm cho nhn din ging nói có
th kh quan.
Các t và nhng âm thanh không phi ngôn ng, chúng ta gi chúng là fillers (ting
th, um, uh, ting ho), to nên nhng câu nói. Nó là nhng đon tách ri ca âm thanh
gia nhng khong ngh. Nó không cn thit trong các câu có nhiu ng ngha thuc v
khái nim.
Cách ph bin nht đ nhn din đc ging nói là: ly dng sóng, chia nó thành các
li nói và khong im lng sau đó c gng nhn din nhng gì
đc nói trong mi li.
làm vic đó chúng ta ly tt c các kt hp có th ca các t và c gng khp chúng vi
âm thanh:
Trc tiên nó là khái nim ca nhng đc trng. Vì s lng các tham s là khá ln
nên chúng ta c gng đ ti u hóa nó. S liu đc tính toán t li nói bng cách chia li
nói thành các khung. Mi chiu dài ca mt khung tiêu biu là 10 mili giây, chúng ta trích
ra 39 s. Gi là véc-t
đc trng. Cách đ phát sinh ra nhng s đó là mt đi tng ca
vic thm dò mt cách ch đng. Hiu theo cách đn gin là s phát sinh ca quang ph.
Th hai là khái nim ca mô hình. Mô hình mô t các đi tng toán hc tp hp t
các thuc tính thông dng ca t đc nói ra. Thc t, mô hình âm thanh ca âm v là hn
hp gn-x ca ba trng thái – đ đn gi
n, nó là mt véc-t tính nng có th xy ra nht.
T khái nim ca mô hình đt ra nhiu vn đ - làm cách nào mô hình có th phù hp vi
thc t nht, mô hình có th tt hn nhng vn đ ca mô hình ni b, s thích nghi ca
mô hình vi điu kin luôn thay đi là nh th nào.
Th ba, nó là mt tin trình phù hp vi chính nó. Phi mt mt khong thi gian lâu
h
n khong thi gian tn ti ca v tr đ so sánh tt c các véc-t đc trng vi tt c
mô hình, quá trình tìm kim thng đc ti u bng nhiu th thut. Ti thi đim hin
ti chúng ta duy trì s khp ni ca các bin th mt cách tt nht và m rng chúng theo
thi gian phát ra phù hp vi bin th các khung ti
p theo.
2.1.2 CÁC MÔ HÌNH NHN DIN GING NÓI
Da theo cu trúc ca ging nói, có 3 mô hình h tr cho vic nhn din ging nói:
Mô hình âm thanh: bao gm các đc tính ca âm thanh cho mi âm v. Mô hình ng
cnh đc lp cha đng các thuc tính (đc tính có th xy ra nht ca mi âm v) và mô
hình ng cnh ph thuc (xây dng t các âm v vi ng cnh).
Trang 7
T đin ng âm: cha mt ánh x t các t đn các âm v. Ánh x này không hiu
hiu qu lm. Ví d, ch có hai hoc ba bin th phát âm đc ghi trong đó, nhng nó
thc hin đ hu ht thi gian. T đin không phi là bin th duy nht đ ánh x t các
t đn các âm v. Nó có th đc thc hin bi các hàm phc tp vi mt c máy có th
hc thut toán.
Mô hình ngôn ng: s dng đ gii hn vic tìm kim các t. Nó đnh ngha t nào có
th theo sau t đc nhn din trc đó (quá trình khp ni li vi nhau là mt quá trình
liên tc) và giúp hn ch đáng k quá trình khp li bng cách b bt các t không có kh
nng xy ra. Mô hình đc s
dng thông dng nht là mô hình ngôn ng n-gram – nó
cha các thng kê ca các t liên tip – và mô hình ngôn ng trng thái hu hn – nó đnh
ngha li nói liên tip bng trng thái hu hn t đng hóa, thnh thong đc đnh ngha
bng trng lng. đt đn tn s chính xác tt, mô hình ngôn ng ca bn cn phi
thành công trong vic tìm kim không gian hn ch. Ngha là nó cn ph
i rt tt trong
vic d đón các t tip theo. Mt mô hình ngôn ng thng gii hn t vng lu tâm đn
các t mà nó cha. ó là mt vn đ v vic nhn dng tên. đi phó vi nó, mt mô
hình ngôn ng có th cha mt vài đon nh nh các t ph hoc thm chí là âm v. Lu
ý rng vic tìm kim không gian h
n ch trong trng hp này thng rt t và tng
đng vi vic gim đ chính xác trong vic nhn dng hn là mt t da trên mô hình
ngôn ng.
Ba mô hình trên kt hp li trong mt c máy nhn dng ging nói. Nu chúng ta ng
dng máy ca chúng ta cho các ngôn ng khác, bn cn phi có cu trúc nh vy. i vi
hu ht các ngôn ng, t đin ng âm và th
m chí là t vng ca ngôn ng đã có sn và
có th ti v t các trang chuyên cung cp mô hình nhn din ging nói.
Mt s khái nim khác dùng đ s dng trong vic nhn din ging nói:
Lattice: mng li mt đ th có hng biu din các bin đi ca vic nhn din.
Thông thng, vic ly đc kt qu khp li thì không thc t; trong trng hp này,
mng li là đnh dng trung gian tt đ biu din các kt qu nhn din.
N-best list ca s bin đi ging nh mng li, cho dù s biu din ca nó không
dày đc nh mng li.
Mng li t hn tp (hình xúc xích): là nhng mng li đc gng vi nhau theo
trình t ca các đim đc ly t mi góc ca mng li đ th.
C s d liu ging nói: là mt b ghi âm đc trng t c s d liu các tác v. Nu
chúng ta phát trin h thng hi thoi nó s là hi thoi ghi âm dành cho ngi dùng. i
vi h thng ra lnh nó có th là đc các bn ghi âm. C s d liu ging nói đc s
dng đ hu
n luyn, điu chnh và kim tra các h thng gii mã.
Trang 8
C s d liu vn bn: nhng vn bn mu đc thu thâp cho hun luyn mô hình
ngôn ng. Thng thì c s d liu vn bn đc thu thp t các mu form. Vn đ vi
vic thu thp là đa tài liu hin ti (tp tin PDF, các trang web, các bn scan,…) vào
trong các mu form. Mt khác bn cn ghi rõ các t vit tt.
2.1.3 TI U HÓA VIC NHN DIN GING NÓI
Khi phát trin nhn din ging nói, vn đ phc tp nht là s chính xác (đa ra nhiu
bin th phù hp nht có th) và s nhanh chóng. Ngoài ra còn có các vn đ khi khp ni
các kt qu nói trong khi các mô hình này không đc hoàn ho.
Nhng đc tính sau s đc dùng:
Tn s t b li (Word error rate/WER). Chúng ta có vn bn gc và vn bn ghi âm
có đ dài là N t. T đó có I t đc thêm vào, D t b xóa và S t thay th:
WER = (I + D + S) / N
WER thng đc tính bng phn trm
chính xác. Hu nh ging vi WER, nhng không có t thêm vào.
chính xác = (N – D – S) / N
chính xác thc s là mt b đo không tt cho hu ht các tác v, vì vic thêm vào
là rt quan trng vi kt qu cui cùng. Nhng đi vi mt s tác v, đ chính xác là b
đo hp lý cho hiu sut ca b gii mã
Tc đ. Gi s tp tin âm thanh dài 2 ting và thi gian gii mã là 6 ting thì tc đc
đm đc là 3xRT
Cung ROC (Receiver Operating Curve), trong lý thuyt phát tín hiu dùng đ xác
đnh tín hiu nhn đc có phi là tín hiu tht s hay. Khi nói v s phát hin tác v, có
th có báo đng gi hoc truy cp/b l; cung ROC s đc s dng trong trng hp
này. Mt góc ca cung ROC là mt đ th biu di
n s ln báo đng gi vi s ln truy
cp và nó c gng đ ti u các đim ni mà s ln báo đng gi nh và s ln truy cp
phù hp 100%.
Trang 9
2.2 S LC V WEB SERVICE:
2.2.1 KHÁI NIM V WEB SERVICE:
Dch v web (web service) là mt h thng phn mm đc xây đng đ h tr kh
nng tng tác gia các máy tính trên mng (theo Wide Web Consortium). Nó cung cp
mt giao tip đc mô t theo mt đnh dng chung thng gi là ngôn ng mô t dch v
web (Web Service Description Language –WSDL). Các h thng khác thc hin tng
tác vi dch v web thông qua giao thc SOAP (Simple Object Access Protocol). ây là
giao thc giúp trao đi thông tin gia s
dng HTTP kt hp vi vic s dng đc t
XML cùng vi mt s chun khác. Nh vy, mc đích chính ca vic phát trin ca dch
v web là cho phép giao tip và trao đi các chc nng, thông tin, d liu gia các ng
dng mt cách d dàng mà không cn quan tâm đn môi trng phát trin, ngôn ng lp
trình bi tt c đã đc quy đnh v m
t đnh dng chung. Bn cht ca web service là
mt tp hp các đi tng, các phng thc đc thc thi và công b trên mng đ có th
đc gi t xa thông qua các ng dng khác nhau.
2.2.2 C IM CA WEB SERVICE:
c đim chung ca web service là cho phép client và server tng tác đc vi nhau
ngay c trong nhng môi trng khác nhau. Phn ln k thut ca web service đc xây
dng da trên mã ngun m
và đc phát trin theo các chun đã đc công nhn. Web
service là s kt hp ca vic phát trin theo hng tng thành phn vi nhng lnh vc
c th và c s h tng web, chúng đa ra nhng li ích cho c doanh nghip, khách
hàng, nhng nhà cung cp khác và c nhng cá nhân thông qua mng Internet.
Trang 10
Hình 2.2 Mô hình giao tip ca Web service
Nhng u đim ca web service giúp vic xây dng h thng đc linh hot hn.
Web service cung cp kh nng hot đng rng ln vi các ng dng phn mm khác
nhau chy trên các nn tng khác nhau. Web service s dng các giao thc và các chun
m. D liu đc đnh dng theo kiu vn bn, thun li cho ngi phát trin ng dng
cng nh nâng cao kh nng tái s dng. Web service thúc đy vic đu t vào các h
thng phn mm đa tn ti bng cách cho phép các tin trình, chc nng nghip v đc
đóng gói trong giao din web service. Web service có th to mi tng tác ln nhau và
mm do gia các thành phn trong h thng, giúp ngi lp trình d dàng cho vic phát
trin các h thng d liu phân tán. Vic phát tri
n h thng tích hp bng web service
làm gim s phc tp ca h thng.
Bên cnh nhng u đim trên, web server cng còn tn ti mt s khuyt đim nh
có quá nhiu chun cho dch v web khin ngi dùng khó nm bt. Cn phi cân nhc
đn tính bo mt ca web service đ tránh nhng l hng không đáng có. Ngoài ra các
giao thc đc thay đ
i và nâng cp, đòi hi ng dng ca client phi đc nâng cp,
thay đi theo.
Trang 11
2.2.3 KIN TRÚC SERVICES
Web service gm có 3 chun chính: SOAP (Simple Object Access Protocol), WSDL
(Web Service Description Language) và UDDI (Universal Description, Discovery, và
Integration). UDDI đc s dng đ đng ký và khám phá dch v Web đã đc miêu t
c th trong WSDL. Giao tác UDDI s dng SOAP đ giao tip vi UDDI server, sau đó
các ng dng SOAP yêu cu dch v Web. Các thông đip SOAP đc gi đi chính xác
bi HTTP và TCP/IP.
Hình 2.3 S đ kin trúc ca web service
Web service có 4 thành phn chính:
Dch v vn chuyn có nhim v truyn thông đip gia các ng dng mng, bao
gm nhng giao thc nh HTTP, SMTP, FTP, JSM và gn đây nht là giao thc thay đi
khi m rng (Blocks Extensible Exchange Protocol- BEEP).
Thông đip XML có nhim v gii mã các thông đip theo đnh dng XML đ có th
hiu đc mc ng d
ng tng tác vi ngi dùng. Hin ti, nhng giao thc thc hin
nhim v này là XML-RPC, SOAP và REST.
Thành phn miêu t đc s dng đ miêu t các giao din chung cho mt dch v
Web c th. WSDL thng đc s dng cho mc đích này, nó là mt ngôn ng mô t
giao tip và thc thi da trên XML. Dch v Web s s dng ngôn ng này đ truyn
tham s và các loi d li
u cho các thao tác và chc nng mà dch v web cung cp.
Khám phá dch v (Discovery): tp trung dch v vào trong mt ni đc đng ký, t
đó giúp mt dch v Web có th d dàng khám phá ra nhng dch v nào đã có trên mng.
Trang 12
Mt dch v Web cng phi tin hành đng ký đ các dch v khác có th truy cp và giao
tip. Hin ti, UDDI API thng đc s dng đ thc hin công vic này
2.2.4 CÁC THÀNH PHN WEB SERVICES
a) XML (Extensible Markup Language):
Là mt chun m do W3C đa ra cho cách thc mô t d liu, nó đc s dng đ
đnh ngha các thành phn d liu trên trang web và nhng tài liu B2B. V hình th
c,
XML hoàn toàn có cu trúc th ging nh ngôn ng HTML nhng HTML đnh ngha
thành phn đc hin th nh th nào thì XML li đnh ngha nhng thành phn đó cha
nhng cái gì. Vi XML, các th có th đc lp trình viên t to ra trên mi trang web và
đc chn là đnh dng thông đip chun bi tính ph bin và hiu qu mã ngun m.
Do dch v Web là s kt h
p ca nhiu thành phn khác nhau nên XML s dng các
tính nng và đc trng ca các thành phn đó đ giao tip. XML là công c chính đ gii
quyt vn đ này và là kin trúc nn tng cho vic xây dng mt dch v Web, tt c d
liu s đc chuyn sang đnh dng th XML. Khi đó, các thông tin mã hóa s hoàn toàn
phù hp vi các thông tin theo chun ca SOAP hoc XML-RPC và có th tng tác vi
nhau trong m
t th thng nht.
b) SOAP - Simple Object Access Protocol:
SOAP là mt giao thc giao tip có cu trúc nh XML.Nó đc xem là cu trúc
xng sng ca các ng dng phân tán đc xây dng t nhiu ngôn ng và các h điu
hành khác nhau.SOAP là giao thc thay đi các thông đip da trên XML qua mng máy
tính, thông thng s dng giao thc HTTP.
Mt client s gi thông đip yêu cu ti server và ngay lp tc server s gi nhng
thông đip tr li ti client. C SMTP và HTTP đu là nhng giao thc lp ng dng
ca SOAP nhng HTTP đc s dng và chp nhn rng rãi hn bi ngày nay nó có th
làm vic rt tt vi c s h tng Internet
Trang 13
Hình 2.4 Mô t SOAP đc s dng trong web service
c) WSDL (Web Service Description Language)
WSDL đnh ngha cách mô t dch v Web theo cú pháp tng quát ca XML, bao
gm các thông tin v tên dch v, giao thc và kiu mã hóa s đc s dng khi gi các
hàm ca dch v web, các loi thông tin nh thao tác, tham s, nhng kiu d liu (có th
là giao din ca dch v Web cng vi tên cho giao din này).
Mt WSDL hp l gm hai phn: phn giao din (mô t giao din và phng thc kt
ni) và phn thi hành mô t thông tin truy xut CSDL. C hai phn này s đc lu trong
2 tp tin XML tng ng là tp tin giao din dch v và tp tin thi hành dch v. Giao din
ca mt dch v Web đc miêu t trong phn này đa ra cách thc làm th nào đ giao
tip qua dch v Web. Tên, giao thc liên kt và đnh dng thông đip yêu cu đ t
ng
tác vi dch v Web đc đa vào th mc ca WSDL.
WSDL thng đc s dng kt hp vi gin đ XML và SOAP đ cung cp dch v
web qua Internet. Mt client khi kt ni ti dch v Web có th đc WSDL đ xác đnh
Trang 14
nhng chc nng sn có trên server. Sau đó, client có th s dng SOAP đ ly ra chc
nng chính xác có trong WSDL.
Hình 2.5 Các thành phn ca WSDL
Mi thành phn có mt chc nng riêng, c th nh sau:
Types: ch đnh kiu d liu cho các thông đip gi và nhn.
Messages: là mt thành phn tru tng mô t cách thc giao tip gia client và
server
Porttypes: mô t ánh x gia các thng đip – đc mô t trong phn t messages –
và các phng thc
Binding: xác đnh giáo thc nào s dng khi giao tip vi dch v web.
Port: ch đa ch hoc đim kt ni đn web service, thng là chui URL đn gin.
d) Universal Description, Discovery, And Integration (UDDI):
có th s dng các dch v, trc tiên client phi tìm dch v, ghi nhn thông tin
v cách s dng và bit đc đi tng nào cung cp dch v. UDDI đnh ngha mt s
Trang 15
thành phn cho bit các thông tin này, cho phép các client truy tìm và nhn nhng thông
tin đc yêu cu khi s dng dch v Web.
e) Cu Trúc UDDI :
Trang trng (White pages): cha thông tin liên h và các đnh dng chính yu ca
dch v Web, chng hn tên giao dch, đa ch, thông tin nhn dng… Nhng thông tin
này cho phép các đi tng khác xác đnh đc dch v.
Trang vàng (Yellow pages): cha thông tin mô t dch v Web theo nhng loi khác
nhau. Nhng thông tin này cho phép các đi tng thy đc dch v Web theo tng loi
vi nó.
Trang xanh (Green pages): cha thông tin k thut mô t các hành vi và các chc
nng ca dch v Web.
Loi dch v (tModel): cha các thông tin v loi dch v đc s dng.
2.3 S LC V H IU HÀNH ANDROID:
2.3.1 LCH S ANDROID:
Android là h điu hành da trên nn tng linux dành cho các thit b đng. H điu
hành Android đc thit k đu tiên ti tng công ty Android. Sau đó đc Google mua
li vào nm 2005 cho đn nm 2007 Google mi chính thc ra mt h điu hành này.
2.3.2 ANDOIRD LÀ GÌ:
Android là tên mt nn tng m cho thit b di đng ca Google da trên kernel
Linux 2.6, gm h điu hành, nh
ng phn mm trung gian (middleware) và mt s ng
dng c bn mà ngi s dng cn đn. B công c phát trin phn mm Android SDK
cung cp các công c và các giao din lp trình ng dng API cn thit đ xây dng và
phát trin các ng dng trên nn Android bng ngôn ng lp trình Java.
2.3.3 KIN TRÚC H IU HÀNH ANDROID:
H điu hành Android có 4 tng t di lên trên là tng ht nhân Linux, tng
Libraries & Android runtime, tng Application Framework và trên cùng là tng
Application.
Hình 2.6 th hin 4 tng ca mt kin trúc h điu hành Android.