TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP. HCM
KHOA CÔNG NGHỆ THÔNG TIN
NGUYỄN KHIẾU ĐÌNH NGUYÊN 11L1120045
NGHIÊN CỨU VÀ ỨNG DỤNG SEO CHO WEBSITE
HỌC VIỆN QUỐC TẾ BMG
LUẬN VĂN TỐT NGHIỆP
GIÁO VIÊN HƯỚNG DẪN
Ths. NGUYỄN LƯƠNG ANH TUẤN
NIÊN KHÓA 2011 - 2013
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
LỜI CẢM ƠN
Chúng em đã bằng sự cố gắng và nỗ lực tìm hiểu, học hỏi của bản thân mình.
Với sự nghiên cứu và tìm tòi các tài liệu, ứng dụng công nghệ SEO vào thiết kế
Website từ sự tham khảo ý kiến của các anh chị đi trước, đặc biệt là sự hướng dẫn
tận tình của thầy ThS. Nguyễn Lương Anh Tuấn đã giúp chúng em hoàn thành tốt
bài LVTN của mình. Chúng em xin chịu trách nhiệm với những gì mình đã viết.
Mặc dù đã cố gắng hoàn thành đề tài với tất cả sự nổ lực của bản thân, nhưng
đề tài chắc chắn không tránh khỏi những thiếu sót nhất định, kính mong sự cảm
thông và tận tình chỉ bảo của quý Thầy Cô.
Em xin chân thành cám ơn ./.
TP. HỒ CHÍ MINH, Ngày tháng năm 2013
Nhóm sinh viên thực hiện
Nguyễn Khiếu Đình Nguyên
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
MỤC LỤC
M C L CỤ Ụ 1
5.7.1. Mô hình x lý t ng quát c a 1 h th ng l p ch m c……………………30 ử ổ ủ ệ ố ậ ỉ ụ 8
L I M UỜ Ở ĐẦ 10
CH NG 1: T NG QUAN TÀIƯƠ Ổ ĐỀ 11
1.Gi i thi uớ ệ 11
2.M c đíchụ 11
3.Ch c n ngứ ă 11
CH NG 2: CÔNG NGH S D NGƯƠ Ệ Ử Ụ 12
2.1 Ngôn ng PHP:ữ 12
CH NG 3: MÔ HÌNH X LÝƯƠ Ử 15
3.1 - B n đ website (Sitemap)ả ồ 15
3.2 - i t ng s d ng: Có 02 đ i t ng s d ng websiteĐố ượ ử ụ ố ượ ử ụ 16
3.2.1 - Khách 16
3.2.2 - Qu n trả ị 16
3.3 - Các ch c n ng chínhứ ă 16
3.3.1 - i v i kháchĐố ớ 16
H i th o & S ki nộ ả ự ệ 16
Bài vi t m iế ớ 17
Liên k t websiteế 18
Khóa h c m iọ ớ 18
3.3.2 - i v i ng i qu n trĐố ớ ườ ả ị 19
Ch ng 4: Mô Hình C S D Li uươ ơ ở ữ ệ 22
4.1 - C u trúc các b ngấ ả 22
4.1.1 - B ng Qu n tr Adminả ả ị 22
22
4.1.2 - B ng Gi i thi uả ớ ệ 22
4.1.3 - B ng Modulesả 23
4.1.4 - B ng Qu n lý Khóa h cả ả ọ 23
4.1.5 - B ng Qu n lý Tin T cả ả ứ 24
1
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
25
4.1.6 - B ng Qu n lý Userả ả 25
4.2 - Mô hình Use Case 26
4.2.1 - Phân h ng i dùngệ ườ 26
4.2.2 - Phân h khách hàngệ 28
4.2.3 - Phân h ng i qu n trệ ườ ả ị 30
5.1- M C TIÊU C N T CỤ Ầ ĐẠ ĐƯỢ 31
5.1.1 - V lý thuy t: Sau khi hoàn thành lu n v n, sinh viên có các k n ng sau:ề ế ậ ă ĩ ă 31
Tìm hi u b máy tìm ki m.ể ộ ế 31
Hi u th nào là SEO, các bi n pháp đ ti n hành SEO m t trang web.ể ế ệ ể ế ộ 31
5.1.2 - V ng d ng:ề ứ ụ 31
a website vào top 10 c a b máy tìm ki m v i các t khóa “h c marketing, h c pr, Đư ủ ộ ế ớ ừ ọ ọ
h c digital marketing, h c sales”.ọ ọ 31
Ph ng pháp duy trì top 10 khi seo đã thành công.ươ 31
5.2 - PH NG PHÁP NGHIÊN C U – K HO CH LÀM VI CƯƠ Ứ Ế Ạ Ệ 31
5.2.1 - Ph ng pháp nghiên c u và gi i quy t v n đ :ươ ứ ả ế ấ ề 31
B c 1: Xây d ng ý t ng, l a ch n mã ngu n, xây d ng website có n i dung riêng ướ ự ưở ự ọ ồ ự ộ
bi t, h tr ng i dùng t i đa.ệ ỗ ợ ườ ố 32
B c 2: B t đ u phát tri n website, song song v i vi c phát tri n c v n i dung l n ướ ắ ầ ể ớ ệ ể ả ề ộ ẫ
mã ngu n, tác gi b t đ u áp d ng các bi n pháp đ t i u hóa website.ồ ả ắ ầ ụ ệ ể ố ư 32
B c 3: Th ng kê, theo dõi các t khóa, l ng ng i truy c p.ướ ố ừ ượ ườ ậ 32
B c 4: Theo dõi các báo cáo c th , duy trì công vi c hi n t i n u SEO thành công ướ ụ ể ệ ệ ạ ế
ho c s a ch a khi SEO ch a thành công.ặ ữ ữ ư 32
K ho ch làm vi cế ạ ệ 32
5.3 - B C C C A SEOỐ Ụ Ủ 33
5.3.1 - T ng quanổ 33
5.3.2 -C s lý thuy tơ ở ế 33
5.3.3 - ng d ngỨ ụ 34
5.3.4 - K t lu n & H ng phát tri n.ế ậ ướ ể 34
5.4 - T NG QUAN B MÁY TÌM KI MỔ Ộ Ế 35
5.4.1 - B máy tìm ki m ho t đ ng nh th nào ?ộ ế ạ ộ ư ế 35
2
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
5.4.2 - Gi i thi u v các search engine thông d ngớ ệ ề ụ 36
5.5 - C U T O CHUNG CÁC B MÁY TÌM KI MẤ Ạ Ộ Ế 37
5.6 – ROBOT: 38
5.6.1 - Robot thu th p thông tin có nhi m v :ậ ệ ụ 38
5.6.2 - Robot ch m c – Robot Indexingỉ ụ 39
góc cao c a tài li u.Ở ủ ệ 40
Trong các đ m c.ề ụ 40
c in đ m.Đượ ậ 40
Trong URL 40
Trong tiêu đ (quan tr ng).ề ọ 40
Trong ph n miêu t trang web (Description) .ầ ả 40
Trong các th dành cho hình nh (ALT).ẻ ả 40
Trong các th ch a t khóa.ẻ ứ ừ 40
Trong các text liên k t.ế 40
5.7 – INDEX – B L P CH M CỘ Ậ Ỉ Ụ 40
5.7.1 - Mô hình x lý t ng quát c a m t h th ng l p ch m cử ổ ủ ộ ệ ố ậ ỉ ụ 40
Step of tokenization: Tách v n b n ra thành các chu i nh vào kho ng tr ng, m i chu iă ả ỗ ờ ả ắ ỗ ỗ
xem nh là m t t .ư ộ ừ 41
Step of removal of stop words: b nh ng t th ng xuyên xu t hi n trong h u h t ỏ ữ ừ ườ ấ ệ ầ ế
các tài li u nh ng l i không quan tr ng trong các tài li u nh tính t , đ i t .ệ ư ạ ọ ệ ư ừ ạ ừ 41
Step of stemming: lo i b các h u t (Suffixes) đ đ a v các t g c. ạ ỏ ậ ố ể ư ề ừ ố 41
5.7.3 - Ph ng pháp l p ch m c: Ph ng pháp l p ch m c g m hai ph n chính y uươ ậ ỉ ụ ươ ậ ỉ ụ ồ ầ ế
sau: 42
5.7.4 - Xác đ nh m c t quan tr ng c n l p ch m cị ụ ừ ọ ầ ậ ỉ ụ 42
5.7.5 - Xác đ nh tr ng s cho m c tị ọ ố ụ ừ 42
5.8 – SEARCH ENGINE – B MÁY TÌM KI M THÔNG TINỘ Ế 43
5.8.1 - Tìm ki m theo t khóaế ừ 43
5.8.2 - Tìm ki m theo ng ngh aế ữ ĩ 43
5.8.3 - Các chi n l c tìm ki mế ượ ế 44
Ta kh i đ u v i m t đ ng thông tin trên m t ch đ khá r ng ?ở ầ ớ ộ ố ộ ủ ề ộ 44
3
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Ho c ta đã hình dung đ c c th nh ng gì c n tìm ? ặ ượ ụ ể ữ ầ 44
Hay ta mu n tìm đ a ch c a ai đó ? ố ị ỉ ủ 44
5.9 - H TH NG RANKỆ Ố 45
5.9.1 - Google PageRank là gì? 45
5.9.2 - Google PageRank đem l i l i ích gì ?ạ ợ 45
5.9.3 - T ng Google PageRank nh th nào?ă ư ế 46
5.10 – ALEXA RANK 46
5.10.1 - Alexa Rank là gì ? 46
5.10.2 - Alexa Rank mang l i l i ích gì?ạ ợ 46
5.10.3 - T ng Alexa Rank nh th nào?ă ư ế 47
5.11 - TÌM HI U V SEOỂ Ề 48
5.11.1 - T i sao c n SEO?ạ ầ 48
5.12 - CÁC PH NG PHÁP T I U HÓA WEBSITEƯƠ Ố Ư 50
5.12.1 - T i u hóa t khóa (keyword)ố ư ừ 50
5.12.2 - Tiêu đ : chính xác và duy nh t.ề ấ 50
Ch n tiêu đ truy n đ t hi u qu ch đ n i dung trang: m i trang web ph i có m t ọ ề ề ạ ệ ả ủ ề ộ ỗ ả ộ
tiêu đ khác nhau phù h p v i n i dung c a trang web đó. ề ợ ớ ộ ủ 52
T o tiêu đ duy nh t cho m i trang: m i trang nên có th tiêu đ duy nh t, th này giúp ạ ề ấ ỗ ỗ ẻ ề ấ ẻ
Google bi t trang này không gi ng nh trang khác nên trang web c a b n đi m nào.ế ố ư ủ ạ ở ể 53
S d ng các tiêu đ ng n g n nh ng mang tính mô t : Tiêu đ có th v a ng n g n và ử ụ ề ắ ọ ư ả ề ể ừ ắ ọ
giàu thông tin. N u tiêu đ quá dài, Google s ch hi n th m t ph n tiêu đ trong k t qu ế ề ẽ ỉ ể ị ộ ầ ề ế ả
tìm ki m. ế 53
Không nh t thi t ph i có t khóa trong tiêu đ webiste, tuy nhiên vi c c g ng t o ấ ế ả ừ ề ệ ố ắ ạ
đ c t khóa trong tiêu đ trang web s mang l i hi u qu cao h n trong k t qu tìm ượ ừ ề ẽ ạ ệ ả ơ ế ả
ki m c a các công c tìm ki m. Tuy nhiên, không ph i b n có v trí cao s đ c khách ế ủ ụ ế ả ạ ị ẽ ượ
hàng l a ch n nhi u h n nh ng b n ph i có m t trong danh sách 10 k t qu tìm ki m ự ọ ề ơ ư ạ ả ặ ế ả ế
đ u tiên. Hãy đ t mình vào v trí c a ng i tìm ki m thông tin, sau khi nh p vào t khóa ầ ặ ị ủ ườ ế ậ ừ
tìm ki m b n s nh n đ c 10 k t qu tìm ki m đ u tiên. n lúc này, b n s đ c các ế ạ ẽ ậ ượ ế ả ế ầ Đế ạ ẽ ọ
tiêu đ hi n th trên k t qu tìm ki m tr c khi b m vào liên k t đ đ n trang web có n i ề ể ị ế ả ế ướ ấ ế ể ế ộ
4
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
dung c n tìm. Vì v y, b n c n ph i có m t tiêu đ h p d n n a m i thu hút đ c s ầ ậ ạ ầ ả ộ ề ấ ẫ ữ ớ ượ ố
l ng khách vi ng th m khi b n đã có m t trang đ u tiên c a k t qu tìm ki m.ượ ế ă ạ ặ ở ầ ủ ế ả ế 53
Tiêu đ h p d n ng i đ c: tiêu đ trang web c a b n h p d n s thu hút đ c nhi u ề ấ ẫ ườ ọ ề ủ ạ ấ ẫ ẽ ượ ề
ng i quan tâm h n m c dù b n có th h ng th p h n. Vì v y ngoài vi c có t khóa ườ ơ ặ ạ ứ ạ ấ ơ ậ ệ ừ
trong tiêu đ b n c n ph i t o ra đ c tiêu đ h p d n v i ng i s d ng.ề ạ ầ ả ạ ượ ề ấ ẫ ớ ườ ử ụ 53
Ch n tiêu đ không liên quan đ n trang.ọ ề ế 53
S d ng các tiêu đ m c đinh nh : Untitle Document ho c New Page…(m c đ nh c a ử ụ ề ặ ư ặ ặ ị ủ
các công c thi t k web)ụ ế ế 53
S d ng tiêu đ chung cho toàn b trang ho c m t nhóm l n các trang.ử ụ ề ộ ặ ộ ớ 53
S d ng các tiêu đ quá dài, không có ích cho ng i dùng.ử ụ ề ườ 54
B sung các t khóa không c n thi t trong các th tiêu đ , vi c đ t t khóa chung v i tiêuổ ừ ầ ế ẻ ề ệ ặ ừ ớ
đ là t t, nh ng vi c này l i là con dao hai l i. Vì v y, b n nên suy ngh k tr c khi ề ố ư ệ ạ ưỡ ậ ạ ĩ ĩ ướ
b sung các t khóa m i vào tiêu đ trang web c a mình.ổ ừ ớ ề ủ 54
5.12.4 - Meta Description 54
5.12.5 - C i ti n c u trúc URLả ế ấ 54
S d ng các t trong URL - URL ch a các t liên quan đ n n i dung và c u trúc trang ử ụ ừ ứ ừ ế ộ ấ
web c a b n s thân thi n v i khách truy c p h n khi đi u h ng trang web c a b n. ủ ạ ẽ ệ ớ ậ ơ ề ướ ủ ạ
Khách truy c p s nh chúng t t h n và có th s n sàng liên k t đ n chúng h n.ậ ẽ ớ ố ơ ể ẵ ế ế ơ 55
T o c u trúc th m c đ n gi n: S d ng c u trúc th m c t ch c t t n i dung c a ạ ấ ư ụ ơ ả ử ụ ấ ư ụ ổ ứ ố ộ ủ
b n và giúp khách truy c p d dàng bi t v trí c a h trên trang web c a b n. Th s ạ ậ ễ ế ị ủ ọ ủ ạ ử ử
d ng c u trúc th m c c a b n đ ch đ nh lo i n i dung đ c tìm th y t i URL đó.ụ ấ ư ụ ủ ạ ể ỉ ị ạ ộ ượ ấ ạ 55
Cung c p phiên b n URL đ liên k t đ n tài li u: ng n ng i dùng liên k t t i phiên ấ ả ể ế ế ệ Để ă ườ ế ớ
b n URL và ng n nh ng ng i khác liên k t t i phiên b n khác (đi u này có th chia c t ả ă ữ ườ ế ớ ả ề ể ắ
uy tín c a n i dung đó gi a các URL), t p trung vào vi c s d ng và tham chi u t i ủ ộ ữ ậ ệ ử ụ ế ớ
URL trong c u trúc và liên k t bên trong trên trang c a b n. N u b n phát hi n r ng m i ấ ế ủ ạ ế ạ ệ ằ ọ
ng i đang truy c p cùng m t n i dung thông qua nhi u URL, vi c thi t l p 301 ườ ậ ộ ộ ề ệ ế ậ
chuy n h ng t các URL không a thích đ n URL v t tr i là gi i pháp t t cho v n ể ướ ừ ư ế ượ ộ ả ố ấ
đ này.ề 55
S d ng các URL dài dòng v i các tham s và các ID phiên không c n thi tử ụ ớ ố ầ ế 56
Ch n tên trang chung chung nh "trang1.html"ọ ư 56
5
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
S d ng quá nhi u t khoá nh "hocmarketing-hocmarketingonline-ử ụ ề ừ ư
diendanmarketing.php" 56
Có c u trúc l p th m c con sâu nh " /dir2 /dir3/dir4/dir5/dir6/page.php"ấ ớ ư ụ ư 56
S d ng tên th m c không liên quan đ n n i dung trong th m c đóử ụ ư ụ ế ộ ư ụ 56
Có các trang t các subdomain và th m c g c (ví d : "bmg.edu.vn/index.php") truy ừ ư ụ ố ụ
c p cùng m t n i dung.ậ ộ ộ 56
L n l n các phiên b n URL có www. và không có www. trong c u trúc liên k t bên trong ẫ ộ ả ấ ế
c a b nủ ạ 56
S d ng cách vi t hoa URL k qu c (nhi u ng i dùng mong đ i các URL đ c vi t ử ụ ế ỳ ặ ề ườ ợ ượ ế
th ng và nh chúng t t h n.)ườ ớ ố ơ 56
5.12.6 - i u h ngĐ ề ướ 56
T o c u trúc phân t ng trôi ch y m t cách t nhiên:Làm cho ng i dùng đi t n i dung ạ ấ ầ ả ộ ự ườ ừ ộ
t ng quát đ n n i dung c th h n mà h mu n trên trang web c a b n càng d dàng càngổ ế ộ ụ ể ơ ọ ố ủ ạ ễ
t t. Thêm các trang đi u h ng khi h p lý và ho t đ ng hi u qu các trang này đ đ a chúngố ề ướ ợ ạ ộ ệ ả ể ư
vào c u trúc liên k t bên trong c a b n.ấ ế ủ ạ 57
Vi t v n b n d đ c: Ng i dùng thích n i dung đ c vi t rõ ràng và d theo dõi.ế ă ả ễ ọ ườ ộ ượ ế ễ 59
T ch c t t ch đ : T ch c n i dung c a b n sao cho khách truy c p bi t rõ n i chổ ứ ố ủ ề ổ ứ ộ ủ ạ ậ ế ơ ủ
đ này b t đ u và n i ch đ khác k t thúc luôn luôn h u ích. Chia n i dung c a b n ề ắ ầ ơ ủ ề ế ữ ộ ủ ạ
thành các bó và đo n lôgic giúp ng i dùng tìm th y n i dung mà h mu n nhanh h n.ạ ườ ấ ộ ọ ố ơ 59
S d ng ngôn ng phù h p: Hãy ngh v các t mà ng i dùng có th tìm ki m đ tìm ử ụ ữ ợ ĩ ề ừ ườ ể ế ể
m t đo n n i dung c a b n. Ng i dùng nào bi t nhi u v ch đ có th s d ng ộ ạ ộ ủ ạ ườ ế ề ề ủ ề ể ử ụ
nhi u t khoá khác nhau trong truy v n tìm ki m c a mình h n ng i m i tìm hi u ề ừ ấ ế ủ ơ ườ ớ ể
ch đ . ủ ề 60
T o n i dung m i m , duy nh t: N i dung m i s không ch gi cho khách truy c p ạ ộ ớ ẻ ấ ộ ớ ẽ ỉ ữ ậ
đã có c a b n tr l i mà còn mang l i các khách truy c p m i.ủ ạ ở ạ ạ ậ ớ 60
Cung c p n i dung ho c d ch v duy nh t: Hãy xem xét vi c t o ra d ch v m i, h u ấ ộ ặ ị ụ ấ ệ ạ ị ụ ớ ữ
ích mà không trang web nào khác cung c p. B n c ng có th vi t bài nghiên c u đ c đáo, ấ ạ ũ ể ế ứ ộ
đ ng m u tin t c thú v ho c t ng s l ng ng i dùng duy nh t c a mình. Các trang ă ẩ ứ ị ặ ă ố ượ ườ ấ ủ
web khác có th thi u tài nguyên ho c chuyên môn đ làm nh ng đi u này.ể ế ặ ể ữ ề 60
6
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
T o n i dung ch y u dành cho ng i dùng c a b n, không ph i dành cho công c tìmạ ộ ủ ế ườ ủ ạ ả ụ
ki m - Thi t k trang web c a b n theo nhu c u c a khách truy c p mà v n đ m b o ế ế ế ủ ạ ầ ủ ậ ẫ ả ả
trang web c a mình d truy c p v i công c tìm ki m th ng t o ra các k t qu khủ ễ ậ ớ ụ ế ườ ạ ế ả ả
quan 60
5.12.7 - Tiêu đ cho n i dungề ộ 60
Ngh v đi m chính và đi m ph c a n i dung trên trang và quy t đ nh n i s d ng các ĩ ề ể ể ụ ủ ộ ế ị ơ ử ụ
th tiêu đ m t cách thích h p.ẻ ề ộ ợ 61
S d ng th tiêu đ n i chúng có ý ngh a. Quá nhi u th tiêu đ trên trang có th khi n ử ụ ẻ ề ở ơ ĩ ề ẻ ề ể ế
ng i dùng khó kh n khi xem l t n i dung và xác đ nh đâu là n i ch đ k t thúc và ch đ ườ ă ướ ộ ị ơ ủ ề ế ủ ề
khác b t đ u.ắ ầ 61
t ph n v n b n trong các th tiêu đ không giúp ích cho vi c xác đ nh c u trúc trang.Đặ ầ ă ả ẻ ề ệ ị ấ 62
S d ng th tiêu đ t i n i các th khác nh <em> và <strong> có th thích h p h n.ử ụ ẻ ề ạ ơ ẻ ư ể ợ ơ . 62
Chuy n t kích th c th tiêu đ này thành kích th c th tiêu đ khác m t cách tu ti n.ể ừ ướ ẻ ề ướ ẻ ề ộ ỳ ệ
62
S d ng quá nhi u th tiêu đ xuyên su t trang.ử ụ ề ẻ ề ố 62
t t t c ph n v n b n c a trang vào th tiêu đ .Đặ ấ ả ầ ă ả ủ ẻ ề 62
Ch s d ng th tiêu đ đ t o ki u cho v n b n ch không trình bày c u trúc.ỉ ử ụ ẻ ề ể ạ ể ă ả ứ ấ 62
5.12.7.2 - T i u Hóa Hình nh.ố Ư Ả 62
5.12.8 – T p Robotệ 63
User-agent: khai báo tên search engine mà b n mu n thi t l p khu v c truy c p v i nó,ạ ố ế ậ ự ậ ớ
vd: Googlebot, Yahoo! Slurp 64
Disallow: là khu v c mà b n mu n khoanh vùng không cho phép search engine truy ự ạ ố
c p.ậ 64
Crawl-Delay: thông s này xác đ nh th i gian (tính b ng giây) search ph i đ i tr c khi ố ị ờ ằ ả ợ ướ
chuy n sang site ti p theo. i u này s có ích đ ng n ch n các search engine load ể ế Đ ề ẽ ể ă ặ
server tùy ti n.ệ 64
D u # đ c s d ng tr c các dòng c n comment.ấ ượ ử ụ ướ ầ 64
5.12.9 – Chi n d ch qu ng bá websiteế ị ả 65
5.12.9.1 - C p nh t n i dungậ ậ ộ 65
5.12.9.2 - Qu ng bá website – t o backlinkả ạ 65
7
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
CÁC V N V RANKẤ ĐỀ Ề 76
CÁC K T QU T CẾ Ả ĐẠ ĐƯỢ 78
M T TRÁI C A VI C SEOẶ Ủ Ệ 78
XU T H NG PHÁT TRI N CHO SEOERĐỀ Ấ ƯỚ Ể 79
L I K TỜ Ế 81
Application and Research of SEO in The Development of Web2.0 Site – Tác gi : ả
Chengling Zhao, Jiaojiao Lu, Fengfeng Duan 82
How to Improve Your Google Ranking Myths and Reality – Tác gi : Ao-Jan Su†, Y. ả
Charlie Hu‡, Aleksandar Kuzmanovic†, and Cheng-Kok Koh‡ 82
The Application of Search Engine Optimization for Internet Marketing An Example
of the Motel Websites 82
Mattcutts Website - 82
Search Engine Optimization Starter Guide – đ c cung c p b i Google.ượ ấ ở 82
Ebook C m nang SEO toàn t p 2011 – TapchiSEO.comẩ ậ 82
SEO made Easy - Brad Callen 82
H i quán tin h c - ọ 82
Th gi i SEO Vi t Nam - ớ ệ 82
[*] />hang-tren-google.html 82
SEO Worder - />optimization.html 82
5.7.1. Mô hình xử lý tổng quát của 1 hệ thống lập chỉ mục……………………
30
5.7.2. Một thủ tục lập chỉ mục tự động cơ bản 31
5.7.3. Phương pháp lập chỉ mục. 31
5.7.4. Xác định mục từ quan trọng cần lập chỉ mục. 31
5.7.5. Xác định trọng số cho mục từ 33
5.8. Search Engine – Bộ máy tìm kiếm thông tin 33
5.8.1. Tìm kiếm theo từ khóa 34
5.8.2 Tìm kiếm theo ngữ nghĩa. 34
5.8.3. Các chiến lược tìm kiếm 34
8
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
5.9. Hệ thống Rank 35
5.9.1. Google PageRank là gì ?. 36
5.9.2. Google PageRank đem lại lợi ích gì ?. 36
5.9.3. Tăng Google PageRank như thế nào ?. 36
5.10. Alexa Rank……………………………………………………………………… …36
5.10.1. Alexa Rank là gì ? 36
5.10.2. Alexa Rank mang lại lợi ích gì ? 36
5.10.3. Tăng Alexa Rank như thế nào ?. 37
5.11. Tìm hiểu về SEO 38
5.12. Các phương pháp tối ưu hóa Website. 40
5.12.1. Tối ưu hóa từ khóa Keyword 40
5.12.2. Tiêu đề: Chính xác và duy nhất 40
5.12.3. Đề xuất biện pháp tốt nhất cho <Title> 42
5.12.4. Meta Decscription 44
5.12.5. Cải tiến cấu trúc URL 44
5.12.6. Điều hướng 46
5.12.6.1. Đề xuất biện pháp tốt nhất để điều hướng 47
5.12.6.2. Đề xuất biện pháp tốt cho nội dung 49
5.12.7. Tiêu đề cho nội dung 50
5.12.7.1. Đề xuất biện pháp tốt nhất cho tiêu đề 51
5.12.7.2. Tối ưu hóa hình ảnh 53
5.12.8. Tệp Robot 53
5.12.8.1. Các tham số có trong file Robot.txt 54
5.12.9. Chiến dịch quảng bá website 55
5.12.9.1. Cập nhật nội dung . Error: Reference source not found
5.12.9.2. Quảng bá Website – Tạo Backlink 55
5.13. Phương pháp giữ TOP 10 khi SEO thành công 61
CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 64
LỜI KẾT. 67
CHƯƠNG 7: TÀI LIỆU THAM KHẢO 68
9
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
LỜI MỞ ĐẦU
Tối ưu hóa SEO (viết tắt của Search Engine Optimization), là cách tối ưu
hóa kết quả tìm kiếm. Kết quả của việc thực hiện SEO là giúp website của bạn tăng
thứ hạng lên cao nhất trong các trang kết quả tìm kiếm của các bộ máy tìm kiếm
chính như Google,Yahoo, Bing, Theo thống kê có đến 80% số người tìm đến
website lần đầu tiên qua Search Engine như Google hay Yahoo.
Tối ưu hóa kết quả tìm kiếm và hệ thống quản lý nội dung là hai công việc
cần thiết tạo nên sự phát triển nhanh chóng của một website. Điều này được minh
chứng bởi lẽ nếu hòa nhập vào bất kỳ một cộng đồng thiết kế web nào hiện nay,
bạn đều được nghe nói về chúng như là một thành phần không thể tách rời trong
suốt quá trình phát triển và vận hành hệ thống website.
Vậy làm thế nào để có thể thu được hiệu quả tốt và nhanh nhất cho việc tối
ưu hóa website? Như ta đã biết, quy trình tối ưu hóa đã được thực hiện thông qua
hệ thống quản trị nội dung. Tuy nhiên, trong thực tế, công việc này cần có kinh
nghiệm và một quy trình phân tích kỹ lưỡng về tính hiệu quả để có một hướng tối
ưu cho website của bạn.
Trong đề tài Luận văn tốt nghiệp “Tìm hiểu và ứng dụng SEO – Search
Engine Optimization cho Website”, chúng tôi đã trình bày một cách nhìn tổng quan
về các bộ máy tìm kiếm, các phương thức thu thập thông tin, và các cách để tối ưu
hóa website (SEO - Search Engine Optimisation) theo hướng phi thương mại.
Trong quá trình thực hiện luận văn, chúng tôi còn gặp nhiều khó khăn và
không tránh khỏi sai sót. Song, nhờ sự hướng dẫn nhiệt tình của cán bộ hướng dẫn,
chúng tôi đã giải quyết những vấn đề đã đặt ra. Nhân đây, tác giả xin gửi lời cám
ơn sâu sắc đến thầy Nguyễn Lương Anh Tuấn đã giúp đỡ tận tình trong suốt thời
gian qua đã hỗ trợ để chúng tôi hoàn thành tốt nhất luận văn này.
10
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI
1. Giới thiệu
Trong thời gian gần đây, với sự phát triển của Internet, việc cập nhật thông tin về
nhiều vấn đề trên thế giới trở nên vô cùng đơn giản đối với mọi người, đặc biệt là
sinh viên – học sinh với nhu cầu tìm hiểu thông tin về việc học của mình.
Với thực tế đó, ngoài website thông tin của học viện BMG International Education,
việc thành lập một website theo chuẩn tìm kiếm chung của toàn cầu là rất cần thiết.
2. Mục đích
Website của Học viện Quốc tế BMG được thành lập với mục đích cung cấp thông
tin, kiến thức và đào tạo các chuyên ngành về Marketing – PR - Sales.
3. Chức năng
Website có các chức năng cơ bản sau:
- Hiển thị các tin tức, khóa học của Học viện BMG.
- Đăng tải thời chương trình hội thảo, khóa học mới…cho sinh viên – học
sinh.
- Ngoài ra, người quản trị còn có các chức năng sau:
o Quản lý bài viết
o Quản lý Menu.
o Quản lý Website theo Module.
11
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
CHƯƠNG 2: CÔNG NGHỆ SỬ DỤNG
2.1 Ngôn ngữ PHP:
PHP (viết tắt hồi quy "PHP: Hypertext Preprocessor") là một ngôn ngữ lập
trình kịch bản hay một loại mã lệnh chủ yếu được dùng để phát triển các ứng
dụng viết cho máy chủ, mã nguồn mở, dùng cho mục đích tổng quát. Nó rất thích
hợp với web và có thể dễ dàng nhúng vào trang HTML. Do được tối ưu hóa cho
các ứng dụng web, tốc độ nhanh, nhỏ gọn, cú pháp giống C và Java, dễ học và thời
gian xây dựng sản phẩm tương đối ngắn hơn so với các ngôn ngữ khác nên PHP đã
nhanh chóng trở thành một ngôn ngữ lập trình web phổ biến nhất thế giới.
Đoạn mã sau minh họa giúp cách viết PHP lồng vào các trang HTML dễ dàng như
thế nào:
<html>
<head>
<title>Mã mẫu</title>
</head>
<body>
<?php
echo "Chào thế giới PHP!";
?>
</body>
</html>
Thẻ <?php và thẻ ?> sẽ đánh đấu sự bắt đầu và sự kết thúc của phần mã PHP qua đó
máy chủ biết để xử lý và dịch mã cho đúng. Đây là một điểm khá tiện lợi của PHP
giúp cho việc viết mã PHP trở nên khá trực quan và dễ dàng trong việc xây dựng
phần giao diện ứng dụngHTTP.
Ngôn ngữ, các thư viện, tài liệu gốc của PHP được xây dựng bởi cộng đồng và có
sự đóng góp rất lớn của Zend Inc., công ty do các nhà phát triển cốt lõi của PHP lập
12
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
nên nhằm tạo ra một môi trường chuyên nghiệp để đưa PHP phát triển ở quy
mô doanh nghiệp.
2.2 Hệ Quản Trị Cơ Sở Dữ Liệu MySQL
MySQL là hệ quản trị cơ sở dữ liệu tự do nguồn mở phổ biến nhất thế giới và được
các nhà phát triển rất ưa chuộng trong quá trình phát triển ứng dụng. Vì MySQL là
cơ sở dữ liệu tốc độ cao, ổn định và dễ sử dụng, có tính khả chuyển, hoạt động trên
nhiều hệ điều hành cung cấp một hệ thống lớn các hàm tiện ích rất mạnh. Với tốc
độ và tính bảo mật cao, MySQL rất thích hợp cho các ứng dụng có truy cập CSDL
trên internet. MySQL miễn phí hoàn toàn cho nên bạn có thể tải về MySQL từ trang
chủ. Nó có nhiều phiên bản cho các hệ điều hành khác nhau: phiên bản Win32 cho
các hệ điều hành dòng Windows, Linux, Mac OS
X, Unix, FreeBSD, NetBSD, Novell NetWare, SGI Irix, Solaris,SunOS,
MySQL là một trong những ví dụ rất cơ bản về Hệ Quản trị Cơ sở dữ liệu quan hệ
sử dụng Ngôn ngữ truy vấn có cấu trúc (SQL).
MySQL được sử dụng cho việc bổ trợ PHP, Perl, và nhiều ngôn ngữ khác, nó làm
nơi lưu trữ những thông tin trên các trang web viết bằng PHP hay Perl,
2.3 Tối Ưu Hóa Website Theo Chuẩn SEO (Search Engine
Optizimation)
SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ tìm
kiếm). SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một
website trong các trang kết quả của các công cụ tìm kiếm và có thể được coi là một
tiểu lĩnh vực của tiếp thị qua công cụ tìm kiếm. Thuật ngữ SEO cũng có thể được
dùng để chỉ những người làm công việc tối ưu hóa công cụ tìm kiếm, là những nhà
tư vấn đưa ra những dự án tối ưu hóa cho các website của khách hàng.
Làm SEO là quá trình tối ưu hóa mã nguồn website, giúp website thân thiện
với các công cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đó tăng số
lượng người truy cập tới. Một website được làm SEO tốt, đồng nghĩa với việc
website đó luôn xuất hiện ở thứ hạng cao khi người truy cập sử dụng công cụ tìm
kiếm để tìm nội dung mà họ cần. SEO cũng có thể bao gồm nhiều loại mục tiêu
13
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
khác nhau khi tìm kiếm như: tìm ảnh, tìm từ khóa, tìm theo quốc gia và một số loại
SEO khác.
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm
kiếm (SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền
theo click và danh sách tìm kiếm miễn phí. Mục tiêu của SEO chủ yếu hướng tới
việc nâng cao thứ hạng của danh sách tìm kiềm miễn phí theo một số từ khóa nhằm
tăng lượng và chất của khách viếng thăm đến trang.
SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp thị và có
thể rất hiệu quả ở giai đoạn phát triển ban đầu và giai đoạn thiết kế website. Hiện
nay, nhận thức của người quản trị website tại Việt Nam nói riêng và thế giới nói
chung nhận biết việc tối ưu hóa website để các máy tìm kiếm trỏ tới rất ít. Người sử
dụng không ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc làm các
phương thức để các máy tìm kiếm trỏ đến. Hiện trên mạng Internet có 3 công cụ tìm
kiếm hữu hiệu nhất và phổ biến nhất (Google, Yahoo, Bing)
Hiện nay, nhận thức của người quản trị website tại Việt Nam nói riêng và thế giới
nói chung nhận biết việc tối ưu hóa website để các máy tìm kiếm trỏ tới rất ít.
Người sử dụng không ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc
làm các phương thức để các máy tìm kiếm trỏ đến. SEO có thể coi như là một kỹ
thuật, một bí quyết thực sự đối với mỗi người quản trị, xây dựng website hay đơn
thuần là người làm trong lĩnh vực truyền thông.
14
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
CHƯƠNG 3: MÔ HÌNH XỬ LÝ
3.1 - Bản đồ website (Sitemap)
Bản đồ website có thể thay đổi tùy theo việc quản lý menu của người quản trị. Sau
đây là bản đồ trang chủ cơ bản ban đầu của website:
* Trang Chủ:
+ Menu Giới thiệu viện
Giới thiệu
Chuyên gia và Giảng viên
Khách hàng
Đối tác
+ Menu Tư Vấn Doanh Nghiệp
Tư vấn tái cấu trúc
Tư vấn kinh doanh
Tư vấn thương hiệu
Tư vấn tài chính
Tư vấn nhân sự
+ Menu Đào Tạo Doanh Nghiệp
+ Menu Khóa Học
+ Đối tác và Tiện Ích
Thư viện
15
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Khảo thí
BMG Awards
Học trực tuyến
3.2 - Đối tượng sử dụng: Có 02 đối tượng sử dụng website
3.2.1 - Khách
Đối tượng khách bao gồm giảng viên, sinh viên, học sinh trong và ngoài trung
tâm…có thể dễ dàng truy cập vào website để xem các thông báo, tin tức, quy
định… của trường.
3.2.2 - Quản trị
Ngoài các chức năng của khách, người quản trị có thể truy cập vào trang quản lý
thông tin của website thông qua một liên kết do người lập trình cung cấp. Người
quản trị phải sử dụng tên đăng nhập và mật khẩu để truy cập vào trang quản lý.
3.3 - Các chức năng chính
Các chức năng được chia làm 02 loại cho khách và người quản trị.
3.3.1 - Đối với khách
Chức năng chính của website dành cho đối tượng khách là hiển thị thông tin. Ngoài
ra, website còn có các chức năng khác dành cho khách và các chức năng này có thể
được thay đổi tùy theo người quản trị.
Hội thảo & Sự kiện
Hiển thị những hoạt động ngoại khóa, sự kiện dành cho học viên của trung tâm.
16
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Bài viết mới
Hiển thị tin tức, bài viết hay về chuyên ngành trong Menu Blog BMG trên giao diện
trang chủ website.
17
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Liên kết website
Hiển thị danh sách các website được liên kết từ trung tâm ở Menu Đối tác và Tiện
Ích. Các liên kết đến các website khác có thể được thay đổi bởi người quản trị.
Khóa học mới
Hiển thị tiêu đề các khóa học được cập nhật gần nhất trên trang chủ. Số lượng
khóa học hiển thị tối đa là 04 khóa.
18
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
3.3.2 - Đối với người quản trị
Chức năng giới thiệu
Chức năng này giúp người quản trị cập nhật thông tin của trung tâm như Giới thiệu,
Khách hàng, Đối tác…
19
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Quản lý bài viết
Chức năng này giúp người quản trị thêm, sửa, xóa các thông tin bài viết của website
như bài viết hay, blog…
Quản lý user
Chức năng này cho phép người quản trị thêm, sửa, xóa và thay đổi thông tin của
người dùng.
Quản lý khóa học
20
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Chức năng này dùng để quản lý các khóa học được cập nhật trên website.
Quản lý module
Đây là chức năng nâng cao của người quản trị. Chức năng này dùng để thêm, sửa,
xóa các module dành cho người dùng.
21
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
Chương 4: Mô Hình Cơ Sở Dữ Liệu
4.1 - Cấu trúc các bảng
4.1.1 - Bảng Quản trị Admin
Lưu thông tin tài khoản của người quản trị website. Chỉ có một tài khoản được lưu
trong bảng và mật khẩu của tài khoản được mã hóa.
Trường Kiểu dữ liệu Collation Ràng buộc Null
1 id smallint(5) Primary No
2 parent_id tinyint(3) Yes
3 admin_name varchar(20) utf8_unicode_ci
4 password varchar(32) latin1_swedish_
ci
No
5 level tinyint(1) Ye
6 pass varchar(32) utf8_unicode_ci Yes
7 name varchar(30) utf8_unicode_ci Yes
8 email varchar(50) utf8_unicode_ci Yes
9 info text utf8_unicode_ci Yes
10 inquiry text utf8_unicode_ci Yes
11 quotation text utf8_unicode_ci Yes
12 cookie varchar(32) latin1_swedish_
ci
No
13 session varchar(32) latin1_swedish_
ci
No
14 ip varchar(15) latin1_swedish_
ci
No
15 modules text utf8_unicode_ci Yes
4.1.2 - Bảng Giới thiệu
Lưu thông tin của Menu Giới thiệu dành cho người lướt web
22