Tải bản đầy đủ (.pdf) (128 trang)

Kiến trúc Web Caching Phân tích giải pháp Web Caching của ISP ở Cămpuchia

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.93 MB, 128 trang )

TAN KOSAL

Bộ giáo dục và đào tạo
trường đại học bách khoa Hà Nội


ngành công nghệ thông tin

TAN KOSAL

Kiến trúc web caching phân tích giảI
pháp web caching của isp
tại cămpuchia


khoá 2003 - 2005

Luận văn thạc sĩ công nghệ thông tin

Hà néi - 2005


Bộ giáo dục và đào tạo

trường đại học bách khoa Hà Nội

Tan kosal

kiến trúc web caching phân
tích giảI pháp web caching
của isp


tại cămpuchia
Chuyên ngành: công nghệ thông tin

Luận văn thạc sĩ công nghệ thông tin


Người hướng dẫn:
TS. Hồ Khánh Lâm

Hà Nội - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

THUT NG V CC T VIT TẮT
Audio
Cache agent
Cache hit
Cache miss
Cache proxy
CARP
Client
DNS
FTP
Gate-way
GDS
GDS(1) GD*(1)
GDS(packets)
GD*(packets)
Hop

Hot
HTML
HTTP
ICP
Image
ISP
LASM

Dữ liệu âm thanh
Hệ thống cache tại một nút mạng
Là tiến trình truy nhập web và lấy nội dung web có sẵn
trên cache
Là tiến trình truy nhập web và nội dung web khơng có
sẵn trên cache, phải lấy từ máy chủ web
Hệ thống cache được đấu nối trên mạng theo cơ chế
proxy
Cache Array Routing protocol - Thủ tục tìm kiếm nội
dung trang web dựa trên cơ chế hàm băm (Hash function)
Là phần cứng hoặc phần mềm xét trong mối quan hệ
tương tác với hệ thống máy chủ (Server)
Domain Name System - Hệ thống tên miền
File Transfer Protocol – Giao thức truyền file
Là cửa ngõ để giao tiếp với các mạng khác
Greedy Dual Size - Thuật tốn thay thể nội dung cache có
tính đến kích thước và chi phí của trang
Là thuật tốn GDS và GD* với chi phí khơng đổi
Là thuật tốn GDS và GD* với chi phí tính theo gói dữ
liệu = 2
+ Kích thước dữ liệu/536
Một nút trong topology của mạng thường được sử dụng

với các thủ tục định tuyến RIP
Thiết bị trên mạng nói chung có địa chỉ IP ví dụ PC,
Server router…
HyperText Markup language – Ngôn ngữ đánh dấu siêu
văn bản
HyperText Transfer Protocol – Giao thức truyền dẫn siêu
văn bản
Internet Cache protocol - Thủ tục tìm kiếm và lấy nội
dung trang Web
Dữ liệu hình ảnh
Internet Service Provider - Nhà cung cấp dịch vụ truy
nhập Internet
Large Scale Active Middleware - Bộ đệm trung gian quy
mơ lớn

Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

LFU-DA
LRU
Media
Mesh
MRU
MTTR
Multimedia
Node

Pre-fetch
Proxy

Router
RTT
Server
SLRU

TCP
Text
TTR
T l byte hit

T l hit
UDP
Video
WCCP

Least Frequently Used with Dynamic Aging-Thuật toán
thay thế nội dung cache dựa trên tần suất truy nhập
Least recently used - Thuật tốn thay thể nội dung cache
dựa trên tính tương quan theo thời gian của truy nhập
Loại dữ liệu ví dụ tiếng nói, hình ảnh, văn bản, phìm…
Mơ tả mạng mà mỗi nút mạng đều có đương kết nối đến
các nút mạng cịn lại
Most recently used - Vị trí lưu các trang mới được sử
dụng nhiều nhất trong ngăn xếp LRU
Mean time to request - Thời gian trung bình tính tới lần
truy nhập tiếp theo
Loại dữ liệu kết hợp hình ảnh và âm thanh

Nút mạng
Là tiến trình đi lấy trược nội dung trang web được dự báo
sẽ được truy nhập trong thời gian tới
Cơ chế đấu nối của một máy chủ trên mạng, máy chủ sẽ
đại diễn cho toàn bộ thuê bao hay máy trạm mà nó làm
proxy để thực hiện các giao dịch mạng
Bộ định tuyến
Route trip time - Độ trễ gói tồn trình
Máy chủ
Segmented least recently used - Thuật tốn thay thể nội
dung cache dựa trên tính tương quan theo thời gian của
truy nhập
Transmission Control Protocol - Giao thức điều khiển
truyền dẫn
Dự liệu văn bản
Time to request - Thời gian tới lần truy nhập tiếp theo
Tỷ lệ giữa tổng dung lượng của các trang web được truy
nhập mà nội dung của chúng đã được lưu sẵn trong cache
proxy trên tổng số dung lượng của các trang web được
truy nhập
Tỷ lệ giữa số truy nhập web mà nội dung được yêu cầu
đã được lưu sẵn trong cache proxy trên tổng số truy nhập
User Datagram Protocol – Giao thức truyền gói tin
Dữ liệu phim
Web cache coordination protocol: thủ tục cache để phối
hợp các bộ định tuyến, các hệ thống cache nhằm khai
thác hiệu quả tài nguyên mạng và tại nguyên cache

Tan Kosal (Cambodia student)


Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

DANH MC HèNH V
Hỡnh 1.1 : Kiến trúc cơ bản của một bộ đệm cho Web

6

Hình 1.2: Mơ hình Client/Server

7

Hình 1.3: Quan hệ giữa Web browser và Internet Server

8

Hình 1.4: mơ hình proxy

9

B
0

Hình 1.5: Proxy Server chạy trên Firewall

11

Hình 1.6: Sơ đồ tổng quát hệ thống Web caching Web


13

Hình 1.7: Mơ hình của cơ chế sử dụng proxy caching

14

Hình 1.8: Mơ tả cơ chế sử dụng bộ đệm trong suốt

16

Hình 1.9 : Bộ đệm phân cấp

17

Hình 1.10 : Mơ hình bộ đệm phân tán

19

Hình 2.1 : Kiến trúc phân tầng của Web Caching

27

Hình 2.2 : Kiến trúc phân tán của Web Caching

28

Hình 2.3: Kiến trúc hỗn hợp của Web Caching

30


Hình 2.4 : Mơ hình phân cấp của ISP ( Network topology)

31

Hình 2.5: Kiểu cây, cách đạt cache (Tree mode, showing cache

32

lacement.)
Hình 2.6 : Thời gian kết nối E[Tc ] với mật độ trang λtot , ∆ = 24h, d = 15 sec

40

Hình 2.7 : Lưu lượng mạng phát sinh bởi kiến trúc phân tầng và kiến

41

trúc phân tán tại mỗi cấp độ cây
Hình 2.8 : Mạng quốc gia khơng bị nghẽn ρ = 0.3

42

Hình 2.9 : Mạng quốc gia nghẽn ρ = 0.8

43

Hình 2.10 : Tổng thời gian trễ phụ thuốc vào kích thước trang, mạng

44


nghẽn ρ = 0.8
Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

Hỡnh 2.11 : Thi gian kt nối phụ thuộc vào số lượng cache công tác

46

tại mỗi cấp mạng trong kiến trúc hỗn hợp
Hình 2.12 : Thời gian kết nối trong kiến trúc hỗn hợp với số cache

47

cộng tác tối ưu kc
Hình 2.13 : Thời gian truyền trung bình phụ thuộc vào số lượng

48

cachecộng tác trong mơ hình hỗn hợp với ( ρ = 0.3) và
( ρ = 0.8) , S = 15 KB

Hình 2.14 : Số lượng cache kết hợp tối ưu k opt phụ thuộc kích thước

50


trang S , ρ = 0.8
Hình 2.15: Tổng độ trễ rong kiến trúc hỗn hợp với k opt = kt = 16 ,

50

ρ = 0.8, S = 200 K

Hình 3.1 : Quan hệ giữa Pump and filter

56

Hình 3.2: Proxy lưu trữ ngược

58

Hình 3.3: Proxy lưu trữ ngược nhiều - nhiều

58

Hình 3.4: Một bộ đệm phân cấp đơn

60

Hình 4.1: Lược đồ thay thế nội dung cache của thuật tốn LRU

75

Hình 4.2: Lược đồ thay thể nội dung cache của thuật tốn SLRU

77


Hình 4.3: Đoạn mã giả lập cho thuật tốn LFU-DA

78

Hình 4.4: Đoạn mã giả lập cho thuật tốn GD

81

Hình 4.5 : Mơ hình so sánh chứng minh

83

Hình 4.6 : Hai trường hợp kết thúc khung thời gian

85

Hình 4.7: Đoạn mã giả lập cho thuật tốn GD*

89

Hình 5.1: Miều tả chung những Cache Farm trong một mạng ISP

95

Hình 5.2: Trình bày chi tiết Cache farm trong mạng ISP

96

Tan Kosal (Cambodia student)


Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

Hỡnh 5.3: C s h tng mạng Internet ở Cămpuchia hiện nay

98

Hình 5.4 : Sơ đồ mạng lưới Web Caching của mạng ISP NiDa

102

Hình 5.5 : Sơ đồ đề xuất giải pháp của mạng ISP NiDa

106

Hình 6.1: Tổ chức phần mềm Squid

108

Hình 6.2 : Cấu hình trình duyệt Netscape cho Web Caching

113

Hình 6.3 : Cấu hình trình duyệt Netscape tự động cho Web caching

114


Hình 6.4: Cấu hình trình duyệt Mozilla cho Web caching

115

DANH MỤC BẢNG
Bảng 3.1: ICPv2 message format

62

Bảng 3.2: ICP_OP_QUERY payload format

64

Bảng 3.3: Khuôn dạng của ICP_OP_HIT_OBJ

67

Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

TI LIU THAM KHO
1. Mng mỏy tính và các hệ thống mở - Nguyễn Thúc Hải
2. Cơng nghệ mạng máy tính – Nhà xuất bản Bưu Điện,2001
3. Các bài viết về Internet - TS Hồ Khánh Lâm - Tạp chí Bưu chính viễn thơng
4. Cơng nghệ Internet Cache ứng dụng.Vũ Duy Lợi, Trần Trọng Minh
5. Analisis of Web Caching Architecture:Hierarchical and Distributed

Caching – Pablo Rodriguez, Christian Spanner, and Ernst Ư.Biersack,
Member IEEE-Tạp chí IEEE/ACM Transactions on Network, Vol 9,No
4,August 2001
6. Algorithms Of The Internet, Organized by Christian chindelhauer
Elaboration on Topic 03 Web Caching by Stefan Luecking (6014415)
stl(at)upb.de University of Paderborn, Date: August, 4th, 2004
7. Internet Cache Protocol (ICP), version 2 , D. Wessels, K. Claffy, National
Laboratory for Applied Network Research/UCSD September 1997
8. Implementation and comparison of distributed caching schemes,
S.Selvakumar, P.Prabhakar. Department of Computer Science and
Engineering, Regional Engeneering College, Tirachirappalli, Tamil
Nadu, India. Extract in Computer and Communications Magazine,
Received 14 March 2000, Revised 24 July 2000, Accepted 27 July 2000.
9. Web Distribution Systems : Caching and Replication,
/>10.

Squid

Web

Proxy

Cache,

/>
/>11. Proxy Design and Caching protocols, By Chang Dong Advisor: Dr. ILing Yen

Tan Kosal (Cambodia student)

Líp: CH2003 - 2005



Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

B GIO DC V O TO
TRNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

BẢN NHẬN XÉT LUẬN VĂN CAO HỌC
Họ và tên học viên

: Tan kosal

Chuyên ngành

: Công Nghệ Thơng Tin

Khố

: 2003 – 2005

Người hướng dẫn

: TS. Hồ Khánh Lâm

Nội dung:” Kiến trúc Web Caching – Phân tích giải pháp Web Caching
của ISP ở Cămpuchia”
Nhận xét của người hướng dẫn : ......................................................................
.........................................................................................................................................
.........................................................................................................................................
.........................................................................................................................................

.........................................................................................................................................
.........................................................................................................................................
.........................................................................................................................................
.........................................................................................................................................

Hà nội, ngày .............. tháng.......... năm 2005
Người hướng dẫn

TS. Hồ Khánh Lâm
Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

MC LC
LI NểI U ..................................................................................................... 1
CHNG 1: GIỚI THIỆU CHUNG VỀ WEB CACHING
1.1. VÌ SAO PHẢI DÙNG WEB CACHING ? .............................................. 3
1.1.1. Sự phát triển của Internet ................................................................. 3
1.1.2. Các giải pháp ................................................................................ .. 3
1.2. GIỚI THIỆU VỀ WEB CACHING ...................................................... .. 5
1.2.1. Một số khái niệm ........................................................................... .. 6
1.2.2. Một số mơ hình hệ thống tiêu biểu ............................................... 12
1.3. QUAN HỆ GIỮA MÁY TRẠM VÀ MÁY CHỦ DỮ LIỆU ............... 22
1.3.1. Định hướng lại địa chỉ URL .......................................................... 22
1.3.2. Định hướng lại tên miền ................................................................ 22
1.3.3. Quan hệ giữa các máy chủ ............................................................ 23
1.4. KẾT LUẬN ........................................................................................... 24

CHƯƠNG 2: SO SÁNH PHÂN TÍCH CÁC MƠ HÌNH KIẾN TRÚC
HỆ THỐNG WEB CACHING
2.1. GIỚI THIỆU CÁC KIẾN TRÚC CACHE............................................ 25
2.1.1. Kiến trúc cache phân tầng – hierarchical Cache ........................... 25
2.1.2. Kiến trúc cache phân tán - Distributed Cache ............................... 27
2.1.3. Kiến trúc cache hỗn hợp – Hybit cache ........................................ 28
2.2. ĐÁNH GIÁ HIỆU NĂNG CỦA KIẾN TRÚC PHÂN TẦNG VÀ
PHÂN TÁN ....................................................................................................... 30
2.2.1. Mơ hình mạng................................................................................ 31
2.2.2. Mơ hình trang ................................................................................ 33
2.2.3. Kiến trúc phân tầng ....................................................................... 34
2.2.4. Kiến trúc phân tán ......................................................................... 34
2.2.5. Phân tích độ trễ .............................................................................. 35
Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

2.2.6. Thi gian kt ni ........................................................................... 39
2.3. ĐÁNH GÍA HIỆU NĂNG CỦA KIẾN TRÚC HỖN HỢP .................. 45
2.3.1. Thời gian kết nối ........................................................................... 45
2.3.2. Thời gian truyền ............................................................................ 47
2.3.3. Thời gian trễ .................................................................................. 49
2.4. KẾT LUẬN ........................................................................................... 51
CHƯƠNG 3 : CÁC GIAO THỨC CHO WEB CACHING
3.1. ĐẶT VẤN ĐỀ ....................................................................................... 52
3.2. CÁC GIAO THỨC CỦA WEB CACHING ......................................... 53
3.2.1. Giao thức ICP (Internet Cache Protocol) ...................................... 53

3.2.2. Giao thức HTCP (HyperText Cache Protocol) ............................. 54
3.2.3. Giao thức CARP ............................................................................ 54
3.2.4. Cache Digest .................................................................................. 55
3.2.5. Các giao thức dựa trên Multicast .................................................. 55
3.2.6. Proxy lưu trữ đảo ngược ................................................................ 57
3.2.7. WCCP (Web Cache Control Protocol )......................................... 59
3.3. GIAO THỨC ICPv2 ............................................................................. 59
2.3.1. Khái niệm ...................................................................................... 59
2.3.2. Định dạng tin nhắn ICPv2 ............................................................. 61
2.3.3. ICP_OPCODE ............................................................................... 63
2.3.4. ICP OPTION FLAG ( Cờ lựa chọn ICPv2) .................................. 68
CHƯƠNG 4: THUẬT TOÁN CỦA WEB CACHING
4.1. TỔNG QUÁT VỀ CÁC THUẬT TOÁN CACHING .......................... 72
4.2. SỰ CẦN THIẾT CỦA WEB CACHING ............................................. 73
4.3. MỘT SỐ THUẬT TOÁN CỦA WEB CACHING ............................... 75
4.3.1. Thuật toán Least Recently Used LRU........................................... 75
4.3.2.Thuật toán Segmented Least Recently Used ................................. 76
4.3.3.Thuật toán Least Frequently Used With Dynamic Aging ............. 78
4.3.4. Thuật toán Greedy Dual ................................................................ 79
Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Kiến trúc Web caching - Phân tích giải pháp Wev Caching của ISP ở Cămpuchia

4.3.5. Thut toỏn GreedyDual-Size ........................................................ 80
4.3.6. THUẬT TOÁN GREEDY DUAL *(GD*) ................................. 88
4.4. KẾT LUẬN ........................................................................................... 90
CHƯƠNG 5: GIẢI PHÁP WEB CACHING CỦA MỘT ISP Ở

CĂMPUCHIA
5.1. CISCO CACHE ENGINE ..................................................................... 92
5.1.1 Giới thiệu Cisco Cache Engine ...................................................... 92
5.1.2. Những đặc điểm của Cache Engine............................................... 93
5.1.3. Tìm hiểu phần cứng Cache Engine ............................................... 94
5.1.4. Ví dụ cấu hình của ISP .................................................................. 95
5.2. MẠNG INTERNET TẠI CĂMPUCHIA.............................................. 97
5.2.1 Khảo sát hiện trạng mạng viễn thông Cămpuchia.......................... 97
5.2.2. Đánh giá Internet của Cămpuchia .................................................101
5.3. KHẢO SÁT HỆ THỐNG WEB CACHING CỦA MẠNG ISP NiDa 102
5.3.1. Nhận xét chung của NiDa..............................................................103
5.3.2. Đề xuất giải pháp cho ISP NiDa ...................................................105
5.4. KẾT LUẬN ...........................................................................................106
CHƯƠNG 6: ÁP DỤNG SQUID CHO WEB CACHING
6.1. CÔNG CỤ PHẦN MỀM SQUID CHO WEB CACHING ...................108
6.1.1. Squid là gì ? ...................................................................................108
6.1.2. Vì sao phải chọn Squdi ? ...............................................................109
6.1.3. Đặc điểm của Squid .......................................................................109
6.1.4. Mơ hình thử nghiệm của Squid .....................................................110
6.2. PHƯƠNG PHÁP CÀI ĐẶT VÀ CHẠY SQUID .................................110
6.2.1. Cấu hình để chạy được phần mềm Squid ......................................110
6.2.2. Cài đặt Squid .................................................................................111
6.2.3. Chạy phần mềm Squid ..................................................................111
6.2.4. Quản hệ giữa browsers và Squid ...................................................112
Tan Kosal (Cambodia student)

Líp: CH2003 - 2005


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching


LỜI NĨI ĐẦU
Ngày nay internet đã trở thành công nghệ tiêu chuẩn, kết nối mở các
hệ thống tính tốn và các mạng máy tính khơng đồng nhất. Việc phát triển
bùng nổ các mạng Internet/Intranet, việc cung cấp các dịch vụ thông tin về
kinh tế, văn hoá, xã hội ngày càng phong phú trên mạng cũng như xu thế
tích hợp các hệ thống thơng tin trong các hoạt động chính trị, kinh tế, xã
hội trên giao diện web nói riêng, cũng như việc tối ưu hóa lưu lượng số
liệu, hạn chế đến mức tối đa khả năng tắc nghẽn số liệu trao đổi trên mạng
trên nên rất cần thiết.
Công nghệ lưu trữ và cung cấp nội dung trang web tại nơi gần người
sử dụng gọi là công nghệ Internet Web Caching. Đây là một trong những
giải pháp cơng nghệ góp phần giải quyết vấn đề nghẽn, nâng cao tốc độ truy
cập Internet, tối ưu được băng thông. Giải pháp web caching được đa số các
nhà cung cấp dịch vụ Internet (ISP) sử dụng để nâng cao chất lượng cung
cấp dịch vụ truy cập Internet và tiết kiệm chi phí đầu tư cho cơ sở hạ tầng
mạng, công suất thiết bị. Kỹ thuật Web caching ln mang tính thời sự và
cần được liên tục nâng cấp để đáp ứng nhu cầu gia tăng với tốc độ chóng mặt
của số lượng người dùng Internet trên tồn cầu và chi phí cho băng thơng
của hạ tầng mạng Internet.
Đó là lý do vì sao chọn nghiên cứu về web caching của luận văn.
Bản luận văn này được trình bày thành 6 chương trong khoảng
…..(120) A4
Chương I: Giới thiệu chung về Web Caching
Chương II: So sánh phân tích các mơ hình kiến trúc hệ thống Web
Caching
Chương III: Các giao thức cho Web Caching
Tan Kosal

Líp: CH2003 - 2005


1


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

Chương IV: Thuật toán của Web Caching
Chương V: Giải pháp Web Caching của một ISP ở Cămpuchia
Chương VI: Áp dụng Squid cho Web Caching
Trong q trình thực hiện đề tài này tơi đã nhận được sự giúp đỡ tận
tình của thầy hướng dẫn TS. Hồ Khánh Lâm đã nhiệt tình giúp đỡ và hướng
dẫn tơi hồn thành đồ án tốt nghiệp này.
Tơi xin gửi lời cảm ơn chân thành tới các thầy cô giáo trong khoa
cộng nghệ thông tin của trường đại học Bách khoa Hà Nội.
Một lần nữa tôi xin cảm ơn tất cả những ai sẽ đọc và góp ý cho luận
văn này.

Tan Kosal

Líp: CH2003 - 2005

2


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ WEB CACHING

1.1. VÌ SAO PHẢI DÙNG WEB CACHING ?


1.1.1. Sự phát triển của Internet
Trong những năm gần đây, với sự phát triển nhanh chóng, Internet đã
trở thành nguồn cung cấp thông tin khổng lồ và phong phú, đặc biệt là trên
các web sites. Số lượng các trang web ước tính đã hơn 3 tỷ và gần 80% số
lượng người sử dụng Internet là truy cập lấy nội dung các trang web. Điều
này làm cho các hệ thống máy chủ dịch vụ web và các kênh truyền thông trở
nên nhanh chóng bị q tải và nghẽn. Chi phí lớn cho đầu tư tăng dung
lượng, công suất cho các máy chủ dịch vụ và truyền dẫn không thể đáp ứng
kịp thời tốc độ phát triển của nhu cầu sử dụng Internet. Các nhà cung cấp
dịch vụ Internet (ISP) một mặt phải đáp ứng nhu cầu sử dụng Internet của số
lượng lớn những người sử dụng, một mặt phải đảm bảo chất lượng cung cấp
dịch vụ (giảm tắc nghẽn, tăng tốc độ truy cập thơng tin) với sự tiết kiệm chi
phí về th kênh viễn thơng. Đó là vấn đề cần phải có giải pháp để thỏa mãn
sự phát triển của Internet.

1.1.2. Các giải pháp
Các giải pháp đều phải khắc phục các nhược điểm của Internet
Services, đó là: giảm nghẽn băng thông ở các cấp mạng: mạng trục quốc gia
(National network); các mạng vùng (Regional networks); và các mạng khu
vực (Institutional networks).
Tan Kosal

Líp: CH2003 - 2005

3


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching


Giải pháp phổ biến nhất là nâng cấp các nguồn tài nguyên mạng như:
sử dụng các server mạnh, truyền dẫn băng thông rộng, tối ưu cấu trúc mạng
về định tuyến, phân tải, v.v… Tuy nhiên, cách tiếp cận trên phải chịu chi phí
lớn về mặt kinh tế, nhưng tốc độ đầu tư và chi phí lớn khơng thể đáp ứng kịp
thời được tốc độ tăng của yêu cầu truy cập Internet.
Vì hơn khoảng 70-80% các truy cập Internet là tham chiếu lấy các nội
dung của các Web Sites. Do vậy phần lớn lưu lượng chiếm tải của các hệ
thống cung cấp dịch vụ và các kênh truyền dẫn là các giao dịch của WWW
giữa người sử dụng (Clients) và các Web Servers. Vậy thì nếu sử dụng giải
pháp bộ nhớ đệm tốc độ cao (cache) để lưu trữ các nội dung các trang web
phổ biến, thông dụng được nhiều người sử dụng tham chiếu đến thì cũng
chứng tỏ được những ưu điểm của nó:
 Bộ đệm làm giảm bớt nhu cầu chiếm giữ đường truyền (khoảng 35%),
giảm thông lượng giữa các máy trạm (clients) và máy chủ thông tin (content
servers).
 Bộ đệm cải thiện chất lượng dịch vụ (QoS) thông qua việc phân phối
thông tin với băng thông rộng tốc độ cao hơn, giảm thời gian trễ và chờ đợi ở
phía người dùng đầu cuối (Client).
Khi người sử dụng tham chiếu một nội dung của trang web nào đó lần
đầu bằng trình duyệt Web, trình duyệt Web sẽ lưu đệm trang Web đó tại máy
tính của người sử dụng (local web caching). Như vậy, lần tham chiếu trang
Web đó tiếp theo thì nội dung trang Web đó được lấy ngay tại máy tính của
người sử dụng mà không cần phải chuyển yêu cầu của trình duyệt Web lên
trên mạng cấp trên hoặc đến tận máy chủ gốc (Origin server) của trang Web
để tìm kiếm. Do đó giảm được lưu lượng sử dụng băng thông ở mạng cấp
trên và sự trễ đối với người dùng. Tính năng Web caching cục bộ này trên
mỗi máy tính cá nhân của người sử dụng được thực hiện nhờ các loại trình
Tan Kosal

Líp: CH2003 - 2005


4


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

duyệt Web của Microsoft, Netscape hay Mozilla của linux Redhat với trường
History (microsoft). Tuy nhiên trong môi trường rộng lớn hơn, như trong
mạng máy tính cục bộ (LAN) có nhiều máy tính kết nối thì “local cache” cho
web được mở rộng thành một “share cache” chia sẻ cho tất cả người dùng
trong một mạng cục bộ. Khi số lượng của người dùng kết nối vào một bộ
đệm đơn (single cache) nhỏ, còn số lượng thơng tin trên Web nhiều, thì các
tính năng của cache bị giảm sút. Tỷ lệ truy nhập trúng trang Web (hit) tại
cache của mạng cục bộ của một cơ quan (các yêu cầu của những người sử
dụng có thể được phục vụ bởi cache có lưu bản sao trang Web) thường trong
khoảng 30% đến 50%.
Do vậy Web Caching là một giải pháp hiệu quả nhất và đỡ tốn kém
chi phí nhất để nâng cao chất lượng dịch vụ đáp ứng được phần lớn các nhu
cầu của người sử dụng truy nhập lấy nội dung thông tin trên Web.

1.2. GIỚI THIỆU VỀ WEB CACHING
Bộ nhớ đệm là một vùng lưu trữ tạm các thông tin được sao chép từ
thông tin gốc. Có hàng triệu trang Web trên mạng internet, điều này đồng
nghĩa với việc có một khối lượng thơng tin khổng lồ, và hàng triệu các đối
tượng cần xử lý khác nhau. Trong q trình khai thác thơng tin, rất nhiều yêu
cầu người dùng tới cùng một đối tượng. Một ví dụ điển hình là logo của
Yahoo trên trang Web của cơng ty này. Hình logo này xuất hiện tại tất cả các
trang Web thông tin. Mỗi trang lại được truy cập bởi nhiều người dùng và
nhiều lần trong ngày. Bộ đệm cho Web là một hệ thống máy tính chuyên
dụng quản lý và lưu trữ các đối tượng khi nó truy xuất đối tượng từ máy chủ.

Với các yêu cầu đến đối tượng, bộ đệm sẽ xử lý và truyền tải đối tượng từ
vùng nhớ của nó thay vì gửi yêu cầu đến Server lưu trữ đối tượng gốc. Mọi
đối tượng Web đều có thể thay đổi theo thời gian, vì vậy cơ chế này quy định
Tan Kosal

Líp: CH2003 - 2005

5


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

một khoảng thời gian cho mỗi đối tượng. Khi qua khoảng thời gian này, bộ
đệm sẽ tự động lấy lại nội dung của đối tượng được lưu trữ trên máy chủ
gốc. Điều này đảm bảo luôn phản ánh đúng nội dung của đối tượng đối với
người dùng. Càng có nhiều yêu cầu truy xuất chung tới một đối tượng,
phương pháp này càng thể hiện được tính hiệu quả của nó.

Web
Cache

Cache

Web
Cache

Internet

Browsers


Cache

Browsers

Hình 1.1 : Kiến trúc cơ bản của một bộ đệm cho Web
1.2.1. Một số khái niệm
Client
Client là bất kỳ ứng dụng nào tạo nên sự kết nối sử dụng cho mục đích
gửi yêu cầu.
Server
Là một ứng dụng sẽ chập nhận việc kết nối cho mục đích trả lời những
yêu cầu bằng việc gửi trở lại những câu trả lời. Bất kỳ chương trình nào cũng
có thể vừa là client vừa là server, phụ thuộc vào vai trò mà một kết nối cụ thể
thực hiện. Thuật ngữ này thường được sử dụng liên quan với mỗi kết nối chứ
không phải dựa vào loại yêu cầu.

Tan Kosal

Líp: CH2003 - 2005

6


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

Gopher

FPT

HTTP


Addressing Schemer
common Protocols
Format Negotiation

Online Browser

Hình 1.2: Mơ hình Client/Server
Web Server
Về mặt kỹ thuật, Web server gồm có phần mềm và phần cứng. để xây
dựng Web server của mình thì phải thiết đặt phầm mềm đặc biệt tới máy tính
đặc biệt hoặc mạng LAN và hệ điều hành (hoặc Network operating system –
NOS) mà đang chạy. Web server có thể thực hiện một số nhiệm vụ như sau:
 Hoạt động việc đăng ký
 Xác nhận những người sử dụng
 Ghi địa chỉ Internet, thời gian và yêu cầu mà làm cho mỗi kết nối
 Bảo vệ tập tin
 Truyền các yêu cầu dữ liệu mà cả browser lẫn server có thể truy
cập trực tiếp tới các ứng dụng gọi là gateway.
Browser
Browser là phần mềm ứng dụng dùng để truy nhập World Wide Web
(WWW). Browser có 2 nhiệm vụ chính:
 Sử dụng URL để truy lục thông tin trên Internet hoặc để bắt đầu
thao tác dựa trên nội dung của URL. Đối với siêu văn bản
(HyperText) browser cần nói về sự sử dụng HTTP, FTP và giao thức
Gopher.

Tan Kosal

Líp: CH2003 - 2005


7


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

 Để giải thích mã HTML trong tài liệu nó nhận từ máy chủ và đưa
ra tài liệu đó tới người sử dụng với nhiều định dạng browser.
Khi nhập URL khác, quá trình sẽ bắt đầu lại khắp nơi. Browser sử
dụng URL để yêu cầu tài liệu rồi cho đợi máy chủ trả lại tài liệu.

Hình 1.3: Quan hệ giữa Web browser và Internet Server
Firewall
Firewall là một kỹ thuật được tích hợp vào hệ thống để chống lại sự
truy cập trái phép nhằm bảo vệ các nguồn thông tin nội bộ cũng như hạn chế
sự xâm nhập vào hệ thống của một số thông tin khác không mong muốn.
Proxy
Proxy là một hệ thống trung gian đóng vai trị vừa là server vừa là
client với mục đích đưa ra yêu cầu, thay thể các client khác. Những proxy
thông thường nằm ở điểm đầu vào mạng. Yêu cầu có thể được đáp ứng bên
trong hoặc có thể chuyển tiếp. Nếu yêu cầu được chuyển tiếp thì lúc đó
proxy đóng vai trị như client trong khi nhận thơng tin từ server và sau đó
đưa thơng tin này đến client yêu cầu.

Tan Kosal

Líp: CH2003 - 2005

8



Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

Proxy
Proxy
Clients

Internet
Clients
Clients

Proxy

Hình 1.4: mơ hình proxy
User Agent
Là các client mà đưa ra yêu cầu ban đầu , thường là trình duyệt, trình
soạn thảo, v.v..
Origin Server
Là server có chứa nội dung nguồn hoặc là nơi nội dung nguồn được
tạo ra.
Caching Proxy
Là một hệ thống trung gian đóng vai trị vừa là server vừa là client với
mục đích đưa ra yêu cầu đến Origin Server, thay thế các client xuất phát yêu
cầu. Những proxy thông thường nằm ở điểm truy cập mạng và có hệ thống
caching để lưu trữ những nội dung trang web thường xuyên được truy nhập
đến. Các client thơng q trình duyệt web gửi yêu cầu nội dung trang web
đến proxy. Nếu nội dung trang web đã được cache trong proxy thì proxy có
thể đáp ứng ngay cho client. Nếu nội dung trang web u cầu khơng có trong
proxy thì proxy sẽ chuyển tiếp yêu cầu của client đến hệ thống web caching
cung cấp hay cấp trên hoặc đến thẳng Origin server. Như vậy, trong trường

hợp này proxy làm nhiệm vụ của một client ủy nhiệm thay cho client nguồn
Tan Kosal

Líp: CH2003 - 2005

9


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

xuất phát u cầu. Khi nhận thơng tin từ server nguồn, thì proxy sẽ chuyển
tiếp nội dung web đến client, đồng thời lưu trữ nội dung trang web tại cache
của mình.
Reverse Proxy
Proxy ngược là một proxy nằm phía Origin server và lưu trữ những
nội dung thường xuyên được các Client yêu cầu. Các proxy ngược thường
được dùng như những cổng phía trước các Origin server sau firewall của
mạng và đóng vai trị hỗ trợ giảm tải cho các Origin server.
Neighbor/sibling Web cache server
Caching Server tham gia trong mạng lưới caching (caching mesh),
gửi/nhận những yêu cầu những Cache Server khác.
Cluster
Là một tập hợp các thiết bị nối cặp với nhau cùng hoạt động để chia
sẻ tải.
Local caching proxy
Là proxy cục bộ mà người sử dụng kết nối trực tiếp.
Intermediate caching proxy
Theo các nhà cung cấp nội dung thì caching proxy trung gian là tất cả
các hệ thống cache có trong caching mesh và khơng phải là các local caching
proxy của người sử dụng.

Web Proxy Server
Web proxy server là một máy chủ HTTP chuyên dụng. Proxy server
dùng để cho phép các client bên trong (internal clients) truy cập đến internet
từ sau một firewall. bất kỳ ai ở đằng sau firewall có thể có đủ Web truy nhập
qua máy chủ firewall (Firewall host) với nội lực nhỏ và khơng cần dàn xếp
bảo mật.

Tan Kosal

Líp: CH2003 - 2005

10


Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

Proxy server lắng nghe những yêu cầu từ các clients bên trong firewall
và chuyển các yêu cầu đến máy chủ (remote internet servers) bên ngoài
firewall. Proxy server đáp ứng đọc từ máy chủ bên ngồi và sau đó gửi
chúng cho các Client bên trong. Đa số Proxy server được thực hiện trên một
cơ sở phương pháp truy nhập. Proxy server có thể cho phép hoặc không cho
phép yêu cầu bên trong tuỳ theo giao thức của u cầu. ví dụ: proxy server
có thể cho phép gọi tới FTP Server khi không cho phép gọi tới HTTP server.
Khi nào cần sử dụng Web Proxy Server ?
Có thể dùng Web proxy server như sau:
 Cho phép và hạn chế Client truy cập đến Internet dựa trên địa chỉ
IP của Client
 Tài liệu chaching cho tài liệu bên trong
 Có sự lựa chọn điều kiện để truy cập tới internet và Subnet dựa trên
URL

 Cung cấp sự truy cập Internet cho các công ty sử dụng private
network
 Việc chuyển đổi dữ liệu dạng HTML vì vậy nó đọc được do
browser.
Browser
FPT

Browser

Browser

Purveyor
Proxy
Server
On a
Corporate
Firewall

Gopher

HTTP

Remote Server

Hình 1.5: Proxy Server chạy trên Firewall
Tan Kosal

Líp: CH2003 - 2005

11



Ch­¬ng 1: Giíi thiƯu chung vỊ WEB Caching

Cache Server
Là những server không phục vụ như bản thân một proxy mà chúng
phục vụ các yêu cầu được tạo ra từ các local caching proxy và các caching
proxy ở các cấp mạng trên.
Caching mesh
Là một tập hợp các proxy cache hoạt động phối hợp (co-operating
proxy caches) hoặc các caching servers hoặc các clusters kết hợp từng cặp
chặt chẽ và hoạt động độc lập nhưng chia sẻ nội dung giữa chúng với nhau
bằng cách sử dụng các giao thức quan hệ cache bên trong (Inter Cache
Communincation Protocols).
Transparent Proxy
Một proxy trong suốt là một proxy loại bỏ những thứ cần thiết cho cấu
hình trình duyệt khi người sử dụng truy nhập một proxy.
Local Web Cache Server
Caching Server chạy trên cùng LAN như một người sử dụng.

1.2.2.Một số mơ hình hệ thơng tiêu biểu
1.2.2.1. Mơ hình tổng qt (xem hình 1.6)
Hình 1.6 mơ tả về thành phần tạo ra Web Caching và hệ thống tiêu
biểu giữa các thành phần.

Tan Kosal

Líp: CH2003 - 2005

12



×