Kỹ thuật lập trình

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (224.37 KB, 9 trang )

Một vài kỹ thuật lập trình
Bùi Việt Hà
Bài viết này là lược dịch từ chương 10 ″Algorithm Design Techniques″ của quyển sách nổi
tiếng ″Data Structure and Algorithms″ của các tác giả Aho A.V., Hopcroft J.E. và Ullman
J.D. Tiêu đề do người biên soạn bài viết tự đặt.
Các bạn trẻ thân mến.
Thuật toán, kỹ thuật lập trình luôn là một điều bí ẩn và hấp dẫn đối với các bạn trẻ, các bạn
học sinh và sinh viên đang ngồi trên ghế nhà trường. Nhiều bài toán khó, đa dạng tưởng
chừng như không thể tìm được lời giải lại ẩn chứa bên trong những thuật toán đơn giản,
tuyệt đẹp đến không ngờ. Cuốn sách ″Data Structure and Algorithms″ của các tác giả Aho
A.V., Hopcroft J.E. và Ullman J.D đã ra đời cách đây 20 năm nhưng giờ đây đọc lại vẫn
thấy rất mới mẻ và chứa đựng nhiều ý tưởng hay. Đặc biệt chương ″Một vài kỹ thuật thiết
kế thuật toán″ chứa đựng nhiều ý tưởng xác định cho toàn bộ định hướng nghiên cứu và
giải quyết bài toán của ngày hôm nay. Nhân dịp số báo đặc biệt Tết Quí Mùi, chúng tôi
chân trọng giới thiệu với bạn đọc, đặc biệt là các bạn học sinh, sinh viên chuyên tin lược
dịch của chương này. Trong quá trình biên soạn, chúng tôi đã thay đổi chút ít cho phù hợp
với đối tượng của độc giả Tin học & Nhà trường. Trong khi trình bày thuật toán các tác giả
đã sử dụng khá nhiều kỹ thuật phân tích đánh giá độ phức tạp, đối với các bạn lần đầu làm
quen với những khái niệm này có thể hoàn toàn bỏ qua chúng mà không ảnh hưởng gì đến
việc đọc các phần khác của bài viết. Chúc các bạn một năm mới với nhiều sáng tạo mới, và
mong rằng những ý tưởng của bài viết này được các bạn tiếp nhận và áp dụng sáng tạo
trong công việc của mình.
1. Thuật toán Chia để Trị (Divide & Conquer) Có lẽ thuật toán được sử dụng nhiều
nhất, quan trọng nhất là kỹ thuật ″Chia để Trị″. Kỹ thuật này sẽ chia bài toán hiện thời
thành N bài toán nhỏ hơn, thực hiện lời giải cho từng bài toán nhỏ này và từ đó xây dựng
thuật toán cho bài toán lớn tổng hợp. Ví dụ cho các thuật toán này là Sắp xếp Trộn
(1)
hoặc
Tìm kiếm Nhị phân
(2)
mà các bạn đã đã được biết trong chương trình Tin học Cơ bản.

Để minh họa rõ hơn cho kỹ thuật này chúng ta hãy xét một ví dụ quen thuộc đó là bài toán
″Tháp Hà Nội″. Giả sử có 3 cọc A, B, C. Ban đầu tại A đặt một số đĩa với thứ tự trên nhỏ
dưới to như hình vẽ.
Yêu cầu của bài toán là chuyển toàn bộ số đĩa trên sang cọc B, trong quá trình chuyển
được phép sử dụng đĩa C, mỗi lần chuyển đúng 01 đĩa và luôn bảo đảm nguyên tắc đĩa nhỏ
nằm trên đĩa to trong suốt quá trình chuyển.
Bài toán Tháp Hà Nội trên có thể giải với thuật toán ″thông minh″ sau: Giả sử ta đặt 3 cọc
trên tại các đỉnh của một tam giác đều. Tại bước với số lượt là lẻ, ta chuyển đĩa nhỏ nhất
sang cọc bên cạnh theo chiều kim đồng hồ, tại bước đi với số lượt là chẵn, ta thực hiện một
thao tác bất kỳ nhưng không đụng đến cái đĩa nhỏ nhất. Các bạn dễ dàng kiểm tra rằng đó
là một thuật toán đúng, tuy nhiên nó rất khó hiểu, khó tổng quát sang các trường hợp khác.
Ta hãy thử vận dụng tư duy của thuật toán ″Chia để Trị″ đối với bài toán Tháp Hà Nội này.
Bài toán chuyển N đĩa từ A sang B có thể chia thành 2 bài toán nhỏ hơn với kích thước N-
1 như sau: (a) Chuyển N-1 đĩa đầu tiên từ A sang C (giữ nguyên trạng thái của đĩa thứ N
tại A). (b) Chuyển đĩa thứ N từ A sang B và chuyển N-1 đĩa từ C sang B. Chú ý rằng khi
thực hiện bài toán (b) phần chuyển N-1 đĩa từ C sang B ta có thể dùng lại hoàn toàn thuật
toán của bài (a) nhưng với vị trí thay đổi giữa A và C và tất nhiên bỏ qua sự có mặt của đĩa
thứ N trong A hay B. Với cách tư duy như vậy, việc mô phỏng thuật toán sẽ tương đối khó
do nó phải gọi đệ qui đến chính nó nhưng cách làm trên thật là dễ hiểu và cho phép chúng
ta áp dụng cho nhiều lớp bài toán khác. Chúng ta hãy xét một vài ví dụ.
Ví dụ 1: Bài toán nhân các số tự nhiên lớn
Xét bài toán nhân 2 số tự nhiên n-bit X và Y. Bài toán nhân 2 số tự nhiên n-bit (n chữ số)
đã được dạy trong nhà trường phổ thông với độ phức tạp O(n
2
)
(3)
. Bây giờ chúng ta sẽ xét
lại bài toán này với kỹ thuật Chia để Trị. Ta phân tách mỗi số X, Y thành 2 phần, mỗi phần
n/2 bit. Để cho đơn giản ta sẽ luôn xét n là lũy thừa của 2. X, Y sẽ được phân tích thành 2
phần n/2-bit như sau:

X = A | B (X = A2
n/2
+ B)
Y = C | D (Y = C2
n/2
+ D)
Khi đó tích XY sẽ có dạng:
XY = AC2
n
+ (AD+BC)2
n/2
+ BD (1)
Dựa trên công thức (1) ta có thể suy luận đơn giản như sau cho việc tính tích XY: chúng ta
sẽ tính 4 phép nhân với các số n/2-bit là AC, AD, BC và BD, sau đó thực hiện 3 phép cộng
với các số 2n-bit, cuối cùng là 2 phép chuyển chữ số (2 phép nhân với lũy thừa của 2) Các
phép cộng và phép chuyển chữ số đều được thực hiện với thời gian O(n), do đó ta thu được
công thức tính độ phức tạp của phép toán trên T(n) là:
T(1) = 1
T(n) = 4T(n/2) + C.n (C-const) (2)
Công thức (2) cho ta T(n) = O(n
2
) và như vậy ta chưa thu được kết quả gì mới so với
phương pháp tính từ nhà trường phổ thông.
Bây giờ ta biến đổi công thức (1) dưới dạng:
XY = AC2
n
+ ((A-B)(D-C) + AC + BD)2
n/2
+ BD (2)
Công thức (2) mặc dù phức tạp hơn (1) nhưng chúng có thể được tính bởi:

- 3 phép nhân n/2-bit: AC, BD và (A-B)(D-C).
- 6 phép +, - các số n/2-bit.
- 2 phép chuyển chữ số (nhân với lũy thừa của 2).
Do vậy với cách tính trên ta có công thức sau tính độ phức tạp của thuật toán này:
T(1) = 1
T(n) = 3T(n/2) + C.n (C-const) (3)
Công thức (3) cho ta
Như vậy ta đã thu được một kết quả mới cho việc thực hiện phép nhân 2 số tự nhiên n-bit
với thuật toán mạnh hơn phép nhân bình thường đã học trong nhà trường (
4
).
Ví dụ 2: Bài toán tạo lịch thi đấu Tennis
Giả sử cần lập một lịch thi đấu Tennis cho n = 2
k
vận động viên (VĐV). Mỗi vận động
viên phải thi đấu với lần lượt n-1 vận động viên khác, mỗi ngày thi đấu 1 trận. Như vậy n-
1 là số ngày thi đấu tối thiểu phải có. Chúng ta cần lập lịch thi đấu bằng cách thiết lập ma
trận có n hàng, n-1 cột. Giá trị số tại vị trí (i,j) (hàng i, cột j) chỉ ra vận động viên cần thi
đấu với vận động viên i trong ngày thứ j.
Sử dụng kỹ thuật Chia để Trị, chúng ta hãy lập lịch thi đấu cho nửa (n/2) số vận động viên
đầu tiên. Bằng việc sử dụng lời gọi đệ qui chúng ta đưa bài toán về trường hợp chỉ có 2
VĐV.
Chúng ta minh họa bằng trường hợp n=8. Lịch thi đấu cho 4 người đầu tiên của danh sách
chiếm nửa trái trên của ma trận (4 hàng, 3 cột). Phần nửa trái dưới (4 hàng, 3 cột) của ma
trận là lịch thi đấu của 4 VĐV còn lại (từ 5 đến 8). Phần này thu được từ nửa trái trên bằng
cách cộng 4 vào mỗi phần tử tương ứng của ma trận. Để điền nốt các phần còn lại của ma
trận chúng ta chỉ cần xác định lịch thi đấu giữa các VĐV với số thấp (≤n/2) với các VĐV
với số cao (≥n/2). Để làm việc này chúng ta xếp các VĐV từ 1 đến n/2 đấu lần lượt với các
VĐV số cao vào ngày 4. Các ngày còn lại thu được từ ngày 4 bằng cách hoán vị vòng
quanh các VĐV với số thứ tự cao. Quá trình điền số được mô tả trong hình 2. Các bạn có

thể tổng quát quá trình này cho trường hợp tổng quát n=2
k
bất kỳ.
2.Thuật toán Qui Hoạch Động (Dynamic Programming)
Trong phần trên chúng ta đã thấy sức mạnh của kỹ thuật Chia để Trị bằng cách chia nhỏ
bài toán cần làm. Tuy nhiên không phải bao giờ cũng có thể chia nhỏ bài toán thành các bài
toán con và từ đó tìm ra lời giải của bài toán lớn. Trong các trường hợp như vậy, mặc dù
chúng ta vẫn có thể chia nhỏ bài toán thành nhiều bài toán con, nhưng thời gian thu được
sẽ tăng theo số mũ và thuật toán trở nên vô giá trị.
Trên thực tế, việc chia thành các bài toán con thường chỉ chiếm thời gian là đa thức. Trong
trường hợp này một bài toán con sẽ được lặp lại nhiều lần trong quá trình tìm kiếm lời giải.
Để khỏi mất thời gian mỗi khi giải quyết các bài toán con, các bạn sẽ lưu trữ các lời giải
này để tra cứu về sau mỗi khi cần đến. Công việc này sẽ đòi hỏi độ phức tạp thuật toán là
đa thức.
Có một cách làm còn đơn giản hơn cách đã nêu trên. Chúng ta sẽ lưu giữ tất cả các lời giải
của các bài toán con lại không cần biết rằng chúng có được dùng lại nhiều lần về sau hay
không, không quan tâm đến việc các lời giải này có cần thiết cho lời giải của bài toán chính
của chúng ta hay không. Cách làm như vậy có tên gọi là Qui hoạch động. Bản thân từ qui
hoạch động được lấy từ lý thuyết điều khiển.
Cách cài đặt thực tế của thuật toán qui hoạch động không thống nhất nhưng điều chung
nhất ở chúng là có một cái bảng và chúng ta cần lần lượt điền các thông số vào cái bảng
này. Để minh họa chúng ta hãy xét một vài ví dụ.
Ví dụ 3: Trò chơi Tán thủ
(5)
Giả sử có hai tán thủ A, B cần đấu trực diện với nhau, qui định chung là người thắng trước
n ván sẽ là người thắng cuộc. Trên thực tế thường giá trị n = 4. Giả sử hai tán thủ A, B là
mạnh ngang nhau và do đó sác xuất thắng, thua trong mỗi ván là 50/50. Giả sử P(i,j) là sác
xuất sao cho A cần thắng thêm i ván nữa , B cần thắng thêm j ván nữa thì A sẽ chắc chắn
thắng chung cuộc. Chúng ta cần tính những giá trị P(i,j) này với i, j bất kỳ.
Nếu i=0, j>0, tức là A đã thắng rồi và do đó P(0,j)=1. Nếu i>0, j=0, tức là B đã thắng và A

đã thua rồi, do đó P(i,0)=0. Với i, j > 0 ta có nhận xét sau: sác xuất để A thắng chung cuộc
dựa vào ván tiếp theo A thắng hay thua. Nếu ván tiếp theo A thắng, khi đó sác xuất để A
thắng sẽ là P(i-1,j), còn nếu A thua ở ván tiếp theo thì sác xuất để A vẫn thắng chung cuộc
sẽ là P(i,j-1). Vì ván tiếp theo khả năng A thắng thua là 50/50 nên ta có công thức P(i,j) =
(P(i-1,j)+P(i,j-1))/2. Tóm lại ta có công thức truy hồi sau để tính P(i,j).
Từ công thức (4) với i+j=n ta dễ dàng tính được công thức truy hồi của độ phức tạp tính
toán T(n) như sau:
T(1) = C (C-const)
T(n) = 2T(n-1) + D (D-const) (5)
Ta tính được T(n) = O(2
n
). Như vậy việc tính toán các hệ số P(i,j) sẽ có độ phức tạp tăng
theo số mũ của n nếu tính toán bằng kỹ thuật đệ qui và đây là một kết quả rất lớn. Tuy
nhiên công thức trên chỉ cho ta giới hạn trên của tính toán, để hiểu rõ hơn sự″tồi tệ″ thực
sự của việc sử dụng đệ qui tính toán theo công thức(4) chúng ta sẽ thử tính toán giới hạn
dưới của công việc tính toán này. (Giới hạn dưới của độ phức tạp được ký hiệu là big-
omega: W). Để tính được giá trị này chúng ta sẽ tính số lần gọi hàm P khi thực hiện đệ qui
cách tính P(i,j) theo công thức (4). Công thức (4) với i+j=n nếu xem xét kỹ sẽ gợi ý cho
chúng ta về một đẳng thức tương tự của hệ số tổ hợp là
(tổ hợp chập i từ n phần tử, số cách chọn ra i phần tử từ tập hợp ban đầu n phần tử). Từ
nhận xét trên dễ dàng suy ra rằng số lần gọi hàm P trong lời gọi P(i,j) sẽ ít nhất là
.
Với i=j=n/2 dễ thấy giá trị này sẽ bằng
.
Vậy ta vừa chứng minh được rằng cận
dưới độ phức tạp tính toán P(i,j) là là một giá trị rất lớn (tuy có nhỏ hơn 2
n
) và
hầu như không thể áp dụng tính toán trên thực tế.
Cách tính P(i,j) tốt nhất là vừa tính vừa điền số vào bảng như mô tả trong hình 3 dưới đây.

Kỹ thuật lập trình

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về