BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HCM
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP BỘ
DẠY HỌC XÁC SUẤT – THỐNG KÊ
Ở TRƯỜNG PHỔ THÔNG
Mã số : B2007.23.47
Chủ nhiệm đề tài : PGS-TS. Lê Thị Hồi Châu
THÀNH PHỐ HỒ CHÍ MINH 2010
NHỮNG NGƯỜI THAM GIA THỰC HIỆN ĐỀ TÀI
1- Tăng Minh Dũng, Khoa Tốn – Tin, ĐHSP TP Hồ Chí Minh
2- Trần Túy An, Trường THPT Lê Hồng Phong, TP Hồ Chí Minh
3- Quách Huỳnh Hạnh, Trường THPT Sao Việt, TP Hồ Chí Minh
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Liên quan đến dạy học (DH) mơn tốn, một quan điểm hiện đang được thừa nhận
rộng rãi trên thế giới là cần phải thỏa mãn hơn phương diện khoa học luận và tôn
trọng hơn quy trình nhận thức của học sinh (HS). Theo xu hướng đó, nghiên cứu
khoa học luận và những ràng buộc, những điều kiện, những yếu tố tác động đến q
trình DH một tri thức là cần thiết, khơng chỉ cho giáo viên (GV), mà còn cho cả việc
soạn thảo chương trình, sách giáo khoa.
Ở Việt nam, kể từ năm 2005 lần đầu tiên một số nội dung về Thống kê – Xác suất
được chính thức đưa vào chương trình đại trà bậc Trung học phổ thông (THPT), áp
dụng trên tồn quốc. Tuy nhiên, ngoại trừ một vài cơng trình xuất hiện gần đây và
nằm trong dự án nghiên cứu của chúng tơi thì chưa có tài liệu tiếng Việt nào xem xét
một cách đầy đủ cả phương diện khoa học luận lẫn phương diện sư phạm về
những nội dung này. Nói cho đúng ra thì đã có hai luận án phó tiến sĩ của Đỗ Mạnh
Hùng và Trần Kiều nghiên cứu vấn đề xây dựng chương trình, nội dung về Thống kê Xác suất để đưa vào bậc Trung học. Hai luận án này bảo vệ từ những năm 90 của thế
kỷ trước, tập trung chủ yếu trên việc bổ sung một số nội dung của Thống kê - Xác
suất vào chương trình phổ thơng và bàn về phương pháp DH một vài vấn đề cụ thể
thuộc nội dung được đề nghị. Có luận án chỉ xét việc DH trong phạm vi các lớp
chun tốn. Chưa có một nghiên cứu khoa học luận nào về những nội dung đưa vào
chương trình. Điều đó làm cho việc đặt ra mục tiêu DH, xây dựng chương trình, và
việc trình bày các nội dung ấy trong sách giáo khoa thiếu một cơ sở vững chắc. Lại
càng thiếu những nghiên cứu về DH Thống kê – Xác suất trong điều kiện công nghệ
thông tin phát triển như ngày nay.
Thực tế DH theo chương trình và sách giáo khoa thí điểm những năm qua cho thấy
GV cịn có nhiều lúng túng trong thực hành, thậm chí có những quan niệm sai lầm về
mục đích DH Thống kê – Xác suất. Chất lượng DH vì thế mà chưa cao. Học sinh
(HS) gặp khó khăn khi vận dụng kiến thức của Thống kê – Xác suất vào giải quyết
những vấn đề của cuộc sống, trong khi khoa học này lại cần thiết cho mọi lĩnh vực
hoạt động của con người.
Trong bối cảnh phải đổi mới mục tiêu, chương trình, nội dung và phương pháp DH
nhằm đào tạo ra những người lao động có khả năng sáng tạo, có năng lực tự học để
thích ứng với những biến đổi không ngừng của xã hội, nghiên cứu do chúng tôi thực
hiện là cần thiết và sản phẩm của nó sẽ là một tài liệu tham khảo có ích cho giáo sinh
2
các trường đại học sư phạm, cho GV phổ thông, cho cả những tác giả tham gia xây
dựng chương trình và viết sách giáo khoa.
2. Mục đích nghiên cứu
Theo Chevallard (1992) : “Đối tượng đầu tiên cần nghiên cứu, và do đó cần chất vấn,
cần mơ hình hóa, cần đặt vấn đề theo các quy tắc hoạt động khoa học không phải là
người học hay người dạy, mà là tri thức toán học được họ xem như đang cùng nhau
nghiên cứu, cũng như những hoạt động toán học mà dự án nghiên cứu chung của họ
sẽ dẫn đến chỗ phải thực hiện”.
Thừa nhận quan điểm của Chevalard, mục đích đầu tiên mà chúng tôi đặt ra cho dự án
nghiên cứu của mình là xem xét tri thức được ở góc độ tri thức tốn học và ở góc độ
tri thức cần dạy. Như thế, nghiên cứu của chúng tôi nhắm đến việc làm rõ một mặt là
đặc trưng khoa học luận và mặt khác là những ràng buộc, những điều kiện do thể
chế quy định cho việc DH một số tri thức về Thống kê - Xác suất theo chương trình
hiện đang áp dụng trong các trường THPT.
Cụ thể, về phương diện khoa học luận, chúng tôi sẽ làm rõ :
-
Mối liên hệ mật thiết giữa hai lý thuyết toán học Thống kê và Xác suất.
-
Các cách tiếp cận khái niệm xác suất của một biến cố.
-
Nghĩa của một số tri thức thống kê được giảng dạy ở bậc phổ thơng.
Về phía thể chế DH Việt nam, chúng tơi sẽ phân tích xem những đặc trưng khoa học
luận này đã được tính đến như thế nào bởi chương trình và sách giáo khoa hiện hành.
Phân tích ấy sẽ cho phép chúng tơi hình thành nên những dự báo về ảnh hưởng của sự
lựa chọn thể chế lên thực tế DH Thống kê - Xác suất ở bậc THPT.
Cuối cùng, trên cơ sở những đặc trưng khoa học luận đã được làm sáng tỏ, chúng tơi
sẽ thiết kế một vài tình huống mang tính chất minh họa cho việc đổi mới phương pháp
DH (theo định hướng tích cực hóa hoạt động học tập), sự đổi mới nhắm đến việc làm
thỏa mãn hơn nhu cầu khoa học luận, giúp HS hiểu nghĩa của tri thức và sử dụng
được nó vào giải quyết các vấn đề của thực tiễn.
Cần phải nói rõ rằng trong chương trình mơn tốn hiện đang áp dụng ở trường phổ
thông, một số yếu tố của Thống kê đã được đưa vào khá sớm, ngay từ bậc Tiểu học.
Nhưng, cho đến tận lớp 7 thì chương trình mới bắt đầu đề cập tương đối có hệ thống
một vài khái niệm mở đầu của khoa học Thống kê mô tả. Tuy nhiên đây mới chỉ là
bước đầu tiên của việc DH này, và những gì có mặt trong chương trình lớp 7 đều xuất
hiện lại trong chương trình tốn THPT. Hơn nữa, chỉ có ở THPT các nội dung về Xác
3
suất mới được giảng dạy. Đó là những lý do khiến chúng tôi giới hạn nghiên cứu việc
DH Thống kê – Xác suất ở bậc THPT.
3. Công cụ lý thuyết và phương pháp nghiên cứu
Để đạt mục đích nêu trên, việc phân tích các đặc trưng của những tri thức mà chúng
tôi quan tâm sẽ được thực hiện trên hai phương diện : phương diện khoa học luận và
phương diện thể chế.
Khái niệm phân tích khoa học luận và lợi ích sư phạm của nó đã được chúng tơi làm
rõ trong một đề tài cấp Bộ nghiệm thu năm 2003 [Lê Thị Hoài Châu, 2003]. Khái
niệm này sẽ được sử dụng ở đây để xem xét những tri thức mà chúng tơi quan tâm từ
góc độ khoa học luận. Điều đó được thực hiện qua việc phân tích lịch sử hình thành,
phát triển của các lý thuyết Thống kê - Xác suất và qua việc tham khảo những giáo
trình dùng ở bậc đại học, những cơng trình liên quan đã cơng bố.
Về phương diện thực tế DH theo chương trình hiện hành, để phân tích sự lựa chọn của
thể chế trong việc đưa vào những tri thức Thống kê- Xác suất mà đề tài xem xét,
chúng tôi sẽ sử dụng các khái niệm của Thuyết nhân học, cụ thể là khái niệm tổ chức
toán học, quan hệ thể chế, quan hệ cá nhân với một đối tượng tri thức.
Khái niệm quan hệ thể chế R(I, O) của thể chế I đối với một đối tượng tri thức O được
Chevallard sử dụng để mơ hình hóa các tác động qua lại mà I có với O. Nó cho biết O
xuất hiện ở đâu, như thế nào, tồn tại ra sao, có vai trị gì, … trong I. Cịn quan hệ cá
nhân R(X, O) với đối tượng tri thức O được ông dùng để chỉ những gì mà cá nhân đó
biết về O, cách cá nhân đó nói về O, nghĩ về O, sử dụng O. Việc học tập của cá nhân
X về đối tượng tri thức O chính là q trình thiết lập hay điều chỉnh mối quan hệ
R(X, O). Hiển nhiên, nếu X là một thành viên của I thì quan hệ R(I, O) luôn để lại dấu
ấn đậm nét lên quan hệ R(X, O).
Làm thế nào để làm rõ các yếu tố của R(I, O) ?
Cũng theo Chevallard, mọi hoạt động xã hội đều có thể phân tích thành các
praxéologie được hình thành từ những kiểu nhiệm vụ xác định. Mỗi praxéologie là
một bộ gồm 4 thành phần [T, τ, θ, Θ], trong đó T là một kiểu nhiệm vụ, τ là kỹ thuật
cho phép giải quyết T, θ là cơng nghệ giải thích cho kỹ thuật τ, Θ là lý thuyết giải
thích cho cơng nghệ θ. Một praxéologie mà các thành phần đều mang bản chất toán
học được gọi là một praxéologie toán học hay một tổ chức tốn học.
Liên quan đến O, trong I có những praxéologie nào ? Chúng được hình thành từ kiểu
nhiệm vụ nào ? những kỹ thuật nào được xây dựng ? kỹ thuật nào được ưu tiên sử
dụng ?... Chính việc làm rõ các tổ chức toán học liên quan đến đối tượng tri thức O sẽ
4
cho phép ta vạch rõ cuộc sống của O trong I : nó xuất hiện ở đâu, như thế nào, để giải
quyết vấn đề gì, có vai trị, có quan hệ ra sao với mạng lưới tri thức tồn tại trong I.
Phân tích các tổ chức tốn học của chúng tôi được đặt dưới ánh sáng của nghiên cứu
khoa học luận về tri thức O. Qua phân tích ấy, chúng tơi sẽ tìm câu trả lời cho câu
hỏi : các đặc trưng khoa học luận của O đã được tính đến như thế nào trong thể chế I ?
Câu hỏi này cần được đặt ra vì việc khơng tính đến chúng một cách không đầy đủ sẽ
làm thu hẹp nghĩa (thậm chí có thể làm mất nghĩa) của O đối với các cá nhân X hoạt
động trong I.
Cuối cùngchúng tôi sẽ thiết kế một số tình huống DH có tính đến phương pháp mơ
hình hóa trong DH tốn, một phương pháp khơng thể thiếu nếu muốn sử dụng tốn
học vào cuộc sống hay các khoa học khác. Mà sự sử dụng này thì khơng thể khơng
nói đến khi bàn về DH Thống kê - Xác suất, bởi – như chúng tôi sẽ chỉ ra trong phần
nghiên cứu khoa học luận, đã nói đến khoa học này là phải nói đến mơ hình hóa. Tất
nhiên, các tình huống đó phải nhắm đến việc làm cho HS hiểu được nghĩa của tri thức
mà ta muốn dạy cho họ.
Kết quả nghiên cứu của chúng tơi sẽ được trình bày trong 4 chương.
Chương 1 dành cho việc nghiên cứu mục đích DH Thống kê và Xác suất nhìn từ đặc
trưng của tốn học nói chung, của các khoa học này nói riêng. Câu hỏi về mục đích
DH tưởng chừng như khơng có gì phải bàn cãi, nhưng thực tế lại cho thấy dường như
cần phải xác định rõ ràng hơn.
Chương 2 trình bày kết quả đạt được của một nghiên cứu khoa học luận nhằm vạch rõ
quan hệ giữa Thống kê và Xác suất, các cách tiếp cận khái niệm Xác suất và nghĩa
của một số khái niệm của Thống kê.
Chương 3 trình bày tóm tắt kết quả nghiên cứu quan hệ thể chế với những đối tượng
tri thức Thống kê - Xác suất mà đề tài đề cập đến, từ đó hình thành nên giả thuyết về
ảnh hưởng của sự lựa chọn thể chế lên quan hệ các nhân GV và HS đối với những đối
tượng này.
Chương cuối cùng giới thiệu hai đồ án sư phạm được xây dựng nhằm làm cho HS
hiểu nghĩa của những tri thức được bàn đến, qua đó nâng cao năng lực hiểu biết toán
của các em.
5
Chương 1
NGHIÊN CỨU MỤC ĐÍCH CỦA DẠY HỌC
XÁC SUẤT – THỐNG KÊ
I. MỤC ĐÍCH CỦA DẠY HỌC TỐN
Về mục đích của DH toán, mọi nền giáo dục đều thừa nhận là phải mang lại cho HS
những kiến thức phổ thông, những kỹ năng cơ bản của người lao động, qua đó rèn
luyện tư duy logic, phát triển năng lực sáng tạo, góp phần hình thành thế giới quan và
nhân sinh quan đúng đắn cho các em.
Vấn đề là cụ thể hóa mục đích ấy như thế nào.
Cuộc cải cách tốn học hiện đại vào những năm 70 của thế kỷ trước chủ trương quán
triệt phương pháp tiên đề, lý thuyết tập hợp và ánh xạ trong DH toán ngay từ bậc phổ
thơng. Nhưng người ta đã nhanh chóng nhận ra thất bại của cuộc cải cách này, mà
một trong những ngun nhân là tốn học được trình bày như vậy là thứ tốn học hình
thức, xa lạ với thực tiễn và HS không thể sử dụng được vào việc giải quyết các vấn đề
nảy sinh từ hoạt động thường ngày của họ.
Những cuộc cải cách thực hiện sau đó chuyển sang xu hướng làm cho toán học gần
với cuộc sống hơn. Xu hướng này vẫn tiếp tục được theo đuổi cho đến ngày nay, đặc
biệt là vài thập niên gần đây, trong bối cảnh phát triển mạnh mẽ của hai cuộc cách
mạng khoa học công nghệ và xã hội.
Ngày nay, bàn về mục tiêu giáo dục, quan điểm được thừa nhận rộng rãi là phải chuẩn
bị cho người học khả năng áp dụng kiến thức một cách linh hoạt vào các bối cảnh
và các vấn đề mới, hình thành thói quen tự học và học tập suốt đời. Quan điểm này
đã dẫn người ta đến chỗ thay đổi hình thức và tiêu chuẩn đánh giá HS. Khái niệm hiểu
biết toán được hình thành từ đó.
I.1. Hiểu biết tốn
Đã có một vài chương trình quốc tế đánh giá HS với mục đích chỉ ra những điểm
mạnh và yếu của hệ thống giáo dục thuộc các quốc gia tham gia khảo sát để không
6
ngừng cải thiện chất lượng đào tạo. PISA (Programme for International Student
Assessment) do tổ chức Hợp tác và Phát triển Kinh tế - gọi tắt là OECD (Organization
for Economic Cooperation and Development) tiến hành là một trong những chương
trình đó.
OEDC được thành lập năm 1997 nhằm đánh giá việc chuẩn bị cho HS tuổi mười lăm
đáp ứng với những thách thức của xã hội ngày nay. Các chuyên gia từ những nước
thành viên làm việc trong các nhóm cơng tác có chun mơn giỏi và kỹ thuật tốt trong
lĩnh vực đánh giá, so sánh. Những công cụ đánh giá mà họ xây dựng đảm bảo có giá
trị quốc tế đồng thời có cân nhắc đến chương trình và đặc trưng văn hóa của các nước
thành viên OECD.
Người ta đánh giá cái gì ?
Theo truyền thống, việc đánh giá HS chủ yếu dựa trên các bài kiểm tra, các kỳ thi.
Chẳng hạn, tại Việt Nam, vấn đề đánh giá ở tầm quốc gia được thực hiện qua những
kỳ thi phân thành hai cấp độ. Ở “cấp độ cao” (như kỳ thi HS giỏi), người ta coi trọng
đánh giá năng lực tư duy logic, sáng tạo của HS, thông qua việc yêu cầu họ giải một
số bài tốn khó. Ở “cấp độ đại trà”, nội dung đánh giá đa phần tập trung vào những
yêu cầu về ghi nhớ hay áp dụng kiến thức, kĩ năng đã được rèn luyện và vận dụng các
quy trình quen thuộc để giải quyết một số bài toán tiêu biểu thường gặp trong sách
giáo khoa và lớp học. Những bài toán tiêu biểu ấy, dù ở “cấp độ đại trà”, ít khi được
hình thành từ một vấn đề của thực tế. Chẳng hạn, theo quan điểm này thì gắn với nội
dung “khảo sát hàm số” dạy ở cuối bậc THPT, người ta chỉ tập trung đánh giá kỹ
năng khảo sát hàm số (cho sẵn dưới dạng một biểu thức giải tích) bằng cơng cụ đạo
hàm. Dường như HS không hề được yêu cầu giải quyết một vấn đề của thực tiễn hay
của khoa học khác (như Vật lý chẳng hạn) trong đó nhu cầu vận dụng các kiến thức
đã học về khảo sát hàm số nảy sinh. Cách dạy, cách đánh giá ấy khiến khơng ít HS
băn khoăn, khơng hiểu mình học “khảo sát hàm số” để làm gì.
Thực tế đó hồn tồn trái ngược với xu thế chung mà giáo dục toán tiên tiến trên thế
giới đã và đang hướng tới.
Chẳng hạn, đối với chương trình PISA, người ta tập trung vào những việc mà HS tuổi
mười lăm cần phải làm trong tương lai và tìm hiểu những gì các em có thể làm được
trên cơ sở kiến thức đã học được. Người ta không chỉ đánh giá kiến thức HS thu được
mà còn xem xét khả năng áp dụng kiến thức và kinh nghiệm vào những vấn đề thực
tế (chứ không phải là vấn đề tiêu biểu thường gặp trong sách giáo khoa và lớp học).
Cụ thể hơn, đánh giá PISA không nặng về mức độ nắm các nội dung có mặt trong
chương trình giảng dạy, mà chú trọng vào khả năng sử dụng kiến thức đã học vào
7
thực tiễn và năng lực xử lý các tình huống mà họ có thể sẽ đối mặt trong cuộc sống
sau khi rời ghế nhà trường.
Liên hệ với mục tiêu DH tốn, ta thấy quan điểm này hồn tồn phù hợp với một thực
tế là đại đa số HS mà chúng ta đào tạo sau này sẽ là người sử dụng tốn chứ khơng
phải là người làm tốn (hiểu theo nghĩa nghiên cứu tốn, đóng góp vào sự phát triển
của các lý thuyết toán học).
Đánh giá PISA được tổ chức thường xuyên ba năm một lần. Ba lĩnh vực được tập
trung đánh giá là đọc hiểu, hiểu biết toán và hiểu biết khoa học. Việc xác định các
lĩnh vực đánh giá như vậy chứng tỏ người ta gán cho DH toán trong nhà trường một
ví trí quan trọng.
Hiểu biết tốn là gì ?
PISA tổ chức lần thứ hai vào năm 2003 với trọng tâm là hiểu biết tốn có sự tham gia
của 41 quốc gia, trong đó có nhiều quốc gia có nền giáo dục tiên tiến trên thế giới như
Nhật Bản, Phần Lan, Hoa Kì, Canada, Đan Mạch, Thụy Điển, Úc... Đánh giá PISA
2003 tập trung vào các bài toán thực tế, tiến xa hơn những loại tình huống và vấn đề
thường gặp trong lớp học.
Định nghĩa về hiểu biết toán của OECD/PISA là:
“Hiểu biết toán là năng lực của một cá nhân, cho phép xác định và hiểu vai trị
của tốn học trong cuộc sống, đưa ra những phán xét có cơ sở, sử dụng và gắn
kết với tốn học theo những cách khác nhau nhằm đáp ứng nhu cầu cuộc sống
của cá nhân đó với tư cách là một cơng dân có tinh thần xây dựng, biết quan tâm
và biết phản ánh.”
Như vậy, thuật ngữ “hiểu biết toán” được dùng để nói về năng lực kết hợp một cách
sáng tạo những kiến thức và kỹ năng toán học khác nhau vào các sự kiện, các vấn đề
được đặt ra bởi tình huống thực tế đa dạng bên ngồi. Những tình huống ấy có thể là
quen thuộc hoặc khơng, có thể đơn giản hay phức tạp. Dĩ nhiên, để kết hợp được như
vậy thì tiền đề là phải có những kiến thức và kỹ năng toán học nền tảng. Nhưng hiểu
biết tốn khơng chỉ là có các kiến thức và kỹ năng ấy.
Định nghĩa về hiểu biết toán nêu trên nhấn mạnh khả năng thiết lập, giải quyết các
vấn đề, hay đơn giản chỉ là giải thích các hiện tượng, sự kiện xuất hiện trong những
bối cảnh khác nhau mà ở đó cần có sự can thiệp của tốn học. Từ bối cảnh ở đây bao
gồm không chỉ những tình huống tốn học thuần túy mà cả những tình huống ngồi
tốn học. Trong những tình huống ấy, thoạt đầu ta khơng thấy có cấu trúc tốn học
nào hiện diện tường minh, và nhiệm vụ của người giải quyết vấn đề là phải đưa ra một
mơ hình tốn học cho phép tìm một câu trả lời có thể chấp nhận được - nói là chấp
8
nhận được vì thực tế khơng phải bao giờ cũng chỉ có một câu trả lời mà thường là tồn
tại nhiều câu trả lời phù hợp với các hoàn cảnh khác nhau.
Định nghĩa về hiểu biết toán của PISA phù hợp với quan điểm DH tích hợp mà người
ta thường nói đến từ vài thập niên qua, theo đó, việc DH các mơn khoa học phải xích
lại gần nhau và gắn với thực tiễn. Những chương trình cũng như những kiểu DH thiên
về kiến thức hàn lâm, xa rời thực tiễn đang dần dần bị loại bỏ.
Dưới đây là vài ví dụ đã được PISA sử dụng khi đánh giá năng lực hiểu biết tốn của
HS tuổi mười lăm.
Ví dụ 1: Đèn đường
“Hội đồng thành phố quyết định dựng một cây đèn đường trong một cơng viên
nhỏ hình tam giác sao cho nó chiếu sáng tồn bộ cơng viên.
Người ta nên đặt nó ở đâu ?” (The PISA 2003, tr. 26)
Ví dụ 2: Bảng trị chơi ở Hội chợ
“Ở một hội chợ, người chơi ném các đồng xu vào một bảng được kẻ những ơ
vng. Nếu một đồng xu dính vào biên, nó bị loại. Nếu lăn ra khỏi bảng, nó sẽ
được ném lại. Nhưng nếu đồng xu nằm lọt vào trong ô vuông, người chơi thắng
được đồng xu lại và thêm một phần thưởng.
Xác suất để thắng ở trò chơi này là bao nhiêu?”
(The PISA 2003, tr. 28)
Ví dụ 3: Tài khoản tiết kiệm
“1000 zed được ký gửi vào một tài khoản tiết kiệm ở ngân hàng. Có hai lựa
chọn: có thể nhận lãi suất 4% hằng năm hay nhận ngay một phần thưởng 10 zed
của ngân hàng và lãi suất 3% hằng năm.
Lựa chọn nào là tốt hơn sau một năm? Sau hai năm ? ” (The PISA 2003, tr. 32)
Những ví dụ trên cho thấy mục tiêu cần phải nhắm đến của DH tốn là hình thành khả
năng vận dụng những kiến thức đã học vào các tình huống của thực tiễn, những tình
huống mà như chúng tơi đã nói trên, trong đó khơng hiện diện tường minh một mơ
hình tốn học nào.
9
I.2. Tốn học hóa các tình huống thực tế (mơ hình hóa)
Để vận dụng kiến thức tốn học vào việc giải quyết những tình huống của thực tế như
trên, người ta phải tốn học hóa tình huống đó, tức là xây dựng một mơ hình tốn học
thích hợp cho phép tìm câu trả lời cho tình huống. Quá trình này gọi là q trình mơ
hình hóa tốn học (mà dưới đây, để ngắn gọn, chúng tôi sẽ gọi là mô hình hóa).
Theo Từ điển bách khoa tồn thư, mơ hình hóa tốn học là sự giải thích tốn học cho
một hệ thống tốn học hay ngồi tốn học nhằm trả lời cho những câu hỏi mà người ta
đặt ra trên hệ thống này.
Q trình mơ hình hóa tốn học được mơ tả qua 4 bước.
Bước 1: Xây dựng mơ hình định tính của vấn đề, tức là xác định các yếu tố có ý nghĩa
quan trọng nhất trong hệ thống và xác lập các qui luật mà chúng ta phải tn theo.
Bước 2: Xây dựng mơ hình tốn học cho vấn đề đang xét, tức là diễn tả lại dưới dạng
ngơn ngữ tốn học cho mơ hình định tính. Lưu ý là ứng với vấn đề đang xem xét có
thể có nhiều mơ hình tốn học khác nhau, tùy theo chỗ các yếu tố nào của hệ thống và
mối liên hệ nào giữa chúng được xem là quan trọng.
Bước 3: Sử dụng các cơng cụ tốn học để khảo sát và giải quyết bài tốn hình thành ở
bước hai. Căn cứ vào mơ hình đã xây dựng cần phải chọn hoặc xây dựng phương
pháp giải cho phù hợp.
Bước 4: Phân tích và kiểm định lại các kết quả thu được trong bước ba. Trong phần
này phải xác định mức độ phù hợp của mơ hình và kết quả tính tốn với vấn đề thực
tế hoặc áp dụng phương pháp phân tích chun gia.
Ở bước này có thể xảy ra một trong hai khả năng :
• Khả năng 1 : Mơ hình và các kết quả tính tốn phù hợp với thực tế.
Khi đó chỉ cần tổng kết lại cách đặt vấn đề, mơ hình tốn học đã xây dựng, các thuật
tốn đã sử dụng, kết quả thu được.
• Khả năng 2 : Mơ hình và kết quả khơng phù hợp với thực tế.
Lúc này phải tìm ngun nhân. Có thể đặt ra những câu hỏi sau :
Các kết quả tính ở bước thứ ba có đủ độ chính xác khơng ?
Để trả lời, người ta phải kiểm tra lại các thuật tốn, các quy trình, các tính tốn đã sử
dụng. Ở đây, người ta tạm chấp nhận rằng mơ hình tốn học (và cũng có nghĩa là mơ
hình định tính) xây dựng như vậy là thỏa đáng.
Mơ hình tốn học xây dựng như thế đã thỏa đáng chưa ?
10
Nếu chưa thì phải xây dựng lại.
Với loại câu hỏi này, ta tạm chấp nhận mơ hình định tính đã xây dựng, nhưng phải
xem xét lại mơ hình tốn học đã lựa chọn.
Mơ hình định tính xây dựng có phản ánh được đầy đủ hiện tượng thực tế không ?
Nếu khơng thì cần phải rà sốt lại bước một xem có yếu tố, qui luật nào bị bỏ sót
khơng.
Các số liệu ban đầu (các thơng số, hệ số) có phản ánh đúng thực tế khơng ?
Nếu khơng thì phải điều chỉnh lại một cách nghiêm túc và chính xác.
(Tham khảo Bùi Thế Tâm, Trần Vũ Thiệu, 1998, tr.7, 8, 9)
Hai câu hỏi cuối đặt ra cho mơ hình định tính đã được xây dựng.
Mơ hình định tính được một số tác giả, ví dụ như L. Coulange, gọi là mơ hình phỏng
thực tiễn. Kết hợp giữa sơ đồ do L. Coulange (1997) đề nghị và những giải thích ở
trên, ta có thể mơ tả q trình mơ hình hóa qua sơ đồ sau :
Phạm vi ngồi tốn học
Câu hỏi trên hệ thống hay
tình huống ngồi tốn học
(Vấn đề thực tiễn)
(1)
Câu trả lời cho
bài toán thực tiễn
(4)
(4)
Câu trả lời cho
bài toán phỏng thực tiễn
Bài tốn
Phỏng thực tiễn
Mơ hình định tính
(2)
(4)
Phạm vi phỏng
thực tiễn
(4)
(4)
Bài tốn tốn học
(4)
(3) Giải
Mơ hình tốn học
Câu trả lời cho
bài tốn tốn học
Phạm vi tốn học
Như thế, mơ hình hóa tốn học là q trình cấu trúc lại vấn đề thực tế nhờ những khái
niệm toán học được lựa chọn một cách phù hợp, thông qua việc xây dựng mơ hình
phỏng thực tế bằng cách “cắt tỉa” – hay ngược lại, bổ sung thực tế - để có thể gắn vấn
11
đề ban đầu với các quy trình tốn học. Trong bước tìm kiếm mơ hình phỏng thực tế
này người ta thường phải thực hiện những việc như đặt giả thuyết, tổng qt hóa, hình
thức hóa,… Bài tốn tốn học cuối cùng được xây dựng phải đại diện trung thực cho
bối cảnh thực tế.
• Trở lại với bài tốn nêu trong ví dụ 1 ở trên.
Bắt đầu bằng một vấn đề thực tế : Đặt cây đèn ở chỗ nào trong cơng viên?
Xây dựng mơ hình phỏng thực tiễn : Cơng viên có thể được thể hiện như là một tam
giác. Vùng chiếu sáng của đèn là một hình trịn mà điểm đặt cột đèn là tâm. Vấn đề là
phải đặt cây đèn sao cho toàn bộ tam giác nằm trong hình trịn.
Chuyển về bài tốn tốn học : xác định tâm của đường tròn ngoại tiếp tam giác. Dùng
kiến thức tâm về tâm đường tròn ngoại tiếp tam giác các đường trung trực để giải bài
toán : dựng hai đường trung trực của hai cạnh tam giác. Giao điểm của hai đường
trung trực là tâm của đường tròn.
Liên hệ kết quả này với công viên thực tế. Chẳng hạn, nếu một trong ba góc của cơng
viên là tù, thì lời giải này khơng hợp lý vì cây đèn sẽ nằm ra ngồi cơng viên. Nếu ba
góc của tam giác đều nhọn thì vẫn cịn phải biết bán kính đường trịn ngoại tiếp tam
giác có vượt q bán kính chiếu sáng của đèn khơng.
Như vậy là cần phải biết hình dạng, các kích thước của tam giác và bán kính chiếu
sáng của đèn. Tìm hiểu những thơng tin bổ sung này rồi lại chuyển về bài tốn tốn
học. …
• Đối với tình huống Trị chơi hội chợ, làm thế nào để giải quyết ?
Trước hết, cần phải nhận ra rằng xác suất để thắng phụ thuộc vào nhiều yếu tố :
khoảng cách từ chỗ đứng ném đến bảng ô vuông, số ô vuông của bảng, kích cỡ tương
ứng của các ô vuông và đồng xu, … (xác định các biến số quan trọng). Kế đến, để
chuyển dịch vấn đề thực tế thành bài toán, phải hiểu yếu tố đầu tiên cần xét đến là mối
quan hệ giữa một hình vng và một hình trịn nhỏ hơn (cắt gọt bớt thực tế). Lúc đó,
kích thước các hình này là quan trọng và ta giả định là đã biết (bổ sung thông tin). Giả
sử bán kính của đồng xu là 3cm và cạnh của hình vng là 10cm. Để thắng, tâm của
đồng xu phải cách mỗi cạnh ít nhất 3cm - nếu khơng thì cạnh của hình vng sẽ cắt
đồng xu. Muốn thế thì tâm của đồng xu
khơng thể nằm ngồi hình vng đồng
tâm với hình vng lớn và có cạnh bằng
4 (khoảng cách giữa hai cạnh song song
gần nhất của hai hình vuông là 3).Suy ra
xác suất thắng là tỉ số diện tích của hai
12
hình vng nhỏ và lớn (trong ví dụ là 16/100).
Trở lại với thực tế : xác suất trên chưa tính đến các yếu tố như số ô vuông của bảng,
khoảng cách từ chỗ đứng ném đến bảng, … Muốn trả lời câu hỏi thì phải thực hiện
một số lớn lần thực nghiệm và quan sát tần suất thắng cuộc.
I.3. DH mơ hình hóa và DH bằng mơ hình hóa
Để nâng cao năng lực hiểu biết tốn cho HS, khơng thể coi nhẹ việc DH cách thức
xây dựng mơ hình tốn học để giải quyết một vấn đề nào đó do thực tiễn đặt ra. Đối
với các nhà tốn học, mơ hình ấy thường là chưa tồn tại, hoặc đã tồn tại nhưng không
cho phép giải quyết mọi trường hợp, hay ngược lại, không mang đến lời giải tối ưu
cho một lớp các trường hợp đặc biệt nào đó. Việc tìm ra mơ hình mới của họ thường
dẫn đến một phát minh mới (một khái niệm, một định lý mới). Đối với GV, mơ hình
ấy đã tồn tại. Điều đó dẫn đến chỗ việc DH có thể được tổ chức theo hai tiến trình:
- Trình bày tri thức tốn học lý thuyết (giới thiệu định nghĩa khái niệm hay định lý,
công thức) → Vận dụng tri thức vào việc giải quyết các bài tốn thực tiễn, ở đó phải
xây dựng mơ hình tốn học.
- Xuất phát từ một vấn đề thực tiễn → Xây dựng mơ hình tốn học → Câu trả lời cho
bài tốn thực tiễn → Thể chế hóa tri thức cần giảng dạy bằng cách nêu định nghĩa hay
định lý, công thức → Vận dụng vào giải các bài tốn thực tiễn khác mà tri thức đó cho
phép xây dựng một mơ hình tốn học phù hợp.
Tiến trình DH thứ nhất, gọi là DH mơ hình hóa, tiết kiệm được thời gian nhưng lại
làm mất đi nguồn gốc thực tiễn của các tri thức toán học, và do đó làm mất nghĩa của
tri thức. Hơn nữa, trong trường hợp này, một cách rất tự nhiên HS sẽ không lưỡng lự
gì và hướng ngay đến việc xây dựng một mơ hình tốn học phù hợp với tri thức vừa
đưa vào. Liệu vượt ra khỏi bối cảnh này, họ có thể xây dựng được mơ hình tốn học
phù hợp hay khơng ?
Tiến trình thứ hai, bản chất là DH tốn thơng qua DH mơ hình hóa, cho phép khắc
phục khiếm khuyết này. Ở đây tri thức cần giảng dạy sẽ hình thành từ quá trình
nghiên cứu các vấn đề thực tiễn, nảy sinh với tư cách là kết quả hay phương tiện giải
quyết vấn đề. Người ta gọi đây là DH bằng mơ hình hóa. (Tham khảo [3], tr.171172).
13
II. MỤC ĐÍCH CỦA DẠY HỌC
XÁC SUẤT – THỐNG KÊ
Xã hội cung cấp một lượng thông tin phong phú, đa dạng, thường là chính xác hoặc
tương đối chính xác và được trình bày một cách khoa học hoặc khơng. Người ta có
thể rút ra những kết luận nào từ thơng tin được cung cấp ? Câu trả lời liên quan đến
phương pháp phân tích thơng tin.
Ngồi ra, trong cuộc sống hằng ngày chúng ta thường gặp những hiện tượng không
chắc chắn : kết quả bầu cử không đúng với dự kiến, dự báo thời tiết không đáng tin
cậy, chỉ số suy thoái của thị trường chứng khoán, khả năng phát triển một lĩnh vực
nào đó, những mơ hình kinh tế khơng hiệu quả, và nhiều biểu hiện khác của tính
khơng chắc chắn trong thế giới của chúng ta.
Nghiên cứu phương pháp phân tích thơng tin và tính khơng chắc chắn liên quan hai
chủ đề : dữ liệu và cơ hội. Đó chính là nội dung nghiên cứu của Thống kê và Xác
suất. Chính vì thế mà ở nhiều nước các kiến nghị gần đây liên quan đến vấn đề giảng
dạy tốn trong nhà trường đều có nhất trí cao đối với việc nên gán cho Thống kê và
Xác suất một vị trí nổi bật hơn so với những chương trình của q khứ.
Có lẽ vì thế mà PISA xem tính không chắc chắn là một trong bốn ý tưởng bao qt
nội dung tốn giảng dạy ở các trường phổ thơng trên thế giới 1.
II.1. Mục đích của DH Thống kê
Việc giảng dạy Thống kê không thể chỉ nhắm vào các cơng thức, vì Thống kê khơng
đơn thuần là một tập hợp kĩ thuật. Đằng sau những kỹ thuật này là tư duy, là cách nắm
bắt các dữ liệu, đặc biệt là nhận thức được sự tồn tại của những cái không chắc chắn,
hệ quả của sự thay đổi thông tin và việc thu thập dữ liệu. DH Thống kê phải mang lại
cho người học khả năng đưa ra quyết định trong những tính huống khơng chắc chắn.
Cụ thể hơn, qua nghiên cứu chương trính tốn ở bậc trung học của Cộng đồng pháp
ngữ Bỉ, Bair và Hasbroeck (2002) cho rằng:
“DH Thống kê ở bậc trung học cần đặc biệt nhắm đến việc đào tạo tốn học cho
cơng dân: bởi vì mỗi người nhận được vô số thông tin đa phương tiện dưới dạng
1
Ba ý tưởng kia là đại lượng ; khơng gian và hình ; thay đổi và các mối quan hệ.
14
số liệu hoặc biểu đồ, nên họ cần phải có khả năng hiểu, làm sáng tỏ và nhận định
các thông tin.”
Quan điểm giảng dạy Thống kê với mục đích rèn luyện tư duy không chỉ được thừa
nhận ở Bỉ mà nó cịn được chia sẻ ở các nước khác, ví dụ ở Pháp:
“Đào tạo công dân: mọi người đều phải đối diện với vô vàn thông tin khác nhau;
DH Thống kê phải phát triển ở họ những khả năng phân tích và tổng hợp thơng
tin, cho phép họ có một cái nhìn phán xét về những thơng tin này.” [Duperret,
2002]
Theo Duperret (2002), việc DH Thống kê cần nhắm đến 3 cấp độ.
Cấp độ đầu tiên: Hiểu sự biến đổi của thơng tin, phân tích một cách chính xác, thận
trọng.
Cấp độ thứ hai: Biết so sánh các dãy dữ liệu. Đây là một trong những vấn đề cơ bản
của Thống kê mơ tả, có thể thực hiện theo các cách thức sau:
- So sánh (định tính) dựa trên các biểu đồ Thống kê.
- So sánh dựa vào các chỉ số “tóm tắt” mẫu dữ liệu, ví dụ như các chỉ số định tâm
(trung bình, trung vị, mốt), các chỉ số định độ phân tán (phương sai mẫu, độ lệch
chuẩn mẫu),…
- So sánh (định lượng) dựa trên chỉ số tương quan giữa hai mẫu số liệu.
Cấp độ thứ ba: Chuyển vào Thống kê suy diễn. Đây là nơi của sự mơ hình hố, mở
rộng thơng tin nhận được cho một trong một phạm vi rộng lớn hơn. Cấp độ này đặt ra
hai vấn đề: sự hợp thức của mơ hình đã chọn lựa và kiểm sốt các nguy cơ có thể gặp
phải. Q trình mơ hình hố địi hỏi một sự quay đi-trở lại giữa một bên là “thực tiễn”
và một bên là “mơ hình tốn học”.
Với ba cấp độ trên, người học có thể hình thành được tư duy Thống kê: biết quản lí
một số lượng lớn các thơng tin và phân tích chúng, biết so sánh các tập hợp thơng tin,
biết mơ hình hố tốn học những thơng tin này để từ đó rút ra kết luận “phù hợp”.
II.2. Mục đích của DH Xác suất
• Hiện tượng ngẫu nhiên và tính khơng chắc chắn tồn tại khắp quanh ta và nghiên cứu
chúng hiển nhiên là một nhu cầu của cá nhân, của xã hội. Trong lịch sử, lý thuyết Xác
suất ra đời cũng chính từ nhu cầu này. Đáp ứng nhu cầu ấy là mục đích đầu tiên cần
phải nói đến khi bàn về việc đưa vào chương trình phổ thông một số nội dung của lý
thuyết Xác suất - ngành toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên
và không chắc chắn.
15
Định nghĩa này có vẻ như mâu thuẫn, vì người ta thường hiểu từ ngẫu nhiên, không
chắc chắn nghĩa là khơng có quy luật. Một biến cố ngẫu nhiên sẽ có thể xẩy ra hoặc
khơng xẩy ra và như thế thì tại sao lại có thể có một lý thuyết cho phép dự đốn kết
quả ?
Thực ra thì khi xem xét một lượng lớn các biến cố ngẫu nhiên độc lập cùng loại (mỗi
một trong đó có thể xẩy ra hoặc khơng xẩy ra) người ta nhận thấy tính ổn định thống
kê của tần suất. Chứng tỏ các biến cố xẩy ra tuân theo những quy luật xác định. Việc
nghiên cứu chúng chính là nội dung của lý thuyết Xác suất.
• Hơn thế, như chúng tơi sẽ chỉ ra trong chương 2, Thống kê và Xác suất là hai lý
thuyết có mối quan hệ mật thiết, khơng thể tách rời. Đây chính là lý do thứ hai biện
minh cho sự cần thiết - và cũng nói lên một mục đích quan trọng - của việc giảng dạy
Xác suất ở trường phổ thơng. Nếu như mục đích của DH Thống kê là cung cấp công
cụ cho việc nghiên cứu các khoa học khác (sinh học, y học, kinh tế) và đào tạo cơng
dân, thì các tính tốn Xác suất lại là kiến thức cần có để làm chủ những cơng cụ này.
II.3. DH Thống kê - Xác suất với mục đích nâng cao năng lực
hiểu biết toán
Cần nhắc lại rằng Thống kê - Xác suất là lĩnh vực tốn học có mối liện hệ chặt chẽ
với thực tiễn. Nói đến Thống kê - Xác suất là nói đến thực tiễn. DH Thống kê - Xác
suất trước hết nhằm mang lại những kiến thức, kỹ năng cần thiết cho hoạt động thực
tiễn của một « cơng dân có tinh thần xây dựng, biết quan tâm và biết phản ánh ». Đây
là mảnh đất màu mỡ có thể khai thác trong mục đích hình thành năng lực hiểu biết
tốn và rèn luyện phương pháp mơ hình hóa (tốn học hóa các tình huống thực tiễn)
cho HS. Khơng phải khơng có lý do mà có ý kiến cho rằng nói đến DH Thống kê Xác suất là nói đến DH mơ hình hóa và DH bằng mơ hình hóa.
16
Chương 2
MỘT NGHIÊN CỨU TRI THỨC LUẬN
Nghiên cứu tri thức luận về những đối tượng tri thức mà chúng tôi quan tâm được tiến
hành qua ba nghiên cứu thành phần mà kết quả sẽ được trình bày tóm lược ở ba phần
đầu tiên của chương.
Trước hết, thông qua việc phân tích lịch sử hình thành các lý thuyết tốn học Thống
kê và Xác suất, chúng tôi sẽ làm rõ mối liên hệ mật thiết giữa hai lý thuyết này.
Thực tế cho thấy hiểu biết của GV về mối liên hệ ấy không nhiều, khiến cho việc DH
Thống kê - Xác suất thiếu sự gắn kết cần có. Đó là một trong những lý do dẫn chúng
tôi đến chỗ tiến hành nghiên cứu thứ nhất này.
Ở hướng nghiên cứu thứ hai chúng tôi sẽ làm rõ những đặc trưng khoa học luận của
khái niệm xác suất. Như thế, mục đích khơng phải là phân tích lịch sử của tồn bộ lý
thuyết Xác suất – một nghiên cứu vượt quá phạm vi đề tài của chúng tôi với mối quan
tâm được giới hạn trong những nội dung về Xác suất được giảng dạy ở trường phổ
thông. Chẳng những thế, ngay cả đối với khái niệm Xác suất của một biến cố, chúng
tôi cũng khơng tiến hành phân tích lịch sử, vì - may mắn thay, các cơng trình của một
số tác giả nh Michel HENRY, Jean-Franỗois PICHARD, ó cú th cho giúp
chúng tôi xác định được đặc trưng khoa học luận của khái niệm này. Một vài giáo
trình đại học về phần Xác suất cũng được chúng tôi sử dụng cho phần thứ hai.
Đặc trưng khoa học luận của một số tri thức thống kê được đưa vào giảng dạy ở
phổ thơng là mục đích của hướng nghiên cứu thứ ba. Ở đây, ngồi việc nghiên cứu
lịch sử, chúng tơi cũng tìm cách tiếp cận vấn đề từ các giáo trình đại học, các tác
phẩm tốn học.
Sau khi đã trình bày kết quả của ba nghiên cứu thành phần, chúng tôi dành phần thứ
tư của chương để đề cập đến những kết luận sư phạm rút ra từ đó và từ những cơng
trình đã cơng bố ở Pháp : những khó khăn, chướng ngại và vấn đề mơ hình hóa trong
DH Thống kê và Xác suất.
17
I. PHÂN TÍCH LỊCH SỬ HÌNH THÀNH
CÁC LÝ THUYẾT THỐNG KÊ VÀ XÁC SUẤT:
MỐI LIÊN HỆ GIỮA CHÚNG
I.1. Nguồn gốc của Thống kê
Nói chung, mọi lý thuyết tốn học khơng được hình thành thuần túy từ suy lý mà
ngược lại, đều nảy sinh trong một bối cảnh đặc biệt, gắn liền với nhu cầu thực hành và
trình độ phát triển của tốn học. Thống kê khơng vượt khỏi logic này : nguồn gốc của
nó là những vấn đề của thực tiễn, và sự phát triển của nó về sau được đặt trong mơi
trường tốn học của những năm cuối thế kỷ XIX, một mơi trường đã cung cấp cho nó
những khái niệm, những cơng cụ cần thiết, trong đó khơng thể khơng nói đến lý
thuyết Xác suất.
Nói một cách chính xác thì Thống kê trước hết là Thống kê mơ tả và thuở ban đầu nó
đã được hình thành từ việc quan sát các sự kiện.
Từ Thống kê có gốc latin là statisticum, đã có từ thời cổ đại. Tuy nhiên, nhu cầu
thống kê bằng những con số chỉ thực sự xuất hiện sau này, khi người đứng đầu nhà
nước muốn biết những yếu tố chứng tỏ sức mạnh của mình (dân số, quân đội, của
cải, …). Ý tưởng lập danh sách những yếu tố đó hình thành khá tự nhiên, khoảng
3000 năm trước Công nguyên.
I.2. Những ý đồ ngoại suy đầu tiên
Vào thế kỷ XIII các dữ liệu trở nên rất nhiều nhờ sự sinh sôi của quốc khố. Đến thế kỷ
XIV người ta bắt đầu có những ghi chép để lưu giữ các yếu tố về hộ tịch : số người
sinh ra, số đám cưới, số người chết, …Thế nhưng, trong suốt thời kỳ này thì Thống kê
chỉ mang tính chất hành chính, hoạt động điều tra cịn rất hiếm hoi.
Những tiến bộ cơ bản của Thống kê xuất hiện ở nửa sau của thế kỷ XVII, từ nhu cầu
biết và giải thích các hiện tượng của kinh tế, xã hội. Giai đoạn này trùng với giai đoạn
phát triển của trường phái chính trị số ở Anh, báo trước sự ra đời của Thống kê suy
diễn. Trường phái này, do John Graunt (1620 – 1674) và William Petty (1623 – 1687)
sáng lập, bận tâm đến việc định lượng và nghiên cứu những bất biến trong tập tính xã
hội, những ứng xử cho phép đánh giá và dự báo trước : số con của một phụ nữ,
khoảng cách giữa hai lần sinh ở cùng một người mẹ, số người sống trong một hộ, tỷ lệ
người chết, … Trường phái này đã tạo ra được nhiều tiến bộ trong kỹ thuật Thống kê.
18
Chẳng hạn, phương pháp ước lượng dân số của W. Petty được Jaqueline Hecht mô tả
trong bài báo Pour une histoire de la statistique (1987) như sau :
“Ông đánh giá trước hết số nhà ở London vào năm 1686 là 88000. Thiết lập một
số trung bình về tỷ lệ giữa số gia đình với số nhà ở Dublin và Bristol, ông đánh
giá số gia đình ở London là 105000, gần như tương đương với con số chính thức
của văn phịng quản lý hộ tịch (105315). Bằng cách giả sử là mỗi gia đình trung
bình có 6 thành viên và 10% số nhà là nơi trú của hai gia đình, số cịn lại chỉ có 1
gia đình, ơng suy ra rằng 105000 ngôi nhà ở London là nơi trú ngụ của 695700
người dân.”
Kỹ thuật ngoại suy này - còn gọi là kỹ thuật nhân – nhanh chóng mang lại những
thành cơng lớn, tạo điều kiện cho những cuộc điều tra trên một bộ phận, góp phần đẩy
lùi các cuộc điều tra “khổng lồ”.
Song song với hoạt động của trường phái chính trị số tại Anh, ở Pháp thời kỳ này
cũng có hai tên tuổi đáng nhớ, Colbert và Vauban. Năm 1664, phối hợp với những
người đứng đầu tỉnh thực hiện một cuộc điều tra quốc gia, Jean Baptiste Collebert (tác
giả cuốn sách Phương pháp tổng quát và dễ dàng để đếm dân số công bố năm 1686)
đã khuyên sử dụng mẫu về những vùng đất có thể cày cấy của mỗi tỉnh để đánh giá tốt
nhất khả năng nông nghiệp của tỉnh.
Phương pháp thay thế những điều tra trên tổng thể bởi điều tra trên bộ phận là căn
nguyên dẫn đến chỗ người ta phải tìm ra các yếu tố để biện minh cho phương pháp.
Sự xuất hiện của các tính toán Xác suất cung cấp cho Thống kê các yếu tố đó. Chúng
ta sẽ nói đến điều này khi phân tích lịch sử hình thành lý thuyết xác suất.
Một trong những người đặt nền móng cho khoa học Thống kê tốn là Adolphe Qtlet
(người Bỉ). Ơng đã hình dung một cách rõ ràng rằng Thống kê có thể dựa trên những
tính tốn Xác suất. Là một “tín đồ” của sự chính xác, nhưng - dù chưa đi đến chỗ ưu
tiên cho những nhận định rút ra từ một mẫu, ông cũng đã chấp nhận sự khái quát hóa
các kết quả thu được trên một bộ phận cho tổng thể, ví dụ như tỉ lệ người chết quan
sát được ở tầng lớp những người có thu nhập cao (nhưng ơng lại từ chối sự khái quát
hóa tỉ lệ bé trai do những người phụ nữ đứng đắn sinh ra).
Dù việc nghiên cứu tổng thể có những ưu thế của nó, sự xem xét trên bộ phận không
biến mất trong quan điểm của các nhà thống kê học. Jean-Baptis Fourier đã đóng vai
trị tích cực trong sự phát triển của Thống kê. Ông đã tiến hành nhiều nghiên cứu về
thủ đô Paris. Cuối thế kỷ XIX ông đã nghiên cứu về lương của những người làm việc
ở Pháp thời kỳ 1891-1893 thông qua điều tra trên một mẫu chiếm 1/5 dân số.
Vào cuối thế kỷ XIX, dường như mọi thứ đã sẵn sàng cho sự phát triển của quan điểm
nghiên cứu trên mẫu : kinh nghiệm thực hành đã có – chủ yếu về nhân khẩu học ; lý
19
thuyết Thống kê đạt được nhiều thành tựu ; nhu cầu ngày càng cao về việc có những
con số phản ánh tình hình xã hội, kinh tế, ý kiến dân chúng, … của các nhà nước.
Cùng với châu Âu, Mỹ là cực chủ yếu tiến hành các cuộc điều tra nảy sinh từ mong
muốn có thơng tin, nếu được thì định lượng, về ý kiến, về suy nghĩ của dân chúng.
Các cuộc điều tra này đã xuất hiện ở Anh, Pháp, nhưng nhiều nhất vẫn là ở Mỹ, vào
dịp bầu cử tổng thống. Một sự kiện mấu chốt liên quan đến quan điểm thừa nhận điều
tra trên mẫu : ngày 31/11/1936, ngày công bố kết quả bầu cử. Trong khi Literary
Digeste, bằng phương pháp điều tra “bỏ phiếu cọng rơm” - thực chất là một lần bỏ
phiếu khơng chính thức, dự báo rằng chiến thắng sẽ thuộc về Landon, thì F.D.
Roosevelt lại là người trúng cử. Nhân vật này đã nhận được phiếu thuận ở ba cuộc
điều tra thực hiện độc lập với nhau bởi ba người. Ba nghiên cứu của họ được tiến
hành theo một phương pháp lựa chọn rất chính xác : người ta phỏng vấn những cá
nhân đã được lấy ra theo tỷ lệ phần trăm, gọi là phương pháp “nước Mỹ thu nhỏ”.
Sau sự kiện này, phương pháp điều tra trên tổng thể (kích thước lớn) biến mất. Nhiều
nước điều tra ý kiến dân chúng theo phương pháp mẫu và thậm chí Hội thảo quốc tế
đầu tiên về Thống kê đã được tổ chức ở Paris năm 1947.
I.3. Cuộc tranh luận về tính đại diện (1895 – 1925)
Khái niệm tính đại diện của một kết quả hay của một mẫu là một khái niệm mới. Mặc
dầu Condorcet thỉnh thoảng đã chú ý đến điều này, nhưng dường như người đầu tiên
sử dụng nó là Jean-Bapstiste Say, người đã khẳng định tính khơng đại diện của tỷ lệ
người chết quan sát từ tầng lớp giàu có đối với toàn thể dân chúng – trường hợp ngoại
suy mà Quételet đã bảo vệ trước đây.
Cuộc tranh luận về tính đại diện hình thành ở Viện Thống kê quốc tế (thành lập ở
London ngày 24 tháng 6 năm 1885). Nó bắt đầu bằng những báo cáo của Anders
Nicolai Kiaer, giám đốc Văn phòng trung tâm Thống kê của Vương quốc Na Uy, tại
Hội thảo năm 1895 ở Berne do Viện Thống kê quốc tế tổ chức. Kiaer không xác định
tiên nghiệm tính đại diện, nhưng đã kiểm tra hậu nghiệm điều đó thơng qua việc so
sánh cấu trúc của mẫu với cấu trúc có được từ một cuộc điều tra tổng thể. Ông đặt ra
câu hỏi:
“… Một Thống kê với tư cách là đại diện phải được thực hiện như thế nào để nó
là hình ảnh thu nhỏ chính xác đến mức có thể được của tồn thể xã hội ? …”
Mặc dầu Kiaer đã phịng ngừa trước, ơng vẫn bị những người tham dự Hội thảo phản
đối kịch liệt. Franỗais Emile Levasseur núi:
20
“Chẳng lẽ giữa Thống kê toàn bộ với các nghiên cứu chun khảo lại có vị trí
cho một phương pháp thứ ba ? […] những nghiên cứu Thống kê dựa vào Thống
kê bộ phận được áp dụng không phải cho tổng thể mà chỉ là cho một số xác định
và hạn hẹp.”
Kiaer tiếp tục bảo vệ ý kiến của mình qua các hội thảo sau đó. Trong Hội thảo tại
Budapet (1901) ơng nói rõ:
“… phương pháp đại diện địi hỏi một số lượng lớn những đơn vị quan sát. Các
đơn vị này được phân bố sao cho các đặc trưng khác nhau phải có mặt theo
những tỷ lệ gần nhất có thể được với tỷ lệ tồn tại trong tổng thể.”
Kiaer đã nhận được sự ủng hộ của Bortkiewiez, giáo sư của đại học Berlin, người đưa
ra gợi ý sử dụng các tính tốn Xác suất để kiểm chứng bằng Thống kê sự chênh lệch
tồn tại giữa phân bố của mẫu với phân bố của tổng thể trên các biến cơ bản (ơng gọi là
biến chìa khóa). Ý kiến của Bortkiewiez, đánh dấu bước quan trọng đầu tiên của việc
đưa Xác suất vào các nghiên cứu Thống kê liên quan đến mẫu đại diện.
Kiaer còn nhận được sự ủng hộ của Carroll Wright, của Bộ trưởng Bộ lao động Mỹ.
Ông Bộ trưởng, trong một bức thư gửi cho Hội đồng phụ trách các nghiên cứu về
phương pháp đại diện đã khẳng định sự đúng đắn của kỹ thuật Kiaer, thường xuyên
được sử dụng thành công ở Mỹ.
Sau năm 1925, các cuộc tranh luận khơng cịn là câu hỏi “có mẫu hay không” mà là
“làm thế nào để lấy ra được một mẫu ?” Cuộc tranh luận đã nhanh chóng đi đến chỗ
phân biệt mẫu ngẫu nhiên (chọn ngẫu nhiên) với mẫu có suy tính (chọn hợp lý, có tính
tốn, cân nhắc).
Cùng thời kỳ này ở Nga người ta cũng đã nghiên cứu việc chọn mẫu ngẫu nhiên. Năm
1425 A.G. Kovalevsky công bố một cuốn sách mà sau này được lấy làm cơ sở về lý
thuyết cũng như về thực hành cho các cuộc điều tra.
I.4. Lịch sử lý thuyết xác suất
“Bàn về suy diễn Thống kê mà khơng nói đến sự tiến triển của khái niệm Xác
suất là vô nghĩa. Người ta không thể nào hiểu được cái này mà khơng nhìn thấy
tầm quan trọng của cái kia.” (Jaque Droesbeke và Philippe Tassi, tr. 22)
Khái niệm “xác suất”
Về nguồn gốc, khái niệm xác suất hình thành từ trị chơi ngẫu nhiên đã lưu truyền
trong dân gian thời cổ đại. Nhưng lý thuyết xác suất chỉ thực sự được hình thành kể từ
đầu thế kỷ XVII. Gắn với sự ra đời của lý thuyết này là là tên tuổi của hai nhà toán
21
học Blaise Pascal (1623 – 1662) và Piere De Fermat (1601 – 1665), những người đã
giải bài toán chia tiền cá cược trong một trị chơi chưa kết thúc.
Bài tốn được tóm tắt như sau : Hai người chơi một trị chơi ngẫu nhiên, trong đó sự
khéo léo và trí thông minh không tác động đến kết quả. Họ thỏa thuận với nhau là
người đầu tiên thắng một số ván nào đó theo quy định sẽ là người thắng cuộc và được
lấy toàn bộ số tiền đặt cược của cả hai người. Giả sử họ phải ngừng trò chơi khi chưa
phân thắng bại. Làm thế nào để phân chia một cách cơng minh tiền đặt cược ?
Bài tốn chia tiền cá cược giống với vấn đề chia tài sản thừa kế hay quyền lợi có từ
các vụ làm ăn kinh tế. Để vấn đề trở thành một bài toán toán học có lời giải hợp lý
người ta đã trải qua một thế kỷ rưỡi mò mẫm.
Cùng với Pascal và Fermat, thời kỳ đó cịn có những cơng trình khác đề cập đến vấn
đề này, chẳng hạn Christiaan Huyghen (1629 – 1695) vào những năm 1650-1660
cũng đã biên soạn tác phẩm De raciociniis in aleoe ludo trong đó có nói về kỳ vọng
tốn và đưa vào khái niệm mẫu có hoặc khơng hồn lại. Tuy nhiên, định nghĩa chúng
ta dùng ngày nay về xác suất không phải do Pascal, Fermat hay Huyghens đưa ra mà
phải đến 1814 mới được Pierre-Simon Laplace trình bày trong Essai Philosophique
sur les Probabilités. Chúng tơi sẽ khơng trình bày ở đây phần phân tích q trình giải
quyết bài tốn và sự hình thành nên khái niệm Xác suất.
Định nghĩa do Laplace nêu ra là :
“Xác suất của một biến cố bằng tỉ số giữa số trường hợp thuận lợi với số trường
hợp có thể.”
Đây là một định nghĩa tường minh của xác suất dựa trên giả thiết về sự đồng xác suất.
Nó được gọi là định nghĩa cổ điển vì việc xem xác suất là tỉ số này đã được Pascal,
Fermat hay Huyghens nói đến trước đây (bấy giờ nó chưa có tên gọi chính thức là xác
suất như Laplace nêu lên). Trong định nghĩa của Laplace, không gian mẫu phải hữu
hạn và các biến cố phải đồng khả năng xẩy ra. Để sử dụng định nghĩa này, người ta
cần đến các kiến thức của Đại số tổ hợp.
Nhưng nếu một trong hai điều kiện của định nghĩa khơng được đáp ứng thì làm thế
nào ?
Chính Jaque Bernoulli đã chỉ ra điểm hạn chế của cách tiếp cận theo định nghĩa trên :
người ta không thể sử dụng nó để nói về các hiện tượng tự nhiên phức tạp như “sự
xuất hiện một bệnh hay các hiện tượng về khí tượng, hoặc dự đốn các chiến lược của
người chơi mà cách hoạt động là không thể đoán trước.”
Để ước lượng xác suất trong bối cảnh này, Bernoulli đề nghị xác định hậu nghiệm xác
suất của biến cố mong đợi sau khi quan sát thấy sự ổn định của tần suất xuất hiện một
22
kết quả khi tiến hành thực nghiệm một số lớn phép thử giống nhau. Trích đoạn dưới
đây của Bernoulli gợi ra phương pháp tiến hành thống kê:
“Nhưng thực ra ở đây, chúng ta cịn một con đường khác để có được cái mà
chúng ta tìm. Điều gì khơng có được ở tiên nghiệm thì tối thiểu cũng phải nhận
được ở hậu nghiệm, nghĩa là có thể khai thác nó bằng cách quan sát các kết
cục của nhiều ví dụ tương tự ; …”
(Bernoulli, 1713, tr.42-44, trích theo Coutinho, 2001, tr.39)
Điều này đã dẫn Bernoulli đến việc ước lượng tần suất cho khái niệm xác suất.
Phương pháp của ơng có một ý nghĩa quan trọng, bởi từ chỗ chỉ có thể tính xác suất
tiên nghiệm cho trường hợp các biến cố đồng khả năng xuất hiện người ta đã ước
lượng được xác suất của những biến cố phức tạp hơn như tác giả nói.
Vấn đề cịn lại mà Bernoulli chưa làm sáng tỏ được là xác định số thí nghiệm cần thiết
để phỏng đoán một xác suất. Moivre và sau này là Laplace đã tìm cách giải quyết vấn
đề đó. Henry ghi nhận lại kết quả của hai ông như sau:
“Định lý Moivre-Laplace sau này cho phép đưa ra một giá trị tương đương với
xác suất P (F - ε < p < F + ε) nên cũng cho phép tính được con số lý tưởng các
thí nghiệm cần thực hiện để có độ chính xác ε và độ tin cậy 1-α cho trước.
Chẳng hạn, với độ chính xác 3% và độ tin cậy 95% (α = 5%) thì các điều tra
thơng thường hiện nay có thể phỏng đốn được xác suất với kích thước mẫu thử
vào khoảng 1000.”
(Henry, 2004, tr.8)
Liên quan đến trường hợp không gian các biến cố sơ cấp là vơ hạn, cịn có định nghĩa
hình học của xác suất được hình thành từ các cơng trình của Buffon với Trị chơi
Franc-Carreau 2 và bài tốn về cây kim 3, công bố năm 1733.
Chúng tôi sẽ trở lại với định nghĩa khái niệm Xác suất của một biến cố ở phần II.
Lý thuyết sai số
Gắn với lịch sử hình thành lý thuyết Xác suất cịn phải nói đến lý thuyết sai số.
Vào thế kỷ XVIII, khoa học thiên văn nhắm tới mục đích sử dụng các số đo thực
nghiệm để xác định vị trí của một đối tượng trên bầu trời. Năm 1632 Galilé dựa vào
78 số đo do 13 nhà quan sát cung cấp. Những người này quan sát ở nhiều nơi khác
2
Tung đồng franc lên một nền lưới các ơ vng bằng nhau thì đồng tiền có thể nằm lọt trong một ơ
vng hoặc nằm trên các đường lưới.
3
Tung cái kim xuống nền gồm những đường thẳng song song cách đều thì kim có thể nằm trọn giữa
hai đường song song hoặc cắt ít nhất một đường thẳng.
23
nhau. Galilé đã nói rõ là dù họ quan sát rất giỏi thì vẫn ln tạo ra sai số, và vấn đề là
các sai số này phải được “sửa” sao cho có thể thu được những thơng tin tốt nhất từ
những quan sát đã thực hiện. Luật Xác suất về các sai số hình thành với mục đích chỉ
ra lợi ích của trung bình số học của những giá trị quan sát được trong việc ước lượng
một tham số. Về bài tốn này, Simpson có những đóng góp quan trọng. Chính ơng đã
đưa ra luật đơn điệu rời rạc : nếu p x là xác suất gắn với giá trị x thì luật này được định
nghĩa bởi :
1
, x =− a, −a + 1,...,0,...a − 1, a , với a là một số ngun dương.
px =
2a + 1
Ơng cịn đưa ra thêm luật luật tam giác rời rạc các sai số. Sau đó, bằng cách chuyển
qua giới hạn, ơng có luật tam giác liên tục các sai số.
Giai đoạn sau đó, nhiều nhà tốn học (Lagrange, Lambert, Laplace, …) góp phần
quan trọng cho sự phát triển của các lý thuyết Thống kê và Xác suất. Lagrange cũng
trình bày một số luật liên tục khác như phân phối chuẩn, phân phối cosinus, phân
phối parabol.
Như đã nói trên, trong phần thứ tư của cuốn sách Ars Conjectandi Bernoulli đã đặt ra
câu hỏi về việc tính Xác suất để nhận được mặt ngửa khi tung một đồng xu khơng cân
đối. Ơng tìm thấy câu trả lời cho câu hỏi bằng cách chỉ ra rằng nếu thực hiện một số
lớn lần phép thử thì tần suất xuất hiện mặt sấp tiến dần tới một đại lượng p có thể xem
như xác suất nhận được kết quả này. Đó chính là dạng ban đầu của luật số lớn.
Song song với các nghiên cứu của Nicolas Bernoulli, cịn có cơng trình Học thuyết về
cơ hội (The Doctrine of Chances) của Abraham de Moivre (1667 – 1754) được công
bố vào năm 1718. Tác phẩm này là một xử lý thuần toán học, đã thực sự vận dụng
giải tích vào lý thuyết xác suất. Chính là từ việc nghiên cứu vấn đề do Bernoulli đặt ra
mà Abraham de Moivre khám phá ra một công thức gần đúng của phân phối nhị thức.
Ông cũng là người đã khám phá ra định lý giới hạn trung tâm.
Như đã nói từ đầu, đi sâu phân tích các thành tựu này khơng phải là mục đích nghiên
cứu của chúng tơi. Điều cần nói ở đây là các luật, các định lý này đã tạo nên mối liên
hệ mật thiết giữa Xác suất với Thống kê, cho phép Thống kê chuyển từ phạm vi mô tả
vào phạm vi suy diễn. Trước hết, chúng tạo nên những cơ sở quan trọng cho Lý thuyết
mẫu, lý thuyết giải quyết bài toán chọn mẫu sao cho nó có thể đại diện cho quần thể
rộng hơn mà người ta muốn nghiên cứu. Tiếp sau đó, chúng là cơ sở cho việc giải
quyết hai vấn đề quan trọng của Thống kê suy diễn – vấn đề ước lượng các tham số
của tổng thể (từ giá trị của tham số của mẫu) và vấn đề kiểm định những giả thuyết rút
24