MỘ
T S ỐKHÍA C Ạ
NH TRONG V Ậ
N DỤ
NG TH Ố
NG KÊ TOÁN H Ọ
C
VÀO NGHIÊN C Ứ
U KHOA H Ọ
C GIÁO D Ụ
C
PGS.TS.Đào Thị Oanh
Viện NCSP – Trường ĐHSP Hà Nội
Bài tham luận tại hội thảo khoa học Trường ĐHSP Hà Nội “Giải
pháp nâng cao năng lực nghiên cứu khoa học giáo dục của Trường
Đại học Sư phạm Hà Nội”, tổ chức ngày 16/01/2015.
1.Đặt vấn đề
Nghiên cứu khoa học giáo dục (NCKHGD) là một nhu cầu khẩn
thiết để xây dựng cơ sở lý luận dẫn đường cho những cải tiến, cải
cách trong giáo dục, đồng thời kết quả các nghiên cứu nghiêm túc
về khoa học giáo dục là cơ sở quan trọng cho những quyết sách
về giáo dục đối với một quốc gia, tránh cho những hậu quả có thể
có của cách làm “thử - sai”. Tri thức về khoa học giáo dục không
chỉ cần cho các nhà lãnh đạo và các nhà hoạch định chính sách,
mà cịn cần cho tất cả những aihoạt động trong lĩnh vực giáo dục,
bởi chính họ là người xây dựng nên hệ thống giáo dục của một đất
nước.Ở hầu hết các nước tiên tiến trên thế giới, NCKHGD rất được
quan tâm đầu tư phát triển, đã đạt được những thành tựu to lớn
vàcó những đóng góp hữu hiệu vào sự phát triển nền giáo dục của
quốc gia.
Trong bối cảnh chung của thời kì hội nhập, Việt Nam chúng ta,
trong đó có các trường đại học sư phạm đang ngày càng quan tâm
nhiều hơn đến lĩnh vực NCKHGDbên cạnh các lĩnh vực nghiên
cứu khoa học cơ bản, bởi NCKHGD là một lĩnh vực quan trọng,
1
thiết thực trước hết đối với chất lượng hoạt động đào tạo của nhà
trường. Song song với việc xúc tiến các nghiên cứu về KHGD, việc
bồi dưỡng nâng cao năng lực nghiên cứu cho đội ngũ giảng viên
cũng được chú trọng, trong đó có nội dung về vận dụng thống kê
toán học vào các nghiên cứu định lượng trong KHGD. Trên thực tế,
đây là điểm yếu, là nhu cầu bồi dưỡng có thực của một bộ phận
giảng viên hiện nay ở các trường đại học sư phạm. Điểm yếu này
là một trong những lí do quan trọng khiến cho kết quả NCKHGD
của chúng ta khó được chấp nhận đăng tải trên các tạp chí
chun ngành ở nước ngồi.
Vào những năm cuối thế kỉ 20, khi đề cập đến chất lượng của
cácNCKHGD, khá nhiều chuyên gia nghiên cứu ở trong và ngồi
ngành giáo dục cịn có thái độ thiếu tin tưởng đối với độ chính xác
hoặc tính thuyết phục của các nghiên cứu này so với những
nghiên cứu trong các ngành khoa học tự nhiên như Vật lí hay Hóa
học (“khoa học cứng”). Điều này đã khiến Larry Hedges tiến hành
khảo sát các cơng trình nghiên cứu trong 13 lĩnh vực của Tâm lí
học và Giáo dục học (“khoa học mềm”) và đem so sánh với các
nghiên cứu trong ngành Vật lí. Kết quả là, Hedges đã tìm thấy một
tình trạng tương tự xẩy ra cả trong khoa học tự nhiên và khoa học
xã hội, rằng, xấp xỉ 50% các công trình nghiên cứu đưa ra các kết
quả khác nhau trong cả Tâm lí học, Giáo dục học và Vật lí. Có
nghĩa là, các nghiên cứu trong Vật lí cũng đưa ra những kết quả
trái ngược nhau tương tự như các kết quả nghiên cứu về giáo dục.
Đó là vì, các nhà nghiên cứu thường loại bỏ những nghiên cứu có
khuynh hướng cho ra những kết quả cực đoan khi tổng hợp lại.
2
Thậm chí, điều này diễn ra trong khoa học tự nhiên nhiều hơn so
với trong khoa học xã hội (40% so với 10%). Những phát hiện này
đã được Hedges trình bày trong bản báo cáo có tựa đề “How Hard
Is Hard Science? How Soft Is Soft Science?”. Trong đó ơng đi đến
nhận xét khái quát rằng, nghiên cứu trong các ngành “khoa học
mềm” có thể so sánh với nghiên cứu trong các ngành “khoa học
cứng” về tính chính xác và độ tin cậy. Các nhà nghiên cứu khoa
học giáo dục cũng như các nhà nghiên cứu khác có thể tìm thấy
những khuynh hướng chung trong những phát hiện từ các nghiên
cứu dài hạn. Cần phải có càng nhiều càng tốt những nghiên cứu
về cùng một chủ đề và đem ra tổng hợp phân tích những nghiên
cứu đó. Kết quả tổng hợp của những phát hiện này sẽ được coi là
một đánh giá tốt nhất có thể có về những gì được biết đến ở chủ
đề ấy [dẫn theo 1]. Gợi ý của Hedges đã khẳng định vai trò của
việc vận dụng thống kê toán học vào NCKHGD, bởi để làm việc đó
nhất định phải sử dụng các phương pháp, kĩ thuật định lượng.
2.Vai trị của thống kê tốn học trong nghiên cứu khoa học
giáo dục
Một trong những đặc điểm cơ bản của khoa học thế giới hiện nay
là các khoa học ngày càng sử dụng rộng rãi các phương pháp của
toán học. Toán học đã xâm nhập vào các lĩnh vực: Sinh học, Y học,
Ngơn ngữ học, Tâm lí học…Gần đây, toán học đã đi vào khoa học
giáo dục với các lí thuyết xác suất thống kê, lí thuyết thơng tin,
logic toán… và đã đưa lại những kết quả rõ rệt. Xu hướng tốn
học hóa đã mở ra những con đường mới, đi sâu vào bản chất và
quy luật của các hiện tượng nghiên cứu như C.Mác đã nói, một
3
khoa học chỉ thực sự phát triển nếu nó có thể sử dụng được tốn
học.
Nghiên cứu KHGD có những đặc điểm chung của nghiên cứu
khoa học với tư cách là một hoạt động sáng tạo, đề xuất ra những
cái mới và hướng tới phát hiện chân lí, vì vậy có những yêu cầu
chặt chẽ đối với người nghiên cứu. Đó là yêu cầu về tính khách
quan, chính xác trong nghiên cứu, thể hiện ở sự trung thànhvới
hiện thực khách quan trong khi phát hiện được cái mới mà không
sửa chữa thêm bớt nó theo ý muốn chủ quan của người nghiên
cứu hoặc của một ai khác. Đối tượng nghiên cứu của khoa học
giáo dục (KHGD) là các hiện tượng, các q trình rất phức tạp,
ln ln biến động do ảnh hưởng của rất nhiều nhân tố khách
quan và chủ quan, do đó sẽ có hàng loạt yếu tố cần được kiểm
sốt trong q trình triển khai nghiên cứu.u cầu khách quan,
chính xác trước hết địi hỏi việc lựa chọn phương pháp, biện pháp,
công cụ, kĩ thuật nghiên cứu phải làm sao càng ít chịu ảnh hưởng
của chủ quan người nghiên cứu hay của những người trung gian
bao nhiêu thì càng đáng tin cậy bấy nhiêu. Bởi kết quả NCKHGD
làm cơ sở để đưa ra những quyết sách về giáo dục và phát triển
giáo dục. Nếu thiếu độ tin cậy thì sẽ ảnh hưởng rất lớn đến tính
khả thi của các chính sách đưa ra, từ đó sẽ ảnh hưởng đến tồn
bộ đời sống xã hội.
Việc xử lí các thơng tin thu thập được là một khâu vô cùng
quan trọng trong tồn bộ q trình tổ chức, triển khai và thực hiện
mơt đề tài nghiên cứu khoa học. Đó là vì, bản thân các sự kiện,
các tư liệu, các thông tin thu thập được chưa phải là việc giải
4
quyết các nhiệm vụ nghiên cứu. Chúng cần phải được đúc kết,
phân tích, lí giải và khái quát một cách đúng đắn. Điều này được
thực hiện bằng việc xử lí các tài liệu thu được cả về mặt định tính
và định lượng. Mục đích của phân tích định tính là xác lập các
phẩm chất, các thuộc tính khác nhau của những hiện tượng được
nghiên cứu. Khi phân tích định tính, ta có thể sử dụng các chỉ số
đã biết và xác định xem liệu chúng có hay khơng có ở các nghiệm
thể. Trong KHGDcác vấn đề định tính là chủ yếu. Tuy nhiên, những
vấn đề có thể định lượng được sẽ giúp cho việc định tính trở nên
cụ thể, chính xác hơn vì có thể làm rõ được tính điển hình của
phẩm chất được nghiên cứu. Tất nhiên, trong giáo dục có những
khía cạnh chỉ có thể định lượng được một cách quy ước và có
nhiều khía cạnh chưa thể định lượng được. Song nếu muốn rút ra
ứng dụng thực tiễn lớn hơn thì cần cố gắng để định lượng.
Như vậy là có nhiều cách xử lí các thơng tin thu thập được, và
xử lí bằng thống kê tốn học là một phương pháp quan trọng.
Các hiện tượng giáo dục luôn biến động khiến cho trên thực tế
hầu như không thể kiểm sốt được tất cả các sai sót trong một
nghiên cứu, làm ảnh hưởng đến tính chính xác của nghiên cứu. Ví
dụ, nhà nghiên cứu giáo dục khơng thể làm hai thực nghiệm trong
những điều kiện đồng nhất hoàn tồn vì trên thực tế khơng thể có
2 học sinh như nhau về mọi mặt, cũng khơng thể có 2 lớp học với
những điều kiện hoàn toàn giống nhau. Thực nghiệm trong
NCKHGD là những thực nghiệm ngẫu nhiên, songngẫu nhiên
không có nghĩa là lung tung, khơng theo quy luật. Khơng thể dự
đốn chính xác kết quả của từng thực nghiệm riêng lẻ, nhưng nếu
5
chuyển từ những thực nghiệm riêng lẻ sang một loạt thực nghiệm
ngẫu nhiên trong những điều kiện nhất định, thì cho dù những kết
quả riêng lẻ diễn biến không theo một quy luật, nhưng kết quả
trung bình của nhiều thực nghiệm ngẫu nhiên lại có tính chất ổn
định. Đó là lí do tại sao các nhà nghiên cứu gán cho các kết quả
của họ một độ đo xác suất. Khi các nhà nghiên cứu thơng báo kết
quả của họ có ý nghĩa ở mức 0,05, có nghĩa rằng chỉ có 5 trong
100 khả năng để những kết quả của họ có lỗi khơng kiểm sốt
được trong nghiên cứu. Khi các nhà nghiên cứu thơng báo kết quả
của họ có ý nghĩa ở mức 0,01 nghĩa là chỉ có 1 trong 100 khả
năng để những kết quả của họ có lỗi khơng kiểm sốt được. Bằng
cách kết hợp các kết quả của nhiều nghiên cứu, có thể đưa ra
những kết luận chắc chắn hơn nhiều so với khi chỉ có một nghiên
cứu riêng lẻ
Lí thuyết xác suất là khoa học về các quy luật của các hiện
tượng ngẫu nhiên, là một cơng cụ đắc lực phục vụNCKHGD.
Thống kê tốn học là một bộ phận của lí thuyết xác suất, có
đối tượng nghiên cứu là thu thập, đúc kết các số liệu quan sát, các
thí nghiệm, phân tích để rút ra kết luận đáng tin cậy từ những số
liệu đó.
Cơng tác giáo dục thường địi hỏi phải xử lí số lượng rất lớn các
dữ liệu như: số lượng học sinh, số lượng giáo viên, kết quả học tập
của học sinh…Thống kê toán học cung cấp cách thức đúc kết số
liệu để theo dõi tình hình, giúp điều tra và đánh giá chất lượng
giáo dục, so sánh hiệu quả của hai phương pháp giáo dục, phân
tích mối quan hệ giữa các hiện tượng giáo dục, phân tích tác dụng
6
của các nhân tố đối với một hiện tượng giáo dục…Trong bài viết
này sẽ đề cập đến một vài vấn đề cụ thể nhằm làm sáng tỏ ý
nghĩa, tác dụng của thống kê toán học trong nghiên cứu KHGD.
Việc lượng hóa trong NCKHGD phụ thuộc trước hết vào vấn đề
cơ bản nhất là làm thế nào để xác định được một cách đúng đắn,
chính xác (bằng con số) những đặc trưng của các hiện tượng
nghiên cứu. Đây là một vấn đề phức tạp vì như đã nói ở phần trên,
hiện nay chưa phải tất cả các hiện tượng giáo dục đều đã có thể
lượng hóa một cách chính xác.
3.Một số phép vận dụng cơ bản vềthống kê toán học vào
nghiên cứu khoa học giáo dục
*Thang đo
Để có thể sử dụng cơng cụ tốn học nhằm xử lí số liệu thu được,
trước hết phải giải quyết đúng đắn vấn đề cơ bản về đo lường hay
lượng hóa các đặc trưng của các đối tượng nghiên cứu.Việc đánh
giá định lượng liên quan chặt chẽ với khái niệm “Đo lường”. Đó là
phép so sánh một đại lượng nào đó với một vật chuẩn đã biết, và
kết quả là đưa ra các con số để đánh giá [3]. Như vậy, “Đo lường”
là gán cho các đối tượng và các thuộc tính cần đo của nó những
con số theo những nguyên tắc xác định. Những nguyên tắc này
quy định sự phù hợp giữa một số đặc điểm của các con số với một
số đặc điểm cần đo của đối tượng. Tùy theo mức độ mà sự phù
hợp được xác định,có thể có các phép đo lường sau đây (và ứng
với chúng là các loại thang đo):
-Phép đo “Định danh” (Nominal - hay định loại) là tách ra một
dấu hiệu nào đó của đặc điểm được nghiên cứu và đánh dấu mỗi
7
khi gặp dấu hiệu ấy (trong quan sát hoặc trong thực nghiệm).
Tổng hợp (đếm) các số ghi được sẽ có một biểu hiện đặc trưng
của đối tượng hay hiện tượng nghiên cứu (ví dụ, có thể đánh giá
khả năng viết đúng các từ của học sinh bằng cách ghi số lỗi mà
học sinh mắc phải trong một bài chính tả).Ứng với phép đo định
danh là “Thang định danh”.
- Phép đo “Định hạng” (Ordinal) là xếp các hiện tượng, các đối
tượng của đặc điểm được nghiên cứu thành một dãy theo thứ tự
giảm dần hoặc tăng dần, và sau đó gán cho mỗi đối tượng một
con số, mà con số đó chỉ rõ vị trí của đối tượng trong dãy số đó.
Con số này được gọi là hạng của đối tượng(ví dụ, xếp hạng của
học sinh một lớp – “nhất”, “nhì”, “ba”…dựa theo kết quả học tập
về một môn học).Ứng với phép đo định hạng là “Thang định
hạng” (hay thang thứ hạng).
- Phép đo “Định khoảng” (Interval – đo chính xác) là so sánh đặc
điểm nghiên cứu với các đơn vị đo lường chuẩn. Ứng với phép đo
định khoảng có “Thang định khoảng”.
- Phép đo “Định tỉ lệ” (tỉ số). Ứng với nó có “Thang tỉ lệ”.
Sự phát triển chung của khoa học, của công nghệ thông tin trong
những năm vừa qua giúp khoa học đo lường có những bước phát
triển mạnh mẽ, khiến các phép đo ngày càng chính xác, và các
đơn vị đo ngày càng tinh tế.
Phép đo chính xác (đo định khoảng) bằng cách so sánh với các
đơn vị đo lường bị hạn chế trong việc áp dụng vào NCKHGD bởi vì
địi hỏi phải có đơn vị đo, và các đặc trưng được đo không thay đổi
trong suốt thời gian đo đạc. Những điều kiện này nói chung khó
8
được thỏa mãn đối với các hiện tượng và các q trình ln ln
biến động trong giáo dục. Vì vậy, trong NCKHGD thường dùng phổ
biến hai phép lượng hóa là“Định danh” và “Định hạng”. Ví dụ, khi
chưa có cách đo trực tiếp được chất lượng kiến thức và kĩ năng,
trình độ phát triển một phẩm chất đạo đức của học sinh, thì có
thể ghi dấu những biểu hiện bề ngồi về hành vi của học sinh, các
lỗi mắc phải, các kết quả hoạt động…Từ đó lượng hóa các đặc
trưng ấy và phát hiện ra những quy luật tương ứng. Mặc dù ta
chưa xác định được chính xác, rằng, đối tượng A mang đặc trưng
nào đó gấp mấy lần đặc trưng đó ở đối tượng B, nhưng ta có thể
xác định được rằng, đặc trưng đó ở A “Mạnh hơn”, “Phát triển
hơn” ở B. Do đó, nếu xếp hạng được các đối tượng nghiên cứu thì
sẽ có thể sử dụng được cơng cụ thích hợp của thống kê tốn học
để tìm ra những kết luận đáng tin cậy. Tùy thuộc vào thang đo
được xác định sẽ tiến hành tính tốn các tham số thống kê (trung
vị, hệ số tương quan thứ bậc, hay trung bình cộng, phương sai, hệ
số tương quan tuyến tính…).
Đối với điểm số theo thang điểm 5 bậc hoặc 10 bậc để đánh giá
trình độ kiến thức của học sinh thì khơng phải phép đo khoảng,
cũng khơng phải phép đo hạng.Trong nhiều trường hợp, người ta
định ra những dấu hiệu để xếp loại các bài làm của học sinh từ 0
đến 10 hoặc từ 1 đến 5. Cách cho điểm này là kết hợp ghi dấu và
xếp hạng, thường được dùng trong các mơn học chính xác hoặc
các trắc nghiệm khách quan. Nếu xét một cách chặt chẽ, thì đối
với các điểm số là khơng thể tính các tham số: trung bình cộng,
phương sai, hệ số tương quan tuyến tính…Tuy nhiên, trong thực
9
tiễn, có thể xử lí một cách gần đúng các điểm số như các số có
được theo phép đo khoảng.
*Một số phương pháp lượng hóa thơng thường hiện được
dùng rộng rãi trong các NCKHGD
Nội dung đầu tiên của thống kê tốn học là mơ tả các kết quả
quan sát, các kết quả thực nghiệm, tức là tìm cách đúc kết một số
lớn số liệu thành một số không lớn các đặc trưng biểu hiện dưới
dạng cô đặc thông tin chứa đựng trong số liệuđể giúp giải quyết
vấn đề cơ bản hơn: Phân tích một cách khoa học các số liệu, từ đó
rút ra những kết luận có tính khái qt, rút ra những quy luật.
Thơng thường, chúng ta muốn tìm hiểu những mặt sau:
- Khuynh hướng chung hay đặc trưng của số liệu thu được;
- Những khác biệt trong các số liệu thu được.
Các yêu cầu thống kê là:
- Mô tả cái điển hình cho tập hợp;
- Mơ tả độ lớn hay độ biến thiên của tập hợp;
- Mô tả quan hệ giữa hai biến trong một tập hợp;
- Xác định xác suất của một đại lượng thống kê hoàn toàn ngẫu
nhiên [4].
Việc đầu tiên trong đúc kết số liệu là xem xét phân phối tần
số của các kết quả thu được: Sau khi đã có kết quả điểm thơ, việc
đầu tiên là sắp xếp các điểm số và ghi số lầnxuất hiện tương ứng
với mỗi điểm số từ cao đến thấp thành một cột. Sau đó cộng tất
cả lại sẽ được tần suất.Từ dãy số liệu đó đúc kết lại thành bảng
phân phối tần suất. Để có thể nhận định được tình hình một cách
10
khái quát hơn, các số liệu đó sẽ được ghép thành các lớp hay
phân loại (ví dụ,xếp những học sinh có điểm 8,9,10 vào loại “khá”
và “giỏi”; những hs có điểm 5,6,7 vào loại “trung bình”; những hs
có điểm 4 trở xuống vào loại “yếu” và “kém).
Trong các nghiên cứu KHGD, người ta thường áp dụng một số
nhóm cơng thức tính tốn thống kê sau đây:
a/Nhóm các phép đoxu thế trung tâm hay để mô tả một cách
tổng quát một tập hợp điểm số. Thuộc nhóm này có các số đo
định tâm. Mục đích là nhằm để đo các trị số trung bình hay trị số
tiêu biểu của một tập hợp.
- Trung bình cộng là một tham số quen thuộc, đặc trưng cho sự
tập trung số liệu, được sử dụng để phản ánh giá trị trung bình của
phân phối được đo theo cấp tỉ lệ hoặc khoảng.
- Trung vị được sử dụng cho các biến số được đo lường theo cấp
đo định hạng (thứ hạng).
- Yếu vị được sử dụng cho các biến số được đo lường theo cấp
định danh. Yếu vị là số mà ở đó tần số là lớn nhất. Do đó, trong
thực tế có thể có yếu vị đơi hoặc khơng có yếu vị.
Như vậy, có nhiều điểm trung bình, song người ta thường nghĩ
chỉ có trung bình cộng, do đó, số trung bình cộng được sử dụng
rộng rãi nhất. Sở dĩ như thế là vì nó rõ ràng, dễ tính tốn và là một
hàm số đại số của tất cả các giá trị của biến lượng. Với một số
lượng quan sát đủ lớn, nó đánh giá một cách chắc chắn tham số
của tổng thể thống kê. Nhưng cũng có những trường hợp khơng
được tính trung bình cộng. Đó là:
11
- Khi số lượng quan sát (n) quá nhỏ;
- Khi sự phân phối quá không đối xứng;
- Khi sự phân phối có lớp mở ở cuối;
- Khi sự phân phối có nhiều đỉnh.
Số yếu vị được dùng trong trường hợp phân phối có nhiều đỉnh.
Khi đó số yếu vị có ý nghĩa rõ ràng và có thể xác định dễ dàng.
Nhưng nó khơng phải là hàm số của tất cả các giá trị của biến, và
không vững chắc (dao động nhiều từ thực nghiệm này sang thực
nghiệm khác). Nếu phân phối thật đối xứng, thì số trung bình = số
trung vị = số yếu vị.
b/Nhóm cácphép đotrị số biến thiên của các số liệu
- Độ lệch chuẩn (standard deviation – SD). SD là một trị số của
độ biến thiên. Nó chỉ độ phân tán của phân bố các giá trị: Độ lệch
càng lớn, thì độ phân tán càng nhiều, và ngược lại, độ lệch càng
nhỏ thì độ phân tán càng ít.
- Trong trường hợp 2 tập hợp số liệu có giá trị trung bình cộng
khác nhau, người ta so sánh mức độ phân tán của các số liệu
bằng hệ số biến thiên V, tức là tỉ số giữa độ lệch chuẩn và giá
trị trung bình cộng của bảng số liệu (thường tính ra % ).
c/Nhóm các phép đo lường quan hệ giữa các biến tham gia vào
nghiên cứu
Hệ số tương quan (Correlation Coefficient) được tính tốn để tìm
ra mối quan hệ giữa các biến số hay các yếu tố. Điều này rất quan
trọng vì cho phép người nghiên cứu hiểu, nắm rõ đặc điểm và bản
12
chất của hiện tượng đang được nghiên cứu. Từ đó, tìm ra con
đường tốt nhất để tiến hành tác động giáo dục.
Hệ số tương quan được dùng để biểu thị sự tương quan giữa 2
hay nhiều tập hợp trị số trong 2 hay nhiều phân phối khác nhau,
hay sự tương quan giữa các yếu tố tham gia vào thực nghiệm. Có
tương quan thuận và tương quan nghịch (nằm trong khoảng từ +1
đến -1). Cịn có tương quan thẳng và tương quan cong.
Có thể tính hệ số tương quan theo một số cơng thức tốn học sau
đây:
* Hệ số tương quan tuyến tính Pearson (R) hay cịn được gọi
là hệ số tương quan mơmen tích số. Nó được sử dụng khi cả 2
biến được đo bằng khoảng. Đây là hệ số tương quan tuyến tính
giữa 2 biến số (thuận hoặc nghịch. Ví dụ, tìm sự tương quan giữa
kết quả kiến thức và thái độ ở điểm posttest của nhóm thực
nghiệm). Hệ số tương quan Pearson không dùng được cho tương
quan cong.
Muốn xem tương quan có ý nghĩa thống kê hay khơng thì cần phải
tính giá trị T-student
* Hệ số tương quan thứ bậc Spearman (R) được sử dụng khi
cả 2 biến được đo ở cấp định hạng (thứ bậc).
Mục đích của hệ số tương quan này là tìm sự tương quan giữa
2 biến có số đo khác nhau (ví dụ, tìm sự tương quan giữa kết quả
kiến thức và thái độ ở điểm posttest của nhóm thực nghiệm). Mẫu
nhất thiết phải lớn hơn hoặc bằng 30.
13
Giống như các phép thử sử dụng cấp độ đo thứ bậc, hệ số
tương quan thứ bậc Spearman không quan tâm đến giá trị của
điểm số mà chỉ chú ý đến quan hệ thứ bậc của chúng trong tập
hợp điểm. Do đó, khi áp dụng phép thử ở cấp độ đo này, cần phải
biết cách lập bảng số thứ tự.
Tóm lại, hệ số tương quan được sử dụng tính tốn trong các
trường hợp sau:
- Tìm mối quan hệ giữa một đặc điểm thể chất với một đặc điểm
tâm lí của một nhóm người (hệ số tương quan Pearson);
- Tìm mối quan hệ giữa 2 đặc điểm tâm lí nào đó của một nhóm
người (hệ số tương quan Pearson);
- Tìm mối quan hệ giữa khả năng của một nhóm hs về một môn
học này so với một môn học khác (hệ số tương quan Pearson);
- Khảo sát tính hiệu lực, độ tin cậy của test (hệ số tương quan
Pearson);
- Tìm tương quan giữa 2 nhóm có quan hệ với nhau về một đặc
điểm nào đó HSTQ Spearman);
- Tìm tương quan giữa 2 biến số có số đo khác nhau (hệ số tương
quan Spearman).
Trong trường hợp tính hệ số tương quan Spearman, số lượng cá
thể mẫu phải lớn hơn hoặc tối thiểu bằng 30.
d/ Nhóm các phép đo sự khác biệt giữa các biến số
Các định luật thống kê đã chỉ rõ sự khác biệt giữa các tập hợp
điểm nhiều khi chỉ là kết quả tác động của các yếu tố ngẫu nhiên.
Do đó, cần sử dụng các phép thử tốn thống kê để khẳng định sự
14
thay đổi quan sát được có đáng kể hay khơng. Nói cách khác, nó
có ý nghĩa hay khơng về phương diện thống kê. Khi thực hiện
những đánh giá về giá trị, có thể mắc hai loại sai lầm: “xấu”
nhưng lại được đánh giá là “Tốt” và, ngược lại, “Tốt” lại bị đánh
giá là “Xấu”. Theo quan điểm thực tế, ta nên tránh mắc những sai
lầm loại đầu mà chấp nhận một xác suất sai nào đó của sai lầm
loại 2 vì ít phương hại hơn. Theo tinh thần trên, khi đánh giá hiệu
quả của tác động giáo dục hoặc quan hệ giữa 2 biến thái độ và
kiến thức, ta nên xuất phát từ giả thiết rằng: tác động giáo dục
không có hiệu quả (kết quả đo được của lớp thực nghiệm không
khác lớp đối chứng, kết quả posttest không khác kết quả pretest ở
lớp thực nghiệm, khơng có sự liên quan giữa kiến thức và thái độ).
Giả thiết như vậy gọi là “giả thiết khơng”, và nó đã trở thành quy
ước thống nhất trong thống kê toán học. Nếu chứng minh được
rằng giả thiết không (Ho) chỉ đúng với xác suất 5% thì có thể n
tâm bác bỏ giả thiết khơng mà chấp nhận giả thiết H1 (có hiệu
quả, có quan hệ) vì khi đó xác suất sai lầm chỉ là 5%. Khi bác bỏ
giả thiết Ho, chấp nhận giả thiết H1 với xác suất sai lầm 5%, ta
nói giá trị tìm được là “có ý nghĩa về xác suất thống kê”. Như đã
nói ở phần đầu, trong NCKHGD, sai số được chấp nhận là 5%. Nếu
muốn chắc chắn hơn, ta có thể chấp nhận giá trị để bác bỏ giả
thiết Ho với xác suất sai 1% (p nhỏ hơn hoặc bằng 0,01). Kết quả
sẽ được gọi là “Khơng có ý nghĩa” nếu xác suất sai lớn hơn 5% (P
lớn hơn 0,05). Ta cũng có thể bác bỏ giả thiết Ho với sai số lớn
hơn, chẳng hạn khi P nhỏ hơn hoặc bằng 0,1. Khi chấp nhận giả
15
thiết H1 như vậy, xác suất sai lầm sẽ là 10%, nghĩa là trong 100
trường hợp khẳng định, có khoảng 10 lần sai.
Việc tìm sự khác biệt giữa các biến số được thực hiện thơng
qua số trung bình cộng hoặc phương sai. Mục đích là để tìm sự
khác biệt có ý nghĩa hay khơng giữa các nhóm được phân loại
theo một biến số nào đó. Thuộc nhóm này có thể có các phép đo
sau:
* So sánh sự khác nhau về giá trị trung bình của một nhóm (kiến
thức, thái độ: pretest và posttest. Ví dụ, đánh giá hiệu quả giáo
dục dân số về kiến thức của khóa giáo sinh năm thứ nhất sau một
năm thực nghiệm) nhằm chứng minh hiệu quả của thực nghiệm.
Muốn thế ta cần phải:
- Xác định giá trị trung bình cộng;
- Xác định giá trị sai số chuẩn;
- Tính T-student nhóm sóng đơi (“Nhóm sóng đơi” là một thuật
ngữ của toán thống kê thể hiện tập hợp điểm của 2 nhóm thực
nghiệm có cùng quan hệ với nhau như: vợ-chồng; anh-em…hoặc
tập hợp điểm pretest-posttest của cùng một nhóm).
* So sánh tập hợp điểm posttest của nhóm thực nghiệm và nhóm
đối chứng/hoặc hai nhóm được thực nghiệm với 2 phương pháp
khác nhau nhằm tìm ra phương pháp có hiệu quả hơn.
Trong trường hợp này người ta thường sử dụng phép thử Tstudent nhóm khơng sóng đơi với điều kiện:
- Hai nhóm khơng có quan hệ với nhau (độc lập với nhau hoàn
toàn);
16
- Các dữ kiện là tương đương nhau (trừ điều kiện tác động);
- Mẫu cá thể tốt nhất là nên bằng nhau (N).
* So sánh kết quả giữa 2 nhóm thực nghiệm và đối chứng bằng
phép thử Chi-square.
Mục đích là nhằm so sánh kết quả giữa 2 nhóm (nhóm thực
nghiệm A và B hoặc nhóm thực nghiệm và nhóm đối chứng. Ví dụ,
đánh giá hiệu quả thực nghiệm giáo dục dân số ở 2 nhóm thực
nghiệm và đối chứng qua kết quả posttest về thái độ) để xem sự
khác biệt có ý nghĩa hay khơng về phương diện thống kê. Cần có
đủ các điều kiện sau:
- 4/5 số tích các chuỗi lề phải lớn hơn 5N (> 5N);
- Sử dụng số đo định tính (xấu-tốt; giỏi-khá-trung bình-yếu-kém).
Trên đây chỉ là một số phép thử tốn thống kê thơng dụng. Ngồi
các điều kiện vận dụng của phép thử, khi sử dụng ta cần chú ý
hồn cảnh vận dụng và mục đích chung của việc đánh giá. Tốn
thống kê có các ưu điểm song chỉ là công cụ của người nghiên
cứu. Từ số liệu có được, phân loại như thế nào là phụ thuộc vào
chuyên môn của người nghiên cứu. Chuyển từ số liệu này sang số
liệu khác cũng có nghĩa là chuyển sang một trường số liệu khác
rồi nên nó sẽ khác. Các kết luận rút ra cần được kiểm tra.
4. Thay cho lời kết
Trong NCKHGD, việc phân tích định tính phải là chủ yếu. Nhưng
điều đó hồn tồn khơng có nghĩa là thiên về biện luận và coi nhẹ
các số liệu. Không loại trừ khả năng dùng một bảng số liệu với vài
dòng ghi chú, thuyết minh đủ để thay thế, thậm chí nhiều khi cịn
17
thuyết phục hơn hàng trang chữ viết. Trong quá trình tập dượt và
trưởng thành về NCKHGD, nhà nghiên cứu cần cố gắng sử dụng
ngày càng tốt hơn sự thống nhất biện chứng giữa phân tích định
tính và định lượng, tiến tới khả năng bắt các con số nói thay. Có
thể khẳng định rằng, cách trình bày các bảng số liệu, đồ thị, mơ
hình… và cách dùng chúng để phục vụ cho việc phân tích định
tính là một chỗ dựa đáng tin cậy để phán đốn đúng về năng lực
và trình độ thành thạo của một người nghiên cứu.
Ngày nay, sự phát triển mạnh mẽ của công nghệ thông tin đã
và đang hỗ trợ rất nhiều cho các nhà nghiên cứu trong lĩnh vực
KHGD. Việc vận dụng các mơ hình thống kê vào nghiên cứu định
lượng trong giáo dục và sử dụng các phần mềm chuyên dụng
thường xuyên được cập nhật về độ mạnh của tính năng đang
ngày càng trở nên phổ biến. Vì vậy, đây cịn là một u cầu cấp
thiết nữa đối với những người thực hiện NCKHGD nếu muốn nâng
cao chất lượng các cơng trình nghiên cứu. Hiện nay, thống kê tốn
học khơng chỉ được sử dụng ở khâu xử lí, phân tích số liệu thực
tiễn mà cịn được vận dụng ở các khâu quan trọng khác của một
cơng trình NCKHGD, như: Xác định cỡ mẫu, xây dựng cơng cụ,
kiểm tra lỗi trong q trình thực hiện. Bởi mỗi bước trong quy
trình nghiên cứu đều tiềm ẩn những sai sót, có thể làm hỏng hoặc
làm giảm giá trị khoa học của cơng trình nghiên cứu.
18