Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (316.35 KB, 6 trang )
<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
<b>Mai Thị Ngọc Hà*<sub>, Bùi Linh Phượng</sub></b>
<i>Trường Đại học Nông Lâm - ĐH Thái Ngun </i>
TĨM TẮT
Thống kê tốn học là một ngành khoa học dựa trên cơ sở phân tích, xử lý số liệu và rút ra kết luận
thực tiễn trong tất cả các lĩnh vực của đời sống. Do đó việc dạy học phần Thống kê tốn học ở
trường đại học phải gắn liền với ngành nghề đào tạo, sinh viên học xong mơn học phải có kĩ năng
xử lý số liệu và phân tích số liệu phục vụ cho nghiên cứu khoa học và giải quyết các vấn đề về
chuyên môn. Bài báo nhằm đưa ra một số vấn đề đổi mới nội dung và phương pháp dạy học học
phần Thống kê tốn học cho sinh viên khoa Chăn ni thú y tại trường Đại học Nông lâm - Đại
học Thái Ngun.
<i><b>Từ khóa: Thống kê tốn, phần mềm R, Đại học Nông lâm Thái Nguyên, Nội dung và phương </b></i>
<i>pháp, Chăn nuôi thú y</i>
ĐẶT VẤN ĐỀ*
Trong khuôn khổ của Chương trình trọng
điểm quốc gia phát triển Toán học giai đoạn
2010 -2020, Viện Nghiên cứu cao cấp về toán
đã tổ chức hội thảo “Nội dung và phương
pháp giảng dạy thống kê toán học” tại Nha
Trang và Phú Thọ. Một số vấn đề bất cập như
giảng dạy Thống kê toán học theo lối truyền
Mục đích của bài báo là nghiên cứu vấn đề
đổi mới nội dung và phương pháp giảng dạy
Thống kê toán học cho sinh viên Khoa Chăn
nuôi thú y của Trường Đại học Nông Lâm.
Cụ thể là: đổi mới nội dung môn học Thống
kê toán học phải gắn liền với thực tiễn ngành
CNTY & TY; đổi mới phương pháp giảng
dạy bắt đầu từ việc dạy sinh viên cách sử
dụng phần mềm thống kê R trong xử lý, phân
tích số liệu thống kê chuyên ngành. Mặc dù
*
<i>Tel: 0962 586083, Email: </i>
hiện nay trên thế giới, có nhiều phần mềm
thống kê như SPSS, STASTA, SAS,
MINITAB,... nhưng sở dĩ chúng tôi lựa chọn
Bài báo gồm 3 phần. Ngoài phần Đặt vấn đề
và Kết luận, phần Nội dung đề xuất thay đổi
một số vấn đề trong đề cương chi tiết mơn
học, giới thiệu một số bài tốn thực tiễn trong
lĩnh vực Chăn nuôi thú y theo từng chương
của học phần Thống kê toán học và hướng
dẫn sinh viên giải quyết các bài toán trên
bằng phần mềm R.
NỘI DUNG
<b>Đổi mới nội dung học phần thống kê Toán học </b>
<i><b>Về phân bổ thời gian trong đề cương mơn </b></i>
<i><b>học: Thống kê tốn học là một phần nội dung </b></i>
đó 50% thời lượng cho Xác suất, 50% cho
Thống kê. Sau khi nghiên cứu các bài giảng,
giáo án, giáo trình, các đề tài nghiên cứu khoa
học chuyên ngành CNTY& TY, kết hợp với
việc tổ chức các seminar chuyên đề có sự
<i>Về nội dung của đề cương môn học: Phần </i>
Xác suất được giới thiệu sơ lược về phép thử,
biến cố, các định nghĩa, định lý về xác suất và
tập trung chủ yếu giảng dạy phần các quy luật
phân phối xác suất thơng dụng. Phần Thống
kê tốn học, ngồi các bài tốn cơ bản như
ước lượng tham số, kiểm định giả thuyết
thống kê, tương quan và hồi quy tuyến tính
cần bổ sung thêm một số khái niệm về sai số
tiêu chuẩn (Standard Error), hệ số biến động
<i>Về các bài toán thực tiễn ứng dụng trong </i>
<i>ngành CNTY& TY: Ngoài phần kiến thức lý </i>
thuyết chung của mỗi chương, để sinh viên
ngành CNTY & TY có thể vận dụng kiến
thức Thống kê toán học trong thiết kế thí
nghiệm, xử lý, phân tích số liệu để đưa ra kết
luận thống kê, ứng với mỗi nội dung học phần
chúng tôi đề xuất đưa vào các ví dụ thực tế về
theo dõi chỉ tiêu sinh trưởng của gia súc, gia
cầm, về tác dụng của thuốc kháng sinh, về các
thí nghiệm đánh giá giống, loài, về tác dụng
của loại men vi sinh đến sinh trưởng, ...
Chẳng hạn, ở chương tổng thể, mẫu, các đặc
trưng của mẫu ngẫu nhiên, sinh viên được
<i>tiếp cận giải quyết bài toán: “Để đánh giá </i>
<i>khả năng sinh trưởng của giống gà Lương </i>
<i>phượng được nuôi tại trại gà thuộc Đồng </i>
<i>Bẩm, Đồng Hỷ, Thái Nguyên, cân trọng </i>
<i>lượng gà ở tuần đầu theo dõi (gà 3 tuần tuổi) </i>
<i>và trọng lượng gà nuôi 10 tuần tuổi ta thu </i>
<i>được bảng số liệu sau: </i>
<b>Bảng 1 </b>
<i>3 TT (g) </i> <i>320 </i> <i>350 </i> <i>330 </i> <i>300 </i> <i>320 </i> <i>340 </i> <i>310 </i> <i>350 </i> <i>330 </i> <i>330 </i> <i>300 </i> <i>330 </i> <i>340 </i>
<i>10 TT(g) 2100 1900 2400 2000 2300 2100 2000 2000 2300 2100 2100 2000 2100 </i>
<i>3 TT (g) 340 </i> <i>350 </i> <i>330 </i> <i>330 </i> <i>320 </i> <i>320 </i> <i>300 </i> <i>340 </i> <i>330 </i> <i>340 </i> <i>330 </i> <i>300 </i> <i>340 </i>
<i>10 TT(g) 1900 2000 2300 2400 </i>
<i>Hãy tính các tham số trung bình mẫu, độ lệch chuẩn mẫu, trung vị. </i>
<b>Bảng 2 </b>
DC 2000 2000 1900 2400 2000 2100 2000 2000 2000 2200 2000 2100 2300
TN 2500 2200 2000 2100 2300 2300 2000 2200 2100 2000 2400 2200 2000
DC 2400 2100 1900 2100 2300 2000 2000 2100 2200 2000 2000 2200 2200
TN 2300 2300 2100 2000 2200 2300 2200 2150 2200 2200 2200 2100 2300
DC 2100 2200 2150 2000
TN 2100 2300 2400 2300
<i>a) Tìm khoảng tin cậy đối xứng cho trọng lượng trung bình của gà Lương Phượng 10 tuần tuổi ở </i>
<i>lô DC và lô TN với độ tin cậy 95%. </i>
<i>b) Hãy cho kết luận về hiệu quả của việc sử dụng men Lactos với mức ý nghĩa 5%. </i>
Cuối cùng, đối với chương tương quan và hồi quy, trong CNTY & TY khơng những cần biết hai
biến số có quan hệ với nhau hay khơng mà cịn cần phải biết loại quan hệ giữa chúng để có thể từ
một giá trị của biến số này dự đoán được giá trị của biến số còn lại: chẳng hạn mối quan hệ giữa
sản lượng sữa của đời bò mẹ và sản lượng sữa của đời bò con, giữa khối lượng quả trứng gà và
đường kính lớn quả trứng, giữa khối lượng với số đo vòng ngực ở trâu,... là mối quan hệ tương
<i>quan tuyến tính. Sinh viên sẽ được học cách giải quyết các bài toán tương tự như: “Đo lường tỷ </i>
<i>lệ mỡ sữa của đời con (y) và đời mẹ </i>
<b>Bảng 3 </b>
<i>Tỷ lệ mỡ </i>
<i>sữa % </i> <i>Mẹ (X) </i>
<i>3.4 </i> <i>3.8 </i> <i>4.0 </i> <i>3.0 </i> <i>3.7 </i> <i>3.0 </i> <i>3.5 </i> <i>3.8 </i> <i>3.1 </i> <i>3.0 </i>
<i>Con (Y) </i> <i>3.5 </i> <i>3.8 </i> <i>3.9 </i> <i>3.3 </i> <i>3.7 </i> <i>3.4 </i> <i>3.6 </i> <i>4.0 </i> <i>3.4 </i> <i>3.1 </i>
<i>a) Tính hệ số tương quan mẫu; </i>
<i>b) Viết phương trình đường hồi quy tuyến tính của tỷ lệ sữa con theo tỷ lệ sữa của mẹ. </i>
<b>Đổi mới phương pháp giảng dạy học phần </b>
<b>Thống kê toán học </b>
<i>Vấn đề giảng dạy phần mềm thống kê trong </i>
<i>học phần Thống kê là cần thiết, phù hợp với </i>
<i>xu thế phát triển. Việc giảng dạy Thống kê </i>
toán học theo cách dạy cũ chủ yếu dạy sinh
viên cách tính tốn thủ công thông qua lập
bảng tính, sinh viên chỉ biết sử dụng máy tính
bỏ túi để thực hiện các phép tốn đơn giản.
Do đó nó tạo ra rất nhiều hạn chế như giảng
viên chỉ tập trung được vào kĩ năng tính tốn,
khơng có thời gian phân tích nhiều về bản
chất, ý nghĩa của các khái niệm, các con số
trong thực tế; sinh viên tiếp thu một cách thụ
động, không hiểu cặn kẽ vấn đề, không giải
thích được các sự kiện, con số tính tốn được.
sở toán học, cú pháp trong R, ví dụ minh họa.
Mỗi ví dụ minh họa đều được phân tích chi
tiết trên cơ sở toán học, đoạn mã lệnh thực
hiện trên R, phân tích kết quả hiển thị trên R
và đưa ra kết luận. Chẳng hạn, để tính trọng
lượng trung bình, độ lệch chuẩn, trung vị cho
giống gà Lương Phượng 3 tuần tuổi và 10
tuần tuổi ở Bảng 1 ta thực hiện đoạn lệnh trên
R như sau
<i>> # Nhập dữ liệu gà Lương Phượng 3 tuần </i>
<i>tuổi bằng lệnh gán đối tượng sau </i>
<i>> LP3TT = c(320, 350, 330, 300, , 340, </i>
<i>310, 350, 330, 330, 300, 330, 340, 320, 340, </i>
<i>350, 330, 330, 320, 320, 300, 340, 330, 340, </i>
<i>330, 300, 340, 340, 330, 340) </i>
<i>> # Lệnh sau gọi ra đối tượng LP3TT </i>
<i>> # Lệnh tính các giá trị trung bình, độ </i>
<i>lệch chuẩn, trung vị và phần mềm R hiển thị </i>
<i>luôn kết quả: </i>
<i>> mean(LP3TT) </i>
<i>[1] 328.3333 </i>
<i>> sd(LP3TT) </i>
<i>[1] 14.87496 </i>
<i>> median(LP3TT) </i>
<i>[1] 330 </i>
Để tính các giá trị trung bình, độ lệch chuẩn,
trung vị cho gà Lương phượng 10 tuần tuổi
cũng nhập lệnh tương tự, thu được
<i>>LP10TT = c(2100, 1900, 2400, 2000, </i>
<i>2300, 2100, 2000, 2000, 2300, 2100, 2100, </i>
<i>2000, 2100, 1900, 2100, 2050, 2000, </i>
<i>2000,2100, 2000, 2400, 2000, 2300, 2000, </i>
<i>2000, 2100, 2100, 2000, 2300, 2400) </i>
<i>>LP10TT </i>
<i>> mean(LP10TT) </i>
[1] 2105
<i>> sd(LP10TT) </i>
<i>[1] 146.4229 </i>
<i>[1] 2100 </i>
Lệnh tính tốn bằng phần mềm R đơn giản,
độ chính xác cao. Nhìn vào trọng lượng trung
bình của gà Lương Phượng 3 tuần tuổi
328.314.875 (g) đến 10 tuần tuổi trọng
lượng trung bình đã đạt 2105146.423(g),
sinh viên có thể đánh giá rằng giống gà
Lương Phượng tăng trọng lượng tương đối
nhanh hơn so với gà ri tại địa phương.
Để tìm khoảng tin cậy đối xứng cho trọng
lượng trung bình của gà Lương Phượng 10
tuần tuổi ở lô gà DC và lô gà TN (Bảng 2),
đầu tiên sinh viên được hướng dẫn phân tích
bài tốn: Kích thước mẫu lớn n =30, chưa biết
phương sai và tổng thể có phân phối chuẩn,
nên khoảng tin cậy cho trọng lượng trung bình
của giống gà Lương Phượng 10 tuần tuổi được
<i>tìm qua hàm t.test với cú pháp lệnh như sau </i>
<i>t.test(x, conf.level) </i>
Trong đó: x là vectơ dữ liệu mẫu; conf.level
là độ tin cậy của khoảng ước lượng, được mặc
định là 0.95.
Ta thực hiện đoạn lệnh sau trên R để tìm
khoảng tin cậy đối xứng cho lô gà DC
<i>> # Nhập dữ liệu vào phần mềm R </i>
<i>> DC = c(2000, 2000, 1900, 2400, 2000, </i>
<i>2100, 2000, 2000, 2000, 2200, 2000, 2100, </i>
<i>2300, 2400, 1900, 2100, 2100, 2300, 2000, </i>
<i>2000, 2100, 2200, 2000, 2000, 2200, 2200, </i>
<i>2100, 2200, 2150, 2000) </i>
<i>># Kiểm tra dữ liệu nhập vào </i>
<i>> DC </i>
<i>[1] 2000 2000 1900 2400 2000 2100 </i>
<i>2000 2000 2000 2200 2000 2100 2300 </i>
<i>2400 1900 2100 2100 2300 2000 2000 </i>
<i>2100 2200 2000 2000 2200 2200 2100 2200 </i>
<i>2150 2000 </i>
<i>> t.test(DC,conf.level =0.95) </i>
<i> One Sample t-test </i>
<i>data: DC </i>
<i>t = 86.461, df = 29, p-value < 2.2e-16 </i>
<i>alternative hypothesis: true mean is not </i>
<i>equal to 0 </i>
<i>95 percent confidence interval: </i>
<i> 2048.698 2147.969 </i>
<i>sample estimates: </i>
<i>mean of x </i>
<i> 2098.333 </i>
Phượng 10 tuần tuổi ở lô DC, với độ tin cậy
95% nằm trong khoảng (2048.698, 2147.969)
(g), với trung bình mẫu là 2098.333 (g)
Cách làm hồn tồn tương tự với lơ gà TN ta
thu được kết quả:
<i> One Sample t-test </i>
<i>data: TN </i>
<i>t = 91.479, df = 29, p-value < 2.2e-16 </i>
<i>alternative hypothesis: true mean is not </i>
<i>equal to 0 </i>
<i>95 percent confidence interval: </i>
<i> 2149.184 2247.482 </i>
<i>sample estimates: </i>
<i>mean of x </i>
<i> 2198.333 </i>
Ở lô TN, trọng lượng trung bình của gà
Lương Phượng 10 tuần tuổi với độ tin cậy
95% nằm trong khoảng (2149.184, 2247.482)
(g) và trung bình mẫu 2198.333(g). Từ đây
sinh viên có thể so sánh giữa trọng lượng
<i>t.test(x,y, </i> <i>mu, </i> <i>alternative, </i> <i>var.equal </i>
<i>=True) </i>
Quy trình kiểm định như sau.
Bước 1: Gọi
0
:
;
: 1 2 1 1 2
0
Bước 2: Ta dùng hàm t.test với các tham số
cần thiết được cho như sau
- x, y là các vectơ dữ liệu về trọng lượng
trong mẫu ở lô DC và TN;
- mu=0; alternative= “less”;
- var.equal =TRUE
Bước 3: Thực hiện lệnh kiểm định trên R
># Nhập dữ liệu DC, TN giống ý a)
<i>>t.test(DC,TN,mu=0,alt=“less”, </i>
<i>var.equal=T) </i>
<i> Two Sample t-test </i>
<i>data: DC and TN </i>
<i>t = -2.9279, df = 58, p-value = 0.002434 </i>
<i>alternative hypothesis: true difference in </i>
<i>means is less than 0 </i>
<i>95 percent confidence interval: </i>
<i>sample estimates: </i>
<i>mean of x mean of y </i>
<i> 2098.333 2198.333 </i>
Bước 4: Phân tích kết quả trên R
Dựa vào p-value =0.002434<0.05 nên bác bỏ
H0. Vậy tại mức ý nghĩa 5% có đủ bằng
chứng thống kê để cho rằng trọng lượng trung
bình của gà ở lô DC nhỏ hơn trọng lượng
trung bình của gà ở lơ TN, nói cách khác việc
bổ sung men Lactos có hiệu quả trong việc
tăng trọng lượng gà.
Để tính hệ số tương quan mẫu giữa tỷ lệ mỡ
sữa của đời con
),
<i>(x</i> (Bảng 3) thay vì lập bảng tính cồng
kềnh, phức tạp như trước đây, sinh viên được
<i>hướng dẫn tính bằng lệnh cor(x,y) trên phần </i>
mềm R, kết quả được tính nhanh gọn, chính
xác. Ta thực hiện tuần tự các bước sau trên R
<i>># Nhập dữ liệu tỷ lệ mỡ sữa mẹ và con </i>
<i>vào R </i>
<i>>Me = c(3.4, 3.8, 4.0, 3.0, 3.7, 3.0, 3.5, </i>
<i>3.8, 3.1, 3.0) </i>
<i>> Con = c(3.5, 3.8, 3.9, 3.3, 3.7, 3.4, 3.6, </i>
<i>4.0, 3.4, 3.1) </i>
<i>> TyLeMoSua = data.frame ( Me, Con) </i>
<i>># Tính hệ số tương quan mẫu </i>
<i>># Ước lượng các hệ số của phương trình </i>
<i>đường hồi quy tuyến tính </i>
<i>> lm(Con~ Me, data=TyLeMoSua) </i>
<i>Call: </i>
<i>lm(formula = Con ~ Me, data = </i>
<i>TyLeMoSua) </i>
<i>Coefficients: </i>
<i>(Intercept) Me </i>
<i>1.2194 0.6853 </i>
Như vậy, ta có hệ số tương quan mẫu giữa tỷ
lệ mỡ sữa mẹ và tỷ lệ mỡ sữa con là
<i>0.9346166. Phương trình đường hồi quy bình </i>
phương trung bình tuyến tính thực nghiệm
của tỷ lệ mỡ sữa con theo tỷ lệ mỡ sữa mẹ là
được một cách trực quan mối quan hệ tuyến
tính giữa <i>y</i>và
<i>> plot(Me, Con) </i>
<i>> </i> <i>hoiquy </i> <i>= </i> <i>lm(Con~Me, </i> <i>data= </i>
<i>TyLeMoSua) </i>
<i>> abline(hoiquy) </i>
KẾT LUẬN
Việc đổi mới nội dung phần thống kê toán
học gắn liền với thực tiễn ngành CNTY & TY
kết hợp với việc giảng dạy phần mềm thống
kê R khơng những góp phần tạo hứng thú học
tập cho sinh viên Khoa CNTY mà quan trọng
hơn là cung cấp cho sinh viên phương pháp,
cơng cụ phân tích, xử lý số liệu thống kê, từ
đó tạo tiền đề để sinh viên học tập môn
chuyên ngành, tham gia các đề tài NCKH
dành cho sinh viên ngay từ năm thứ 2. Việc
sinh viên có năng lực phân tích, xử lý số liệu
thống kê không những phục vụ cho nhiệm vụ
nghiên cứu, học tập trước mắt mà còn phục
vụ cho công việc, học tập chuyên môn lâu
dài, suốt đời.
TÀI LIỆU THAM KHẢO
<i>1. Đỗ Đức Lực, Bài giảng phương pháp thí </i>
<i>nghiệm trong CNTY & TY, Đại học Nơng nghiệp I </i>
Hà Nội.
2. Phan Thanh Hồng, Nguyễn Thị Nhung (2015),
<i>Thống kê ứng dụng hướng dẫn thực hành trên </i>
<i>phần mềm R, Nxb Thống kê. </i>
<i>3. Khoa CNTY, Bài giảng Phương pháp thí nghiệm </i>
<i>trong CNTY, Đại học Nơng Lâm Thái Nguyên. </i>
<i>4. Wackerly, Mendenhall, scheaffer, Mathematical </i>
<i>Statistics with Application. </i>
<i>5. Roger D. Peng, Statistical methods for </i>
<i>enviromental epidemiology with R. </i>
<i>6. Hogg, Mckean, Craig, Introduction to </i>
<i>Mathematical Statistics. </i>
<i>7.Nathabandu T. Kottegoda, Applied . Statistics </i>
<i>for Civil and Enviromental Engineers. </i>
<i>8. Helmut van Emden, Statistics for terrified biologist, </i>
<i>9. John Verzani, Using R for introductory Statistics. </i>
10. R. Mead, R.N Curnow and A.M, Hasted,
<i>Statistical </i> <i>methods </i> <i>in </i> <i>Agriculture </i> <i>and </i>
<i>experimental biolog. </i>
SUMMARY
<b>IMPROVING THE CONTENTS AND TEACHING METHODS FOR </b>
<b>MATHEMATICAL STATISTICS MODULE FOR STUDENTS </b>
<b>OF VETERINARY HUSBANDRY AT THAI NGUYEN UNIVERSITY OF </b>
<b>AGRICULTURE AND FORESTRY </b>
<b>Mai Thi Ngoc Ha*, Bui Linh Phuong</b>
<i>University of Agriculture and Forestry - TNU</i>
Mathematical statistics is a the tool of data analysis and processing in all areas of study and life.
Therefore, teaching this subject at university should be attached with training sectors. After
studying the subject, students should have the skills of anlalyzing and processing data for scientific
researches or to deal with specialised majors. The article aims to give innovation issues of the
contents and teaching methods for mathematical statistics module for students of veterinary
husbandry at Thai Nguyen University of Agriculture and Forestry.
<i><b>Key words: mathematical statistics, software R, Thai Nguyen University of Agriculture and </b></i>
<i>Forestry, content and teaching methods, veterinaryl husbandry. </i>
<i><b>Ngày nhận bài: 19/10/2016; Ngày phản biện: 08/11/2016; Ngày duyệt đăng: 31/03/2017</b></i>