BÀI TẬP MƠN TIN HỌC ỨNG DỤNG TRONG QUẢN LÍ KINH TẾ.
Bài 1. Cho bảng số liệu
Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
thunhap
1
1.1
0.7
1.4
0.5
0.4
0.55
0.8
0.7
0.25
0.65
0.4
1.8
0.4
0.5
0.3
1
0.5
0.8
1.4
0.8
1.5
tieudung
0.6
0.65
0.48
0.9
0.38
0.23
0.32
0.48
0.45
0.18
0.4
0.25
0.95
0.25
0.3
0.2
0.5
0.25
0.45
0.7
0.45
0.78
Obs
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
thunhap
0.6
0.5
0.7
0.4
0.55
0.5
0.9
0.4
0.31
1.2
0.6
0.3
0.8
0.44
0.5
1
1.8
1.4
1.5
1.2
0.8
0.9
tieudung
0.35
0.35
0.38
0.2
0.35
0.35
0.55
0.3
0.22
0.65
0.4
0.2
0.4
0.28
0.39
0.6
0.9
0.7
0.75
0.6
0.45
0.45
a. Hãy sử dụng các thủ tục cần thiết trong SPSS để lập bảng thống kê mô tả, hãy mô
tả về thông tin biến dựa trên các đặc trưng thống kê thu được.
- Analyze/ Descritiw Statistiees/ Frequencies vào cửa sổ chọn giới tính trong variables
tuỳ chọn các lệnh tương ứng.sau khi xuất hiện kết quả ta nhấn đúp vào đồ thị, xuất hiện
cửa sổ Charts editor và đưa số liệu vào đồ thị.
- Elements/ Show data tables /chỉnh sửa đồ thị/click chuột phải/ properties window /
lựa chọn các lệnh tương ứng.
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
thunhap
44
.25
1.80
.7898
.41414
tieudung
44
.18
.95
.4539
.20308
Valid N (listwise)
44
thunhap
Frequency
Valid
.25
.30
.40
.50
.55
.65
.70
.80
1.00
1.10
1.40
1.50
1.80
Total
Percent
Valid Percent
Cumulative Percent
1
1
3
3
1
1
2
3
2
1
2
1
1
4.5
4.5
13.6
13.6
4.5
4.5
9.1
13.6
9.1
4.5
9.1
4.5
4.5
4.5
4.5
13.6
13.6
4.5
4.5
9.1
13.6
9.1
4.5
9.1
4.5
4.5
22
100.0
100.0
4.5
9.1
22.7
36.4
40.9
45.5
54.5
68.2
77.3
81.8
90.9
95.5
100.0
tieudung
Frequency
Valid
.18
.20
.23
.25
.30
.32
.38
.40
.45
.48
.50
.60
.65
.70
.78
.90
.95
Total
Percent
Valid Percent
Cumulative Percent
1
1
1
3
1
1
1
1
3
2
1
1
1
1
1
1
1
4.5
4.5
4.5
13.6
4.5
4.5
4.5
4.5
13.6
9.1
4.5
4.5
4.5
4.5
4.5
4.5
4.5
4.5
4.5
4.5
13.6
4.5
4.5
4.5
4.5
13.6
9.1
4.5
4.5
4.5
4.5
4.5
4.5
4.5
22
100.0
100.0
4.5
9.1
13.6
27.3
31.8
36.4
40.9
45.5
59.1
68.2
72.7
77.3
81.8
86.4
90.9
95.5
100.0
b. Vẽ biểu đồ histogram của thu nhập trên đó có vẽ đường cong chuẩn, hãy nhận
xét phân bố của biến thu nhập.
c . Hãy sử dụng các thủ tục cần thiết phân tích mối quan hệ giữa thu nhập và
tiêu dùng
Correlations
thunhap
thunhap
Pearson Correlation
tieudung
1
Sig. (2-tailed)
N
tieudung
Pearson Correlation
Sig. (2-tailed)
N
.975**
.000
44
44
**
1
.975
.000
44
44
**. Correlation is significant at the 0.01 level (2-tailed).
Hệ số tương quan bội giữa thu nhập và tiêu dùng có r = 0.975 nên nó có tương quan rất
chặt và đồng biến.Sig = 0,000< α = 0,05 .
Tiêu dùng
YAxis
Thu nhập
XAxis
Y = 0,08 + 0,48 *Y
Bài 2. Cho bảng số liệu doanh thu trong ngày của 2 cửa hàng của công ty như sau:
Cửa
Cửa
hàng 1
4.5 4.75 4.85 3.85 3.9 4.35 4.7 4.25 5.3 3.9 5.4 5.3 4.5 3.95 4.35
3.4 4.25 4.5 4.9 4.6 4.45 3.95 3
4.7 3.7 5.05 3.3 3.43 4.15 5.2
hàng
2
Hãy dùng
các thủ tục cần thiết trong SPSS để phân tích và so sánh doanh
thu của hai cửa hàng nói trên. Cửa hàng nào cho doanh thu cao hơn (giả
thiết rằng doanh thu trong ngày có phân bố gần phân bố chuẩn).
Group Statistics
cửa hàng
Doanh thu tiêu thụ
N
Mean
Std. Deviation
Std. Error Mean
cửa hàng 1
15
4.5233
.52504
.13556
cửa hàng 2
15
4.1720
.68471
.17679
*Bước 1: Kiểm định phương sai 2 mẫu :
H0 : Var1 = var 2
H1 : var1 ≠ var2
Nhìn vào bảng Independent Samples Test ta thấy: Cột Sig=0,216 > α =0,05 nên ta có
cơ sở chấp nhận H0
Phương sai 2 mẫu bằng nhau.
Independent Samples Test
Levene's Test for
Equality of
Variances
t-test for Equality of Means
95% Confidence
Interval of the
Sig. (2-
F
Sig.
t
df
tailed)
Mean
Std. Error
Difference Difference
Difference
Lower
Upper
Doanh Equal
thu
variances
tiêu
assumed
thụ
Equal
variances
not
1.604
.216
1.577
28
.126
.35133
.22279
-.10502
.80769
1.577
26.234
.127
.35133
.22279
-.10641
.80908
assumed
*Bước 2 : Kiểm định giá trị bình quân 2 mẫu.
H0: M1 = M2
H1: M1≠ M2
Vì phương sai của 2 mẫu bằng nhau: Sig ((2-tailed) = 0.126 > α = 0,05 nên có cơ sở
chấp thuận H0. Doanh thu tiêu thụ của 2 cửa hàng khác biệt không đáng kể. Với mức
độ tin cậy là 95%(hoặc mức ý nghĩa thống kê 5%) chúng ta luôn tin tưởng rằng doanh
thu tiêu thụ bình qn của 2 cửa hàng là khơng đáng kể.
Bài 3. Cho bảng số liệu lượng tiêu thụ sản phẩm của doanh nghiệp được ghi
theo mùa trong nhiều năm. Hãy thực hiện xử lý dữ liệu thích hợp, phân tích
ảnh hưởng của mùa tới lượng tiêu thụ của sản phẩm.
Descriptives
Tiêu Thụ
N
Xuân
Hạ
Thu
Đông
Total
20
20
20
20
80
Mean
5.355/a
5.595/a
5.340/a
4.670/b
5.240
Std. Deviation
.6755
.6917
.5744
.8202
.7655
Std. Error
.1510
.1547
.1284
.1834
.0856
95
Lower B
Multiple Compari
Dependent Variable: Tiêu Thụ
LSD
(I) Mùa
(J) Mùa
Xuân
Hạ
Thu
Đông
Xuân
Thu
Đông
Xuân
Hạ
Đông
Xuân
Hạ
Mean Difference (I-J)
Std. Error
Sig.
Hạ
Thu
Đông
Thu
*. The mean difference is significant at the 0.05 level.
-.2400
.0150
.6850*
.2400
.2550
.9250*
-.0150
-.2550
.6700*
-.6850*
-.9250*
.2201
.2201
.2201
.2201
.2201
.2201
.2201
.2201
.2201
.2201
.2201
.
.
.
.
.
.
.
.
.
.
.
-.6700*
.2201
.0
So sánh giá trị bình quân >= 3 mẫu độc lập
H0: M1 = M2 =M3 = M4
H1: Có ít nhất M ≠ khác biệt với các mùa cịn lại.Nhìn vào bảng ANOVA ta thấy: Cột
Sig ANOVA =0,001 < α =0,05 nên ta có cơ sở bác bỏ H0
Có ít nhất 1 mùa có số lượng tiêu thụ khác biệt đáng kể so với 3 mùa còn lại.
ANOVA
Tieuthu
Sum of Squares
df
Mean Square
F
Sig.
Between Groups
9.483
3
3.161
6.527
.001
Within Groups
36.809
76
.484
Total
46.292
79
*Xác định mùa có sự khác biệt đáng kể : Nhìn vào bảng Multiple Comparisons ta thấy:
Multiple Comparisons
Dependent Variable: Tieuthu
LSD
95% Confidence Interval
(I) Mua
(J) Mua
Mean Difference (I-J) Std. Error
Sig.
Lower Bound
Upper Bound
1
2
-.2400
.2201
.279
-.678
.198
3
.0150
.2201
.946
-.423
.453
4
.6850*
.2201
.003
.247
1.123
2
3
4
1
.2400
.2201
.279
-.198
.678
3
.2550
.2201
.250
-.183
.693
4
.9250
*
.2201
.000
.487
1.363
1
-.0150
.2201
.946
-.453
.423
2
-.2550
.2201
.250
-.693
.183
4
.6700*
.2201
.003
.232
1.108
1
-.6850
*
.2201
.003
-1.123
-.247
2
-.9250*
.2201
.000
-1.363
-.487
3
-.6700*
.2201
.003
-1.108
-.232
*. The mean difference is significant at the 0.05 level.
Cột Mean Difference (I-J) các dịng có dấu * có sự khác biệt đáng kể với mức ý nghĩa
thống kê 5%. Vì vậy mùa Đơng có số lượng tiêu thụ thấp hơn 1 cách đáng kể so với 3
mùa còn lại.
Bài 4: Một xưởng sản xuất ván ép, người ta sản xuất hai loại ván ép, loại 1 có bề
dày 10mm, loại 2 có bề dày 20mm. Sau đây là dữ liệu do bề dầy của các mẻ ép
của hai loại:
Loại ván
van10mm 9.87 9.89 10.03
van20mm 19.82 19.99 20.05
van10mm 10.08 10.01 9.93
van20mm 19.8 20.07 19.81
10.03
19.82
10.04
19.85
Bề dầy (mm)
9.97 9.86
20.14 20.37
9.87 9.87
20.07 19.82
9.99
20.03
9.89
19.99
10.13 9.99 10.04
19.97 19.92 20.01
10.03 10.03 9.97
20.05 19.82 20.14
Hãy phân tích xem sai số bề dầy có phụ thuộc vào loại ván sản xuất hay không?
Group Statistics
LOẠI
VÁN
ván
BỀ DÀY
10mm
ván
20mm
Std.
Std. Error
N
Mean
Deviation
Mean
20
9.9760/a
.07950
.01778
20
19.9770/b
.14815
.03313
Kiểm định T cho
= 9.9760 +(-
trường hợp phương
19.9770) = -266.016
sai khác nhau
Mức ý nghĩa thống
0.0000
kê (sig ,2 phía
Kết quả từ bảng 1.1 cho thấy bề dày cuả loại ván 20mm lớn hơn 1 cách đáng kể so với
bề dày loại ván 10mm(với mức ý nghĩa thống kê 5 %).
Independent Samples Test
Levene's Test
for Equality
of Variances
t-test for Equality of Means
95% Confidence
Sig.
(2-
F
Sig.
t
df
Interval of the
Mean
Std. Error
tailed) Difference Difference
Difference
Lower
Upper
BỀ
Equal
DÀY variances 5.304
.027
assumed
266.016
38
.000
-10.00100
.03760
29.104 .000
-10.00100
.03760
-
-
10.07711 9.92489
Equal
variances
-
not
266.016
-
-
10.07788 9.92412
assumed
Nhìn vào bảng Independent Samples Test cột Sig ta thấy:
Bởi vì cột sig dịng 1 = 0.027 < α = 0.05 nên bề dày 2 loại ván có sự khác biệt đáng kể
với sự khác biệt α = 0.05.
Bài 5: Tìm hiểu về nhu cầu sử dụng điện thoại, ơng Bình đã sử dụng bộ dữ liệu của
Singapore giai đoạn 1960-1981 với 2 biến sau:
TEL:
Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đơ la
Singapore năm 1968.
Năm
TEL
GDP
Năm (tt)
TEL
90
GD
P
2723
1960
36
1299
1971
1961
37
1365
1972
102
3033
1962
38
1409
1973
114
3317
1963
41
1549
1974
126
3487
1964
42
1416
1975
141
3575
1965
45
1473
1976
163
3784
1966
48
1589
1977
196
4025
1967
54
1757
1978
223
4286
1968
59
1974
1979
262
4628
1969
67
2204
1980
291
5038
1970
78
2462
1981
317
5472
a. Vẽ đồ thị phân tán điểm cho tập dữ liệu trên.
Biểu đồ 5.1 đồ thị phân tán điểm cho TEL và GDP.
b. Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương
sai, độ lệch chuẩn, đồng phương sai).
Descriptive Statistics
Std.
Minimu
Số lượng điện thoại
Thu nhập BQ đầu
người
Valid N (listwise)
Mean(Trung
Deviation(độ
Variance
N
m
Maximum
bình)
lệch chuẩn)
(phương sai)
22
36
317
116.82
88.483
7829.299
22
1299
5472
2812.05
1323.027
1750399.855
22
c. Hãy xác định hệ số tương quan tuyến tính giữa TEL và GDP. Giải thích ý
nghĩa của hệ số tương quan.
Model
Variables Entered/Removeda
Variables Entered
Variables Removed
Method
1
GDP binh quanb
a. Dependent Variable: Số điện thoại
b.
All requested variables entered.
.
Enter
Model Summary
Model
R
1
.973a
a.
Predictors: (Constant), GDP binh quan
R Square
.946
Descriptive Statistic
Mean
Số lượng điện thoại
Thu nhập BQ đầu người
116.82
2812.05
Correlations
Số lượng điện thoại
Số lượng điện thoại(TEL)
Pearson Correlation
1
Sig. (2-tailed)
N
Thu nhập BQ đầu người(GDP)
Pearson Correlation
22
.973**
Sig. (2-tailed)
.000
N
22
**. Mức ý nghĩa thống kê 1% Correlation is significant at the 0.01 level (2-tailed).
R = 0,973 nên giữa GDP và Tel có mối quan hệ đồng biến tương quan rất chặt .
*Giải thích ý nghĩa của hệ số tương quan: Vì hệ số tương quan bội (Pearson
Cerelation = 0.973) nên giữa GDP và TEL có mối quan hệ rất chặt và đồng biến (với
mức ý nghĩa thống kê 1%).
d. Xây dựng mơ hình hồi quy giữa TEL và GDP.
TEL= β0+ β1*GDP
Trong đó:
β0:Hệ số chẵn
β 1:Hệ số góc.
Mơ hình hồi quy tuyến tính đơn nên phải kiểm định các giả thiết.
Dựa vào biểu đồ 5.3 ta thấy đồ thị của biến TEL bị lệch phải.Vì vậy chúng ta phải thực
hiện chuyển đổi biến bằng lệnh Transform.
LnTEL = Ln(TEL)
LnGDP= Ln(GDP)
LnTEL= β0+ β1 LnGDP
Variables Entered/Removeda
Model
Variables Entered
Variables Removed
Method
lnGDPb
1
. Enter
a. Dependent Variable: lnTEL
b. All requested variables entered.
Model Summaryb
Std. Error of the
Model
R
R Square
a
1
.990
Adjusted R Square
.980
Estimate
.979
Durbin-Watson
.10682
.309
a. Predictors: (Constant), lnGDP
b. Dependent Variable: lnTEL
ANOVAa
Model
1
Sum of Squares
Regression
Mean Square
F
11.039
1
11.039
.228
20
.011
11.267
21
Residual
Total
df
Sig.
.000b
967.330
a. Dependent Variable: lnTEL
b. Predictors: (Constant), lnGDP
Coefficientsa
Standardized
Unstandardized Coefficients
Model
1
B
(Constant)
lnGDP
Coefficients
Std. Error
Beta
-7.265
.379
1.502
.048
t
.990
Sig.
-19.170
.000
31.102
.000
a. Dependent Variable: lnTEL
Residuals Statisticsa
Minimum
Predicted Value
Maximum
Mean
Std. Deviation
N
3.5043
5.6645
4.5007
.72502
22
-.17634
.15550
.00000
.10425
22
Std. Predicted Value
-1.374
1.605
.000
1.000
22
Std. Residual
-1.651
1.456
.000
.976
22
Residual
a. Dependent Variable: lnTEL
Bài 6: Tìm hiểu về năng suất của của loại cây trồng Y khi bón phân bón loại X
người ta ghi nhận số liệu gồm 2 dữ liệu đó là lượng phân bón (tạ/ha) và năng suất
(tạ/ha) trong thời gian 10 năm từ năm 1965 đến năm 1975. Anh chị hãy ước lượng
mơ hình hồi quy năng suất phụ thuộc vào mức phân bón và trả lời các câu hỏi.
a. Mức phân bón X có ảnh hưởng đến năng suất của cây trồng Y? Viết câu lệnh và
kết quả thu được.
b. Viết câu lệnh tính và giải thích ý nghĩa của mơ hình.
c. Với mức bón phân X 20 tạ/ha hãy dự báo năng suất. Viết câu lệnh và kết quả thu
được.
NĂM
1991
1992
1993
LUONGPHAN
(TA/HA)
1.8
1.9
2.1
NANGSUAT
(TA/HA)
3.7
3.8
3.7
NĂM LUONGPHAN(
TA/HA)
2004 4
2005 4.1
2006 4.2
NANGSUAT
(TA/HA)
4.9
5
5.1
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2.6
3
3.1
3.2
3.3
3.5
3.6
3.7
3.8
3.9
3
4
4.1
4.2
4.3
4.5
4.5
4.6
4.7
4.8
2007
2008
2009
2010
2011
2012
2013
2014
2015
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
6
6.5
a. Mức phân bón X có ảnh hưởng đến năng suất của cây trồng Y? Viết câu lệnh
và kết quả thu được.
Descriptive Statistics
N
LUONGPHAN(TA/HA)
NANGSUAT (TA/HA)
Valid N (listwise)
Mean
25
25
25
Std. Deviation
4.148
5.192
1.2962
1.1128
Variance
1.680
1.238
a.