THÔNG TIN VỀ LUẬN VĂN THẠC SĨ
1. Họ và tên học viên:
PHẠM THỊ HƯƠNG
2. Giới tính: Nữ
3. Ngày sinh:
27/11/1984
4. Nơi sinh: Hà Nội
5. Quyết định công nhận học viên số:
, ngày
tháng
năm
6. Các thay đổi trong quá trình đào tạo:
(ghi các hình thức thay đổi và thời gian tương ứng)
7. Tên đề tài luận văn:
Hồi quy bội tuyến tính, hồi quy phi tuyến và ứng dụng
8. Chuyên ngành: Lý thuyết xác suất và thống kê toán 9. Mã số:13005233
10. Cán bộ hướng dẫn khoa học:
GS.TSKH ĐẶNG HÙNG THẮNG
Khoa Toán – Cơ – Tin học, Đại Học Khoa Học Tự Nhiên Hà Nội.
11. Tóm tắt các kết quả của luận văn:
Phân tích hồi quy là phương pháp có ứng dụng rộng rãi nhất trong các
phương pháp thống kê. Hiện nay, các mô hình hồi quy được sử dụng nhiều trong
quản trị kinh doanh, kinh tế, kỹ thuật và xã hội, y tế, khoa học và sinh học…..Các
mô hình hồi quy rất đa dạng bao gồm: hồi quy tuyến tính, hồi quy phi tuyến. Trong
các loại mô hình gồm nhiều dạng nhỏ khá phức tạp. Ứng dụng thành công của các
mô hình đòi hỏi một sự hiểu biết sâu về cả lý thuyết cơ bản và những vấn đề thiết
thực mà đang gặp phải trong việc sử dụng các mô hình trong các tình huống thực tế
cuộc sống. Đề tài: “Hồi quy tuyến tính bội, hồi quy phi tuyến và ứng dụng” là một
tài liệu có pha trộn lý thuyết và ứng dụng nên tránh những thái cực của các cơ sở lý
thuyết thuần túy.
Luận văn được tổ chức thành các chương rõ ràng và theo luồng của đề tài.
Hồi quy tuyến tính đơn là mô hình hồi quy chỉ liên quan đến một biến dự báo. Vì
vậy nhiều khi rất thiếu thông tin để có thể đánh giá được đúng tình trạng thực tế của
mô hình. Do đó cần nghiên cứu mô hình bao gồm nhiều biến dự báo cho kết quả
đáp ứng được chính xác hơn, đó là mô hình hồi quy tuyến tính bội. Trong chương 1,
luận văn có nhắc lại một số kiến thức cơ bản về hồi quy tuyến tính đơn, vì những
kết quả này là nền tảng để có những phân tích trong hồi quy tuyến tính bội. Tiếp
đó, trong chương có trình bày về sự cần thiết phải đưa ra nhiều biến dự báo thay cho
một biến dự báo và đưa ra mô hình hồi quy tuyến tính tổng quát. Luận văn cũng đưa
ra các dạng khác nhau của mô hình, mà thực chất sau khi biến đổi thì cũng đưa về
mô hình hồi quy tuyến tính tổng quát: hồi quy đa thức, hồi quy với biến định tính,
hồi quy với các biến có ảnh hưởng tương tác, …..thậm chí là sự kết hợp của các
dạng khác nhau trong cùng một mô hình. Luận văn cũng trình bày dạng ma trận của
mô hình và các kết quả phân tích có được từ dạng ma trận. Các kết quả tính toán ở
dạng ma trận được sử dụng từ hồi tuyến tính đơn được mở rộng cho trường hợp của
hồi quy tuyến tính bội với nhiều hơn một biến dự báo. Từ đó đưa ra các ước lượng
cho các tham số, ước lượng mẫu và ước lượng phần dư của mô hình. Luận văn cũng
trình bày những kết quả phân tích phương sai, hệ số xác định bội và hệ số tương
quan. Sau đó là kết luận về các tham số hồi quy, đưa ra các ước lượng khoảng tin
cậy đối xứng và và các kiểm định cho tham số hồi quy. Khi đưa ra được mô hình
phù hợp, tài liệu cũng đề cập đến việc ước lượng giá trị trung bình của mô hình và
ước lượng cho việc dự báo các quan sát mới. Vấn đề đặt ra cần cẩn trọng với phép
ngoại suy ẩn. Tuy nhiên luận văn cũng đưa ra việc chẩn đoán dựa vào các biểu đồ,
các bài toán kiểm định và từ đó có biện pháp khắc phục phù hợp.
Chương 2: Hồi quy phi tuyến và mô hình mạng Nơron. Hồi quy phi tuyến
là mô hình không tuyến tính đối với các tham số. Chương 2 đưa ra mô hình hồi quy
tổng quát từ đó có thể thấy được điểm chung của hồi quy phi tuyến và hồi quy tuyến
tính. Tuy nhiên cũng phân tích để thấy được điểm khác nhau giữa hai dạng mô hình
này. Trong luận văn cũng trình bày hai ví dụ về mô hình hồi quy phi tuyến được sử
dụng rộng rãi trong thực tế đó là: mô hình hồi quy dạng mũ và mô hình hồi quy
logistic. Chương này cũng đưa ra các ước lượng cho mô hình thông qua các thủ tục
tìm kiếm, từ đó xây dựng và chẩn đoán mô hình. Luận văn cũng đưa ra các kết luận
về tham số hồi quy phi tuyến trên cơ sở lý thuyết mẫu lớn. Từ đó đưa ra các ước
lượng khoảng cho các tham số và kiểm định tính liên quan của các tham số trong
mô hình. Trong chương 2, luận văn cũng đưa ra một mô hình có ứng dụng rất rộng
rãi trong thực tế mà đặc biệt là trong lĩnh vực tìm kiếm số liên quan đến lượng lớn
dữ liệu: Mô hình mạng Nơ ron. Các ước lượng tham số cho mô hình mạng Nơ ron
cũng được đưa ra.
Chương 3: Ứng Dụng. Đề cập đến các áp dụng của mô hình hồi quy tuyến
tính bội và hồi quy phi tuyến ngoài thực tế. Trong mỗi áp dụng có nhấn mạnh đến
việc xây dựng mô hình, ước lượng tham số và đánh giá mô hình. Đối với hồi quy
tuyến tính bội đề cập đến ứng dụng dự báo doanh số bán hàng của Dwaine studios.
Từ số liệu của 21 thành phố mà studios đang hoạt động, thông qua các tính toán cơ
bản đưa ra ước lượng cho mô hình, sau đó phân tích sự phù hợp của mô hình thông
qua các ước lượng khoảng tin cậy và kiểm định. Ngoài ra áp dụng còn chỉ ra việc
dự báo cho việc mở rộng địa điểm kinh doanh của studio. Đối với hồi quy phi tuyến
có 3 áp dụng. Áp dụng về dự báo mức độ phục hồi sau khi xuất viện: dự báo mức
độ phục hồi dài hạn sau khi xuất viện cho các bệnh nhân bị thương nặng. Dữ liệu
nghiên cứu cho 15 bệnh nhân, thông qua các thủ tục tìm đưa ra mô hình phi tuyến
và đánh giá sự phù hợp của mô hình. Áp dụng thứ hai của mô hình phi tuyến là
đường cong học tập là việc so sánh sự hiệu quả học tập của các địa điểm khác nhau,
ở đây là địa điểm A và B. Dữ liệu đưa ra cho 30 quan sát là từ đó tính toán đưa ra
mô hình. Áp dụng thứ ba của mô hình hồi quy phi tuyến là về bệnh thiếu máu cơ
tim. Dữ liệu đưa ra từ quan sát 788 người bị phát sinh từ bệnh tim mạch vành. Thực
hiện tính toán và đưa ra mô hình thông qua các tham số được ước lượng.
12. Khả năng ứng dụng trong thực tiễn: (nếu có)
13. Những hướng nghiên cứu tiếp theo: (nếu có)
14. Các công trình đã công bố có liên quan đến luận văn:
(liệt kê các công trình theo tứ tự thời gian nếu có)
Ngày 10 tháng 12 năm 2015
Học viên
Phạm Thị Hương
INFORMATION ON MASTER’S THESIS
1. Full name:
PHAM THI HUONG
2. Sex: Female
3. Date of birth:
27/11/1984
4. Place of birth: Ha Noi
5. Admission decision number:
Dated
6. Changes in academic process:
7. Official thesis title:
Multiple regression, nonlinear regresstion and application
8. Major:
Probability theory and mathematical statistics
9. Code:13005233
10. Supervisors:
GS.TSKH DANG HUNG THANG
Faculties Mathematics, Mechanics and Informatics; Ha Noi University of Science
11. Summary of the finding of the thesis:
Regression analysis is the method most widely used in the statistical
methods. Today, the regression model was used extensively in business
administration, economics, engineering and the social, health, science and
biology ... The regression models are varied, including: linear regression, nonlinear
regression. In these types of models include small types is complicated. Successful
application of the model requires a deep understanding of both basic theory and
practical problems that are encountered in the use of models in real-life situations.
Thesis: "multiple linear regression, nonlinear regression and application" is a
document that blends theory and application should avoid the extremes of a purely
theoretical basis.
The thesis is organized into clear chapters and the flow of the subject.
Simple linear regression is the regression model involves only one predictor
variables. So much as a lack of information in order to assess the actual condition of
the correct model. Therefore research model includes many variables forecast
results met more precisely, it is a linear regression model bumper. In chapter 1, the
thesis has recalled some basic knowledge about the application of linear regression,
because these results are the foundation for the analysis of multiple linear
regression. Then, in chapter provides information about the need to make many
changes forecast rather than a predictor variables and given models generalized
linear regression. The thesis also describes different types of models, substantially
after the change, it also brought about a linear regression model overview:
polynomial regression, regression with qualitative variables, regression with the
variables Interactive influence ... even a combination of different forms of the same
model. Thesis is presented as matrix of the model and the analysis results obtained
from the matrix. The calculation results in the form of a matrix used in the linear
unit from being extended to the case of a multiple linear regression to predict more
than one variable. Since then made estimates of the parameters, sample estimates
and estimates of model residuals. The dissertation also presents the results of
analysis of variance, coefficient of determination and multiple correlation
coefficients. Then the conclusion of the regression parameters, making the estimates
and confidence intervals are symmetric and parametric testing for regression. When
given by pattern matching, document also refers to the estimated average value of
modeling and forecasting estimates for the new observations. The question needs to
be careful with hidden extrapolation. However thesis also make the diagnosis based
on the chart, the verification problem and from there appropriate remedies.
Chapter 2: Nonlinear Regression and Neural Network model. Nonlinear
regression is a nonlinear model for the parameters. Chapter 2 provides a general
regression model which can be seen from the general point of nonlinear regression
and linear regression. But also analyzed to see the differences between the two
types of models. In the thesis also presents two examples of nonlinear regression
model is widely used in practice are: exponential regression models and logistic
regression models. This chapter also provides estimates for the model through the
search procedures, thus building and diagnostic models. The dissertation also
describes the conclusion of parameter nonlinear regression based on large sample
theory. From there make estimates about the parameters and test the relevance of
these parameters in the model. In chapter 2, the thesis also provides a model that is
widely applied in practice, especially in the field of search involving large amounts
of data: neural network model. The parameter estimates for the neural network
model is also given.
Chapter 3: Applied. Referring to the application of the linear regression
model nonlinear regression deficit and external reality. In each application with
emphasis on modeling, parameter estimation and model evaluation. For a multiple
linear regression application refers to forecast sales of Dwaine studios. From the
data of 21 cities that studios are operating, through basic calculation giving
estimates for the model, then analyze the appropriateness of the model through the
estimates and confidence intervals tested. Also applies also pointed out the forecast
for the expansion of the business location of the studio. For non-linear regression
with 3 applies. Applies to forecast the strength of recovery after discharge: the
forecast level of long-term recovery after hospital discharge for patients with
serious injuries. Research data for 15 patients, through the search procedure given
nonlinear model and assess the appropriateness of the model. Apply second
nonlinear model is the learning curve is to compare the academic performance of
the different locations, here is the location A and B. The data for the 30
observations made from it made model calculations. Apply third nonlinear
regression model is ischemic heart disease. The data from observations made 788
persons arising from coronary heart disease. Perform calculations and given models
through the parameters are evaluated.
12. Practical applicability:
13. Further research directions:
14. Thesis-related publications:
Date:10/12/2015
Signature:
Full name: Phạm Thị Hương