Tải bản đầy đủ (.pdf) (122 trang)

Nghiên cứu ứng dụng machine learning trong dự đoán chỉ số giá xây dựng công trình dân dụng tại thành phố hồ chí minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (12.6 MB, 122 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

-------- ∞0∞--------

TRẦN VŨ NGHIÊM

NGHIÊN CỨU ỨNG DỤNG
MACHINE LEARNING TRONG DỰ ĐỐN CHỈ SỐ
GIÁ XÂY DỰNG CƠNG TRÌNH DÂN DỤNG
TẠI THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ
XÂY DỰNG CƠNG TRÌNH DÂN DỤNG VÀ CƠNG NGHIỆP

TP. HỒ CHÍ MINH, NĂM 2020
1


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

-------- ∞0∞--------

TRẦN VŨ NGHIÊM

NGHIÊN CỨU ỨNG DỤNG
MACHINE LEARNING TRONG DỰ ĐỐN CHỈ SỐ
GIÁ XÂY DỰNG CƠNG TRÌNH DÂN DỤNG
TẠI THÀNH PHỐ HỒ CHÍ MINH
Chuyên ngành: Xây dựng cơng trình dân dụng và cơng nghiệp


Mã số chun ngành: 60 58 02 08
LUẬN VĂN THẠC SĨ
XÂY DỰNG CƠNG TRÌNH DÂN DỤNG VÀ CÔNG NGHIỆP
Giảng viên hướng dẫn: TS. NGUYỄN THANH PHONG
TP. HỒ CHÍ MINH, NĂM 2020
2


TRƯỜNG ĐẠI HỌC MỞ
THÀNH PHỐ HỒ CHÍ MINH
KHOA ĐÀO TẠO SAU ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc

GIẤY XÁC NHẬN

Tôi tên là: TRẦN VŨ NGHIÊM
Ngày sinh: 27/07/1991

Nơi sinh: Bình Định

Chuyên ngành: Xây dựng dân dụng và công nghiệp

Mã học viên: 1685802080003

Tôi đồng ý cung cấp tồn văn thơng tin luận văn tốt nghiệp hợp lệ về bản quyền cho
Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học Mở
Thành phố Hồ Chí Minh sẽ kết nối tồn văn thơng tin luận văn tốt nghiệp vào hệ thống
thông tin khoa học của Sở Khoa học và Cơng nghệ Thành phố Hồ Chí Minh.

Ký tên
(Ghi rõ họ và tên)


d2

ceNG ndn xA ngr cu0 Ncnia. vrET NAM
D6c lf,p

-

Tu do

-

Hanh phlic

''f Xrnx CHO PHEP nAo VE LUAN vAN THAC
CUA GIANG VINN rrrTdNC DAN

si

.-\
\
J
Hsc vi6n thuc hiQn: . TP.IN...{!1...Nft11.8N...
Nedy sinh: . AU.oX

ran


cr6

tai:

frrry

{

l.lgg n.

Noi sinh: ...&til.. e'd..

...hhli& qi^i d ,tq
f*6 *N aJ ?{

4rg....Pi...nt*.fr1 ....No..chi*- ..t*ot*rg-,,,...

N dw ry fffi de *a
r\u

'f

Uen ctu gi6o vi6n hu6ng adn vC vi6c cho ph6p hec vi6n..

.IR/N.. yQ.. Mg*fEU...

duoc bAo vQ luQn vdn tru6c H6i d6ng:

b.dr,


.G. ......1.t+[.+.......q44-"+.

Thdnh

phii

ruA Cnt

Urnh, ngdy..4{.thdng ..?... ndm 20tO

Ngudi nh0nx6t

7\7r.Nguyril

=----

{.K*nk..Pk^'f


1

LỜI CAM ĐOAN

Tôi xin cam đoan Luận văn “ NGHIÊN CỨU ỨNG DỤNG MACHINE
LEARNING TRONG DỰ ĐOÁN CHỈ SỐ GIÁ XÂY DỰNG CƠNG TRÌNH
DÂN DỤNG TẠI THÀNH PHỐ HỒ CHÍ MINH” là đề tài nghiên cứu thật sự của
cá nhân tôi, được thực hiện dựa trên cơ sở nghiên cứu lý thuyết tính tốn và số liệu
dưới sự hướng dẫn của: TS. NGUYỄN THANH PHONG.
Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tơi cam đoan
rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc

được sử dụng để nhận bằng cấp ở những nơi khác.
Khơng có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này
mà khơng được trích dẫn theo đúng quy định.
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại
học hoặc cơ sở đào tạo khác.

TP. HCM, ngày……tháng……năm 2020.
HỌC VIÊN

TRẦN VŨ NGHIÊM


2

LỜI CẢM ƠN
Để hoàn thành Luận văn này, ngoài sự cố gắng và nỗ lực của bản thân, tôi đã
nhận được sự giúp đỡ từ nhiều từ tập thể và các cá nhân. Tơi xin ghi nhận và tỏ lịng
biết ơn đến tập thể và các cá nhân đã giúp đỡ tôi một cách chân thành.
Tôi xin bày tỏ sự biết ơn sâu sắc đến Thầy TS. NGUYỄN THANH PHONG,
Trưởng Bộ Môn Quản lý Dự Án XD, Trường Đại học Mở Thành Phố Hồ Chí Minh.
Thầy đã góp ý cho tôi rất nhiều về cách nhận định đúng đắn trong những vấn đề
nghiên cứu, cũng như cách tiếp cận giải quyết vấn đề nghiên cứu sao cho hiệu quả.
Tôi cũng xin bày tỏ lòng biết ơn đối với các thầy cô trong Khoa Xây dựng và Khoa
Sau Đại Học, Trường Đại học Mở Thành Phố Hồ Chí Minh đã tạo điều kiện thuận
lợi nhất cho tơi trong q trình học tập, nghiên cứu.
Luận văn tốt nghiệp đã hoàn thành trong thời gian quy định với sự nỗ lực của
bản thân, tuy nhiên khơng thể khơng có những thiếu sót. Kính mong Quý Thầy/Cô
chỉ dẫn thêm để tôi bổ sung những kiến thức và hoàn thiện hơn.
Xin trân trọng cảm ơn.


TP.HCM, ngày ….. tháng ….. năm 2020.
HỌC VIÊN

TRẦN VŨ NGHIÊM


3

TÓM TẮT LUẬN VĂN THẠC SĨ

NGHIÊN CỨU ỨNG DỤNG MACHINE LEARNING TRONG DỰ
ĐỐN CHỈ SỐ GIÁ XÂY DỰNG CƠNG TRÌNH DÂN DỤNG TẠI
THÀNH PHỐ HỒ CHÍ MINH
TĨM TẮT:
Đề tài nghiên cứu ứng dụng Machine Learning trong dự đoán chỉ số giá xây
dựng cơng trình dân dụng là cơng trình nghiên cứu về các yếu tố gây ảnh hưởng đến
chỉ số giá xây dựng, bằng các phương pháp lập bảng câu hỏi khảo sát ý kiến của
chuyên gia, từ đó rút ra những yếu tố quan trọng nhất và thu thập số liệu của những
yếu tố này để làm dữ liệu đầu vào cho mơ hình dự đốn, xây dựng mơ hình ứng dụng
Machine Learning, cụ thể là Phương pháp KNN (K-Nearest Neighbor), từ cơ sở dữ
liệu về chỉ số giá xây dựng, các chỉ số kinh tế, tài chính, xã hội… thu thập được từ
Sở Xây dựng và Cục Thống kê TP, dựa vào kết quả dự đoán dữ liệu mới sau khi chạy
mơ hình, tiến hành so sánh chỉ số giá xây dựng đã dự đoán với chỉ số giá xây dựng
thực tế đã được Sở Xây dựng công bố và tính tốn sai số. Kết luận và kiến nghị về độ
chính xác và tính ứng dụng của mơ hình dự đốn. Từ đó đề xuất cách tính tốn chi
phí dự phịng.


4


RESEARCH ON THE APPLICATION OF MACHINE LEARNING IN
THE PROJECT OF CONSTRUCTION PRICE INDICATOR FOR CIVIL
WORKS IN HO CHI MINH CITY

ABSTRACT: The research topic of Machine Learning in predicting the price
index of civil works is the study of the factors affecting the construction price index,
by the methods of preparing questionnaires. expert's opinion, from which to draw the
most important factors and collect data of these factors to make input data for
prediction model, build machine learning application model, namely KNN method
(K-Nearest Neighbor), from the database of construction price indexes, economic,
financial, social indicators ... collected from the Department of Construction and the
Municipal Statistics Office, based on the results. Predict new data after running the
model, compare the predicted construction price index with the actual construction
price index announced by the Department of Construction and calculate the error.
Conclusions and recommendations on the accuracy and applicability of the prediction
model. From there propose a way to calculate contingency costs.


4

MỤC LỤC
CHƯƠNG 1 : MỞ ĐẦU .................................................................................. 8
1.1 ĐẶT VẤN ĐỀ:........................................................................................... 8
1.2 MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI: .............................................. 9
1.3 CÂU HỎI NGHIÊN CỨU: ........................................................................ 9
1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU: ........................................ 10
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN .............................................. 10
Ý nghĩa khoa học ......................................................................10
Ý nghĩa thực tiễn .......................................................................10
CHƯƠNG 2 : TỔNG QUAN ......................................................................... 12

2.1 CƠ SỞ LÝ THUYẾT VỀ MACHINE LEARNING ............................... 12
2.2 CHỈ SỐ GIÁ XÂY DỰNG ................................................................. 15
2.2.1 Khái niệm ................................................................................15
2.2.2 Phân loại ..................................................................................15
2.2.3 Giải thích một số thuật ngữ .................................................16
2.3 PHƯƠNG PHÁP XÁC ĐỊNH CHỈ SỐ GIÁ XÂY DỰNG............ 17
2.3.1 Xác định chỉ số giá xây dựng cơng trình .........................17
2.3.2 Xác định các chỉ số theo yếu tố chi phí ..........................18
2.3.3 Xác định các chỉ số theo cơ cấu chi phí ..........................21
2.4 THU THẬP DỮ LIỆU BẰNG PHƯƠNG PHÁP PHỎNG VẤN ........... 24
2.5 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC VÀ THẾ GIỚI ............... 26
2.5.1 Các nghiên cứu trong nước .......................................................26
2.5.2 Các nghiên cứu trên thế giới .....................................................27
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU ........................................... 29


5

3.1 QUY TRÌNH NGHIÊN CỨU .................................................................. 29
3.2 PHƯƠNG PHÁP KHẢO SÁT BẢNG CÂU HỎI................................... 31
3.2.1 Giới thiệu chung ........................................................................31
3.2.2 Các bước thực hiện ...................................................................31
3.2.3 Xử lý dữ liệu .............................................................................33
3.3 THUẬT TOÁN KNN (K-NEAREST NEIGHBOR) ........................... 34
3.3.1 Định nghĩa ................................................................................34
3.3.2 Ý tưởng của KNN .................................................................35
3.3.3 KNN cho Regression ..............................................................38
3.3.4 Sai số tồn phương trung bình ..................................................39
3.3.5 Ví dụ minh họa ..........................................................................39
CHƯƠNG 4: XÂY DỰNG MƠ HÌNH ......................................................... 44

4.1 XÁC ĐỊNH DỮ LIỆU ĐẦU VÀO .......................................................... 44
4.1.1 Tổng quan các yếu tố ảnh hưởng CCI ......................................44
4.1.2 Khảo sát ý kiến chuyên gia và chọn ra các yếu tố chính ..........44
4.1.3 Chọn các yếu tố chính ...............................................................45
4.1.4 Sự tương quan giữa biến đầu vào và CCI .................................50
4.2 THỰC THI BÀI TOÁN BẰNG PYTHON ............................................ 52
4.3 ĐỀ XUẤT CÁCH TÍNH TỐN CHI PHÍ DỰ PHÒNG ........................ 70
CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ ................................................. 77
5.1 KẾT LUẬN .............................................................................................. 77
5.2 HẠN CHẾ ................................................................................................ 78
5.3 KIẾN NGHỊ ............................................................................................. 79
TÀI LIỆU THAM KHẢO .............................................................................. 80


6

DANH MỤC HÌNH ẢNH
Hình 2.1: MNIST: bộ cơ sở dữ liệu của chữ số viết tay.
Hình 3.1: Hình ảnh mơ phỏng thuật tốn KNN
Hình 3.2: Cơng thức tính khoảng cách giữa các điểm dữ liệu
Hình 3.3: Quy ntrình nthực nhiện ncủa nthuật ntốn nKNN
Hình 3.4: Đồ thị so sánh giữa kết quả dự đốn và dữ liệu đầu vào
Hình 3.5: Biểu đồ ví dụ minh họa
Hình 3.6: Biểu đồ ví dụ minh họa
Hình 3.7: Biểu đồ ví dụ minh họa
Hình 4.1: Màn hình code
Hình 4.2: Màn hình code
Hình 4.3: Dữ liệu đầu vào
Hình 4.4: Màn hình code
Hình 4.5: Màn hình code

Hình 4.6: Màn hình code
Hình 4.7: Màn hình code
Hình 4.8: Biểu đồ tương quan giữa K và MSE
DANH MỤC BẢNG
Bảng 3.1: Sơ đồ nghiên cứu
Bảng 3.2: Sơ đồ xác định các yếu tố ảnh hưởng đến chỉ số giá xây dựng
Bảng 3.3: Thang đo mức độ quan trọng
Bảng 3.4: Bảng dữ liệu ví dụ minh họa
Bảng 4.1. Các yếu tố ảnh hưởng đến chỉ số giá xây dựng
Bảng 4.2. Kết quả khảo sát
Bảng 4.3. Các yếu tố đầu vào cho mơ hình
Bảng 4.4. Bảng dữ liệu các yếu tố đầu vào cho mơ hình
Bảng 4.5: Thống kê hệ số tương quan Pearson giữa các biến đầu vào với CCI
Bảng 4.6. Bộ dữ liệu huấn luyện cho mơ hình


7

Bảng 4.7. Bộ dữ liệu kiểm tra và đánh giá mơ hình
Bảng 4.8: Kết quả MSE với K tương ứng
Bảng 4.9: Kết quả của mơ hình dự đốn chỉ số giá xây dựng
Bảng 4.10: Phân bổ vốn đầu tư theo tiến độ thực hiện
Bảng 4.11: Tính mức độ trượt giá bình qn
Bảng 4.12: Tính chi phí dự phịng theo yếu tố trượt giá
Bảng 4.13: Dữ liệu đầu vào cho mô hình dự đốn chỉ số giá xây dựng theo từng
năm
Bảng 4.14: Tính mức độ trượt giá bình qn từ kết quả của mơ hình
Bảng 4.15: Chi phí dự phịng cho yếu tố trượt giá (theo kết quả từ mơ hình)
Bảng 4.16: Kết quả chi phí dự phịng tính theo các cách khác nhau


MỘT SỐ KÝ HIỆU VÀ VIẾT TẮT
CCI

: Chỉ số giá xây dựng

KNN

: K-Nearest Neighbor

TP.HCM

: Thành phố Hồ Chí Minh


8

CHƯƠNG 1 : MỞ ĐẦU
1.1 ĐẶT VẤN ĐỀ:
Trong ngành xây dựng, chi phí (money) là một trong những phần tử quan trọng
hình thành nên sản phẩm cơng trình xây dựng. Nó là một trong năm chữ M (5M)
quan trọng của cơng tác quản lý thi cơng cơng trình xây dựng hiện đại cùng với vật
tư (Material), móc thiết bị (machine), nhân công (man), và nhà quản lý hoặc sự quản
trị (manager/management).
Ngồi ra, việc ước lượng chi phí cho các dự án đầu tư xây dựng cơng trình
ln ln là một thách thức không nhỏ trong ngành công nghiệp xây dựng bởi vì bản
chất của ngành cơng nghiệp xây dựng được đặc trưng bởi sự biến đổi của tình hình
kinh tế - xã hội trong nước và ngồi nước nên nó chịu chi phối của nhiều yếu tố như
chỉ số giá tiêu dùng, giá trị sản xuất công nghiệp, giá trị đầu tư xây dựng, lạm phát,
lãi suất cơ bản, tỷ giá hối đối, v.v.. Đặc biệt là ước tính mức độ biến động của giá
nhân công xây dựng và chi phí vật liệu là khơng hề đơn giản bởi vì mỗi dự án xây

dựng là duy nhất về công việc cũng như vật liệu (Wang & Mei, 1998).
Các dự án đầu tư xây dựng thường được thực hiện trong một khoảng thời gian
dài, do đó dẫn đến chi phí, giá cả của vật liệu xây dựng, máy móc thiết bị, nhân cơng
có thể biến động một cách đáng kể. Vì vậy, trong giai đoạn lập kế hoạch cho một dự
án việc làm cách nào để đối phó và dự đốn các vấn đề chi phí, giá cả thay đổi theo
thời gian vẫn cịn là một vấn đề lớn. Qua đó, chúng ta nhận thấy nếu dự đốn chính
xác mức độ trượt giá của chi phí sẽ đem lại hiệu quả cho việc thực hiện dự án xây
dựng của tất cả các bên tham gia dự án. Đối với các nhà thầu, khả năng dự đốn chi
phí có thể cho phép họ kết hợp các biến động giá dự kiến vào chiến lược đấu thầu và
mua sắm nguồn vật tư, máy móc. Đối với chủ đầu tư, để có kế hoạch chuẩn bị đầu tư
tốt hơn họ cũng có thể sử dụng thơng tin dự đốn này.
Trong thực tế lập và quản lý dự án đầu tư xây dựng cơng trình, cán bộ quản lý
dự án hay người lập dự toán thường sử dụng chỉ số giá xây dựng (còn gọi là chỉ số
chi phí xây dựng), thường ký hiệu là CCI (Construction Cost Index). Chỉ số giá cung


9

cấp thơng tin về những thay đổi trong chi phí các ngành công nghiệp được gây ra bởi
một sự kết hợp của các biến về giá nhân công, vật tư, thiết bị. Chỉ số giá xây dựng
(CCI) rất quan trọng trong việc hỗ trợ ước tính chính xác chi phí của dự án, chuẩn bị
ngân sách trong giai đoạn hoạch định dự án xây dựng và đồng thời quản lý, kiểm sốt
chi phí trong suốt các vịng đời của dự án xây dựng.
Ngoài ra, chỉ số giá xây dựng giúp doanh nghiệp xây dựng nhận biết được xu
thế, tình hình biến động và định hướng thị trường xây dựng. Nó cịn dùng làm cơng
cụ để xác định và điều chỉnh chỉ tiêu tổng mức đầu tư dự án, dự toán chi phí xây dựng
cơng trình, điều chỉnh giá trị hợp đồng, thanh quyết toán hợp đồng, quy đổi vốn đầu
tư. v.v.
Do đó đề tài nghiên cứu “Nghiên cứu ứng dụng Machine Learning trong dự
đốn chỉ số giá xây dựng cơng trình dân dụng” là hồn tồn tất yếu.


1.2 MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI:
 Mục tiêu tổng quát:
Tìm hiểu được các phương pháp dự đoán trong ngành xây dựng; từ đó, xác định
các yếu tố ảnh hưởng đến chỉ số giá xây dựng và xây dựng mơ hình dự đoán chỉ số
giá xây dựng.
 Mục tiêu cụ thể:
(i) Xác định các yếu tố ảnh hưởng đến chỉ số giá xây dựng (Construction Cost
Index) của cơng trình dân dụng tại TP.HCM.
(ii) Ứng dụng Machine Learning và xây dựng một mô hình dự đốn chỉ số giá
xây dựng cơng trình dân dụng dựa vào các số liệu thu thập được trong q khứ thơng
qua thuật tốn KNN (K-Nearest Neighbors)
(iii) Từ kết quả trích xuất từ mơ hình dự đốn, so sánh với số liệu chỉ số giá xây
dựng thực tế đã được Sở Xây dựng TP.HCM công bố.

1.3 CÂU HỎI NGHIÊN CỨU:
Để giải quyết vấn đề nghiên cứu, câu hỏi đặt ra cho tác giả như sau:
- Đâu là những yếu tố ảnh hưởng đến chỉ số giá xây dựng (Construction Cost
Index) của cơng trình dân dụng tại TP.HCM?


10

- Lựa chọn mơ hình dự đốn chỉ số giá bằng việc ứng dụng Machine Learning
nào?

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU:
- Đối tượng nghiên cứu: Đối tượng nghiên cứu chính của đề tài là chỉ số giá xây
dựng và/hoặc các chỉ số kinh tế - xã hội khác có liên quan.
- Phạm vi nội dung: Đề tài chỉ tập trung vào nghiên cứu về các biến số chính

ảnh hưởng đến chỉ số giá xây dựng cơng trình dân dụng và xây dựng các mơ hình dự
đốn chỉ số giá xây dựng.
- Về không gian: Đề tài chủ yếu nghiên cứu tại địa bàn thành phố Hồ Chí Minh.
- Về thời gian: Các chỉ số giá xây dựng và các chỉ số kinh tế xã hội từ năm 2015
đến năm 2019.
- Phạm vi nghiên cứu: trên địa bàn Thành phố Hồ Chí Minh.
- Thời gian nghiên cứu luận văn thạc sĩ: từ tháng 07 năm 2019 đến tháng 08
năm 2020

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Ý nghĩa khoa học
- Bổ sung lý luận và dữ liệu về chỉ số giá và các chỉ số kinh tế liên quan nhằm
phục vụ cho việc ước lượng chi phí đầu tư xây dựng cơng trình.
- Nghiên cứu này cịn có thể dùng làm tài liệu tham khảo cho sinh viên trong
môn học kinh tế xây dựng. Ngồi ra, nó hỗ trợ các phương pháp dự đoán trong hoạt
động xây dựng, tạo tiền đề về cơ sở lý luận cho các nghiên cứu tiếp theo về lĩnh vực
này.
Ý nghĩa thực tiễn
- Nghiên cứu xuất phát từ nhu cầu thực tiễn trong lĩnh vực kinh tế xây dựng
và quản lý dự án đầu tư xây dựng cơng trình. Kết quả nghiên cứu góp phần giúp cho
người ra quyết định có cơ sở để đánh giá và lựa chọn các mơ hình dự bao chỉ số giá
một cách thuận lợi. Cụ thể, kết quả nghiên cứu mang lại một số ý nghĩa như sau:


11

- Cung cấp thông tin thực tế khảo sát được về các biến số tác động chủ yếu
đến chỉ số giá xây dựng cơng trình dân dụng tại Thành phố Hồ Chí Minh.
- Xây dựng được mơ hình dự đốn chỉ số giá xây dựng cơng trình dân dụng
bằng một phương pháp Machine Learning.



12

CHƯƠNG 2 : TỔNG QUAN
2.1 CƠ SỞ LÝ THUYẾT VỀ MACHINE LEARNING
Trong những năm qua, chúng ta thường nghe nói tới cụm từ AI - Artificial
Intelligence (hay còn gọi là Trí Tuệ Nhân Tạo) hiện đang đóng vai trị cực kỳ lớn và
quan trọng trong ngành khoa học công nghệ và máy tính, và cụ thể hơn là cơng nghệ
ứng dụng Machine Learning (Học Máy) nổi lên như một bằng chứng của cuộc cách
mạng công nghiệp lần thứ 4, đã phục vụ và xử lý thay cho con người một khối lượng
cơ sở dữ liệu khổng lồ mà chưa một loại máy tính nào trong lịch sử làm được.
Điển hình của cơng nghệ Trí Tuệ Nhân Tạo trong cuộc sống mà ta có thể nhận
biết được như là: Xe máy robot tự lái của Google và Tesla, hệ thống tự động nhận
diện khuôn mặt trong ảnh của mạng xã hội Facebook, trợ lý ảo Siri của Apple, hệ
thống gợi ý các sản phẩm của Amazon dựa vào các thói quen của khách hàng tham
gia vào chuỗi hệ thống cửa hàng trực tuyến, hệ thống gợi ý phim của Netflix…chỉ là
một vài trong rất nhiều những ứng dụng của công nghệ AI/Machine Learning.
Có thể nói, Machine Learning là một tập con của AI. Machine Learning là một
lĩnh vực nhỏ của ngành Khoa Học Máy Tính, điểm đặc biệt của nó là có khả năng tự
học hỏi dựa trên bộ dữ liệu mà người sử dụng nhập vào mà không cần phải lập trình
thuật tốn cụ thể.
- Phân nhóm các thuật tốn Machine Learning
Thuật tốn Machine learning có 2 cách phân nhóm phổ biến. Một là dựa trên phương
thức học (learning style), hai là dựa trên chức năng (function) (của mỗi thuật tốn).
- Phân nhóm dựa trên phương thức học
Theo phương thức học, các thuật toán Machine Learning thường được chia làm
4 nhóm: Supervised learning, Unsupervised learning, Semi-supervised lerning và
Reinforcement learning.
Ở đây vì đề tài này lựa chọn mơ hình thuật tốn là phương thức Supervised

Learning nên sẽ khơng nói sâu về các phương thức thuật tốn cịn lại.


13

- Supervised Learning (Học có giám sát)
Supervised Learning là một dạng thuật toán dự đoán đầu ra của một dữ liệu
mới dựa trên các cặp dữ liệu đầu vào đã biết từ trước (input, outcome). Cặp dữ liệu
này thường được gọi là (data, label), tức (dữ liệu, nhãn). Trong các thuật tốn của
Machine Learning thì Supervised Learning là thuật tốn gần như phổ biến nhất.
Một cách nôm na theo ngành tốn học, thuật tốn Supervised learning là khi có một
tập hợp bộ dữ liệu biến đầu vào X={x1,x2,…,xN} và một tập hợp nhãn tương
ứng Y={y1,y2,…,yN}, trong đó xi,yi là các vector. (xi,yi) ∈ X × Y là các cặp dữ liệu đã
biết trước và được gọi là tập training data (bộ dữ liệu huấn luyện). Từ tập training
data này, chúng ta cần tạo ra một hàm số tương quan mà mỗi phần tử từ tập X gắn
với một phần tử tương ứng của tập Y:
Yi ≈ f(xi), ∀i = 1, 2, … , N
Mục đích là có được hàm số f thật tốt để khi có một dữ liệu X mới, chúng ta có thể
tính được nhãn tương ứng của nó y=f(x).
Ví dụ : Để nhận dạng chữ viết tay trong hình dưới đây, ta thiết lâu cho máy
học nhận biết, ứng với mỗi chữ viết tay, là tương ứng tác giả là một người, hay hiểu
theo nghĩa thuật toán là biến X sẽ tương ứng nhãn Y, sau đó thuật tốn tạo ra mơ hình,
dựa vào sự tương quan, tức một hàm số mà dữ liệu đầu vào là một bức ảnh và đầu ra
là một chữ số. Khi nhận được một tấm ảnh mới, mà mơ hình này chưa từng nhận thấy
bao giờ, nó sẽ dự đốn bức ảnh đó chứa chữ số nào. Cũng giống như cách con người
dạy con lúc còn nhỏ. Khi ta đưa ra một bảng các chữ cái cho con nhỏ xem, ta dạy
chúng hình ảnh này là chữ A, hình này là chữ B. Sau đó, ta mở một cuốn sách bất kỳ
khác mà trẻ nhỏ chưa từng thấy thì trẻ có thể nhận biết được đâu là chữ A, đâu là chữ
B dựa vào những dữ liệu hình ảnh đã được dạy từ trước đó.



14

Hình 2.1: MNIST: bộ cơ sở dữ liệu của chữ số viết tay.
(Nguồn: Simple Neural Network implementation in Ruby)
Thuật toán supervised learning còn được tiếp tục chia nhỏ ra thành hai loại chính:
- Classification (Phân loại)
Một thuật tốn được gọi là phân loại (classification) nếu các nhãn (label) của dữ liệu
đầu vào (input data) được chia thành một số nhóm hữu hạn. Đơn giản, Classification
là bài tốn đi tìm đầu ra là định tính. Ví dụ: Facebook tự nhận diện khn mặt trên
một bức ảnh được tag tên, Gmail có thể lọc được các loại email spam…
- Regression (Hồi quy)
Được hiểu đơn giản là bài toán định lượng giá trị. Nếu label khơng được chia thành
các nhóm (định tính) mà là một giá trị thực (định lượng) cụ thể. Ví dụ: Tập đồn cơng
nghệ Microsoft có một ứng dụng có thể dự đốn được giới tính và tuổi dựa trên ảnh
của khn mặt. Phần dự đốn giới tính có thể coi là thuật toán phân
loại Classification, phần dự đoán tuổi có thể coi là thuật tốn hồi quy Regression.


15

2.2 CHỈ SỐ GIÁ XÂY DỰNG (Nguồn: Thông tư 14/2019/TT-BXD
của Bộ Xây dựng)
2.2.1 Khái niệm
Chỉ nsố ngiá nxây ndựng n(CCI) nlà nchỉ nsố nphản nánh nmức nđộ nbiến nđộng ncủa nchi
phí nxây ndựng ntheo nthời ngian.

n

Chỉ nsố nCCI nđược ndùng nđể nlập nvà nđiều nchỉnh ntổng nmức nđầu ntư ndự nán, ndự

tốn ngói nthầu nvà ngiá ndự nthầu, ndự ntốn nxây ndựng ncơng ntrình, nđiều nchỉnh ngiá nhợp

n

đồng nxây ndựng nvà nquy nđổi nchi nphí nđầu ntư nxây ndựng ncơng ntrình.

n

Chỉ nsố nCCI nđược nSở nXây ndựng ntính ntốn ndựa ntrên nsự nbiến nđộng ncủa ngiá
vật nliệu nxây ndựng, nnhân ncông, nvà nmáy nthi ncông nxây ndựng nđược nban nhành nqua

n

các nthơng ntư nquản nlý nchi nphí nđầu ntư nxây ndựng. nChỉ nsố nCCI nđược ncơng nbố ntheo

n

loại ncơng ntrình, ntheo ncơ ncấu nchi nphí n(gồm nchỉ nsố ngiá nphần nxây ndựng, nchỉ nsố ngiá

n

phần nthiết nbị, nchỉ nsố ngiá nphần nchi nphí nkhác), nyếu ntố nchi nphí ngồm nchỉ nsố ngiá nvật

n

liệu nxây ndựng, nchỉ nsố ngiá nnhân ncông nxây ndựng, nchỉ nsố ngiá nmáy nvà nthiết nbị nxây

n

dựng nđược nxác nđịnh ntrên ncơ nsở ndanh nmục nvà nsố nlượng ncơng ntrình nđại ndiện nđể


n

tính ntốn. nNó nđược ntính nbình nqn ntrong nkhoảng nthời ngian nđược nlựa nchọn,

n

khơng ngồm ncác nchi nphí nbồi nthường, nhỗ ntrợ nvà ntái nđịnh ncư, nlãi nvay ntrong nthời

n

gian nxây ndựng, nvốn nlưu nđộng nban nđầu ncho nsản nxuất nkinh ndoanh n(nếu ncó). nĐơn

n

vị ntính nchỉ nsố ngiá nxây ndựng nlà nphần ntrăm n(%) nvà ncơ ncấu nchi nphí nsử ndụng nđể ntính

n

tốn nchỉ nsố ngiá nxây ndựng nphải nphù nhợp nvới ncơ ncấu nchi nphí ntheo nquy nđịnh nvề

n

quản nlý nchi nphí nđầu ntư nxây ndựng, nđược ntổng nhợp ncác nsố nliệu nthống nkê nvà nđược

n

sử ndụng ncố nđịnh nđến nkhi ncó nsự nthay nđổi nthời nđiểm ngốc n(Bộ nXây ndựng n, n2016).

n


2.2.2 Phân loại
Các nchỉ nsố ngiá nxây ndựng nđược ncông nbố nbởi nSở nXây nDựng nTPHCM nbao
gồm ncác nloại nchỉ nsố nsau:

n

+ nChỉ nsố ngiá nxây ndựng ncơng ntrình: nđược nxác nđịnh n(được ntính ntốn) ntheo
nhóm ncơng ntrình nthuộc n5 nloại ncơng ntrình nxây ndựng n(cơng ntrình ndân ndụng, ncơng

n


16

trình ncơng nnghiệp, ncơng ntrình ngiao nthơng, ncơng ntrình nthủy nlợi, ncơng ntrình nhạ ntầng

n

kỹ nthuật)

n

+ nCác nchỉ nsố ngiá nxây ndựng ntheo ncơ ncấu nchi nphí, nbao ngồm:
• nChỉ nsố ngiá nphần nxây ndựng.
• nChỉ nsố ngiá nphần nthiết nbị.
• nChỉ nsố ngiá nphần nchi nphí nkhác. n n n n n n n n n n n n n n n n n n n n n n n n n n n n n
+ nCác nchỉ nsố ngiá nxây ndựng ntheo nyếu ntố nchi nphí, nbao ngồm:
• nChỉ nsố ngiá nvật nliệu nxây ndựng ncơng ntrình.
• nChỉ nsố ngiá nnhân ncơng nxây ndựng ncơng ntrình.

• nChỉ nsố ngiá nmáy nthi ncơng nxây ndựng ncơng ntrình.
+ nCác nchỉ nsố ngiá ntheo nloại nyếu ntố nđầu nvào nbao ngồm:
• nChỉ nsố ngiá ntheo nloại nvật nliệu nxây ndựng nchủ nyếu.
• nChỉ nsố ngiá ntheo nloại nnhân ncơng nxây ndựng nchủ nyếu.
• nChỉ nsố ngiá ntheo nnhóm nmáy nthi ncơng nxây ndựng nchủ nyếu.
* nChỉ nsố ngiá nxây ndựng ncông ntrình nlà nchỉ nsố nphản nánh nmức nđộ nbiến nđộng
giá ncho nmột nnhóm ncơng ntrình nhoặc nmột nloại ncơng ntrình nxây ndựng.

n

- nCác nchỉ nsố ngiá nxây ndựng ntheo ncơ ncấu nchi nphí nlà ncác nchỉ nsố ngiá ntính ntheo
cơ ncấu nchi nphí ncủa ntổng nmức nđầu ntư, ngồm ncác nchỉ nsố nnhư: nchỉ nsố ngiá nphần nxây

n

dựng, nchỉ nsố ngiá nphần nthiết nbị nvà nchỉ nsố ngiá nkhoản nmục nchi nphí nkhác.

n

- nCác nchỉ nsố ngiá nxây ndựng ntheo nyếu ntố nchi nphí nlà ncác nchỉ nsố ngiá ntính ntheo
n

yếu ntố nchi nphí ncủa ndự ntốn nxây ndựng ncơng ntrình, ngồm ncác nchỉ nsố nnhư: nchỉ nsố ngiá

vật nliệu nxây ndựng ncơng ntrình, nchỉ nsố ngiá nnhân ncơng nxây nqdựng ncơng ntrình nvà nchỉ

n

số ngiá nmáy nthi ncơng nxây ndựng ncơng ntrình.


n

2.2.3 Giải thích một số thuật ngữ
Thời nđiểm ngốc nlà nthời nđiểm nđược nchọn nlàm nmốc nthời ngian nđể nso nsánh.
Thời nđiểm nso nsánh nlà nthời nđiểm ncần nxác nđịnh nchỉ nsố ngiá nxây ndựng nso nvới
thời nđiểm ngốc nban nđầu.

n


17

Giá nxây ndựng ncơng ntrình nđược nlấy nlàm ngốc nđể ntính nlà nnăm n2015 n(được
quy nước nlà n100%) nvà ngiá ncủa ncác nthời nđiểm nkhác nđược nbiểu nthị nbằng ntỷ nlệ nphần

n

trăm n(%) nso nvới nthời nđiểm ngốc.

n

Cách ntính nchỉ nsố ngiá nxây ndựng: nLấy nchỉ nsố ngiá nxây ndựng ncủa nnăm nsau
chia ncho nchỉ nsố ngiá nxây ndựng ncủa nnăm ntrước.

n

2.3 PHƯƠNG PHÁP XÁC ĐỊNH CHỈ SỐ GIÁ XÂY DỰNG
2.3.1 Xác định chỉ số giá xây dựng cơng trình
Chỉ nsố ngiá nxây ndựng ncơng ntrình nđược nxác nđịnh nbằng ntổng ncác ntích ncủa ntỷ
trọng nbình nqn ncủa nchi nphí nxây ndựng, nthiết nbị, nchi nphí nkhác nvới ncác nChỉ nsố ngiá


n

phần nxây ndựng, nphần nthiết nbị, nphần nchi nphí nkhác ntương nứng ncủa ncác ncơng ntrình

n

đại ndiện nlựa nchọn.

n

Chỉ nsố ngiá nxây ndựng ncơng ntrình n(I) nđược ntính ntheo ncông nthức nsau:
I n= nPXD nIXD n+ nPTB nITB n+ nPCPK nICPK

(1)

nnnn

Trong nđó:
- nPXD, nPTB, nPCPK: ntỷ ntrọng nbình nqn ncủa nchi nphí nxây ndựng, nthiết nbị, nchi
phí nkhác ncủa ncác ncơng ntrình nđại ndiện nlựa nchọn; nTổng ncác ntỷ ntrọng nbình nqn nnói

n

trên nbằng n1.

n

- nIXD, nITB, nICPK: nchỉ nsố ngiá nphần nxây ndựng, nphần nthiết nbị, nphần nchi nphí
khác ncủa ncơng ntrình nđại ndiện nlựa nchọn.


n

Cách nxác nđịnh ncác nthành nphần ncủa ncông nthức n(1) nnhư nsau:
- nChỉ nsố ngiá nphần nxây ndựng, nphần nthiết nbị, nphần nchi nphí nkhác n(IXD, nITB,
ICPK) nxác nđịnh ntheo nhướng ndẫn ntại nmục n2 ndưới nđây.

n

- nTỷ ntrọng nbình nquân ncủa nchi nphí nxây ndựng, nthiết nbị, nchi nphí nkhác n(PXD,
PTB, nPCPK) nđược nxác nđịnh nnhư nsau:

n

Tỷ ntrọng nbình nquân ncủa nchi nphí nxây ndựng n(PXD), nchi nphí nthiết nbị n(PTB), nchi
phí nkhác n(PCPK) nđược nxác nđịnh nbằng nbình nquân nsố nhọc ncủa ncác ntỷ ntrọng nchi nphí

n

xây ndựng, ntỷ ntrọng nchi nphí nthiết nbị, ntỷ ntrọng nchi nphí nkhác ntương nứng ncủa ncác

n

cơng ntrình nđại ndiện ntrong nloại ncơng ntrình.

n


18


Tỷ ntrọng nchi nphí nxây ndựng, nchi nphí nthiết nbị, nchi nphí nkhác ncủa ntừng ncơng
trình nđại ndiện nbằng ntỷ nsố ngiữa nchi nphí nxây ndựng, nthiết nbị, nchi nphí nkhác ncủa ncơng

n

trình nđại ndiện nđó nso nvới ntổng ncác nchi nphí nnày ncủa ncơng ntrình. nCơng nthức nxác

n

định nnhư nsau:

n

PXDi 

PTBi 

GXDi
GXDCTi

(2)

GTBi
GXDCTi

(3)

PCPKi 

GCPKi

GXDCTi

(4)

Trong nđó:
- nPXDi, nPTBi, nPCPKi: ntỷ ntrọng nchi nphí nxây ndựng, nthiết nbị, nchi nphí nkhác nso nvới
tổng ncác nchi nphí nnày ncủa ncơng ntrình nđại ndiện nthứ ni;

n

- nGXDi, nGTBi, nGCPKi: nchi nphí nxây ndựng, nthiết nbị, nchi nphí nkhác ncủa ncơng
trình nđại ndiện nthứ ni;

n

- nGXDCTi: ntổng ncác nchi nphí nxây ndựng, nthiết nbị nvà nchi nphí nkhác ncủa ncơng
trình nđại ndiện nthứ ni.

n

Các nsố nliệu nvề nchi nphí nxây ndựng, nchi nphí nthiết nbị nvà nchi nphí nkhác ncủa ncác
cơng ntrình nđại ndiện nlựa nchọn nđược nxác nđịnh ntừ ncác nsố nliệu nthống nkê nthu nthập.

n

2.3.2 Xác định các chỉ số theo yếu tố chi phí
a) nChỉ nsố ngiá nvật nliệu nxây ndựng ncơng ntrình n(KVL) nđược nxác nđịnh nbằng
tổng ncác ntích ncủa ntỷ ntrọng nchi nphí ntừng nloại nvật nliệu nchủ nyếu nnhân nvới nchỉ nsố

n


giá nloại nvật nliệu nchủ nyếu ntương nứng nđó. nChỉ nsố ngiá nvật nliệu nxây ndựng ncơng ntrình

n

tại nthời nĐiểm nso nsánh nnhư nsau:

n

m

KVL   Pvlj  KVLj
j 1

Trong nđó:

(5)


19

- nPvlj: ntỷ ntrọng nchi nphí nbình nqn ncủa nloại nvật nliệu nxây ndựng nchủ nyếu nthứ
j trong ntổng nchi nphí ncác nloại nvật nliệu nxây ndựng nchủ nyếu ncủa ncác ncơng ntrình nđại

n n

diện;

n


- nKVLj: nchỉ nsố ngiá nloại nvật nliệu nxây ndựng nthứ nj;
- nm: nsố nloại nvật nliệu nxây ndựng nchủ nyếu.
Tỷ ntrọng nchi nphí nbình nqn n(Pvlj) ncủa nloại nvật nliệu nxây ndựng nchủ nyếu nthứ
j trong ntổng nchi nphí ncác nloại nvật nliệu nchủ nyếu nbằng nbình nqn ncác ntỷ ntrọng nchi

n n

phí nloại nvật nliệu nxây ndựng nchủ nyếu nthứ nj ncủa ncác ncông ntrình nđại ndiện.

n

Tổng ncác ntỷ ntrọng nchi nphí nloại nvật nliệu nxây ndựng nchủ nyếu nbằng n1.
Tỷ ntrọng nchi nphí ncủa ntừng nloại nvật nliệu nxây ndựng nchủ nyếu nthứ nj ncủa ntừng
cơng ntrình nđại ndiện nđược ntính nbằng ntỷ nsố ngiữa nchi nphí nloại nvật nliệu nchủ nyếu nthứ

n

j so nvới ntổng nchi nphí ncác nloại nvật nliệu nchủ nyếu ntrong nchi nphí ntrực ntiếp ncủa ncơng

n n

trình nđại ndiện nđó, nđược nxác nđịnh nnhư nsau:

n

Pvlji 

i
Gvlj
m


i

 Gvlj

j 1

(6)

Trong nđó:
i

- n Pvlj : ntỷ ntrọng nchi nphí nloại nvật nliệu nxây ndựng nchủ nyếu nthứ nj ncủa ncơng ntrình
đại ndiện ni;

n

i

- n Gvlj : nchi nphí nloại nvật nliệu nxây ndựng nchủ nyếu nthứ nj ncủa ncơng ntrình nđại
diện nthứ ni.

n

Các nloại nvật nliệu nxây ndựng nchủ nyếu nđược nquy nđịnh nbao ngồm: nXi nmăng,
cát nxây ndựng, nđá nxây ndựng, ngỗ nxây ndựng, ngạch nxây, ngạch nốp nlát, nthép nxây ndựng,

n

vật nliệu nbao nche, nvật nliệu nđiện, nvật nliệu nnước, nnhựa nđường, nvật nliệu nhoàn nthiện.


n

Tùy ntheo nđặc nĐiểm, ntính nchất ncụ nthể ncủa ntừng ncơng ntrình nxây ndựng, nloại
vật nliệu nxây ndựng nchủ nyếu ncó nthể nbổ nsung nđể ntính ntốn ncho nphù nhợp.

n

Chỉ nsố ngiá nloại nvật nliệu nxây ndựng n(KVLj) nđược ntính nbằng nbình nqn ncác
chỉ nsố ngiá ncủa ncác nloại nvật nliệu nxây ndựng ncó ntrong nnhóm nvật nliệu nđó.

n


20

Chỉ nsố ngiá ncủa ntừng nloại nvật nliệu ntrong nnhóm nđược nxác nđịnh nbằng ntỷ nsố
giữa ngiá nbình nquân nđến nhiện ntrường ncủa nloại nvật nliệu nxây ndựng nđó ntại nthời nĐiểm

n

so nsánh nso nvới nthời nĐiểm ngốc.

n

b) nChỉ nsố ngiá nnhân ncơng nxây ndựng ncơng ntrình n(KNC) nxác nđịnh nbằng
bình nqn ncác nchỉ nsố ngiá nnhân ncơng nxây ndựng ncủa ncác nloại nbậc nthợ nchủ nyếu ncủa

n


cơng ntrình nhoặc nloại ncơng ntrình.

n

Tùy ntheo nđặc nĐiểm, ntính nchất ncụ nthể ncủa ntừng ncơng ntrình, nloại ncơng ntrình
xây ndựng nđể nlựa nchọn nloại nbậc nthợ nnhân ncông nchủ nyếu nphục nvụ ntính ntốn nchỉ nsố

n

giá nnhân ncơng nxây ndựng ncơng ntrình ncho nphù nhợp.

n

Giá nnhân ncông nxây ndựng nđược nxác nđịnh ntrên ncơ nsở nđơn ngiá nnhân ncông nsử
dụng ntrong nquản nlý nchi nphí nđầu ntư nxây ndựng ndo ncơ nquan nnhà nnước ncó nthẩm

n

quyền ncơng nbố ntại nthời nĐiểm ntính ntốn, nphù nhợp nvới nmặt nbằng ngiá nnhân ncơng

n

thị ntrường.

n

Chỉ nsố ngiá nnhân ncông nxây ndựng ncủa ntừng nloại nbậc nthợ nchủ nyếu nxác
định nbằng ntỷ nsố ngiữa nđơn ngiá nngày ncông ncủa ncông nnhân nxây ndựng ntại nthời nĐiểm

n


so nsánh nvới nthời nĐiểm ngốc.

n

c) nChỉ nsố ngiá nmáy nthi ncơng nxây ndựng ncơng ntrình n(KMTC) nđược nxác nđịnh
bằng ntổng ncác ntích ncủa ntỷ ntrọng nchi nphí ncủa ntừng nloại nmáy nthi ncông nxây ndựng

n

chủ nyếu nnhân nvới nchỉ nsố ngiá ncủa nloại nmáy nthi ncông nxây ndựng nchủ nyếu nđó, ncụ

n

thể nnhư nsau:

n

f

K MTC   PMk  K Mk
k 1

(7)

Trong nđó:
- nPMk: ntỷ ntrọng nchi nphí ncủa nmáy nthi ncông nxây ndựng nchủ nyếu nthứ nk ntrong
tổng nchi nphí ncác nmáy nthi ncơng nxây ndựng nchủ nyếu ncủa ncác ncơng ntrình nđại ndiện;

n


- nKMk: nchỉ nsố ngiá ncủa nmáy nthi ncông nxây ndựng nchủ nyếu nthứ nk
- nf: nsố nmáy nthi ncông nxây ndựng nchủ nyếu.
Tổng ncác ntỷ ntrọng nchi nphí nmáy nthi ncơng nxây ndựng nchủ nyếu nbằng n1.


×