HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
-----------------------------------
NGUYỄN HỒNG VŨ
ÁP DỤNG HỌC MÁY TRONG CÁC ỨNG DỤNG
THÔNG MINH DỰA TRÊN CHUỖI KHỐI
BLOCKCHAIN
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
TP. HỒ CHÍ MINH – NĂM 2023
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
--------------------------------------
NGUYỄN HỒNG VŨ
ÁP DỤNG HỌC MÁY TRONG CÁC ỨNG DỤNG
THÔNG MINH DỰA TRÊN CHUỖI KHỐI
BLOCKCHAIN
Chuyên ngành: Hệ thống thông tin
Mã số:
8.48.01.04
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS TRẦN CƠNG HÙNG
TP.HỒ CHÍ MINH – NĂM 2023
i
LỜI CAM ĐOAN
Tôi cam đoan rằng đề án tốt nghiệp thạc sĩ: “Áp dụng học máy trong các ứng
dụng thông minh dựa trên chuỗi khối blockchain” là cơng trình nghiên cứu của
chính tơi.
Tơi cam đoan các số liệu, kết quả nêu trong đề án là trung thực và chưa từng
được ai cơng bố trong bất kỳ cơng trình nào khác.
Khơng có sản phẩm hoặc nghiên cứu nào của người khác được sử dụng trong
đề án này mà khơng được trích dẫn theo đúng quy định.
TP. Hồ Chí Minh, ngày 17 tháng 8 năm 2023
Học viên thực hiện đề án
Nguyễn Hoàng Vũ
ii
LỜI CẢM ƠN
Tôi xin chân thành cảm ơn Thầy PGS.TS Trần Cơng Hùng, người thầy kính
u đã hết lịng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tôi trong suốt q
trình thực hiện và hồn thành đề án tốt nghiệp thạc sĩ.
Trong suốt quá trình học tập và nghiên cứu thực hiện đề án tốt nghiệp thạc sĩ,
ngoài nỗ lực của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình q báu của q
Thầy Cơ, cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng nghiệp. Với
lịng kính trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành tới:
Ban Giám Đốc, Phòng đào tạo sau đại học và quý Thầy Cô đã tạo mọi điều
kiện thuận lợi giúp tơi hồn thành đề án.
Tơi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã
động viên, hỗ trợ tơi trong lúc khó khăn để tơi có thể học tập và hồn thành đề án.
Mặc dù đã có nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm nghiên cứu
khoa học còn hạn chế nên khơng thể tránh khỏi những thiếu sót. Tơi rất mong nhận
được sự góp ý của q Thầy Cơ cùng bạn bè đồng nghiệp để kiến thức của tôi ngày
một hồn thiện hơn.
Xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 17 tháng 8 năm 2023
Học viên thực hiện đề án
Nguyễn Hoàng Vũ
iii
MỤC LỤC
LỜI CAM ĐOAN ......................................................................................................1
LỜI CẢM ƠN ........................................................................................................... ii
MỤC LỤC ................................................................................................................ iii
DANH SÁCH HÌNH VẼ ...........................................................................................v
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ...........................................vi
PHẦN MỞ ĐẦU ........................................................................................................1
1.
Tính cấp thiết của đề tài ...................................................................................1
2.
Tình hình nghiên cứu liên quan đến đề tài .......................................................1
3.
Mục tiêu, ý nghĩa khoa học và thực tiễn ..........................................................4
4.
Đối tượng và phạm vi nghiên cứu....................................................................4
5.
6.
4.1
Đối tượng nghiên cứu ...............................................................................4
4.2
Phạm vi nghiên cứu ..................................................................................4
Phương pháp nghiên cứu..................................................................................4
5.1
Phương pháp nghiên cứu lý thuyết ...........................................................4
5.2
Phương pháp nghiên cứu thực nghiệm .....................................................5
Bố cục đề án .....................................................................................................5
CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY VÀ BLOCKCHAIN......................6
1.1. Tổng quan về công nghệ Blockchain ...............................................................6
1.1.1. Khái niệm ...................................................................................................6
1.1.2. Đặc điểm của Blockchain ..........................................................................6
1.1.3. Cơ chế đồng thuận phân quyền..................................................................7
1.1.4. Chuỗi khối và dịch vụ chuỗi khối ..............................................................7
1.1.5. Hợp đồng thông minh (Smart Contract) ....................................................7
1.2. Tổng quan về học máy (Machine Learning) ....................................................9
1.2.1. Khái niệm học máy ..................................................................................10
1.2.2. Phân loại học máy ....................................................................................10
1.3. Các ứng dụng điển hình của Blockchain ........................................................14
iv
CHƯƠNG 2: CÁC CƠNG TRÌNH LIÊN QUAN HỌC MÁY VÀ
BLOCKCHAIN .......................................................................................................20
2.1. Các cơng trình liên quan học máy và Blockchain ..........................................20
2.1.1. Blockchain ...............................................................................................20
2.1.2. Machine learning .....................................................................................24
2.2. Các cơng trình liên quan Blockchain và học sâu ...........................................26
2.3. Các cơng trình khác liên quan cải tiến Blockchain bằng học máy .................28
CHƯƠNG 3: HỌC MÁY TRONG ỨNG DỤNG THÔNG MINH DỰA TRÊN
CHUỖI KHỐI BLOCKCHAIN.............................................................................32
3.1. Học máy trong ứng dụng thông minh trên chuỗi khối ...................................32
3.2. Thuật toán áp dụng học máy trong ứng dụng thơng minh trên chuỗi khối ....34
3.3. Tiêu chí đánh giá ............................................................................................40
CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................42
4.1. Áp dụng học máy trong ứng dụng thông minh dựa trên chuỗi khối blockchain
...............................................................................................................................42
4.2. Kết quả áp dụng học máy trong ứng dụng thông minh dựa trên chuỗi khối
blockchain..............................................................................................................48
4.3. Kết quả và thảo luận .......................................................................................55
PHẦN KẾT LUẬN ..................................................................................................59
1.
Kết quả nghiên cứu của đề tài ........................................................................59
2.
Hạn chế đề tài .................................................................................................60
3.
Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu ................................61
DANH MỤC TÀI LIỆU THAM KHẢO ...............................................................62
v
DANH SÁCH HÌNH VẼ
Hình 1.1: Cấu trúc cơ bản của Blockchain ...............................................................9
Hình 3.1: Sơ đồ áp dụng học máy trong ứng dụng thơng minh trên chuỗi khối........35
Hình 3.2: Thuật tốn cho pha mơ phỏng. ................................................................37
Hình 3.3: Thuật tốn pha sắp xếp và thực thi .........................................................38
Hình 3.4:
Quy tắc tổng hợp dựa trên lỗi ................................................................40
Hình 4.1:
Mơ hình chuỗi khối trong huấn luyện dữ liệu........................................44
Hình 4.2:
Tấn cơng Gaussian với ε = 0.4 của dữ liệu Wisconsin ..........................48
Hình 4.3:
Tấn cơng Gaussian với ε = 0.4 của dữ liệu Wisconsin ..........................49
Hình 4.4:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,75 với ε = 0,4 ..............49
Hình 4.5:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,63 với ε = 0,4 ..............49
Hình 4.6:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,48 với ε = 0,4 ..............50
Hình 4.7:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,75 với ε = 0,2 ..............50
Hình 4.8:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,48 với ε = 0,2 ..............50
Hình 4.9:
Tấn cơng ở khoảng cách thấp ở khoảng cách 0,63 với ε = 0,2 ..............51
Hình 4.10: Tấn cơng Gaussian với ε = 0,4 của dữ liệu MNIST ..............................52
Hình 4.11: Tấn công Gaussian với ε = 0,2 của dữ liệu MNIST ..............................52
Hình 4.12: Tấn cơng ở khoảng cách thấp ở khoảng cách 0,75 với ε = 0,4 của dữ liệu
MNIST ......................................................................................................................53
Hình 4.13: Tấn cơng ở khoảng cách thấp ở khoảng cách 0,75 với ε = 0,2 của dữ liệu
MNIST ......................................................................................................................53
Hình 4.14: Thời gian tính tốn cho ba quy tắc tổng hợp .........................................54
Hình 4.15: Độ trễ giao dịch cho hai mơ hình ...........................................................54
vi
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
VIẾT TẮT
NGHĨA TIẾNG ANH
NGHĨA TIẾNG VIỆT
AI
Artificial Intelligence
Trí tuệ nhân tạo
BT
Blockchain Technology
Cơng nghệ chuỗi khối
CNN
DDoS
Convolutional Neural
Network
Distributed Denial of
Service
Mạng nơ-ron hợp pháp
Từ chối dịch vụ phân tán
DoS
Denial of Service
Từ chối dịch vụ
DL
Deep Learning
Học sâu
DML
Differential Privacy
Machine Learning
Mơ hình học máy riêng
DP
Differential Privacy
Quyền riêng tư khác biệt
IDS
Intrusion Detection System
Hệ thống phát hiện xâm nhập
IoT
Internet Of Things
Vạn vật kết nối
LSTM
Long short-term memory
Bộ nhớ ngắn hạn dài
ML
Machine Learning
Học máy
OS
Ordering Service
Sắp xếp dịch vụ.
SC
Smart Contract
Hợp đồng thông minh
vii
SG
SGD
Smart Grid
Stochastic Gradient
Descent
Lưới điện thơng minh
Thuật tốn suy giảm độ dốc
SVM
Support Vector Machines
Học máy hỗ trợ
TM
Trust Management
Quản lý tin cậy
UAV
Unmanned Aerial Vehicle
Phương tiện không người lái
1
PHẦN MỞ ĐẦU
1. Tính cấp thiết của đề tài
Trong những năm gần đây, sự xuất hiện của Công nghệ Blockchain
(Blockchain Technology – BT) đã trở thành một công nghệ độc đáo, đột phá nhất và
có xu hướng. Cơ sở dữ liệu phi tập trung trong BT nhấn mạnh tính bảo mật và quyền
riêng tư của dữ liệu.
Ngoài ra, cơ chế đồng thuận trong đó đảm bảo rằng dữ liệu được bảo mật và hợp
pháp. Tuy nhiên, nó làm nảy sinh các vấn đề bảo mật mới như tấn công số đông và
chi tiêu gấp đôi. Để xử lý các vấn đề nói trên, cần có phân tích dữ liệu trên dữ liệu an
tồn dựa trên BT. Phân tích trên những dữ liệu này nâng cao tầm quan trọng của công
nghệ phát sinh Học máy (Machine Learning - ML). ML liên quan đến lượng dữ liệu
hợp lý để đưa ra quyết định chính xác. Độ tin cậy của dữ liệu và sự chia sẻ của nó là
rất quan trọng trong ML để cải thiện độ chính xác của kết quả. Sự kết hợp của hai
cơng nghệ này (ML và BT) có thể mang lại kết quả chính xác cao.
Trong phần đề án này, tơi trình bày một nghiên cứu chi tiết về việc áp dụng
ML để làm cho các ứng dụng thơng minh dựa trên BT có khả năng chống lại các cuộc
tấn cơng tốt hơn. Có nhiều kỹ thuật ML truyền thống khác nhau, chẳng hạn như Máy
vectơ hỗ trợ (Support Vector Machines - SVM), các thuật toán phân cụm, đóng gói
và Học sâu (Deep Learning - DL) như Mạng nơ-ron hợp pháp (Convolutional Neural
Network - CNN) và Bộ nhớ ngắn hạn dài (Long short-term memory - LSTM) có thể
được sử dụng để phân tích các cuộc tấn cơng vào mạng dựa trên BT.
Đề tài như sau: “Áp dụng học máy trong các ứng dụng thông minh dựa trên
chuỗi khối blockchain”.
2. Tình hình nghiên cứu liên quan đến đề tài
Từ vài thập kỷ qua, dữ liệu đã trở thành một nguồn thông minh thiết yếu và
mang lại những cơ hội mới cho các vấn đề trong cuộc sống thực như truyền thông
không dây, công thức sinh học, nông nghiệp và tài chính thơng qua các ứng dụng
thơng minh. Các ứng dụng này dựa trên dữ liệu và dựa trên tỷ lệ thông tin chi tiết hữu
2
ích về trải nghiệm người dùng, cho phép các cá nhân hoàn thành nhiệm vụ mong
muốn một cách hiệu quả hơn.
Nó vận hành thơng tin chi tiết, cá nhân hóa trải nghiệm của khách hàng, tối ưu
hóa các tương tác của khách hàng, cải thiện hiệu quả hoạt động và kích hoạt mơ hình
kinh doanh mới. Có nhiều ứng dụng thông minh khác nhau như SG, UAV, Smart
Cities, làm cho cuộc sống của một cá nhân dễ dàng hơn. Các ứng dụng này tạo ra một
lượng lớn dữ liệu và việc lưu trữ dữ liệu không ngừng phát triển này trong cơ sở dữ
liệu là một vấn đề và giao tiếp của nó cũng làm tăng mối lo ngại về bảo mật. Để xử
lý những vấn đề này, có thể sử dụng BT có mạng cơ sở dữ liệu phân tán. Nó được
Satoshi Nakamoto đặt ra vào năm 2008 và chứa một loạt hồ sơ chống giả mạo được
đóng dấu thời gian, được quản lý bởi một nhóm máy tính phân tán. Nó bao gồm một
chuỗi các khối được kết nối bằng cách sử dụng các nguyên thủy mật mã. Ba điểm
chính của BT là tính bất biến, tính phi tập trung và tính minh bạch. Ba đặc tính này
đã mở ra cánh cửa cho nhiều ứng dụng khác nhau, ví dụ, sự tồn tại của tiền kỹ thuật
số (tiền tệ khơng có tồn tại vật lý) và phân tích về tính phù hợp của nó trong các ứng
dụng thơng minh. Mặc dù BT đảm bảo an ninh và quyền riêng tư các vấn đề, một số
lỗ hổng bảo mật cũng bắt đầu xuất hiện sau khi triển khai. Ví dụ, bản chất của các
cuộc tấn công bắt đầu ngày càng tinh vi như tấn công đa số (tấn công 51%) để kiểm
sốt việc bỏ phiếu, tấn cơng Sybil để tạo danh tính giả để kiểm sốt sự đồng thuận.
Để xử lý vấn đề đã đề cập ở trên, cần có Hệ thống phát hiện xâm nhập (IDS) mạnh
mẽ vì các phương pháp truyền thống sử dụng cách tiếp cận dựa trên chữ ký để phát
hiện các mẫu cụ thể. Tuy nhiên, để phát hiện các cuộc xâm nhập và các kiểu tấn công,
một trong những công nghệ mới nổi được gọi là ML có thể được sử dụng để phân
tích lưu lượng dữ liệu. Do đó, việc thiết kế các thuật tốn hiệu quả và hiệu quả để
phân tích lượng dữ liệu khổng lồ này là nhu cầu rất lớn của các ứng dụng thông minh
dựa trên Blockchain. Do đó, ML ngày nay rất thịnh hành và sử dụng hàng chục lần
một ngày mà không hề hay biết. ML bao gồm máy tính để nghiên cứu, suy nghĩ và
hành động mà không cần sự can thiệp của con người. Nó được coi là một trong những
ứng dụng của Trí tuệ nhân tạo (AI).
3
ML cung cấp cho máy tính khả năng học hỏi mà khơng cần được lập trình nó
một cách rõ ràng. Ý tưởng cơ bản của nó là xây dựng một thuật tốn hiệu quả có thể
chấp nhận dữ liệu đầu vào và với sự trợ giúp của phân tích thống kê, đưa ra dự đoán
và cập nhật kết quả đầu ra. Một lượng dữ liệu đáng kể có thể được ML phân tích để
tạo ra các quyết định theo hướng dữ liệu.
Trong một mạng lưới giao tiếp của các ứng dụng thơng minh dựa trên
Blockchain, có việc xử lý các vấn đề bảo mật theo từng lớp. Một số vấn đề bảo mật
được xử lý ở lớp mạng, chẳng hạn như các gói độc hại và một số vấn đề ở lớp ứng
dụng như phần mềm độc hại. Ở lớp mạng, các gói dữ liệu độc hại có thể được sử dụng
để áp đặt mạng nhằm thiết lập sự đồng thuận gian lận. Một giải pháp đơn giản cho
vấn đề này có thể là sử dụng tường lửa để đảm bảo rằng các gói đáp ứng các tiêu chí
bảo mật được xác định trước. Mặc dù vậy, các cuộc tấn công ngày càng trở nên tinh
vi hơn với các mô hình khó nhìn thấy để vượt qua tường lửa. Để ngăn chặn vấn đề
này, dữ liệu tiêu đề gói có thể được phân tích bằng cách sử dụng mơ hình ML trong
thời gian thực bằng cách sử dụng dữ liệu lịch sử. Phân tích này giúp phát hiện các
mẫu mới và thay đổi. Tương tự, các kỹ thuật ML có thể được sử dụng để phân loại
phần mềm độc hại đến điểm cuối như máy chủ, thiết bị di động hoặc máy trạm. Hơn
nữa, một số ứng dụng thông minh dựa trên Blockchain như UAV, Data Trading, SG
xây dựng lòng tin giữa các bên trao đổi dữ liệu. Nó rất quan trọng trong bất kỳ ứng
dụng thông minh nào đồng thời; dữ liệu phải được bảo mật. BT đảm bảo bảo mật dữ
liệu nhưng để xây dựng độ tin cậy và các kỹ thuật ML được sử dụng để dự đốn các
nút khơng đáng tin cậy dựa trên các mẫu trong quá khứ. Tương tự, UAV có cấu trúc
liên kết mạng khác biệt đáng kể so với cấu trúc liên kết mạng Blockchain thơng
thường. Nó bao gồm thơng tin liên lạc bằng vệ tinh và các trạm mặt đất khác nhau.
Đối với UAV, BT được sử dụng để lưu trữ an toàn tọa độ và các dữ liệu liên quan
khác nhằm duy trì tính tồn vẹn của đồ thị cho các phương tiện. Trong các phần tiếp
theo, tơi tìm hiểu cơng trình nghiên cứu gần đây về việc áp dụng ML trong ứng dụng
thông minh dựa trên Blockchain.
4
3. Mục tiêu, ý nghĩa khoa học và thực tiễn
Mục tiêu chính của đề tài Nghiên cứu đề xuất xây dựng ứng dụng tích hợp học
máy (ML) với chuỗi khối Blockchain trong môi trường thông minh.
Xuất phát từ mục tiêu chính trên, đề án hướng tới những mục tiêu cụ thể như
sau:
•
Nghiên cứu tổng quan về học máy, Nghiên cứu về các thuật tốn học máy.
•
Nghiên cứu về tổng quan chuỗi khối.
•
Nghiên cứu đề xuất thuật tốn tích hợp học máy và chuỗi khối trong mơi
trường thơng minh.
•
Nghiên cứu mơ phỏng và thực nghiệm thuật toán đã đề xuất.
4. Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu:
•
Đối tượng nghiên cứu chính là tác vụ trên chuỗi khối Blockchain.
•
Nghiên cứu các thuật tốn dự báo áp dụng vào dự báo tác vụ.
4.2 Phạm vi nghiên cứu
Phạm vi nghiên cứu:
•
Xây dựng mơ hình mơ phỏng thuật tốn: để tiết kiệm chi phí nên trong đề án
này, thuật tốn sẽ xây dựng với mức mơ phỏng.
•
Nghiên cứu các thuật toán ML hỗ trợ nâng cao hiệu năng về năng lượng và
truyền dữ liệu trong mạng blockchain (đơn giản, theo thời gian thực)
•
Xây dựng mơ phỏng ở mức từ 2~ 5 server đồng thuận, các ứng dụng đơn giản
tích hợp blockchain, áp dụng vào 1 vài lĩnh vực cụ thể như truy xuất nguồn
gốc thực phẩm, truy xuất bảng điểm sinh viên.
5. Phương pháp nghiên cứu
5.1 Phương pháp nghiên cứu lý thuyết
-
Tìm hiểu các phương pháp nghiên cứu tài liệu, tổng quan tài liệu
-
Tìm hiểu cơ sở lý thuyết về các lý thuyết về học máy, Blockchain
5
-
Tìm hiểu các cơng nghệ Blockchain và học máy
5.2 Phương pháp nghiên cứu thực nghiệm
-
Xây dựng mơ hình mơ phỏng và thực nghiệm thuật toán đã đề xuất
6. Bố cục đề án
Bên cạnh phần mở đầu, phần kết luận và phần danh mục tài liệu tham khảo,
phần nội dung chính của bài nghiên cứu được chia thành 4 chương chính như sau:
Chương 1: Tổng quan về học máy và Blockchain
Chương 2: Các cơng trình liên quan về học máy và Blockchain
Chương 3: Học máy trong ứng dụng thông minh dựa trên chuỗi khối
Blockchain
Chương 4: Thực nghiệm và đánh giá
6
CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY
VÀ BLOCKCHAIN
1.1. Tổng quan về công nghệ Blockchain
1.1.1. Khái niệm
Blockchain (chuỗi khối), tên ban đầu blockchain là một cơ sở dữ liệu phân cấp
lưu trữ thông tin trong các khối thông tin được liên kết với nhau bằng mã hóa và mở
rộng theo thời gian. Mỗi khối thông tin đều chứa thông tin về thời gian khởi tạo và
được liên kết đến khối trước đó, kèm một mã thời gian và dữ liệu giao dịch.
Blockchain được thiết kế để chống lại sự thay đổi của dữ liệu: Một khi dữ liệu đã
được mạng lưới chấp nhận thì sẽ khơng có cách nào thay đổi được [3].
Blockchain được đảm bảo nhờ cách thiết kế sử dụng hệ thống tính tốn phân
cấp với khả năng chịu lỗi byzantine cao. Nhờ thế nên Blockchain có thể đạt được sự
đồng thuận phân cấp. Vì vậy Blockchain phù hợp để ghi lại những sự kiện, hồ sơ y
tế, xử lý giao dịch, cơng chứng, danh tính và chứng minh nguồn gốc. Việc này có
tiềm năng giúp xóa bỏ các hậu quả lớn khi dữ liệu bị thay đổi trong bối cảnh thương
mại toàn cầu.
Blockchain lần đầu tiên được phát minh [2] và thiết kế bởi Satoshi Nakamoto
vào năm 2008 và được hiện thực hóa vào năm sau đó như là một phần cốt lõi của
Bitcoin, khi công nghệ blockchain đóng vai trị như là một cuốn sổ cái cho tất cả các
giao dịch. Qua việc sử dụng mạng lưới ngang hàng và một hệ thống dữ liệu phân cấp,
Bitcoin Blockchain được quản lý tự động. Việc phát minh ra Blockchain cho Bitcoin
đã làm cho nó trở thành loại tiền tệ kỹ thuật số đầu tiên giải quyết được vấn đề double
spending (chi tiêu gian lận khi 1 lượng tiền được dùng 2 lần). Công nghệ này của
Bitcoin đã trở thành nguồn cảm hứng cho một loạt các ứng dụng khác.
1.1.2. Đặc điểm của Blockchain
Blockchain là một cấu trúc dữ liệu phân tán, nghĩa là dữ liệu được lưu trữ trên
nhiều máy tính khác nhau trên một mạng lưới. Các giao dịch được ghi lại và lưu trữ
trong các khối liên kết với nhau [4] theo một trình tự xác định. Mỗi khối chứa một số
7
giao dịch và mã hash của khối trước đó. Mã hash được tạo ra bằng cách sử dụng thuật
toán mã hóa độc đáo, điều này đảm bảo tính tồn vẹn của dữ liệu trong khối và liên
kết giữa các khối với nhau.
Hình 1.1: Cấu trúc cơ bản của Blockchain
1.1.3. Cơ chế đồng thuận phân quyền
Cơ chế này ngược lại với mơ hình cổ điển về cơ chế đồng thuận tập trung
nghĩa là khi một cơ sở dữ liệu tập trung được dùng để quản lý việc xác thực giao dịch.
Một sơ đồ phân tán đồng đẳng chuyển giao quyền lực và sự tin tưởng cho một mạng
lưới phân tán đồng đẳng và cho phép các nút của mạng lưới đó liên tục lưu trữ các
giao dịch trên một khối (block) công cộng, tạo nên một chuỗi (chain) độc nhất: chuỗi
khối (blockchain).
1.1.4. Chuỗi khối và dịch vụ chuỗi khối
Một chuỗi khối giống như một nơi để lưu trữ dữ liệu bán công cộng trong một
không gian chứa hẹp (khối). Bất cứ ai cũng có thể xác nhận việc bạn nhập thơng tin
vào vì khối chứa có chữ ký của bạn, nhưng chỉ có bạn (hoặc một chương trình) có thể
thay đổi được dữ liệu của khối đó vì chỉ có bạn cầm khóa bí mật cho dữ liệu đó.
1.1.5. Hợp đồng thông minh (Smart Contract)
Hợp đồng thông minh (Smart Contract) là một dạng [5] hợp đồng kỹ thuật số
được lập trình trên một nền tảng Blockchain. Smart Contract là một mã chương trình
được thiết kế để tự động thực hiện các giao dịch khi các điều kiện trong hợp đồng
được thỏa mãn.
8
Smart Contract được tạo ra để giải quyết các vấn đề pháp lý và giảm thiểu
các rủi ro liên quan đến việc sử dụng hợp đồng truyền thống. Điều này được đảm
bảo bằng cách mã hóa các điều khoản và điều kiện của hợp đồng vào mã nguồn của
Smart Contract. Khi mã nguồn này được thực thi trên mạng Blockchain, các điều
khoản và điều kiện sẽ được tự động áp dụng và thực hiện theo cách đã được định
trước.
Các Smart Contract được lập trình trên các nền tảng Blockchain như
Ethereum, Solana, Near, ... và chúng thường được sử dụng để tạo ra các ứng dụng phi
tập trung (decentralized applications - DApps), trong đó các giao dịch được thực hiện
trực tiếp giữa các bên mà không cần thông qua một bên trung gian.
Ví dụ, một Smart Contract có thể được lập trình để tự động chuyển tiền từ tài
khoản của một người dùng đến tài khoản của người bán khi một sản phẩm được mua
bằng tiền điện tử được định danh trên nền tảng Blockchain. Smart Contract có thể
được thiết lập để tự động thực hiện các hành động như thế mà không cần sự can thiệp
của bên thứ ba.
Smart Contract (Hợp đồng thông minh) là một đoạn mã được viết trong ngơn
ngữ lập trình và triển khai trên nền tảng blockchain, đặc biệt là trên blockchain
Ethereum. Smart Contract là một hợp đồng tự thực thi và tự động thực hiện các điều
khoản và điều kiện đã được định nghĩa trước một cách tự động, tin cậy và không thể
thay đổi sau khi triển khai.
Smart Contract hoạt động như một mô-đun phần mềm tự động, giúp thực hiện,
xác minh, thực thi và ghi nhận các giao dịch hoặc hành động giữa các bên trong một
mạng lưới blockchain. Một Smart Contract có thể chứa các điều khoản và điều kiện
mà các bên tham gia phải tuân thủ. Khi các điều kiện đó được đáp ứng, hợp đồng sẽ
tự động thực thi các hành động liên quan, chẳng hạn như chuyển tiền, ghi nhật ký,
gửi thông báo, và nhiều hành động khác.
Smart Contract không chỉ giúp giảm thiểu sự phụ thuộc vào bên thứ ba và tăng
tính tin cậy trong các giao dịch, mà cịn cung cấp tính tồn vẹn và minh bạch. Các
9
hợp đồng thông minh thường được lưu trữ và thực thi trên blockchain, nơi mọi người
có thể kiểm tra và xác minh các giao dịch và quy trình một cách công khai.
Ứng dụng của Smart Contract rất đa dạng, bao gồm việc xử lý giao dịch tài
chính, quản lý dữ liệu, chia sẻ tài nguyên, thực hiện giao dịch trong lĩnh vực bất động
sản, bảo hiểm, thương mại điện tử và nhiều lĩnh vực khác. Smart Contract đã trở thành
một công nghệ tiềm năng để thúc đẩy sự cách mạng trong các lĩnh vực kinh tế và xã
hội.
Các Smart Contract đem lại tính minh bạch, an tồn và tin cậy cho các giao
dịch kỹ thuật số. Chúng cũng có thể được sử dụng trong nhiều lĩnh vực, bao gồm tài
chính, bảo hiểm, chuỗi cung ứng, bất động sản và y tế…
Một số ứng dụng của Smart Contract [10] trong Blockchain bao gồm:
- Thực hiện các giao dịch tài chính: Smart Contract có thể được sử dụng để
thực hiện các giao dịch tài chính một cách tự động và an tồn hơn. Ví dụ, Smart
Contract có thể được tạo ra để thực hiện các giao dịch chứng khoán hoặc chuyển
tiền trên mạng Blockchain.
- Đảm bảo tính tồn vẹn dữ liệu: Smart Contract có thể được sử dụng để
đảm bảo tính tồn vẹn của dữ liệu và các giao dịch trên mạng Blockchain. Điều
này đảm bảo rằng các giao dịch được thực hiện chính xác và khơng bị thay đổi.
- Quản lý hợp đồng: Smart Contract có thể được sử dụng để quản lý các hợp
đồng trên mạng Blockchain một cách tự động và an toàn hơn. Điều này giúp giảm
thiểu các rủi ro liên quan đến việc thực hiện các hợp đồng truyền thống.
1.2. Tổng quan về học máy (Machine Learning)
Ngày nay, các thuật ngữ của cách mạng công nghiệp 4.0 như Robot thơng
minh, Trí tuệ nhân tạo đã trở lên phổ biến và quen thuộc đối với tất cả mọi người.
Nhờ vào các cơng nghệ này, máy tính đã có thể thực hiện được những nhiệm vụ phức
tạp một cách thơng minh như con người, thay vì thực hiện từng bước cụ thể được chỉ
ra bởi con người để giải quyết một vấn đề thì máy tính giờ đây có thể học được thông
qua việc quan sát từ dữ liệu.
10
1.2.1. Khái niệm học máy
Học máy là một lĩnh vực của trí tuệ nhân tạo (AI) tập trung [14] vào việc phát
triển các thuật tốn và các mơ hình máy tính để tự động học hỏi từ dữ liệu và sử dụng
kết quả học để thực hiện các tác vụ cụ thể mà khơng cần được lập trình trực tiếp. Nó
liên quan đến việc tạo ra các mơ hình dựa trên các kết quả học từ dữ liệu và sử dụng
chúng để dự đoán hoặc phân loại đầu vào mới. Quá trình học này được thực hiện bằng
cách sử dụng các thuật toán học máy để xác định các mẫu, cấu trúc và thơng tin trong
dữ liệu. Các mơ hình học máy có thể được sử dụng trong nhiều lĩnh vực, bao gồm
phân tích tài chính, y học, marketing, giáo dục và nhiều lĩnh vực khác. Các mơ hình
học máy có thể đạt được hiệu suất tốt hơn so với các phương pháp truyền thống trong
nhiều trường hợp, đặc biệt là khi đối tượng phải được phân loại hoặc dự đoán dựa
trên các dữ liệu phức tạp.
Học máy (Machine Learning) là một lĩnh vực trong trí tuệ nhân tạo (Artificial
Intelligence - AI) tập trung vào việc phát triển các thuật tốn và mơ hình để máy tính
có thể học và cải thiện hiệu suất của nó từ dữ liệu mà khơng cần được lập trình một
cách cụ thể.
Thay vì việc lập trình trực tiếp các quy tắc và quyết định cụ thể, học máy cho
phép máy tính học hỏi từ các dữ liệu đầu vào và tạo ra các dự đốn và quyết định dựa
trên những gì đã học. Q trình học này dựa trên việc phân tích và hiểu các mẫu, quy
luật và thông tin tiềm ẩn trong dữ liệu.
Các ứng dụng của học máy rất đa dạng và phổ biến trong nhiều lĩnh vực như
nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên, hệ thống gợi ý, dự đốn thị trường tài
chính, phân loại và nhận dạng mẫu, và nhiều lĩnh vực khác. Học máy đã đóng góp
đáng kể vào sự tiến bộ của nhiều cơng nghệ và ứng dụng trong cuộc sống hàng ngày
của chúng ta.
1.2.2. Phân loại học máy
Học máy có giám sát
Học có giám sát (supervised learning) là một loại học máy, trong đó một thuật
toán được đào tạo trên một tập dữ liệu đã được gán nhãn trước, trong đó các đầu vào
11
(input) được liên kết với các đầu ra (output) tương ứng. Mục tiêu của q trình học
có giám sát là tìm ra mối quan hệ giữa các đầu vào và các đầu ra, từ đó có thể dự đốn
đầu ra mới dựa trên đầu vào mới.
Quá trình học này được thực hiện [17] bằng cách đưa vào mơ hình học máy
một tập dữ liệu đã được gán nhãn, có thể được chia thành hai phần: tập huấn luyện
và tập kiểm tra. Trong đó, tập huấn luyện được sử dụng để đào tạo mơ hình, trong khi
tập kiểm tra được sử dụng để kiểm tra độ chính xác của mơ hình trên dữ liệu mới.
Một số ví dụ của học có giám sát bao gồm phân loại ảnh, nhận dạng giọng nói,
dự đốn giá cổ phiếu và phân loại email spam. Các thuật tốn học có giám sát phổ
biến bao gồm các mơ hình hồi quy tuyến tính, mơ hình hồi quy logistic và các mơ
hình cây quyết định.
Trong supervised learning, dữ liệu được chia thành hai tập: tập huấn luyện
(training set) và tập kiểm tra (test set). Tập huấn luyện chứa các điểm dữ liệu đã
biết đầu ra, được sử dụng để huấn luyện mơ hình. Tập kiểm tra là tập dữ liệu được
sử dụng để kiểm tra hiệu suất của mơ hình đã huấn luyện trên tập huấn luyện.
Các thuật toán supervised learning được sử dụng để giải quyết nhiều bài toán
khác nhau, bao gồm phân loại (classification), dự đoán (prediction), hồi quy
(regression) và xác định giá trị bị khuyết (imputation).
Ví dụ về supervised learning là bài tốn phân loại email, trong đó một mơ
hình được huấn luyện để phân loại email vào các nhóm khác nhau, như spam hoặc
không phải spam. Trong trường hợp này, tập huấn luyện sẽ chứa các email đã được
phân loại và tập kiểm tra sẽ chứa các email chưa được phân loại. Mô hình sẽ được
huấn luyện trên tập huấn luyện để dự đốn xem mỗi email trong tập kiểm tra có
phải là spam hay không.
Học máy không giám sát
Học không giám sát (unsupervised learning) là một loại học máy [6] trong đó
một thuật toán được đào tạo trên một tập dữ liệu khơng có nhãn hoặc khơng có đầu
ra mong muốn được gán trước. Mục tiêu của q trình học khơng giám sát là tìm ra
12
các mơ hình ẩn và cấu trúc trong dữ liệu mà khơng cần có bất kỳ thơng tin gán nhãn
nào.
Q trình học này được thực hiện bằng cách đưa vào mơ hình học máy một
tập dữ liệu chứa các đầu vào, và mơ hình cố gắng tìm ra các mẫu, cấu trúc hoặc thơng
tin ẩn bên trong dữ liệu đó. Các thuật tốn học khơng giám sát có thể được sử dụng
để giải quyết các vấn đề như phân nhóm (clustering), giảm chiều dữ liệu
(dimensionality reduction), và phát hiện bất thường (anomaly detection).
Một số ví dụ của học khơng giám sát bao gồm phân nhóm khách hàng dựa trên
hành vi mua hàng, phân tích tâm trạng từ các bài viết mạng xã hội và phát hiện lỗi
trong dữ liệu. Các thuật tốn học khơng giám sát phổ biến bao gồm phân cụm KMeans, phân tích thành phần chính (PCA) và giảm chiều dữ liệu t-SNE.
Thuật tốn học khơng giám sát không được hướng dẫn bởi một người giám
sát nào trong việc học từ dữ liệu và không yêu cầu việc xác định các nhãn hoặc đầu
ra mong muốn trước khi bắt đầu q trình học. Thay vào đó, nó giúp tìm ra các
mẫu, cấu trúc hoặc đặc trưng của dữ liệu bằng cách tự động học từ dữ liệu đầu vào.
Các thuật tốn học khơng giám sát thường được sử dụng [9] để phân nhóm
dữ liệu (clustering), giảm chiều dữ liệu (dimensionality reduction), phát hiện bất
thường (anomaly detection), hoặc tìm kiếm các mơ hình ẩn trong dữ liệu.
Một số ví dụ về thuật tốn học khơng giám sát bao gồm K-Means, PCA
(Principal Component Analysis), Autoencoder, t-SNE (t-distributed Stochastic
Neighbor Embedding), và DBSCAN (Density-Based Spatial Clustering of
Applications with Noise).
Học máy tăng cường
Reinforcement learning (Học tăng cường) là một lớp của học máy [9], nó
đào tạo các mơ hình để tương tác với một mơi trường và tối ưu hóa các hành động
dựa trên phản hồi trực tiếp từ mơi trường đó. Học tăng cường được sử dụng trong
các tình huống khi mơi trường không được xác định trước hoặc khi các quyết định
phải được đưa ra theo thời gian thực.
13
Trong học tăng cường, một agent được đào tạo để tương tác với một môi
trường. Agent thực hiện một hành động tại mỗi bước thời gian, và sau đó nhận
được phản hồi từ môi trường. Mục tiêu của agent là tối ưu hóa một hàm phần thưởng
(reward function) trong khi tương tác với môi trường.
Hàm phần thưởng cung cấp cho agent một lượng phản hồi cho mỗi hành
động của nó. Agent cố gắng tối đa hóa hàm phần thưởng này bằng cách chọn hành
động tối ưu trong mỗi trạng thái. Quá trình này được gọi là quá trình học tăng
cường.
Một số ví dụ về ứng dụng của học tăng cường bao gồm:
• Robot học cách di chuyển và hoạt động trong một mơi trường mới và khơng
được biết trước.
• Game được đào tạo để tương tác với một môi trường phức tạp như một trị
chơi video.
• Hệ thống điều khiển tự động trong ơ tơ hoặc máy bay.
Các thuật tốn học tăng cường được phát triển dựa trên các kỹ thuật từ lý
thuyết xác suất và quy hoạch động, và các phương pháp học sâu, như mạng nơ-ron
sâu, cũng được sử dụng trong học tăng cường.
Học sâu
Deep learning (Học sâu) là một phương pháp học máy [1] dựa trên kiến trúc
mạng nơ-ron sâu (deep neural network). Trong deep learning, các mạng nơ-ron
được thiết kế với nhiều lớp (hidden layers) giúp học và trích xuất các đặc trưng
phức tạp của dữ liệu đầu vào. Nhờ đó, deep learning có khả năng xử lý và phân tích
dữ liệu có độ phức tạp cao hơn so với các phương pháp học máy truyền thống.
Điểm mạnh của deep learning là khả năng học tự động các đặc trưng phức
tạp của dữ liệu thông qua việc xử lý đồ sộ dữ liệu với số lượng lớn các tham số cần
học. Deep learning có thể được áp dụng cho nhiều bài toán, từ phân loại ảnh, nhận
diện giọng nói, dịch thuật tự động, đến các bài tốn dự báo thị trường tài chính.
Một trong những kiến trúc mạng nơ-ron sâu được sử dụng phổ biến trong
deep learning là mạng CNN (Convolutional Neural Network), được thiết kế đặc
14
biệt để xử lý dữ liệu hình ảnh. Ngồi ra, cịn có các kiến trúc mạng khác như mạng.
RNN (Recurrent Neural Network) được sử dụng trong xử lý dữ liệu chuỗi, hay
mạng GAN (Generative Adversarial Network) được sử dụng trong việc sinh dữ liệu
mới.
1.3. Các ứng dụng điển hình của Blockchain
Ứng dụng trong nghành chăm sóc sức khỏe, y tế
Xu hướng số hóa các dữ liệu như thơng tin bệnh nhân, các đơn đặt hàng, quản
lý kho và các giao dịch mua bán trang thiết bị y tế, … trong quá trình quản lý tài liệu
đang trở nên phổ biến hơn.
Do vậy, các thiết bị thông minh được trang bị trong phần lớn các bệnh viện để
giám sát các dữ liệu này. Tuy nhiên các thiết bị này vẫn còn nhiều hạn chế về quyền
riêng tư và bảo mật, cho nên công nghệ blockchain được sử dụng để khắc phục những
vấn đề này.
Các ứng dụng điển hình trong nghành y tế [19]:
• Liên kết và phát triển ứng dụng quản lý chất lượng và quản lý bệnh.
• Kiểm sốt chuỗi cung ứng thuốc và vật tư y tế như theo dõi nguồn đầu vào,
nguồn gốc và hạn sử dụng của các trang thiết bị y tế.
• Đảm bảo tính minh bạch và khả năng tự động hóa đối với giao dịch khám chữa
bệnh, quyền sở hữu dữ liệu tình trạng sức khỏe của người bệnh, kết quả xét
nghiệm lâm sàng
• Quản lý dữ liệu y tế: Blockchain có thể được sử dụng để tạo ra một hệ thống
quản lý dữ liệu y tế an toàn, bảo mật và minh bạch. Các bản ghi y tế của bệnh
nhân có thể được lưu trữ trên blockchain, cho phép bệnh nhân và các nhà cung
cấp dịch vụ y tế truy cập và chia sẻ thơng tin này một cách an tồn và hiệu quả
hơn.
• Quản lý thuốc: Blockchain cũng có thể được sử dụng để quản lý quá trình sản
xuất, vận chuyển và lưu trữ thuốc. Mỗi lần thuốc được sản xuất, vận chuyển
hoặc bán ra thị trường, một bản ghi sẽ được tạo trên blockchain để đảm bảo
tính minh bạch và truy xuất được nguồn gốc của thuốc.
15
• Xác thực danh tính: Blockchain có thể được sử dụng để xác thực danh tính của
các nhà cung cấp dịch vụ y tế và bệnh nhân. Việc xác thực danh tính có thể
giúp ngăn chặn các hoạt động gian lận và giả mạo trong ngành y tế.
• Điều tra dịch bệnh: Blockchain có thể được sử dụng để theo dõi và điều tra các
dịch bệnh. Thông tin về các ca nhiễm bệnh có thể được ghi lại trên blockchain
để giúp các nhà chức trách và các tổ chức y tế theo dõi và điều tra dịch bệnh
một cách hiệu quả hơn.
• Phát triển dịch vụ y tế trên các nền tảng kỹ thuật số: Blockchain có thể được
sử dụng để tạo ra các nền tảng kỹ thuật số cho các dịch vụ y tế, cho phép các
bệnh nhân truy cập và quản lý thơng tin y tế của mình một cách dễ dàng và
tiện lợi.
• Thanh tốn y tế: Blockchain có thể được sử dụng để tạo ra các hệ thống thanh
toán y tế tiên tiến và bảo mật. Việc sử dụng blockchain để xử lý thanh toán
y tế có thể giảm thiểu chi phí và tăng tính minh bạch.
Ứng dụng trong lĩnh vực giáo dục
Cơng nghệ blockchain có thể giúp hạn chế gian lận [19] trong quá trình học
tập, xin việc làm, học bổng, giảm thiểu tình trạng khai gian về học vấn, kinh nghiệm
làm việc,… Với tính năng đồng bộ thông minh, các điều khoản về nội quy đào tạo sẽ
được thực hiện tự động giúp xử lý những trường hợp vi phạm, nâng cao quy trình
giảng dạy, phản hồi từ người học,…
Ứng dụng blockchain trong ngành giáo dục:
• Theo dõi và lưu trữ dữ liệu học tập của học sinh, sinh viên như: Bảng điểm,
trường đại học, trường dạy nghề, chứng chỉ, ….
• Đánh giá mức độ phù hợp của ứng viên trong quá trình đào tạo, từ đó sẽ có
những điều chỉnh hợp lý.
• Đánh giá năng lực của cá nhân so với yêu cầu đầu vào dựa trên dữ liệu học
vấn đã được ghi lại.
• Quản lý mức độ đánh giá sự uy tín trong các bài nghiên cứu khoa học.
16
• Chứng chỉ và bằng cấp: Blockchain có thể được sử dụng để lưu trữ các chứng
chỉ và bằng cấp của học sinh và sinh viên. Điều này giúp đảm bảo tính tồn
vẹn dữ liệu và hạn chế giả mạo.
• Quản lý tài liệu: Blockchain có thể được sử dụng để quản lý tài liệu giáo dục,
bao gồm cả sách giáo khoa, tài liệu đào tạo và bài giảng. Việc lưu trữ tài liệu
trên Blockchain giúp đảm bảo tính tồn vẹn dữ liệu và ngăn chặn việc sửa
đổi trái phép.
• Trả tiền học phí và hỗ trợ tài chính: Blockchain có thể được sử dụng để xác
minh việc trả tiền học phí và cung cấp hỗ trợ tài chính cho sinh viên. Việc này
giúp giảm thiểu những sai sót và gian lận liên quan đến việc trả tiền học phí
và cung cấp hỗ trợ tài chính.
• Quản lý dữ liệu sinh viên: Blockchain có thể được sử dụng để lưu trữ dữ liệu
sinh viên, bao gồm cả thông tin cá nhân và học tập. Việc này giúp quản lý
thông tin sinh viên một cách an toàn và bảo mật, giảm thiểu sự lạm dụng dữ
liệu.
• Học tập liên kết: Blockchain có thể được sử dụng để thiết lập các mơ hình học
tập liên kết giữa các trường và các tổ chức đào tạo. Việc này giúp tăng tính
linh hoạt trong học tập và giúp sinh viên truy cập vào các khóa học được
cung cấp bởi các tổ chức khác nhau.
Ứng dụng trong ngành tài chính – ngân hàng
Trong lĩnh vực tài chính và ngân hàng, vấn đề bảo mật dữ liệu người dùng,
tham nhũng, lạm quyền là vấn đề rất nan giải. Nhưng với quyết định ứng dụng công
nghệ blockchain với các điểm nổi bật từ chính năng năng như bảo mật cao, giao dịch
nhanh, tiết kiệm chi phí, tối thiểu hóa rủi ro.
Các ứng dụng blockchain [19] trong lĩnh vực tài chính – ngân hàng:
• Xác thực thơng tin khách hàng, khả năng tín dụng trực tiếp mà khơng cần qua
trung gian.
• Tính bảo mật cao và tiện lợi với các cơng nghệ xác minh danh tính, thanh thanh
tốn nhanh chóng và cập nhật giao dịch liên tục.