Tải bản đầy đủ (.pdf) (85 trang)

Phương pháp học tập liên kết trong môi trường thông minh dựa trên nền tảng Blockchain

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.81 MB, 85 trang )

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
-----------------------------------

VÕ MINH TUẤN AN

PHƯƠNG PHÁP HỌC TẬP LIÊN KẾT
TRONG MÔI TRƯỜNG THÔNG MINH
DỰA TRÊN NỀN TẢNG BLOCKCHAIN

ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023


HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
--------------------------------------

VÕ MINH TUẤN AN

PHƯƠNG PHÁP HỌC TẬP LIÊN KẾT
TRONG MÔI TRƯỜNG THÔNG MINH
DỰA TRÊN NỀN TẢNG BLOCKCHAIN
Chuyên ngành: Hệ thống thông tin
Mã số:

8.48.01.04

ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)


NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS TRẦN CÔNG HÙNG

THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023


i

LỜI CAM ĐOAN
Tôi cam đoan rằng đề án tốt nghiệp thạc sĩ: “Phương pháp học tập liên kết
trong môi trường thơng minh dựa trên nền tảng Blockchain” là cơng trình
nghiên cứu của chính tơi.
Tơi cam đoan các số liệu, kết quả nêu trong đề án là trung thực và chưa từng
được ai cơng bố trong bất kỳ cơng trình nào khác.
Khơng có sản phẩm/nghiên cứu nào của người khác được sử dụng trong đề
án này mà khơng được trích dẫn theo đúng quy định.

TP. Hồ Chí Minh, ngày 15 tháng 08 năm 2023
Học viên thực hiện đề án

Võ Minh Tuấn An


ii

LỜI CẢM ƠN
Trong suốt quá trình học tập và nghiên cứu thực hiện đề án tốt nghiệp thạc
sĩ, ngoài nỗ lực của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình q báu
của q Thầy Cơ, cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng
nghiệp. Với lịng kính trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành

tới:
Tôi xin chân thành cảm ơn Thầy PGS.TS Trần Công Hùng, người Thầy
kính u đã hết lịng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tơi trong
suốt q trình thực hiện và hoàn thành đề án tốt nghiệp thạc sĩ.
Ban Giám Đốc, Phòng đào tạo sau đại học và quý Thầy Cô đã tạo mọi
điều kiện thuận lợi giúp tơi hồn thành đề án.
Tơi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã
động viên, hỗ trợ tơi trong lúc khó khăn để tơi có thể học tập và hồn thành đề
án. Mặc dù đã có nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm
nghiên cứu khoa học còn hạn chế nên khơng thể tránh khỏi những thiếu sót. Tơi
rất mong nhận được sự góp ý của q Thầy Cơ cùng bạn bè đồng nghiệp để kiến
thức của tôi ngày một hồn thiện hơn.
Xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 15 tháng 08 năm 2023
Học viên thực hiện đề án

Võ Minh Tuấn An


iii

MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................ i
LỜI CẢM ƠN .............................................................................................................ii
MỤC LỤC................................................................................................................. iii
DANH MỤC CÁC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT .................................... vi
DANH SÁCH HÌNH VẼ ..........................................................................................vii
MỞ ĐẦU ..................................................................................................................... 1
1. Tính cấp thiết của đề tài ...................................................................................... 1
2. Tình hình nghiên cứu liên quan đến đề tài .......................................................... 2

3. Mục tiêu, ý nghĩa khoa học và thực tiễn .............................................................. 3
4. Đối tượng và phạm vi nghiên cứu ....................................................................... 4
5. Phương pháp nghiên cứu .................................................................................... 4
6. Bố cục đề án ....................................................................................................... 5
CHƯƠNG 1 : TỔNG QUAN ĐỀ TÀI ...................................................................... 6
1.1

Tổng quan về cơng nghệ Blockchain ............................................................... 6

1.1.1

Blockchain là gì? ......................................................................................... 6

1.1.2

Đặc điểm của Blockchain ............................................................................. 7

1.1.3

Cơ chế đồng thuận phân tán (Distributed) ................................................... 7

1.1.4

Chuỗi khối và dịch vụ chuỗi khối ................................................................. 8

1.1.5

Tính tốn tin cậy (Trusted Computing) ......................................................... 8

1.1.6


Hợp đồng thơng minh (Smart Contracts) ...................................................... 9

1.1.7

Proof of Work (Bằng chứng Công việc - PoW) ............................................. 9


iv

1.1.8
1.2

Proof of Stake (PoS - Bằng chứng cổ phần) ............................................... 10
Tổng quan về Phương pháp Học tập liên kết (Federated Learning) ................ 10

1.2.1

Khái niệm................................................................................................... 11

1.2.2

Phân loại ................................................................................................... 12

1.2.3

Các tính năng chính của Phương pháp Học tập liên kết ............................. 16

1.3


Tổng quan về Phương pháp Học tập liên kết dựa trên Blockchain (BCFL) .... 17

1.3.1

Kiến trúc của BCFL ................................................................................... 19

1.3.2

Kho lưu trữ dữ liệu trong BCFL ................................................................ 20

1.3.3

Nền tảng áp dụng triển khai BCFL ............................................................. 22

1.3.4

Cải tiến mơ hình BCFL .............................................................................. 23

1.3.5

Cải thiện hiệu suất của mơ hình BCFL ....................................................... 25

1.3.6

Đo lường hiệu quả và cải thiện mơ hình BCFL .......................................... 26

CHƯƠNG 2 : CÁC CƠNG TRÌNH LIÊN QUAN BLOCKCHAIN VÀ HỌC TẬP
LIÊN KẾT

............................................................................................................ 28


2.1

Các cơng trình liên quan Blockchain tích hợp AI ........................................... 28

2.2

Các cơng trình liên quan Blockchain tích hợp học máy ................................. 29

2.3

Các cơng trình liên quan Blockchain tích hợp học tập liên kết ....................... 33

CHƯƠNG 3 : MƠ HÌNH ĐỀ XUẤT...................................................................... 36
3.1

Mơ hình học tập liên kết trên nền tảng Blockchain ........................................ 36

3.2

Thuật toán đề xuất ......................................................................................... 39

3.3

Tiêu chí đánh giá ........................................................................................... 50


v

CHƯƠNG 4 : THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................. 53

4.1

Thực nghiệm trên ứng dụng truy xuất nguồn gốc thực phẩm ......................... 53

4.2

Kết quả hiệu năng của mạng Blockchain áp dụng học tập liên kết ................. 61

4.3

Kết quả và thảo luận ...................................................................................... 67

PHẦN KẾT LUẬN ................................................................................................... 69
1. Kết quả nghiên cứu của đề tài ........................................................................... 69
2. Ưu và nhược điểm của đề tài ............................................................................ 70
3. Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu .................................... 71
DANH MỤC TÀI LIỆU THAM KHẢO ................................................................. 72


vi

DANH MỤC CÁC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT
Viết Tắt

Tiếng Anh

Tiếng Việt

FL


Federated Learning

Học tập Liên kết

BCFL

Blockchain-based Federated

Học tập liên kết dựa trên nền

Learning

tảng Blockchain

IoT

Internet of Things

Kết nối Internet vạn vật

PoW

Proof Of Work

Bằng chứng công việc

PoS

Proof of Stake


Bằng chứng cổ phần

AI

Artificial Intelligence

Trí tuệ nhân tạo

ML

Machine Learning

Học máy

CV

Curriculum Vitae

Tóm tắt

SVM

Support Vector Machine

Máy Vecto hỗ trợ


vii

DANH SÁCH HÌNH VẼ

Hình 1.1: Minh họa của các cơ chế Tập trung, Phi tập trung và Phân tán ...................... 7
Hình 1.2: Các khối và mơ tả chuỗi giữa các khối .......................................................... 8
Hình 1.3: Mơ hình tính tốn tin cậy cơ bản ................................................................... 8
Hình 1.4: Giao dịch Hợp đồng thơng minh giữa 2 bên mà không cần bên thứ 3 ............ 9
Hình 1.5: Quy trình của một Bằng chứng cơng việc...................................................... 9
Hình 1.6: Mơ tả q trình PoS .................................................................................... 10
Hình 1.7: Sơ đồ của một giao thức Học liên kết phân tán với các thiết bị AI ............ 11
Hình 1.8: Sơ đồ một mơ hình Học liên kết cơ bản ...................................................... 12
Hình 1.9: Mơ hình Học liên kết tập trung (Centralized Federated Learning) ............... 13
Hình 1.10: Mơ hình Học liên kết khơng tập trung ....................................................... 14
Hình 1.11: Cấu trúc học tập liên kết cho kiến trúc mạng không đồng nhất. ................. 16
Hình 1.12: Kiến trúc của BCFL (Blockchain-based Federated Learning) .................. 19
Hình 1.13: Dữ liệu trong BCFL đã được mã hóa cục bộ từ các khối ......................... 22
Hình 1.14: Các Mơ hình triển khai BCFL như: Ethereum, Hyperledger Fabric, Quorum
................................................................................................................................... 23
Hình 3.1: Mơ hình chia sẻ dữ liệu ............................................................................... 40
Hình 3.2: Mơ hình phân phối sử dụng Blockchain. ..................................................... 41
Hình 3.3: Thuật tốn mơ hình tính tốn phân phối Học liên kết trong Blockchain ...... 43
Hình 3.4: Cấu trúc của khối trong mạng Blockchain ................................................... 46
Hình 3.5: Quy trình làm việc của khung tính tốn được đề xuất ở lớp biên .............. 48
Hình 3.6: Quy trình làm việc của khung tính tốn được đề xuất ở lớp sương mù ..... 49
Hình 4.1: Sơ đồ ứng dụng truy xuất nguồn gốc sử dụng phương pháp Học liên kết trong
môi trường Blockchain ............................................................................................... 56
Hình 4.2: Tỷ lệ chính xác của lớp biên ....................................................................... 62
Hình 4.3: Tỷ lệ chính xác của lớp sương mù ............................................................... 62


viii

Hình 4.4: Giá trị mất mát với lớp biên ........................................................................ 63

Hình 4.5: Tỷ lệ mất lớp sương mù .............................................................................. 63
Hình 4.6: Tỷ lệ chính xác với lớp biên ........................................................................ 64
Hình 4.7: Tỷ lệ chính xác với lớp sương mù ............................................................... 64
Hình 4.8: Truy tìm nguồn gốc sản phẩm Arabica ........................................................ 66
Hình 4.9: Trích xuất thơng tin Café Pacamara ............................................................ 67


1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Trong thời đại kỹ thuật số, hầu hết tất cả các mơ hình kinh doanh đã trải
qua những thay đổi chưa từng có nhờ nhiều tiến bộ trong công nghệ thông tin và
truyền thông như Internet of Things (IoT) [1]. Một công nghệ nổi bật đã thay đổi
cục diện công nghệ cao là công nghệ Blockchain. Năm 2008, Nakamoto đã giới
thiệu Bitcoin trong sách trắng [2]. Bitcoin sử dụng một hệ thống công khai và
phi tập trung để ghi lại các giao dịch và duy trì sổ cái (Blockchain). Mạng lưới
Bitcoin bao gồm các nút (nodes) trên tồn cục, mỗi nút có thể là một cá nhân
hoặc một tổ chức. Các giao dịch được xác nhận và đóng gói thành các khối
(blocks) bởi các thợ mỏ (miners), sau đó được thêm vào blockchain.
Tình hình hiện tại của Blockchain thường được so sánh với Internet vào
giữa những năm 1990, khi Internet vẫn còn trong giai đoạn phát triển ban đầu và
giá trị và tiềm năng của nó vẫn chưa được hiểu rõ. Nhưng một số quốc gia đã
nhận ra tầm quan trọng của công nghệ Blockchain trong những năm gần đây và
đã thành lập các viện nghiên cứu trong khu vực này.
Để khám phá tiềm năng cao của Blockchain, trong các môi trường thông
minh như công nghiệp, hệ thống y tế, thành phố thông minh và giao thông vận
tải, người ta đã chú ý nhiều đến nó và rất nhiều nghiên cứu đã được thực hiện
trong lĩnh vực này. Có rất nhiều cách sử dụng Blockchain và nhiều bài báo đã
được xuất bản về việc sử dụng Blockchain [3].

Mặt khác, học tập liên kết (Federated Learning) là kỹ thuật phân tích dữ
liệu đã biết để đạt được quyền riêng tư và bảo mật trong q trình học máy trong
các hệ thống địi hỏi độ an toàn, bảo mật cao như: hệ thống y tế và chăm sóc sức
khỏe thơng minh, mơi trường cơng nghiệp và thành phố thông minh.


2

Gần đây, FL được biết đến là một trong những kỹ thuật trí tuệ nhân tạo
quan trọng được đề xuất và ứng dụng bởi nhiều nghiên cứu [4, 5].
Là một phương pháp học máy cụ thể và chuyên nghiệp, FL có thể cập nhật
và làm mới các thơng số đào tạo cần thiết và lưu tất cả tập dữ liệu trên các thiết
bị cục bộ. Bằng cách phân chia các bản ghi dữ liệu trên các máy vật lý hoặc ảo đã
chọn trong mỗi vùng liên kết, các bộ dữ liệu có thể được đào tạo với quy trình tốc
độ cao và điều kiện an toàn để phát hiện các mẫu phi cấu trúc và chưa được biết
đến [6]. Bằng cách đào tạo nhanh chóng và các quy trình kiểm tra với học tập hợp
tác, độ chính xác cao với quyền riêng tư hỗ trợ có thể được đảm bảo cho các bộ
dữ liệu hiện có. Sử dụng FL để cập nhật mơ hình cục bộ của các sự trao đổi dữ
liệu của các thiết bị đầu cuối với mô hình tồn cục dựa trên Blockchain trong mơi
trường thơng minh [7].
Đề tài như sau: “PHƯƠNG PHÁP HỌC TẬP LIÊN KẾT TRONG
MƠI

TRƯỜNG

THƠNG

MINH

DỰA


TRÊN

NỀN

TẢNG

BLOCKCHAIN”.

2. Tình hình nghiên cứu liên quan đến đề tài
Vì cơng nghệ Blockchain có thể nâng cao chất lượng của các yếu tố bảo
mật và quyền riêng tư để được đào tạo và phân tích thơng tin nhạy cảm và quan
trọng, việc áp dụng công nghệ này để sử dụng các cơ chế FL có thể đảm bảo phân
tích dữ liệu tiềm năng cao về học tập hợp tác với thời gian và chi phí phản hồi tối
thiểu [8]. Nói cách khác, Blockchain như một công nghệ cốt lõi trong mơi trường
thơng minh có thể tham gia vào quy trình học tập liên kết để hỗ trợ các hoạt động
liên quan đến bảo mật và quyền riêng tư [9]. Nhiều nghiên cứu khác nhau đã được
công bố về các lỗ hổng trong hợp đồng thông minh, tấn công hợp đồng và đánh
cắp tiền điện tử như Blockchain và công nghệ Ethereum [10].


3

Một đánh giá về các nghiên cứu đó bằng cách sử dụng các nghiên cứu khảo
sát và đánh giá có hệ thống trong lĩnh vực Blockchain và FL cho thấy mặc dù lĩnh
vực này đã được các nhà nghiên cứu khác nhau xem xét trong những năm gần
đây, nhưng đánh giá các bài báo cho thấy rằng một nghiên cứu toàn diện trong
lĩnh vực bảo mật và quyền riêng tư của các tài liệu nghiên cứu Blockchain được
lập chỉ mục trong ISI khơng được thực hiện [11]. Do đó, do tầm quan trọng của
những thách thức về bảo mật và quyền riêng tư, cần phải nghiên cứu các phương

pháp FL dựa trên Blockchain bằng cách sử dụng đánh giá có hệ thống.
Với mục đích này, một phân tích đánh giá tồn diện được trình bày để phân
loại các khía cạnh kỹ thuật của các phương pháp FL dựa trên Blockchain. Phân
loại này bao gồm một loạt các phương pháp để phân tích các ấn phẩm khoa học
bằng cách sử dụng các cơng cụ tốn học và thống kê khác nhau và phân tích mơi
trường thơng minh. Một loạt phân tích có hệ thống các nghiên cứu này giúp cải
thiện và tối ưu hóa quy trình học tập liên kết, đồng thời đảm bảo tính hiệu quả
và độ tin cậy của mơ hình.

3. Mục tiêu, ý nghĩa khoa học và thực tiễn
Mục tiêu chính của đề tài là nghiên cứu và đề xuất phương pháp tích hợp
học tập liên kết (FL) trong môi trường thông minh dựa trên chuỗi khối
Blockchain.
Xuất phát từ mục tiêu chính trên, đề án hướng tới những mục tiêu cụ thể
như sau:
-

Nghiên cứu về Blockchain.

-

Nghiên cứu về học tập liên kết (FL).

-

Nghiên cứu về môi trường thông minh tích hợp FL và chuỗi khối
Blockchain.

-


Nghiên cứu đề xuất xây dựng phương pháp tích hợp FL và Blockchain.


4

-

Nghiên cứu triển khai thực nghiệm phương pháp đề xuất.

4. Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu:
-

Phương pháp tích hợp học tập liên kết (FL).

-

Mơi trường thông minh dựa trên chuỗi khối Blockchain.

4.2 Phạm vi nghiên cứu
Phạm vi nghiên cứu:
-

Xây dựng ứng dụng đơn giản, Môi trường Blockchain bắt tay giữa

3 ~ 5 server, có thể sử dụng mơi trường ảo hóa để thực nghiệm.

5. Phương pháp nghiên cứu
5.1 Phương pháp nghiên cứu lý thuyết
-


Tìm hiểu về cấu tạo, cách thức hoạt động của Blockchain, các mơi

trường thơng minh.
-

Tìm hiểu cơ sở lý thuyết về thuật tốn học tập liên kết dựa trên

Blockchain.
-

Tìm hiểu sự kết hợp của thuật toán học tập liên kết dựa trên

Blockchain được sử dụng trong môi trường thông minh.
5.2 Phương pháp nghiên cứu thực nghiệm
-

Mơ phỏng thuật tốn học tập liên kết dựa trên Blockchain được sử

dụng trong các môi trường thơng minh.
này.

Thực hiện việc chạy thử nghiệm và tìm ra phương án phát triển sau


5

6. Bố cục đề án
Bên cạnh phần mở đầu, phần kết luận và phần danh mục tài liệu tham khảo,
phần nội dung chính của bài nghiên cứu được chia thành 4 chương chính như sau:

Chương 1: Tổng quan đề tài
Chương 2: Các cơng trình liên quan
Chương 3: Mơ hình đề xuất
Chương 4: Kết quả mô phỏng thực nghiệm


6

CHƯƠNG 1 : TỔNG QUAN ĐỀ TÀI

1.1

Tổng quan về công nghệ Blockchain

1.1.1 Blockchain là gì?
Blockchain (chuỗi khối), ban đầu là một cơ sở dữ liệu phân cấp lưu trữ
thông tin trong các khối thông tin được liên kết với nhau bằng mã hóa và mở rộng
theo thời gian. Mỗi khối thông tin đều chứa thông tin về thời gian khởi tạo và
được liên kết tới khối trước đó, kèm một mã thời gian và dữ liệu giao
dịch. Blockchain được thiết kế để chống lại sự thay đổi của dữ liệu: Một khi dữ
liệu đã được mạng lưới chấp nhận thì sẽ khơng có cách nào thay đổi được nó[3].
Blockchain được đảm bảo nhờ cách thiết kế sử dụng hệ thống tính tốn
phân cấp với khả năng chịu lỗi byzantine cao. Nhờ thế nên Blockchain có thể đạt
được sự đồng thuận phân cấp. Vì vậy Blockchain phù hợp để ghi lại những sự
kiện, hồ sơ y tế, xử lý giao dịch, cơng chứng, danh tính và chứng minh nguồn gốc.
Việc này có tiềm năng giúp xóa bỏ các hậu quả lớn khi dữ liệu bị thay đổi trong
bối cảnh thương mại toàn cục.
Blockchain lần đầu tiên được phát minh và thiết kế bởi Satoshi
Nakamoto vào năm 2008 và được hiện thực hóa vào năm sau đó như là một phần
cốt lõi của Bitcoin, khi cơng nghệ Blockchain đóng vai trị như là một cuốn sổ cái

cho tất cả các giao dịch. Qua việc sử dụng mạng lưới ngang hàng và một hệ thống
dữ liệu phân cấp, Bitcoin được Blockchain quản lý tự động. Việc phát minh ra
Blockchain cho Bitcoin đã làm cho nó trở thành loại tiền tệ kỹ thuật số đầu tiên
giải quyết được vấn đề double spending (chi tiêu gian lận khi 1 lượng tiền được
dùng 2 lần). Công nghệ này của Bitcoin đã trở thành nguồn cảm hứng cho một
loạt các ứng dụng khác.


7

1.1.2 Đặc điểm của Blockchain
Công nghệ Blockchain tương đồng với cơ sở dữ liệu, chỉ khác ở việc tương
tác với cơ sở dữ liệu. Để hiểu Blockchain, cần nắm được năm định nghĩa sau:
chuỗi khối (Blockchain), cơ chế đồng thuận phân tán (Distributed), tính tốn tin
cậy (Trusted Computing), hợp đồng thông minh (Smart Contracts) và bằng chứng
công việc (Proof Of Work - PoW), bằng chứng kí gửi hay bằng chứng cổ phần
(Proof of Stake - PoS). Mơ hình tính tốn này là nền tảng của việc tạo ra các ứng
dụng phân tán.

1.1.3 Cơ chế đồng thuận phân tán (Distributed)
Cơ chế này ngược lại với mơ hình cổ điển về cơ chế đồng thuận tập trung
nghĩa là khi một cơ sở dữ liệu tập trung được dùng để quản lý việc xác thực giao
dịch. Một sơ đồ phân tán đồng đẳng chuyển giao quyền lực và sự tin tưởng cho
một mạng lưới phân tán đồng đẳng và cho phép các nút của mạng lưới đó liên tục
lưu trữ các giao dịch trên một khối (block) công cộng, tạo nên một chuỗi (chain)
độc nhất: Chuỗi khối (Blockchain).

Hình 1.1: Minh họa của các cơ chế Tập trung, Phi tập trung và Phân tán



8

1.1.4 Chuỗi khối và dịch vụ chuỗi khối
Một chuỗi khối giống như một nơi để lưu trữ dữ liệu bán công cộng trong
một không gian chứa hẹp (khối). Bất cứ ai cũng có thể xác nhận việc bạn nhập
thơng tin vào vì khối chứa có chữ ký của bạn, nhưng chỉ có bạn (hoặc một chương
trình) có thể thay đổi được dữ liệu của khối đó vì chỉ có bạn cầm khóa bí mật cho
dữ liệu đó.

Hình 1.2: Các khối và mơ tả chuỗi giữa các khối

1.1.5 Tính tốn tin cậy (Trusted Computing)
Khi bạn kết hợp các nền tảng đằng sau mỗi chuỗi khối, cơ chế đồng thuận
phi tập trung và hợp đồng thông minh, bạn sẽ nhận ra rằng chúng hỗ trợ cho việc
truyền bá các nguồn lực và giao dịch trên một mặt phẳng theo một cách ngang
hàng, và trong khi làm điều đó, chúng cho phép các máy tính tin tưởng lẫn nhau
ở một mức độ sâu.

Hình 1.3: Mơ hình tính tốn tin cậy cơ bản


9

1.1.6 Hợp đồng thông minh (Smart Contracts)
Hợp đồng thông minh là các khối để xây dựng nên các ứng dụng phi tập
trung. Một hợp đồng thông minh tương đương với một chương trình nhỏ mà bạn
có thể tin tưởng với một đơn vị giá trị và quản lý giá trị đó.

Hình 1.4: Giao dịch Hợp đồng thơng minh giữa 2 bên mà không cần bên thứ 3


1.1.7 Proof of Work (Bằng chứng Công việc - PoW)
Proof of Work (Bằng chứng Công việc, thường được viết tắt là PoW) là
một cơ chế để ngăn chặn chi tiêu kép. Hầu hết các tiền mã hóa sử dụng nó như
là thuật tốn đồng thuận của chúng, được dùng như một phương pháp để bảo mật
cho sổ cái của tiền mã hóa.

Hình 1.5: Quy trình của một Bằng chứng cơng việc


10

1.1.8 Proof of Stake (PoS - Bằng chứng cổ phần)
Proof of Stake (PoS - Bằng chứng cổ phần) là một thuật tốn làm việc của
Blockchain. Có thể hiểu nơm na là người dùng sẽ ký gửi (Stake) một lượng tài
sản nhất định để trở thành Validator (người xác thực) của Blockchain.

Hình 1.6: Mơ tả q trình PoS

1.2 Tổng quan về Phương pháp Học tập liên kết (Federated Learning)
Một trong những thách thức bao trùm của kỷ nguyên kỹ thuật số là quyền
riêng tư của dữ liệu. Vì dữ liệu là mạch máu của trí tuệ nhân tạo hiện đại, các vấn
đề về quyền riêng tư của dữ liệu đóng một vai trò quan trọng (và thường là giới
hạn) trong quỹ đạo của AI. Trí tuệ nhân tạo bảo vệ quyền riêng tư – các phương
pháp cho phép các mơ hình AI học hỏi từ bộ dữ liệu mà không ảnh hưởng đến
quyền riêng tư của chúng – do đó nó ngày càng trở thành mục tiêu theo đuổi quan
trọng. Có lẽ cách tiếp cận hứa hẹn nhất để bảo vệ quyền riêng tư của AI là phương
pháp Học liên kết hay Federated Learning.


11


Hình 1.7: Sơ đồ của một giao thức Học liên kết phân tán với các thiết bị AI

1.2.1 Khái niệm
Học liên kết (học cộng tác hay Federated Learning) là một phương pháp
học máy phân tán, cho phép các thiết bị (như điện thoại di động, máy tính bảng)
hoặc các đơn vị (như bệnh viện, tổ chức) tập hợp dữ liệu và cùng tham gia vào
q trình huấn luyện mơ hình mà khơng cần phải chuyển tồn bộ dữ liệu về một
trung tâm.
Trong Federated Learning, các thiết bị hoặc đơn vị đóng vai trị làm các
nút mạng, mỗi nút chỉ giữ lại dữ liệu của riêng mình và chỉ chia sẻ các tham số
được tạo ra trong quá trình huấn luyện với các nút khác. Như vậy, dữ liệu của
người dùng được bảo mật hơn vì nó khơng cần được gửi đến một trung tâm trung
tâm nào.
Phương pháp này được áp dụng rộng rãi trong các lĩnh vực như hình ảnh
y tế, dự đốn tài chính, quản lý năng lượng, quản lý sản phẩm và các ứng dụng
IoT. Nó giúp cho việc huấn luyện mơ hình trở nên nhanh hơn, tiết kiệm chi phí
và giảm thiểu rủi ro bảo mật dữ liệu.


12

Hình 1.8: Sơ đồ một mơ hình Học liên kết cơ bản

1.2.2 Phân loại
a. Học tập liên kết tập trung (Centralized Federated Learning)
Học máy liên kết tập trung (Centralized Federated Learning) là một
phương pháp học máy liên kết trong đó có một bên thứ ba (trung tâm) được
ủy quyền để quản lý quá trình huấn luyện và điều phối các thiết bị hoặc đơn
vị tham gia. Trung tâm sẽ có quyền truy cập vào toàn bộ dữ liệu của các thiết

bị hoặc đơn vị tham gia, điều này giúp tăng tính hiệu quả và khả năng điều
khiển của q trình huấn luyện.
Trong học máy liên kết tập trung, các thiết bị hoặc đơn vị tham gia sẽ
gửi các thông tin gradient hoặc các thơng tin cập nhật mơ hình đến trung tâm.
Sau đó, trung tâm sẽ tính tốn trung bình các thơng tin đó để cập nhật mơ hình
chính. Q trình này sẽ được lặp lại cho đến khi đạt được một mơ hình ổn
định và chất lượng mong muốn.
Ưu điểm của học máy liên kết tập trung là trung tâm có quyền kiểm
sốt q trình huấn luyện và có thể đảm bảo tính nhất quán và bảo mật dữ
liệu. Tuy nhiên, phương pháp này lại có một số hạn chế như:


13

- Tính tập trung: việc tập trung q trình huấn luyện vào một bên thứ
ba có thể làm giảm hiệu quả của quá trình huấn luyện.
- Bảo mật dữ liệu: các thiết bị hoặc đơn vị tham gia sẽ phải chia sẻ
dữ liệu của mình với trung tâm, điều này có thể gây nguy cơ bảo mật dữ liệu.

Hình 1.9: Mơ hình Học liên kết tập trung (Centralized Federated Learning)

b. Học tập liên kết phi tập trung (Decentralized Federated Learning)
Học tập liên kết phi tập trung (Decentralized Federated Learning) là
một phương pháp học máy liên kết trong đó các thiết bị hoặc đơn vị tham gia
được phân phối và có quyền kiểm sốt và quản lý dữ liệu của mình. Trong
phương pháp này, khơng có một bên thứ ba nào có quyền kiểm sốt tồn bộ
q trình huấn luyện.
Thay vì gửi dữ liệu hoặc thông tin gradient đến một bên thứ ba, các
thiết bị hoặc đơn vị tham gia sẽ trực tiếp trao đổi thơng tin với nhau. Q trình
này được điều khiển bởi một giao thức phân phối được đồng thuận giữa các

thiết bị hoặc đơn vị tham gia.


14

Mỗi thiết bị hoặc đơn vị tham gia sẽ huấn luyện một mơ hình riêng trên
dữ liệu của mình và chia sẻ thông tin gradient với các thiết bị hoặc đơn vị
khác. Quá trình này sẽ được lặp lại cho đến khi đạt được một mơ hình ổn định
và chất lượng mong muốn.
Ưu điểm của Federated Learning phi tập trung là tính phân tán, giúp
tăng tính hiệu quả và độ tin cậy của q trình huấn luyện. Ngồi ra, phương
pháp này cịn đảm bảo tính riêng tư và bảo mật dữ liệu, vì khơng có bên thứ
ba nào có quyền truy cập vào dữ liệu của các thiết bị hoặc đơn vị tham gia.
Tuy nhiên, FL phi tập trung cũng có một số hạn chế như:
- Sự khơng nhất qn: các thiết bị hoặc đơn vị tham gia có thể có
các bản sao khác nhau của dữ liệu, điều này có thể làm giảm tính nhất qn
của q trình huấn luyện.
- Chi phí tính tốn: việc tính tốn trên các thiết bị hoặc đơn vị tham
gia có thể tốn kém hơn so với việc tính tốn trên một trung tâm.
- Khó khăn trong việc quản lý và kiểm sốt: do khơng có một bên
thứ ba nào có quyền kiểm sốt tồn bộ q trình huấn luyện, việc quản lý và
kiểm sốt có thể trở nên khó khăn hơn.

Hình 1.10: Mơ hình Học liên kết khơng tập trung


15

c. Học tập liên kết không đồng nhất (Heterogeneous Federated Learning)
Học tập liên kết không đồng nhất là phương pháp học tập liên kết trong

đó các thiết bị hoặc đơn vị tham gia có các khả năng và tài nguyên khác nhau.
Trong phương pháp này, các thiết bị hoặc đơn vị tham gia có thể có
các tính năng, tốc độ CPU, mức độ lưu trữ và tốc độ truyền tải dữ liệu khác
nhau. Tương tự như Federated Learning phi tập trung, các thiết bị hoặc đơn
vị tham gia sẽ huấn luyện một mơ hình riêng trên dữ liệu của mình và chia sẻ
thông tin gradient với các thiết bị hoặc đơn vị khác. Tuy nhiên, các thơng tin
gradient được tính tốn dựa trên khả năng tính tốn của từng thiết bị hoặc đơn
vị tham gia.
FL khơng đồng nhất có một số ưu điểm như:
- Hiệu quả và tính phân tán: các thiết bị hoặc đơn vị tham gia được
tận dụng tối đa để đạt được hiệu quả tốt nhất và giảm thiểu chi phí tính
tốn.
- Độ chính xác cao: phương pháp này có thể cải thiện độ chính xác
của mơ hình do sự đa dạng của dữ liệu và các thông số của từng thiết bị
hoặc đơn vị tham gia.
Nhưng FL khơng đồng nhất cũng có một số thách thức và hạn chế như:
- Khó khăn trong việc phân phối công việc: phương pháp này yêu cầu
phân phối công việc sao cho các thiết bị hoặc đơn vị tham gia có khả
năng tính tốn khác nhau vẫn có thể hồn thành cơng việc một cách hiệu
quả.
- Khó khăn trong việc tính tốn thơng tin gradient: thơng tin gradient
phải được tính tốn dựa trên khả năng tính tốn của từng thiết bị hoặc


×