Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
1
Lập lịch cho mạng truyền thông tán xạ ngược cấp
nguồn không dây sử dụng trò chơi Stackelberg
Ngoc-Tan Nguyen1 , Nam-Hoang Nguyen2 , and Quoc-Tuan Nguyen3
Khoa Điện tử - Viễn thông, Trường Đại học Công Nghệ, ĐHQGHN, Hanoi, Việt Nam
Email: 1 , 2 , 3
tế có nhiều loại WPD khác nhau với các chức năng và cấu
hình phần cứng khác nhau, ví dụ như chúng có thể thực hiện
truyền thơng tán xạ ngược hoặc HTT hoặc cả hai. Hơn nữa,
các thiết bị IoT thường thuộc về một nhà cung cấp dịch vụ
IoT (ISP) và nó phải trả chi phí cho việc mua năng lượng để
vận hành các dịch vụ của mình. Trong trường hợp này, các
giao dịch năng lượng giữa ISP và nhà cung cấp dịch vụ năng
lượng (ESP) nên được tính đến trong khi tối ưu hóa việc lập
lịch cho các thiết bị IoT.
Trong bài báo này, mục tiêu của chúng tôi là giới thiệu một
giải pháp cho việc tối ưu hóa việc giao dịch năng lượng và lập
lịch thời gian cho mạng WPBC (HWPBC) không đồng nhất
bằng cách nghiên cứu sự tương tác giữa ISP và ESP. Cụ thể,
chúng tôi sử dụng lý thuyết trò chơi Stackelberg để nắm bắt
tương tác chiến lược giữa PB và các thiết bị IoT [8]- [7]. Trong
trị chơi này, ISP đóng vai trị là người chơi thứ nhất (NC1)
làm chủ trị, nó có thể chủ động chọn một dịch vụ năng lượng
bằng cách gửi yêu cầu năng lượng của mình với giá cả và thời
gian sạc. Sau đó, ESP được mơ hình hố là người chơi thứ
hai (NC2) sẽ đưa ra chiến lược để đối phó với chiến lược từ
NC1. Do đó, trong trị chơi này, nó có nhiệm vụ tìm ra cơng
suất truyền tối ưu để có thể tối đa hóa lợi ích của nó trong
khi vẫn đáp ứng các yêu cầu từ ISP. Mơ hình chi phí có dạng
hàm bậc hai được áp dụng cho giao dịch năng lượng [9] để
tối ưu hóa lợi nhuận của ESP, tức là NC2, đạt được bằng cách
bán năng lượng dựa trên chi phí và thời gian hoạt động của
PB do ISP (hay là NC1) đưa ra. Lợi nhuận của ISP thu được
từ doanh thu của việc cung cấp dịch vụ (ví dụ như thu thập
dữ liệu) sau khi đã trừ đi chi phí năng lượng. Đây là một hàm
không lồi đa biến theo đơn giá mua năng lượng và thời gian
hoạt động của các thiết bị PB và IoT được đề xuất bởi ISP. Để
tối đa hàm lợi nhuận này, chúng tôi giới thiệu một thuật tốn
tối ưu ln phiên. Cuối cùng, các kết quả mơ phỏng xác minh
hiệu quả của phương pháp được đề xuất so với các phương
pháp khác (BBCM [11] và HTTCM [4]).
Tóm tắt nội dung—Trong bài báo này, chúng tôi giới thiệu mơ
hình mạng truyền thơng IoT khơng đồng nhất tán xạ ngược và
cấp nguồn khơng dây, trong đó, chúng tơi giả thiết nguồn phát
(PB) thuộc nhà cung cấp dịch vụ năng lượng (ESP) và các thiết
bị IoT thuộc nhà cung cấp dịch vụ IoT (ISP). Để tối đa đồng thời
lợi nhuận của hai nhà cung cấp dịch vụ về mặt hiệu quả năng
lượng và thơng lượng mạng, mơ hình trị chơi Stackelberg được
sử dụng để nghiên cứu các tương tác giữa ISP và ESP. Trong bài
báo này, chúng tôi sẽ giới thiệu một thuật toán tối ưu hoá luân
phiên để giải quyết bài tốn tối ưu khơng lồi của ISP. Thơng qua
các mơ phỏng máy tính, chúng tơi chỉ ra rằng phương pháp đề
xuất có thể nâng cao được lợi nhuận cho cả hai nhà cung cấp so
với các phương pháp thơng thường, ví dụ như các phương pháp
tán xạ ngược song phân và "thu hoạch-truyền" (HTT). Ngoài
ra, các kết quả mơ phỏng cũng xác thực độ phức tạp của thuật
tốn tối ưu ln phiên là thấp và có thể hồn thành trong thời
gian đa thức.
Index Terms—Tán xạ ngược, thu hoạch năng lượng.
I. GIỚI THIỆU
Internet vạn vật (IoTs) được định nghĩa là một mơ hình
mạng thơng minh sử dụng các cơng nghệ hiện đại cho phép
các thiết bị IoT kết nối với nhau [1]. Trong thập kỷ vừa qua,
với tốc độ phát triển vũ bão, IoT đã được ứng dụng trong
nhiều lĩnh vực như thành phố/nhà thơng minh, nơng nghiệp,
chăm sóc sức khỏe, và giao thơng nhằm mang lại những tiện
ích cao cấp cho cuộc sống của chúng ta [1]- [2]. Để đáp ứng
các yêu cầu như chi phí thấp và kích thước gọn nhẹ, các thiết
bị IoT thường được cấp nguồn bằng pin có dung lượng nhỏ
để hỗ trợ hoạt động của chúng. Tuy nhiên, việc thường xuyên
sạc lại hoặc thay thế pin cho một lượng lớn số lượng thiết bị
IoT như vậy thường khơng hiệu quả vì nó rất tốn kém, bất
tiện, và thậm chí khơng khả thi trong một số trường hợp (ví
dụ như trong cấy ghép y sinh) [3].
Mạng WPBC tích hợp hai cơng nghệ đó là phương pháp Thu
hoạch năng lượng-Truyền (HTT) [4] và truyền thông tán xạ
ngược [5]. Trong mạng WPBC, thiết bị cấp nguồn không dây
(WPD) được thiết kế để thực hiện truyền thông tán xạ ngược
(tức là truyền dữ liệu thụ động) hoặc truyền thông bằng cách
sử dụng mạch vô tuyến (RF) của nó (tức là truyền dữ liệu chủ
động) và năng lượng thu được từ một nguồn phát sóng RF, ví
dụ như “Power beacon" (PB).
Hầu hết các nghiên cứu hiện tại về WPBC đều tập trung
tối ưu hóa việc lập lịch cho các thiết bị để thực hiện các tác
vụ như thu hoạch năng lượng, truyền dữ liệu chủ động và
thụ động theo giao thức ghép kênh phân chia theo thời gian
(TDM) với giả định là các thiết bị IoT đồng nhất về cấu hình
phần cứng và các yêu cầu về năng lượng [6]- [7]. Trên thực
ISBN 978-604-80-5958-3
II. MƠ
HÌNH HỆ THỐNG
A. Thiết lập mạng
Như được minh hoạ trong Hình 1a, chúng tơi xem xét mơ
hình mạng HWPBC có hai nhà cung cấp dịch vụ, đó là ISP
và ESP. Ở phía ISP, chúng tơi xem xét ba loại thiết bị IoT có
giá thành thấp và cấu hình phần cứng khác nhau có thể hỗ
trợ hai chức năng: BBCM và HTTCM. Loại thiết bị IoT đầu
∆
tiên được đại diện bởi A = {AWPDa |∀a = {1, . . . , A}} là các
thiết bị IoT cấp nguồn khơng dây chủ động (được kí hiệu là
AWPD), chúng được trang bị mạch thu năng lượng và truyền
42
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
động tiếp theo của PB (giai đoạn ngủ). Lưu ý rằng thiết bị
AWPDa có thể thực hiện thu hoạch năng lượng trong tồn bộ
thời gian phát sóng vơ tuyến của PB (tức là β), trong khi đó
thời gian thu hoạch năng lượng của HWPDh là (β − τh ) vì nó
phải thực hiện truyền thông tán xạ ngược trong khoảng thời
gian τh . Trong giai đoạn ngủ của PB, các AWPD và HWPD
có thể thực hiện truyền dữ liệu chủ động để cung cấp dữ liệu
cho gateway dựa trên giao thức TDMA.
AWPD
PWPD
l
na
RF
HWPD
sig
al
RF sign
RF s
igna
l
F
R
Gateway
g
si
l
na
RF
Power Beacon
Backscatter signal
Transmit signal
B. Phân Tích Thơng Lượng Mạng
Energy supply
service
1) Giai đoạn phát sóng vơ tuyến của PB: Trong mơ hình
hệ thống mà chúng tơi đề xuất, có ba kênh truyền bao gồm:
(1) kênh truyền từ PB đến các thiết bị IoT, (2) kênh truyền
từ các thiết bị IoT đến IoT gateway, và (3) kênh truyền từ PB
đến IoT gateway. Vì phạm vi truyền thơng của các mạng IoT
thường giới hạn, nên chúng ta chỉ xem xét các kênh truyền
trên là truyền thẳng (LOS), do đó, độ lợi của chúng là:
Communication
service
(a)
Normalized time frame of the HWPBCN
Sleeping period (1 − 𝛽)
PWPDs
𝜃1
HWPDs
𝜃𝑃
𝜏1
AWPDs
𝜏𝐻
Unlocated
𝜈1
HWPDs
𝜈𝐴
𝜇1
𝜇𝐻
Unlocated
gc =
Backscattering
A∪H
A∪H
A ∪ H\{HWPD1}
A ∪ H\{HWPDH}
Self Transmitting
A∪H
Energy Harvesting
Operating period 𝛽
(1)
trong đó, gc , gd , và gg lần lượt là độ lợi của các kênh truyền
1, 2, và 3. GB , GD , và GG lần lượt là độ lợi ăng-ten của
PB, IoT devices, và IoT gateway. λ là bước sóng của sóng vơ
tuyến, và dBD , dDG , và dBG lần lượt là khoảng cách truyền
của các kênh truyền kể trên. Tốc độ tán xạ ngược có thể đạt
được (tính bằng bit/s) của PWPDp và HWPDh là [14]:
(b)
Hình 1: (a) Mơ hình của hệ thống (b) Khung thời gian chuẩn
hố.
dữ liệu khơng dây. Với cấu hình phần cứng này, AWPD chỉ có
thể hoạt động trong chế độ HTTCM. Tiếp theo, chúng tôi ký
∆
hiệu P ={PWPDp |∀p = {1, . . . , P }} là một tập hợp các thiết
bị IoT cấp nguồn không dây thụ động (PWPD), chúng được
thiết kế với mạch truyền thông tán xạ ngược để thực hiện chế
độ BBCM. Cuối cùng, các thiết bị IoT cấp nguồn không dây
∆
kết hợp (HWPD) thuộc loại H= {HWPDh |∀h = {1, . . . , H}},
chúng được trang bị tất cả các thành phần phần cứng để hỗ trợ
cả hai chế độ hoạt động nói trên. Mặt khác, ESP sử dụng một
bộ phát sóng vơ tuyến chun dụng (PB) để cung cấp năng
lượng cho các thiết bị IoT.
Dịch vụ IoT hoạt động trong hai khoảng thời gian làm việc
liên tiếp của PB, tức là, thời gian phát sóng vơ tuyến β và
thời gian ngủ (1 − β) như được hiển thị trong Hình 1b. Để
đơn giản và đạt được tính hiệu quả trong việc phân bổ tài
nguyên thời gian cho nhiều thiết bị IoT, khung thời gian TDM
được áp dụng ở đây để tránh xung đột giữa các lần truyền của
∆
T
các thiết bị IoT. Chúng tôi ký hiệu θ = (θ1 , . . . , θp , . . . , θP )
∆
T
và τ = (τ1 , . . . , τh , . . . , τH ) lần lượt là các véc-tơ thời gian
truyền thông tán xạ ngược của các thiết bị PWPD và HWPD
∆
trong chu kỳ phát sóng vơ tuyến của PB. Tương tự, ν =
∆
T
T
(ν1 , . . . , νa , . . . , νA ) và µ = (µ1 , . . . , µh , . . . , µH ) lần lượt
là các véc-tơ thời gian truyền dữ liệu chủ động của các thiết
bị AWPD và HWPD trong khoảng thời gian ngủ của PB. Khi
PB đang trong chu kỳ phát sóng vơ tuyến, nó truyền tín hiệu
RF khơng điều chế, do đó, các thiết bị IoT (PWPD và HWPD)
với khả năng truyền thơng tán xạ ngược có thể truyền dữ liệu
của chúng một cách thụ động bằng cách tận dụng các tín hiệu
đó. Trong khi đó, các thiết bị AWPD và HWPD được trang
bị mạch thu năng lượng có thể thu hoạch năng lượng cho quá
trình truyền dữ liệu chủ động của chúng trong giai đoạn hoạt
ISBN 978-604-80-5958-3
GD GG λ2
GB GG λ2
,
g
=
,
g
=
d
g
2
2
2,
(4πdBD )
(4πdDG )
(4πdBG )
GB GD λ2
W = ΛB log2 1 +
ζPRep
N0
,
(2)
trong đó, cơng suất nhận tại IoT gateway là:PRep =
2
η 2 gc gd π42 (Γ0 − Γ1 ) PS . ζ là hệ số bù so với điều chế thực
tế, và N0 là phân bố phổ công suất (psd) của nhiễu đường
truyền. Tổng thông lượng thu được qua truyền thơng tán xạ
ngược trong khoảng thời gian phát sóng vô tuyến của PB là:
P
Rep =
H
Wp θp +
p=1
Wh τh
h=1
P
=
ΛB θp log2(1+κp PS)+
p=1
(3)
H
ΛB τh log2(1+κh PS) ,
h=1
2
where κp = ζηp2 gc,p gd,p (Γ0 − Γ1 ) π24N 0 and κh =
a
2
ζηh2 gc,h gd,h (Γ0 − Γ1 ) π24N 0 .
h
2) Giai đoạn ngủ của PB: Như được đề cập trong phần trên,
chỉ có các thiết bị AWPD và HWPD là có khả năng truyền
thông với gateway trong giai đoạn này bằng việc sử dụng
các mạch truyền thông vô tuyến của chúng. Tổng lương năng
lượng thu hoạch được của các thiết bị AWPDa và HWPDh
từ PB lần lượt là Ea = βPaR và Eh = (β − τh ) PhR . Trong
B
B
= ϕa gc,a PS và PR,h
= ϕh gc,h PS lần lượt là cơng
đó, PR,a
suất tín hiệu nhận được ở AWPDa và HWPDh từ PB [12].
PS là công suất truyền của PB và {ϕa , ϕh } lần lượt là hiệu
quả thu hoạch năng lượng của AWPDa và HWPDh . Để cho
đơn giản, chúng tôi giả sử năng lượng tiêu hao bởi quá trình
truyền chủ động của AWPDs và HWPDs chiếm tỉ trọng lớn
nhất, do đó, năng lượng tiêu hao bởi mạch điện được bỏ qua.
Do đó, tồn bộ năng lượng thu hoạch được sử dụng cho quá
43
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Bổ đề 1. Nếu biết được chiến lược của NC1 (ở đây là ISP),
NC2 (ở đây là ESP) có thể tìm được một giá trị tối ưu duy
nhất của PS∗ theo chiến lược đó.
trình truyền dữ liệu của AWPDs và HWPDs khi PB khơng
phát sóng. Cơng suất truyền của AWPDa và HWPDh lần lượt
là Pat = Ea /νa và Pht = Eh /µh . Vì vậy, tổng thơng lượng đạt
được do việc truyền dữ liệu chủ động của AWPD và HWPD
khi PB ở trạng thái ngủ được xác định như sau:
A
ζgd,a Pat
+
R = νa ΛD log2 1+
Na0
a=1
sp
H
µh ΛDlog2 1+
h=1
H
A
Chứng minh. Thật vậy, hàm lợi nhuận của NC2 trong công
thức (7) là một hàm bậc hai theo PS . Do đó, nếu biết được
chiến lược (pl , β, ψ) của NC1, nghiệm tối ưu và duy nhất PS
−bm
.
là PS∗ = pl2a
m
ζgd,h Pht
Nh0
(β −τh)PS
,
µh
h=1
(4)
ζϕ g gd,h
ζϕ g g
. ΛD là băng
trong đó, δa = a Nc,aa d,a và δh = h Nc,h
h
0
0
thông sử dụng trong giao thức HTT, và {Na0 , Nh0 } lần lượt là
ồn trên các kênh truyền từ AWPDa và HWPDh đến gateway.
Cuối cùng, thơng lượng mạng (Rsum ) được tính như trong
cơng thức (5) và được mơ hình hố là lợi nhuận đạt được của
ISP để từ đó xây dựng bài toán tối đa đồng thời lợi nhận của
cả hai nhà cung cấp dịch vụ.
βPS
= νa ΛD log2 1+δa
+
νa
a=1
Bổ đề 2. Với chiến lược PS∗ mà NC2 đưa ra trong Bổ đề 1,
tồn tại một tập nghiệm tối ưu cho NC1 (ISP), và do đó, chiến
lược tốt nhất mà ISP có thể đưa ra được tìm thơng qua một
thuật tốn lặp.
µh ΛD log2 1+δh
Chứng minh. Với chiến lược PS∗ của NC2, hàm lợi nhuận của
NC1 có thể được biểu diễn lại như trong cơng thức (8). Bài
tốn tối ưu lợi nhuận của NC1 được biểu diễn như sau:
max UL (pl , β, ψ) ,
s.t. 0 ≤ PS ≤ PSmax ,
Pimin
Eimin
γibb ≥
III. THỰC HIỆN GIAO
DỊCH NĂNG LƯỢNG VÀ LẬP LỊCH
ĐỒNG THỜI DỰA TRÊN LÝ THUYẾT TRỊ CHƠI
STACKELBERG
A. Thiết lập trị chơi
0≤
1) Hàm lợi nhuận của ISP: Hàm lợi nhuận đạt được của
ISP được định nghĩa như sau:
UISP (pl , β, ψ) = pr Rsum − pl βPS ,
0≤
(6)
(10a)
∈ {a, h} ,
(10b)
γimin , i ∈ {p, h} ,
P
H
θp +
τh ≤ β ≤ 1, ∀θp , ∀τh ≥ 0,
p=1
h=1
A
H
νa +
µh ≤ 1−β ≤ 1, ∀νa , ∀µh ≥ 0.
a=1
h=1
(10d)
≤ Ei ≤
∈ {a, h} ,
(10c)
(10e)
(10f)
=
là
các ràng buộc về mặt thời gian và công suất của PB và các
thiết bị IoT. Để tìm nghiệm tối ưu χ∗ = (p∗l , β ∗ , ψ ∗ ) cho bài
tốn khơng lồi (10), chúng tơi sẽ giới thiệu một thuật tốn có
độ phức tạp thấp áp dụng kỹ thuật BCD trong phần sau.
IV. THUẬT TOÁN
TỐI ƯU LUÂN PHIÊN
Để giải bài tốn tối ưu khơng lồi trong (10), chúng tơi
đề xuất một thuật tốn tối ưu ln phiên để chia nhỏ tập
biến χ thành hai tập biến nhỏ hơn, đó là đơn giá mua năng
lượng và thời gian phát năng lượng của PB pl , β, và thời gian
∆
hoạt động của các thiết bị IoT ψ = (θ, τ , ν, µ). Cụ thể là,
thuật tốn sẽ khởi chạy tại điểm khởi tạo {pl (0) , β (0) , ψ (0) }.
Hai bước sau đây sẽ được thực hiện tuần tự và lặp lại cho
đến khi nào hàm lợi nhuận của ISP không tăng lên nữa: (i)
Tối ưu đồng thời đơn giá mua năng lượng và thời gian phát
năng lượng của PB pl (n) , β (n) từ điểm tối ưu ở vòng lặp trước
(n−1)
{pl
, β (n−1) , ψ (n−1) }; (ii) Tối ưu thời gian hoạt động của
các thiết bị IoT ψ (n) và giữ nguyên pl (n) , β (n) .
(7)
B. Nghiệm của trò chơi Stackelberg
Định nghĩa cân bằng Stackelberg (SE) được phát biểu là:
Định nghĩa 1. Tập nghiệm tối ưu (PS∗ , p∗l , β ∗ , ψ ∗ ) được gọi
là cân bằng Stackelberg (SE) nếu các điều kiện sau đây thoả
mãn [13]:
(9)
A. Tối ưu đồng thời đơn giá mua năng lượng và thời gian
phát của PB
Để tìm được cân bằng Stackelberg, chúng tơi sử dụng kỹ
thuật quy nạp ngược trong hai bổ đề sau.
ISBN 978-604-80-5958-3
≤
Pimax , i
Eimax , i
ϕa gc,a β(pl −bm )
(pl −bm )
t
, and Pht
2am , Pa =
2am νa
ϕh gc,h (β−τh )(pl −bm )
. Trong bài tốn tối ưu trên, (10a)-(10f)
2am µh
trong đó, F (x) = am x2 + bm x là một hàm bậc hai được dùng
để tính giá thành của việc tạo ra năng lượng ở PB [9].
UISP (PS∗ , p∗l , β ∗ , ψ ∗ ) ≥ UISP (PS∗ , pl , β, ψ) ,
UESP (PS∗ , p∗l , β ∗ , ψ ∗ ) ≥ UESP (PS , p∗l , β ∗ , ψ ∗ ) .
≤
Pit
trong đó, PS =
trong đó, pr là số tiền được trả trên mỗi bit thông tin được
truyền bởi các thiết bị IoT, pl là đơn giá năng lượng được trả
bởi ISP cho ESP. Do đó, ISP cần tối đa hàm lợi nhuận của nó
UL theo đơn giá năng lượng pl , thời gian hoạt động của PB β,
∆
và thời gian hoạt động của các thiết bị IoT ψ = (θ, ν, τ , µ).
2) Hàm lợi nhuận của ESP: Trong trị chơi này, PB đóng
vai trị là NC2, nó tối ưu cơng suất truyền của nó dựa trên
u cầu của ISP, đó là đơn giá năng lượng và thời gian hoạt
động từ ISP. Hàm lợi nhuận của NC2 được xác định dựa trên
lợi nhuận của nó thu được từ việc bán năng lượng cho ISP và
giá thành của việc tạo ra năng lượng:
UESP (PS ) = β [pl PS − F (PS )] ,
(10)
(pl ,β,ψ)
Trong mục này, chúng ta sẽ tối ưu đồng thời đơn giá mua
năng lượng pl và thời gian phát năng lượng của β dựa trên
44
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
P
Rsum (θ, ν, τ , µ)= Rep +Rsp =
A
γp Wp θp +
p=1
νa κa log2 1+δa
a=1
βPS
+
νa
H
γh Wh τh +µh κh log2 1+δh
h=1
(β −τh )PS
µh
.
(5)
P
A
UL (pl , β, ψ) = pr
ΛB θp log2 1+κp
p=1
H
+
h=1
(pl − bm )
β (pl − bm)
+
ΛD νa log2 1+δa
2am
2νa am
a=1
(n−1)
nghiệm tối ưu trong vịng lặp trước {pl
thơng qua bài tốn tối ưu phụ sau:
, β (n−1) , ψ (n−1) }
max G (pl , β) ,
s.t. 0 ≤ β ≤ 1,
0 ≤ pl − bm ≤ 2am PSmax ,
ϕa gc,a β
Pamin ≤ (n−1) (pl − bm) ≤ Pamax ,
am
2νa
Tiếp theo, chúng ta sẽ thực hiện tối ưu thời gian hoạt động
(n)
của các thiết bị IoT ψ (n) với các giá trị cố định {pl , β (n) }.
Bài toán tối ưu ban đầu (10) được đơn giản hoá thành:
(11a)
(11b)
˜ (ψ) ,
max G
(11c)
(pl −
(n−1)
bm) ≤ Phmax ,
2µh am
ϕ
g
a c,a β
Eamin ≤
(pl −bm ) ≤ Eamax ,
2am
Ehmin ≤
ϕh gc,h β −
(n−1)
τh
c3 ϕa gc,a β (n)
≤ Pamax ,
νa
c3 ϕh gc,h β (n) − τh
≤
≤ Phmax ,
µh
s.t. Pamin ≤
(15a)
Phmin
(15b)
(11d)
Ehmin ≤ c3 ϕh gc,h β (n) − τh ≤ Ehmax ,
(11e)
(pl − bm) ≤ Ehmax ,
(15)
ψ
(n−1)
ϕh gc,h β − τh
pl β(pl −bm )
−
.
2am
B. Tối ưu thời gian hoạt động của các thiết bị IoT
(11)
pl ,β
Phmin ≤
(8)
(β −τh )(pl −bm )
(pl −bm )
ΛB τh log2 1+κh
+ΛD µh log2 1+δh
2am
2µh am
P
0≤
p=1
A
0≤
(11f)
2am
κa (pl −bm) ≥ 2am γpmin, κh (pl −bm ) ≥ 2am γhmin, (11g)
a=1
θp +
νa +
(n)
trong đó, c3 =
pl
−bm
2am
H
h=1
H
τh ≤ 1 − β (n) , ∀θp , τh ≥ 0,
(15d)
µh ≤ β (n) , ∀νa , µh ≥ 0,
(15e)
h=1
,
P
trong đó, G (pl , β) ở trong biểu thức (12), và c1 = pr ΛB ,
c2 = pr ΛD . Tuy nhiên, hàm mục tiêu G là một hàm không lồi
vì xuất hiện tích βpl (pl − bm ). Do đó, ta phải tuyến tính hố
tích này bằng cách đặt biến phụ q1 = 1/2 (pl − bm ) (1 + β)
và q2 = 1/2 (pl − bm ) (1 − β). Bài toán (11) trở thành:
˜
G(ψ)
=
A
c1 θp log2 (1 + c3 κp )+
p=1
c2 νa log2 1+
a=1
H
+
(15c)
c1 τh log2 (1+c3 κh )+c2 µh log2 1+
h=1
c3 δa β (n)
νa
c3 δh β (n) −τh
µh
(n)
max Q (q1 , q2 ) ,
(13)
q1 ,q2
s.t.0 ≤ q2 ≤ q1 ,
0 ≤ q1 + q2 ≤ 2am PSmax ,
ϕa gc,a
Pamin ≤ (n−1) (q1 −q2 ) ≤ Pamax,
2νa
am
(n−1)
Phmin≤
ϕh gc,h 1−τh
Eamin ≤
(n−1)
q1 − 1+τh
(n−1)
2µh
ϕh gc,h 1−τh
(16)
Chúng ta có thể dễ dàng nhận thấy rằng các ràng buộc về
SNR của các thiết bị tán xạ ngược (PWPDs và HWPDs) và
các thiết bị truyền chủ động (AWPDs và HWPDs) bị triệt tiêu
(n)
˜
với các giá trị cố định của {pl , β (n) }. Vì hàm mục tiêu G
là một hàm lõm theo ψ, do đó, ta có thể giải dễ dàng bằng
phương pháp “Interior-point".
(13a)
(13b)
(13c)
q2
am
ϕa gc,a
(q1 −q2 ) ≤ Eamax,
2am
(n−1)
Ehmin ≤
− c3 pl β (n) .
≤ Phmax, (13d)
C. Thuật tốn lặp tìm nghiệm cho bài toán tối ưu hàm lợi
nhuận của ISP
(13e)
(n−1)
q1 − 1+τh
Thuật tốn 1 được sử dụng để tìm nghiệm tối ưu cho bài
toán tối ưu hàm lợi nhuận của ISP.
q2
≤ Ehmax, (13f)
2am
κp (q1 +q2 ) ≥ 2am γpmin, κh (q1 +q2 ) ≥ 2am γhmin , (13g)
V. KẾT QUẢ
Trong phần này, chúng tôi sẽ thực hiện các mô phỏng để
minh hoạ nghiệm tối ưu và đánh giá lợi nhuận của NC1 (ở
đây là mạng IoT) đạt được bởi phương pháp đề xuất và các
phương pháp truyền thống. Chúng tôi sử dụng tần số sóng
mang là 2.4 GHz. Băng thơng của tín hiệu vơ tuyến và độ lợi
trong đó, Q(q1 , q2 ) được biểu diễn trong biểu thức (14). Tuy
nhiên, bài toán tối ưu phụ (13) là bài toán difference-of-convexfunction (DC) nên chúng ta có thể dễ dàng giải được bằng
phương pháp convex-concave procedure (CCCP) [15].
ISBN 978-604-80-5958-3
MÔ PHỎNG
45
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
P
A
c1 θp(n−1) log2 1+
G (pl , β) =
p=1
H
(n−1)
(n−1)
c1 τh
log2
+
κp
δa β
(pl −bm) + c2 νa(n−1) log2 1+ (n−1) (pl −bm)
2am
2νa
am
a=1
h=1
δh (β −τh
)
κp
(n−1)
1+
(pl −bm) +c2 µh
log2 1+
(pl −bm)
(n−1)
2am
2µ
am
h
(12)
βpl (pl −bm )
,
−
2am
A
P
δa (q1 −q2 )
κp (q1 + q2 )
+ c2 νa(n−1) log2 1+ (n−1)
2am
2νa
am
a=1
p=1
(14)
H
δh (1−τh(n−1) )q1 −(1+τh(n−1) )q2 q 2 +b q
2
q
+b
q
κ
(q
+q
)
m
1
m
2
h 1
2
(n−1)
(n−1)
c τ
log2 1+
+c2 µh log2 1+
− 1
+ 2
,
+
(n−1)
1 h
2am
2am
2am
2µ
am
Q(q1 , q2 ) =
c1 θp(n−1) log2 1 +
h=1
h
7000
Utility of the Follower
6000
p l = 29752
5000
4000
3000
2000
1000
Profit of the Follower
0
-1000
0
0.2
0.4
0.6
0.8
1
Transmission Power of the Power Beacon P S
(a)
(b)
Hình 2: Lợi nhuận của NC2 theo (a) cơng suất truyền của PB, (b) giá và thời gian mua năng lượng đề xuất.
Algorithm 1 Thuật tốn lặp để tìm nghiệm χ∗
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
ồn của các thiết bị IoT lần lượt là ζ = −5 dB và N0 = −100
dBm. Laptop Dell với cấu hình: CPU Intel core i7-8565U, 16
GB RAM, và GPU Radeon RX 540 series, được sử dụng để
mô phỏng. Đầu tiên, chúng ta sẽ đánh giá lợi nhuận của NC2
(ở đây là ESP) ở trong Hình 2. Đầu tiên chúng ta mô phỏng
lợi nhuận này như một hàm bậc 2 theo công suất truyền của
PB như ở trong biểu thức (7). Hình. 2(a) biểu diễn giá năng
lượng đề xuất tương ứng với điểm tối ưu của đường cong lợi
nhuận. Sau khi thiết lập công suất truyền tối ưu cho PB, lợi
nhuận của ESP phụ phuộc vào giá năng lượng và thời gian
hoạt động của PB được đề xuất bởi ISP Hình 2(b)đề xuất. Có
thể nhận thấy rằng, lợi nhuận của ESP sẽ tăng tuyến tính theo
thời gian mua năng lượng và phi tuyến theo giá năng lượng
đề xuất.
Tiếp theo, chúng ta sẽ đánh giá lợi nhuận của ISP khi thay
đổi lợi nhuận thu được trên mỗi bit được truyền trong khoảng
0.1 đến 1 (Hình 3). Trong mơ phỏng này chúng ta giả sử mỗi
loại thiết bị sẽ có 10 thiết bị. Rõ ràng, lợi nhuận của ISP đạt
được bởi tất cả các phương pháp đều tăng khi lợi nhuận thu
được trên mỗi bit truyền tăng. Ngoài ra, lợi nhuận thu được
bởi phương pháp đề xuất cũng cao hơn các phương pháp khác.
Ngược lại, vì hiệu quả tán xạ thấp nên phương pháp BBCM
cho kết quả là lợi nhuận của ISP thấp hơn nhiều so với các
phương pháp khác.
Trong Hình 4, chúng tôi biểu diễn lợi nhuận của NC1 thay
đổi theo khoảng cách giữa PB và các thiết bị IoT. Ở khoảng
cách 2 mét, lợi nhuận của NC1 (ISP) đạt được bằng phương
Đầu
vào:
Đầu
ra
của
vòng
lặp
trước
{pl (n−1) , β (n−1) , ψ (n−1) }.
Initialize: n = 1, {pl (0) , β (0) , ψ (0) }, sai số ξ1 > 0.
Tính: Lợi nhuận của NC1 UL pl (0) , β (0) , ψ (0) .
Lặp lại:
Tìm {pl (n), β (n)} từ {pl (n−1), β (n−1), ψ (n−1)} bằng việc sử
dụng phương pháp CCCP;
Tìm ψ (n) với giá trị cố định của {pl (n),β (n)} bằng việc
giải quyết bài toán phụ 2 (15);
Nếu:
UL pl (n), β (n), ψ (n) −UL pl (n−1), β (n−1), ψ (n−1) < ξ1 ;
Thì:
Đặt {pl ∗, β ∗, ψ ∗} = {pl (n), β (n), ψ (n)} và dừng lại.
Nếu khơng thì:
Cập nhật n ← n + 1 và tiếp tục.
Đầu ra: Nghiệm χ∗ = {pl ∗ , β ∗ , ψ ∗ } cho bài toán tối ưu
hàm lợi nhuận của ISP.
ăng-ten của PB lần lượt là 10 MHz và 6 dBi. Băng thơng của
các tín hiệu vơ tuyến phát bởi AWPDs và HWPDs là 1 MHz
và độ lợi ăng-ten của chúng là 1.8 dBi. Khoảng cách giữa PB
và các thiết bị IoT được thiết lập mặc định là 10 mét. Hiệu
quả thu hoạch năng lượng của AWPDs và HWPDs là ϕ = 0.6,
trong khi đó, hiệu quả tán xạ η gây ra sự suy hao 1.1 dB ở
PWPDs và HWPDs. Ngoài ra, hệ số bù hiệu năng và psd của
ISBN 978-604-80-5958-3
46
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
104
8
HTTCM
TDMA
2
1
BBCM
HTTCM
2
TDMA
1.5
1
0.5
0
0.1
0.2
N=5
N = 10
N = 15
Proposed Approach
Utility of the Leader
Utility of the ISP
3
105
2.5
Proposed Approach
BBCM
Run time of Proposed Schemes
4
0.3
0.4
0.5
Benefit per bit transmitted pr
Hình 3: Lợi nhuận của NC2 theo
lợi ích trên mỗi bit truyền được.
0
2
5
10
20
Hình 4: Lợi nhuận của NC2 theo
khoảng cách từ PB đến các thiết bị
IoT.
pháp BBCM lớn hơn rất nhiều so với các phương pháp khác vì
cơng suất truyền của PB có ảnh hưởng rất lớn đến các thiết bị
tán xạ ngược. Tuy nhiên, hiệu quả của phương pháp này giảm
một cách nhanh chóng khi khoảng cách này tăng lên. Ngược
lại, lợi nhuận của ISP đạt được bởi các phương pháp đề xuất,
TDMA, và HTTCM thì giảm nhẹ khi khoảng cách tăng lên
nhưng vẫn nhỏ hơn 10 mét. Khi khoảng cách lớn hơn 4 mét
thì lợi nhuận của ISP đạt được bởi phương pháp đề xuất lớn
hơn tất cả các phương pháp khác.
Cuối cùng, Hình 5 biểu diễn thời gian chạy (độ phức tạp)
của thuật toán đề xuất khi thay đổi số lượng các thiết bị IoT.
Chúng ta sẽ thực hiện đo thời gian chạy của thuật toán đề
xuất trong 1000 lần chạy với số lượng các thiết bị IoT trong
mỗi loại lần lượt là N = 5, N = 10, N = 15. Nhìn chung,
thời gian chạy của thuật tốn đề xuất là khá thấp, ngay cả với
trường hợp tổng số các thiết bị là 45 (tương ứng N = 15) thì
thời gian chạy vẫn nhỏ hơn 5 giây. Rõ ràng khi chúng ta tăng
số lượng thiết bị IoT lên thì thời gian chạy cũng sẽ tăng lên,
chủ yếu do bài tốn lập lịch cho các thiết bị IoT.
6
5
4
3
2
1
0
200
400
600
800
1000
Number of Tests
Hình 5: Thời gian chạy của các
phương pháp.
[3] D. W. K. Ng et al., “The Era of Wireless Information and Power
Transfer," in Wireless Information and Power Transfer: Theory and
Practice, Wiley, pp.1-16, 2019.
[4] H. Ju and R. Zhang, “Throughput maximization in wireless powered
communication networks,” IEEE Trans. Wireless Commun., vol. 13, no.
1, pp. 418-428, Jan. 2014.
[5] N. Van Huynh et al., “Ambient Backscatter Communications: A Contemporary Survey," IEEE Commun Surv. & Tut., vol. 20, no. 4, pp.
2889-2922, May 2018.
[6] S. Gong et al., “Backscatter Relay Communications Powered by Wireless Energy Beamforming," IEEE Trans. Commun., vol. 66, no. 7, pp.
3187-3200, July 2018.
[7] W. Wang et al., "Stackelberg Game for Distributed Time Scheduling in
RF-Powered Backscatter Cognitive Radio Networks," IEEE Trans. on
Wireless Commun., vol. 17, no. 8, pp. 5606-5622, Aug. 2018.
[8] D. T. Hoang et al.,“Overlay RF-powered backscatter cognitive radio
networks: A game theoretic approach," in IEEE Inter. Conf. on Commun., Paris, May 2017, pp. 1-6.
[9] A. M. Rad et al., “Autonomous demand-side management based on
game-theoretic energy consumption scheduling for the future smart
grid," IEEE Trans. Smart Grid, vol. 1, no. 3, pp. 320-331, Dec. 2010.
[10] P. Tseng, “Convergence of a block coordinate descent method for
nondifferentiable minimization,” Jour. Optim. Theory Appl., vol. 109,
no. 3, pp. 475–494, June 2001.
[11] N. F. Hilliard, P. N. Alevizos and A. Bletsas,“Coherent Detection and
Channel Coding for Bistatic Scatter Radio Sensor Networking," IEEE
Trans. Commun., vol. 63, no. 5, pp. 1798-1810, May 2015.
[12] C. A. Balanis, Antenna Theory: Analysis and Design. NY, Wiley, 2012.
[13] D. Fudenberg, J. Tirole, Game Theory, MIT Press, 1991.
[14] S. H. Kim and D. I. Kim, “Hybrid Backscatter Communication for
Wireless-Powered Heterogeneous Networks," in IEEE Transactions on
Wireless Communications, vol. 16, no. 10, pp. 6557-6570, Oct. 2017.
[15] A. L. Yuille and A. Rangarajan, “The Concave-Convex Procedure
(CCCP)," in Proc. Adv. Neural Inf. Process. Syst., Apr. 2001, pp.
1033–1040.
VI. KẾT LUẬN
Như vậy, trong bài báo này, chúng tơi đã giới thiệu lý thuyết
trị chơi Stackelberg trong việc tối đa lợi nhuận của hai nhà
cung cấp dịch vụ trong các mạng truyền thông IoT không
đồng nhất cấp nguồn khơng dây, đó là nhà cung cấp dịch vụ
IoT (ISP) và nhà cung cấp năng lượng (ESP). Điểm cân bằng
Stackelberg đạt được bao gồm một cơng suất phát sóng vô
tuyến tối ưu của ESP và đơn giá mua năng lượng, thời gian
phát sóng vơ tuyến của PB, và thời gian hoạt động của các
thiết bị IoT được đề xuất bởi ISP thơng qua thuật tốn tối ưu
ln phiên. Thuật tốn này được chứng minh thơng qua cả lý
thuyết và mơ phỏng là có tốc độ hội tụ nhanh và hiệu quả tính
tốn cao trong thời gian đa thức. Các kết quả mô phỏng cũng
chỉ ra rằng lợi nhuận đạt được của phương pháp đề xuất cao
hơn các phương pháp khác.
TÀI LIỆU
[1] D. Bandyopadhyay and J. Sen, “Internet of Things: Applications
and Challenges in Technology and Standardization," Wireless Pers.
Commun., vol. 58, no. 1, pp. 49–69, Apr. 2011.
[2] A. A. Fuqaha et al., “Internet of Things: A Survey on Enabling
Technologies, Protocols, and Applications," IEEE Commun. Surv. &
Tut., vol. 17, no. 4, pp. 2347-2376, Jun. 2015.
ISBN 978-604-80-5958-3
15
Distance between the PB and IoT devices (m)
7
47