Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022)
Nâng cao hiệu quả phân loại điều chế tự động
sử dụng mạng CNN đa đầu vào
Tạ Thị Kiều Lan1, Lê Hà Khánh1, Hoàng Văn Phúc1 và Đồn Văn Sáng2
1
Viện Tích hợp hệ thống, Trường Đại học Kỹ thuật Lê Q Đơn
Số 236 Hồng Quốc Việt, Quận Bắc Từ Liêm, Hà Nội
2
Học viện Hải Qn, Nha Trang, Khánh Hịa
Email:
Tóm tắt – Phân loại điều chế tự động (Automatic Modulation
Classification: AMC) là quá trình phát hiện và phân loại điều
chế dựa trên tín hiệu thu được mà khơng có thơng tin tiên
nghiệm về tín hiệu (sóng mang, cơng suất tín hiệu, pha tín
hiệu…). Học sâu (Deep Learning: DL) là một trong những
phương pháp hứa hẹn nhất với độ chính xác cao, ngày càng được
ứng dụng rộng rãi vào phân loại điều chế tự động. Các nghiên
cứu trước đây trong phân loại tín hiệu điều chế chỉ tập trung với
các mơ hình đơn đầu vào nên độ chính xác phân loại cịn hạn
chế. Do đó, nghiên cứu trong bài báo này đề một phương pháp
sử dụng mạng học sâu đa đầu vào để trích lọc nhiều hơn các đặc
trưng của tín hiệu từ đó nâng cao độ chính xác phân loại. Mơ
hình đa đầu vào lần lượt được đánh giá với các đầu vào khác
nhau, gồm tín hiệu IQ kết hợp tín hiệu I (In-phase) (gọi là mơ
hình IQ-I) và tín hiệu IQ kết hợp tín hiệu Q (Quadrature phase)
(gọi là mơ hình IQ-Q). Kết quả mơ phỏng cho thấy mơ hình đa
đầu vào cho độ chính xác phân loại điều chế tín hiệu cao hơn mơ
hình đơn đầu vào, cụ thể các mơ hình IQ-I và IQ-Q đạt độ chính
xác cao hơn mơ hình đơn đầu vào IQ lần lượt là 6% và 7%.
số kênh và việc tính tốn sẽ phức tạp khi các tham số chưa biết
được đưa vào. Trong khi đó, phương pháp FB được sử dụng
bằng cách trích xuất tích lũy bậc cao hơn (HOC: Higher-order
cumulants) và phân tích các đặc trưng cho mỗi sơ đồ điều chế.
Tuy nhiên, các phương pháp trên đều phân loại kém hiệu quả
trong môi trường kênh phức tạp [3].
Index Terms—Học sâu, đa đầu vào, điều chế, tỉ số tín trên tạp,
phân loại điều chế tự động.
Trong những năm gần đây, học sâu đã có những tiến bộ
vượt bậc trên nhiều lĩnh vực như nhận thức sự vật, dịch tự động,
nhận dạng giọng nói, …. Đó là những vấn đề từng rất khó khăn
với các nhà nghiên cứu trí tuệ nhân tạo. Tuy nhiên, ứng dụng
học sâu trong phân loại điều chế là một cách tiếp cận khá mới
và có thể áp dụng trong cả lĩnh vực dân dụng và quân sự.
Không giống như các kỹ thuật LB và FB yêu cầu ngưỡng
quyết định thủ công, phương pháp học sâu có thể thích nghi
tìm kiếm và xác định chúng. Các thuật tốn AMC thơng
thường cần tính tốn với thời gian thực để đưa ra kết quả.
Khơng chỉ là độ phức tạp tính tốn cao hơn, mà thời gian trễ
dài hơn đều khơng có lợi để áp dụng trong tồn bộ hệ thống
truyền thơng. Học sâu có thể thích nghi để đối phó với những
vấn đề này đúng cách. Mặc dù phải mất một lượng lớn thời
gian để huấn luyện mạng, mạng đã được huấn luyện có thể
thực hiện nhiệm vụ phân loại gần như trong thời gian thực,
sát với quy trình xác thực.
I. GIỚI THIỆU
Sự phát triển bùng nổ của các hệ thống thông tin trong tất
cả các lĩnh vực kinh tế - xã hội, quốc phòng, an ninh dẫn tới
lượng dữ liệu truyền đi trên kênh vô tuyến ngày càng lớn, nhu
cầu sử dụng phổ tần số vô tuyến ngày càng cao, tần số sử
dụng ngày càng trở nên khan hiếm, cần được quản lý và sử
dụng hiệu quả hơn. Do đó, phân loại điều chế tự động (AMC:
Automatic Modulation Classification) là một trong những
nhiệm vụ quan trọng, để xác định và giảm thiểu các điểm yếu
bảo mật. Đồng thời AMC cũng cho phép chia sẻ phổ hợp tác
để tối đa hóa tiện ích phổ, giúp cho việc quản lý và sử dụng
hiệu quả phổ tần trong kỷ nguyên của truyền thông không dây
trên các lĩnh vực dân sự, thương mại, chính phủ và ứng dụng
quân sự chia sẻ phổ tần.
Một quá trình phân loại điều chế điển hình thường liên quan
đến hai bước: tiền xử lý tín hiệu và phân loại tín hiệu đã được
xử lý. Cụ thể, T.J. O’Shea và J. Corgan [4] đã xây dựng một
mạng nơ ron tích chập (CNN: Convolutional Neural Network)
để nhận dạng tập dữ liệu bao gồm 11 điều chế: 8 kỹ thuật số và
3 tương tự. Mô hình này đạt được độ chính xác phân loại
khoảng 87,4% trên tập dữ liệu thử nghiệm.
Hiệu năng phân loại điều chế của CNN trên 8 kiểu điều
chế đã được nghiên cứu trong [5]. Nhóm tác giả đã thơng
qua các kiến trúc GoogLeNet và AlexNet để phân loại điều
chế dựa trên hình ảnh chịm sao tín hiệu làm đầu vào. Tuy
nhiên, các kiến trúc trên cho thấy sự phụ thuộc ngày càng
nhiều vào các yếu tố tiền xử lý hình ảnh như độ phân giải
hình ảnh, kích thước cắt ảnh,... và đạt được độ chính xác
dưới 80% ở SNR = 0 dB.
AMC truyền thống được chia thành hai loại: Dựa trên khả
năng (LB: Likelihood-based) [1] và dựa trên đặc trưng (FB:
Feature-based) [2]. Phương pháp phân loại điều chế LB so sánh
giá trị hàm khả năng của tín hiệu nhận được trong nhóm điều chế
được xem xét. Tuy nhiên, phương pháp LB cần biết trước tham
ISBN 978-604-80-7468-5
159
Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022)
A. P. Hermawan và cộng sự [6] đã sử dụng các tín hiệu
IQ (In-phase and quadrature phase) làm đầu vào để nghiên
cứu hiệu năng của kiến trúc CNN với 4 lớp tích chập, 2 lớp
gộp cực đại và 2 lớp kết nối đầy đủ để phân loại 11 dạng điều
chế và đạt được độ chính xác là 83,4% ở 18 dB.
Những nội dung còn lại của bài báo được tổ chức như sau:
phần II mơ tả mơ hình đề xuất. Tập dữ liệu sử dụng trong bài
báo được trình bày trong phần III. Phần IV thảo luận các kết
quả mô phỏng và nhận xét. Cuối cùng, kết luận bài báo được
trình bày trong phần V.
Tim O’Shea và T. Charles Clancy [7] đã khảo sát với tập
dữ liệu gồm 24 kiểu điều chế bậc cao với mơ hình ResNet
được sửa đổi để khắc phục hiện tượng tê liệt nơ-ron
(vanishing gradient) của mạng CNN. Đối với các kiểu điều
chế bậc thấp, ở SNR cao, ResNet đạt được tỷ lệ chính xác
phân loại tối đa là 99,8%. Ở SNR thấp hơn, hiệu quả giữa
mạng VGG và ResNet hầu như giống hệt nhau.
II.
Trong phần này, mơ hình mạng nơ ron đa đầu vào được
đề xuất và mô tả nhằm phân biệt nó với mơ hình đơn đầu vào.
Trước tiên, các thành phần của một mơ hình CNN sẽ được
mơ tả làm rõ. Theo đó, mơ hình CNN thường bao gồm: lớp
tích chập, lớp kích hoạt phi tuyến, lớp pooling và lớp kết nối
đầy đủ.
Yogesh Kumar [8] đã khảo sát mơ hình ResNet-50 và mạng
Inception ResNet V2 nhằm xác định các kiểu điều chế 2ASK,
4ASK, QPSK, 8PSK, 8QAM, 16QAM, 32QAM, và 64QAM.
Cả hai mơ hình, ResNet-50 và Inception ResNet V2 cung cấp
phân loại đáng tin cậy khi SNR > 5 dB cho tất cả các kiểu điều
chế ngoại trừ 16QAM và 64QAM.
Lớp tích chập (Convolutional Layer) là lớp chính trong
mạng CNN. Đó là lớp đầu tiên để nhận dạng các đặc trưng
nổi bật từ đầu vào. Trong phép tốn tích chập, từng ơ nhỏ của
ma trận đầu vào được nhân tích chập với một ma trận bộ lọc.
Phép tích chập được tính theo cơng thức:
Tuy nhiên, các bài báo trên mới trích xuất đặc trưng tín
hiệu trên miền thời gian và sử dụng mơ hình tương đối phức
tạp để đạt được hiệu quả phân loại cao. H. Elyousseph, M. L
Altamimi [9] đã trích xuất các đặc trưng tín hiệu trên miền I,
miền Q và miền phổ tạo ra dữ liệu đầu vào dưới dạng hình
ảnh lai ghép để đưa vào huấn luyện. Với cách xử lí dữ liệu
đầu vào như trên, bài toán AMC được quy về bài tốn phân
loại ảnh. Các phương pháp biểu diễn hình ảnh kết hợp với
CNN đã đạt được hiệu quả phân loại tốt, tuy nhiên với đầu
vào dạng ảnh có thể làm tăng kích thước đầu vào, tín hiệu
trước khi đưa vào mơ hình phải qua các bước tiền xử lý và
ghép lại với nhau, làm tăng đặc trưng của tín hiệu nhưng cũng
làm tăng tham số tính tốn của mơ hình.
k ( x, y ) * f ( x, y )
m/ 2
n/ 2
k (u , v ) f ( x u , y v )
u m / 2 v n / 2
(1)
Trong đó k ( x , y ) là bộ lọc kích thước m n , f ( x , y ) là ma
trận đầu vào. Trong q trình tính tích chập, số bước nhảy
cho mỗi lần di chuyển luôn được xem xét trượt bộ lọc trên
toàn bộ ma trận đầu vào. Tuy nhiên, số bước nhảy khơng thể
phủ tồn bộ ma trận đầu vào, đặc biệt với những đặc trưng
ngồi biên.
Lớp kích hoạt phi tuyến thường sử dụng hàm kích hoạt
ReLU (Rectified Linear Unit) là một hàm phi tuyến có tác
dụng đưa các giá trị âm về 0. Mục đích của lớp này là đưa giá
trị đầu vào về một ngưỡng để loại bỏ các giá trị âm khơng cần
thiết có thể ảnh hưởng cho các bước tính tốn sau này. Về
mặt tốn học, hàm ReLU được biểu diễn như sau:
Hầu hết các phương pháp AMC dựa trên học sâu đề cập ở
trên đều cố gắng mơ tả đặc điểm của tín hiệu được điều chế ban
đầu, nhưng hiếm khi xem xét mối quan hệ giữa các đặc trưng
của tín hiệu và cấu trúc mạng. Để giải quyết vấn đề trên, bài báo
đề xuất phân loại điều chế dựa trên mơ hình CNN với đa đầu vào
mà cụ thể là hai đầu vào, với một đầu vào là tín hiệu kênh IQ,
một đầu vào là tín hiệu kênh I hoặc kênh Q để gia tăng đặc trưng
học được từ đó nâng cao hiệu quả phân loại. Tại cùng một thời
điểm, tín hiệu ban đầu được chuyển đổi thành dữ liệu kênh IQ,
kênh I hoặc kênh Q và mạng CNN được xây dựng để trích xuất
các đặc trưng về biên độ và pha của tín hiệu. Những đóng góp
của nghiên cứu này có thể được tóm tắt như sau:
f ( x ) max(0, x)
(2)
Lớp gộp (pooling) thực chất là lấy mẫu xuống, làm giảm
kích thước đầu vào khi thực hiện tích chập mà vẫn giữ được
đặc trưng của đầu vào. Điều này cho phép giảm độ phức tạp
tính tốn đồng thời khơng làm mất đi các đặc trưng quan trọng
của đầu vào. Lớp gộp có 3 loại chính như sau: gộp cực đại,
gộp trung bình, và gộp tổng. Trong đó, gộp cực đại là kiểu
thường được sử dụng nhất.
Lớp kết nối đầy đủ (Fully Connected Layer): Ma trận
nhận được sau các bước tích chập và gộp được đưa vào mạng
kết nối đầy đủ như mạng nơ ron truyền thống. Do đó, mỗi nút
trong lớp kết nối đầy đủ được kết nối trực tiếp với mọi nút
trong cả lớp trước và lớp tiếp theo như trong Hình 1. Các lớp
kết nối đầy đủ thường được theo sau bởi hàm kích hoạt ReLU,
riêng với lớp kết nối đầy đủ cuối cùng của mạng CNN thường
- Đánh giá mối quan hệ giữa các đặc trưng tín hiệu và cấu
trúc mạng, cụ thể là số kênh lọc.
- Sử dụng mơ hình CNN đa đầu vào nhằm trích xuất nhiều
hơn các đặc trưng của tín hiệu trên miền I, Q và tín hiệu IQ, khai
thác tối đa các đặc trưng của từng miền, từ đó nâng cao hiệu quả
phân loại điều chế.
ISBN 978-604-80-7468-5
MƠ HÌNH ĐỀ XUẤT
160
Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022)
được theo sau bởi hàm kích hoạt softmax để tính xác suất cho
mỗi lớp:
𝑆(𝑦𝑖 ) =
𝑒
A
, 𝑖 = 1,2, … , 𝑁
(6)
Q
arctan
I
𝑖
𝑗
∑𝑁
𝑗 𝑒
I 2 Q2
(3)
Trước hết, bài báo xem xét mối quan hệ giữa đặc trưng
tín hiệu với cấu trúc mạng có số bộ lọc khác nhau dựa trên
mơ hình CNN đơn đầu vào sử dụng kênh IQ trong Hình 3.
Trên cơ sở cấu trúc mạng tối ưu đối với đặc trưng tín hiệu,
nhóm tác giả triển khai kiến trúc mạng CNN đa đầu vào như
Hình 4 để so sánh hiệu quả phân loại với mạng CNN đơn
đầu vào. Các mơ hình huấn luyện sử dụng số vịng lặp
(epoch) là 50, mini-batch size là 64, tốc độ học khởi tạo là
0.001, thuật toán tối ưu Adam và hàm mất mát categorical
cross-entropy. Thiết bị sử dụng để mô phỏng là máy tính với
cấu hình CPU 3.7 GHz, RAM 32GB và NVIDIA GeForce
GTX 3060ti GPU.
trong đó 𝑆(𝑦𝑖 ) là xác suất để đầu vào rơi vào lớp thứ i và N
là số lớp đầu ra.
Tín hiệu IQ
Kích thước 128x2
Hình 1. Lớp kết nối đầy đủ.
Tín hiệu I/Q
Kích thước 128x1
Đầu vào
Đầu vào
Reshape
128,2,1
Reshape
64,2,1
Conv2D 64x3x1
ReLU
Conv2D 64x3x1
ReLU
Gộp cực đại
2x2
Gộp cực đại
2x2
Chọn ngẫu nhiên
0.4
Chọn ngẫu nhiên
0.4
Conv2D 64x3x1
ReLU
Conv2D 64x3x1
ReLU
Chọn ngẫu nhiên
0.4
Chọn ngẫu nhiên
0.4
Bài báo ứng dụng mạng CNN với mơ hình đa đầu vào
trích xuất nhiều hơn các đặc trưng tín hiệu I, Q và IQ để nâng
cao hiệu quả phân loại.
Véc-tơ hóa
Véc-tơ hóa
Cơ sở tốn học để biểu diễn kênh I và kênh Q của tín hiệu
xuất phát từ biểu thức tổng quát của tín hiệu:
Kết nối đầy đủ 128
ReLU
Kết nối đầy đủ 128
ReLU
Kết nối đầy đủ 11
Softmax
Kết nối đầy đủ 11
Softmax
Đầu ra
11
Đầu ra
11
a, Đầu vào IQ
b, Đầu vào I hoặc Q
Lớp ghép kênh (concatenate layer) giúp kết hợp các mảng
với nhau, yêu cầu các mảng đầu vào lớp ghép kênh phải cùng
kích thước. Việc kết hợp được thực hiện bằng cách ghép xen
các hàng của từng mảng đầu vào như được biểu diễn trong
Hình 2.
Đầu vào 1
r*c
Ghép kênh
2r*c
Đầu vào 2
r*c
Hình 2. Lớp ghép kênh.
s (t ) A cos( t )
c
A cos cos( t ) A sin sin( t )
c
c
(4)
Kênh I và Q được xác định qua biểu thức (5), biên độ và
pha của tín hiệu được biểu diễn bởi kênh I, Q thông qua biểu
thức (6):
I A.cos
Q A sin
ISBN 978-604-80-7468-5
Hình 3. Cấu trúc mạng CNN đơn đầu vào.
(5)
161
Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thơng và Cơng nghệ Thơng tin (REV-ECIT2022)
Tín hiệu IQ
Kích thước 128x2
dụng Matlab làm công cụ mô phỏng. Kết quả so sánh độ chính
xác của các mơ hình thể hiện ở Hình 5.
Tín hiệu I/Q
Kích thước 128x1
Đầu vào
Đầu vào
Reshape
128,2,1
Reshape
64,2,1
Conv2D 64x3x1
ReLU
Conv2D 64x3x1
ReLU
Gộp cực đại
2x2
Gộp cực đại
2x2
Chọn ngẫu nhiên
0.4
Chọn ngẫu nhiên
0.4
Conv2D 64x3x1
ReLU
Conv2D 64x3x1
ReLU
Chọn ngẫu nhiên
0.4
Chọn ngẫu nhiên
0.4
Véc-tơ hóa
Véc-tơ hóa
Kết nối đầy đủ 128
ReLU
Kết nối đầy đủ 128
ReLU
Nhóm tác giả tiến hành mơ phỏng mơ hình CNN đơn đầu
vào với số kênh lọc của lớp tích chập lần lượt là 32 và 64. Từ
kết quả mơ phỏng ở Hình 5, mơ hình CNN với 64 kênh lọc
cho độ chính xác cao hơn khoảng 3% so với mơ hình CNN
với 32 kênh lọc cho SNR từ -20 dB đến +18 dB. Có thể thấy
rằng, việc thay đổi số kênh lọc làm tăng các đặc trưng của tín
hiệu được trích xuất, từ đó tăng độ chính xác phân loại. Bên
cạnh đó, việc sử dụng tín hiệu đầu vào cho mơ hình chỉ sử
dụng kênh I hoặc kênh Q cũng cho độ chính xác gần với tín
hiệu kênh IQ. Tuy nhiên với kênh I, độ chính xác thấp nhất,
thấp hơn khoảng 4% so với kênh Q và tín hiệu kênh IQ.
Ghép kênh
Kết nối đầy đủ 11
Softmax
Đầu ra
11
Hình 4. Cấu trúc mạng CNN đa đầu vào.
Hình 5. Độ chính xác phân loại mơ hình đơn đầu vào.
III. TẬP DỮ LIỆU ĐÁNH GIÁ
Khi sử dụng mơ hình CNN với hai đầu vào là tín hiệu
kênh IQ và tín hiệu kênh I (hoặc kênh Q), kết quả mô phỏng
ở Hình 6 cho thấy độ chính xác phân loại tín hiệu tăng đáng
kể. Độ chính xác của mơ hình đa đầu vào cao hơn mơ hình
đơn đầu vào khoảng 7% cho cả kênh I và kênh Q với SNR từ
-20dB đến 18dB. Có thể thấy rằng, cùng một cấu trúc mơ hình
mạng, nhờ việc tăng đặc trưng của tín hiệu thơng qua mơ hình
sử dụng đa đầu vào làm cải thiện đáng kể độ chính xác phân
loại của mơ hình.
Bài báo sử dụng tập dữ liệu RML2016.10a đã được giới
thiệu trong bài báo [4], bao gồm 11 dạng tín hiệu điều chế
thuộc 5 nhóm điều chế khác nhau được liệt kê như sau:
• Điều chế tương tự: WB-FM, AM-SSB, AM-DSB.
• Điều chế FSK: BFSK, CPFSK.
• Điều chế PAM: 4PAM.
• Điều chế PSK: BPSK, QPSK, 8PSK.
• Điều chế QAM: 16QAM, 64QAM.
Bộ dữ liệu có tín hiệu với chiều dài 128 mẫu I/Q đối với
từng loại điều chế, tỷ số tín hiệu trên tạp âm (signal to noise
ratio: SNR) là từ -20 dB đến +18 dB, bước cách 2 dB. Tổng
cộng, bộ dữ liệu có 220.000 mẫu tín hiệu. Tập dữ liệu được
tạo ra trong điều kiện kênh có Fading đa đường biến đổi theo
thời gian của kênh đáp ứng xung đơn vị, độ trôi với bước ngẫu
nhiên của dao động tần số sóng mang và đồng hồ thời gian
mẫu và tạp âm trắng cộng tính Gauss.
IV. THẢO LUẬN KẾT QUẢ
Trong phần này, nhằm đánh giá hiệu quả các mơ hình
CNN sử dụng đơn đầu vào và đa đầu vào, nhóm tác giả sử
ISBN 978-604-80-7468-5
Hình 6. Độ chính xác mơ hình đơn và mơ hình đa đầu vào.
162
Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022)
Ma trận so sánh (confusion matrix) được sử dụng để cho
thấy sự so sánh giữa các nhãn dự đoán so với các nhãn đúng.
Như chỉ ra trong Hình 7, các dạng điều chế tương tự như AMDSB, điều chế số bậc thấp như BPSK, CPFSK, GPSK, 4PAM
cho độ chính xác phân loại cao, trên 96% tại SNR= +2dB và
ít bị lỗi hơn. Với các tín hiệu điều chế số bậc cao như 8PSK,
16QAM, 64QAM cho độ chính xác dưới 70% tại SNR =
+2dB. Có thể thấy các tín hiệu điều chế bậc cao mặc dù cho
tốc độ truyền dẫn nhanh hơn, nhưng do tồn tại nhiều điểm tín
hiệu, khoảng cách từ điểm tín hiệu đến biên quyết định bị thu
hẹp, đặc biệt bị ảnh hưởng của tạp trắng chuẩn cộng tính cũng
như điều kiện kênh pha-đing đa đường, khi tỷ lệ lỗi tăng, tức
là SNR giảm, chịm sao tín hiệu bị phân tán hơn, các điểm tín
hiệu tiến gần hơn đến biên quyết định, dẫn tới giảm hiệu quả
phân loại tín hiệu.
VI.
KẾT LUẬN
Trong bài báo này, với cùng bộ dữ liệu đầu vào trong điều
kiện ảnh hưởng của tạp trắng chuẩn cộng tính và có pha-đing
đa đường, nhóm tác giả đã so sánh sự ảnh hưởng của tương
quan giữa đặc trưng tín hiệu với cấu trúc mạng CNN tới độ
chính xác phân loại. Bài báo cũng so sánh độ chính xác phân
loại giữa mơ hình CNN đơn đầu vào và mơ hình CNN đa đầu
vào và chỉ ra rằng mơ hình CNN đa đầu vào trích xuất được
nhiều hơn các đặc trưng của tín hiệu. Cụ thể, các đặc trưng của
tín hiệu kênh IQ kết hợp với kênh I hoặc kênh Q cho phép mơ
hình CNN đa đầu vào nâng cao hiệu năng phân loại.
Kết quả sơ bộ đầy hứa hẹn mở ra hướng nghiên cứu tiếp
theo cho bài toán AMC với nhiều loại tín hiệu hơn, dữ liệu
đầu vào lớn hơn và trong các điều kiện kênh truyền khác
nhau. Việc sử dụng kết hợp các kênh tín hiệu khác nhau cho
phép nâng cao độ chính xác phân loại tín hiệu tần số vơ tuyến
ngay cả khi chúng chỉ có các đặc trưng nổi bật trong miền tần
số so với miền thời gian hoặc ngược lại. Trong các nghiên
cứu tiếp theo, nhóm tác giả tập trung tạo ra nhiều dạng sóng
hơn cho bộ dữ liệu huấn luyện, nghiên cứu tiền xử lý tín hiệu,
trích xuất các đặc trưng tín hiệu trên các miền khác nhau như
thời gian, tần số, pha… đưa vào huấn luyện với các mơ hình
đa đầu vào mới để nâng cao độ chính xác phân loại.
LỜI CẢM ƠN
Nghiên cứu này được Bộ Khoa học và Công nghệ tài trợ
trong đề tài nghị định thư Việt Nam - CH Séc mã số
NĐT/CZ/22/12.
TÀI LIỆU THAM KHẢO
[1] J. L. Xu, W. Su and M. Zhou, “Likelihood-Ratio
Approaches to Automatic Modulation Classification,”
in IEEE Transactions on Systems, Man, and
Cybernetics, Part C (Applications and Reviews), vol.
41, no. 4, pp. 455-469, July 2011, doi:
10.1109/TSMCC.2010.2076347.
[2] Hazza, M. Shoaib, S. A. Alshebeili and A. Fahad, “An
overview of feature-based methods for digital
modulation classification,” 2013 1st International
Conference on Communications, Signal Processing,
and their Applications (ICCSPA), 2013, pp. 1-6, doi:
10.1109/ICCSPA.2013.6487244.
[3] S. Hu, Y. Pei, P. P. Liang and Y. -C. Liang, “Deep
Neural Network for Robust Modulation Classification
Under Uncertain Noise Conditions,” in IEEE
Transactions on Vehicular Technology, vol. 69, no. 1,
pp.
564-577,
Jan.
2020,
doi:
10.1109/TVT.2019.2951594.
[4] T.J. O’Shea, J. Corgan, T. C. Clancy, “Convolutional
Radio
Modulation
Recognition
Networks,”
a. Mơ hình đa kênh đầu vào IQ-I
b. Mơ hình đa kênh đầu vào IQ-Q
Hình 7. Ma trận so sánh khi phân loại điều chế sử dụng mơ
hình đa đầu vào tại SNR = +2 dB.
ISBN 978-604-80-7468-5
163
Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022)
[5]
[6]
[7]
[8]
[9]
Communications in Computer and Information Science,
vol. 629, pp 213–226, Jun. 2016.
S. Peng, H. Jiang, H. Wang, H. Alwageed, Y. Zhou, M.
M. Sebdani, and Y. Yao, “Modulation classification
based on signal constellation diagrams and deep
learning,” IEEE Transactions on Neural Networks and
Learning Systems, vol. 30, no. 3, pp. 718–727, 2019,
doi: 10.1109/TNNLS.2018.2850703.
P. Hermawan, R. R. Ginanjar, D. Kim, and J. Lee,
“CNN-Based Automatic Modulation Classification for
Beyond 5G Communications,” IEEE Communications
Letters, vol. 24, no. 5, pp. 1038–1041, 2020, doi:
10.1109/LCOMM.2020.2970922.
T. J. O’Shea, T. Roy and T. C. Clancy, “Over-the-Air
Deep Learning Based Radio Signal Classification,”
in IEEE Journal of Selected Topics in Signal
Processing, vol. 12, no. 1, pp. 168-179, Feb. 2018, doi:
10.1109/JSTSP.2018.2797022.
Y. Kumar, M. Sheoran, G. Jajoo and S. K. Yadav,
“Automatic Modulation Classification Based on
Constellation Density Using Deep Learning,” in IEEE
Communications Letters, vol. 24, no. 6, pp. 1275-1278,
June 2020, doi: 10.1109/LCOMM.2020.2980840.
H. Elyousseph, M. L. Altamimi, “Deep Learning Radio
Frequency Signal Classification with Hybrid
Images,” 2021 IEEE International Conference on
Signal and Image Processing Applications (ICSIPA),
2021, pp. 7-11.
ISBN 978-604-80-7468-5
164