HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
-----------------------------------
PHẠM TRIỀU DƯƠNG
NGHIÊN CỨU DỮ LIỆU KHÔNG GIAN
PHÁT TRIỂN TRẠM BTS 5G
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
TP. HỒ CHÍ MINH – NĂM 2023
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
--------------------------------------
PHẠM TRIỀU DƯƠNG
NGHIÊN CỨU DỮ LIỆU KHÔNG GIAN
PHÁT TRIỂN TRẠM BTS 5G
Chuyên ngành: Hệ thống thông tin
Mã số:
8.48.01.04
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. HUỲNH TRỌNG THƯA
TP.HỒ CHÍ MINH – NĂM 2023
i
LỜI CAM ĐOAN
Tôi cam đoan rằng đề án tốt nghiệp thạc sĩ: “NGHIÊN CỨU DỮ LIỆU
KHÔNG GIAN PHÁT TRIỂN TRẠM BTS 5G” là cơng trình nghiên cứu của
chính tơi.
Tơi cam đoan các số liệu, kết quả nêu trong đề án là trung thực và chưa từng
được ai công bố trong bất kỳ cơng trình nào khác.
Khơng có sản phẩm/nghiên cứu nào của người khác được sử dụng trong đề
án này mà khơng được trích dẫn theo đúng quy định.
TP. Hồ Chí Minh, ngày 18 tháng 08 năm 2023
Học viên thực hiện đề án
Phạm Triều Dương
ii
LỜI CẢM ƠN
Trong suốt quá trình học tập và nghiên cứu thực hiện đề án tốt nghiệp thạc sĩ,
ngoài nỗ lực của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình q báu của
q Thầy Cơ, cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng nghiệp.
Với lịng kính trọng và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành tới:
Tôi xin chân thành cảm ơn Thầy TS. Huỳnh Trọng Thưa, người thầy kính
u đã hết lịng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tôi trong suốt q
trình thực hiện và hồn thành đề án tốt nghiệp thạc sĩ.
Ban Giám Đốc, Phòng đào tạo sau đại học và quý Thầy Cô đã tạo mọi điều
kiện thuận lợi giúp tơi hồn thành đề án.
Tơi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã
động viên, hỗ trợ tơi trong lúc khó khăn để tơi có thể học tập và hồn thành đề án.
Mặc dù đã có nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm nghiên cứu
khoa học còn hạn chế nên khơng thể tránh khỏi những thiếu sót. Tơi rất mong nhận
được sự góp ý của q Thầy Cơ cùng bạn bè đồng nghiệp để kiến thức của tôi ngày
một hồn thiện hơn.
Xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 18 tháng 08 năm 2023
Học viên thực hiện đề án
Phạm Triều Dương
iii
DANH SÁCH HÌNH VẼ
Hình 1.1:Các mốc thời gian lộ trình phát triển 5G tại Việt Nam ............................8
Hình 1.2:Ví dụ về ảnh vector ..................................................................................9
Hình 1.3:Ví dụ về ảnh raster ...................................................................................9
Hình 1.4:Ví dụ về phân tích dữ liệu khơng gian và trực quan hóa chúng .............11
Hình 1.5:Ví dụ về ứng dụng học máy để tách lớp.................................................12
Hình 1.6:Ví dụ về sử dụng SVM để phân lớp ảnh raster ......................................13
Hình 1.7:Ví dụ về phân cụm theo khơng gian .......................................................14
Hình 3.1:Biểu đồ heatmap Hệ số tương quan Pearson ..........................................26
Hình 3.2:Thống kê mơ tả các dữ liệu kiểu số ........................................................26
Hình 3.3:Biểu đồ phân bổ theo các biến ...............................................................28
Hình 3.4:Biểu đồ phân bổ các trạm BTS theo huyện ............................................29
Hình 3.5:Biểu đồ phân bổ các trạm BTS theo xã/phường/TP ...............................30
Hình 3.6:Biểu đồ cột các trường dữ liệu kiểu số ...................................................31
Hình 3.7:Biểu đồ phân bố thiết bị 2G ...................................................................31
Hình 3.8:Biểu đồ phân bố thiết bị 3G ...................................................................32
Hình 3.9:Biểu đồ phân bố thiết bị 4G ...................................................................32
Hình 3.10:Biểu đồ phân bố thiết bị 5G .................................................................33
Hình 4.1:Bản đồ tỉnh Tây Ninh theo hành chính Huyện/TX/TP ..........................35
Hình 4.2:Bản đồ tỉnh Tây Ninh theo hành chánh phường xã ................................36
Hình 4.3:Bảng phân bổ các trạm BTS theo tổng lưu lượng ..................................37
Hình 4.4:Bản đồ phân bổ các trạm BTS theo tổng lưu lượng với không gian
phường xã ..............................................................................................................38
Hình 4.5:Bản đồ phân bổ các trạm BTS theo tổng lưu lượng theo vị trí khu vực 38
Hình 4.6:Phân bổ các trạm BTS theo số lượng thiết bị 2G ...................................39
Hình 4.7:Phân bổ các trạm BTS theo số lượng thiết bị 3G ...................................40
Hình 4.8:Phân bổ các trạm BTS theo số lượng thiết bị 4G ...................................40
Hình 4.9:Phân bổ các trạm BTS theo số lượng thiết bị 5G ...................................41
iv
Hình 4. 10 Dự đốn khu vực phát triển trạm BTS 5G mới ...................................51
Hình 4.11:Trang Dashboard của ứng dụng ...........................................................53
Hình 4.12:Trang vị trí các trạm BTS .....................................................................54
Hình 4.13:Trang các trạm BTS với thơng số ........................................................56
Hình 4. 14 Trang dự báo phát triển trạm theo lưu lượng trên GIS........................58
v
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
VIẾT TẮT
TIẾNG ANH
TIẾNG VIỆT
BTS
Trạm trạm thu phát sóng
2G
Base Transceiver Station
Geographic Information
System
2nd Generation
3G
3rd Generation
thế hệ thứ 3
4G
4th Generation
thế hệ thứ 4
5G
5th Generation
Long Term Evolution
thế hệ thứ 5
GIS
LTE
Hệ thống Thông tin Địa lý
thế hệ thứ 2
Lỗi trung bình bình phương
RMSE
Root Mean Squared Erorr
gốc
MSE
Mean Squared Erorr
sai số bình phương trung bình
CDR
Cell Downtime Rate
CQI
Channel Quality Indicator
vi
MỤC LỤC
LỜI CAM ĐOAN .......................................................................................................i
LỜI CẢM ƠN ........................................................................................................... ii
DANH SÁCH HÌNH VẼ ......................................................................................... iii
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ............................................v
MỤC LỤC .................................................................................................................vi
PHẦN MỞ ĐẦU ........................................................................................................1
1.
Tính cấp thiết của đề tài ...................................................................................1
2.
Tình hình nghiên cứu liên quan đến đề tài .......................................................2
3.
Mục tiêu, ý nghĩa khoa học và thực tiễn ..........................................................3
4.
Đối tượng và phạm vi nghiên cứu....................................................................4
5.
6.
4.1
Đối tượng nghiên cứu ...............................................................................4
4.2
Phạm vi nghiên cứu ..................................................................................4
Phương pháp nghiên cứu..................................................................................4
5.1
Phương pháp nghiên cứu lý thuyết ...........................................................4
5.2
Phương pháp nghiên cứu thực nghiệm .....................................................5
Bố cục đề án .....................................................................................................5
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ TRẠM BTS 5G VÀ KHÔNG
GIAN PHÁT TRIỂN.................................................................................................6
1.1. Tổng quan về trạm BTS 5G .............................................................................6
1.1.1. Tổng quan về trạm BTS 5G tại Việt Nam ..................................................6
1.1.2. Tình hình 5G tại Việt Nam [5] ...................................................................7
1.2. Tổng quan về dữ liệu không gian (Spatial Data)..............................................8
1.3. Tổng quan về học máy với dữ liệu không gian ..............................................10
CHƯƠNG 2: CÁC CƠNG TRÌNH LIÊN QUAN ................................................14
2.1. Các cơng trình liên quan trên thế giới ............................................................14
2.2. Các cơng trình liên quan ở Việt Nam .............................................................21
vii
CHƯƠNG 3: MƠ HÌNH ĐỀ XUẤT DỰ BÁO KHƠNG GIAN PHÁT TRIỂN
TRẠM BTS THEO LƯU LƯỢNG ........................................................................23
3.1. Thiết kế mô hình .............................................................................................23
3.2. Bộ dữ liệu của bài tốn ...................................................................................24
3.3. Phương pháp đánh giá ....................................................................................33
CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................35
4.1. Phân tích dữ liệu với GIS ...............................................................................35
4.2. Huấn luyện và kiểm thử mơ hình ...................................................................42
4.3. Kết quả và thảo luận .......................................................................................49
4.4. Dự đoán vùng xây dựng BTS 5G mới ............................................................51
4.5. Ứng dụng demo ..............................................................................................53
PHẦN KẾT LUẬN ..................................................................................................59
1.
Kết quả nghiên cứu của đề tài ........................................................................59
2.
Hạn chế đề tài .................................................................................................60
3.
Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu:...............................61
DANH MỤC TÀI LIỆU THAM KHẢO ...............................................................62
1
PHẦN MỞ ĐẦU
1. Tính cấp thiết của đề tài
Hiện nay, vấn đề quản lý và phát triển trạm BTS là nội dung đặc biệt quan trọng
trong hệ thống thông tin di động. Với sự phát triển mạnh mẽ của công nghệ thông
tin, những năm gần đây, công nghệ thông tin đã được tích cực nghiên cứu và ứng
dụng trong quản lý hạ tầng bưu chính viễn thơng nói chung và hạ tầng trạm BTS nói
riêng thay cho việc quản lý, tổng hợp, báo cáo thủ công trên giấy theo truyền thông,
đặc biệt gần đây là ứng dụng hệ thống thông tin địa lý GIS.
Dự đốn vùng khơng gian phù hợp cho việc phát triển các trạm thu, phát sóng thơng
tin di động (BTS) đóng vai trị quan trọng trong quy hoạch và quản lý chiến lược
phát triển hệ thống BTS. Sử dụng hệ thống thông tin địa lý (GIS) để số hóa quy
hoạch phát triển hạ tầng viễn thơng động và số hóa dữ liệu trạm thu, phát sóng
thơng tin di động từ tất cả các doanh nghiệp di động trên tồn quốc, có thể cung cấp
hỗ trợ cho việc quản lý mạng lưới thông tin di động của nhà nước và tăng cường
hiệu quả quản lý.
Tăng cường khả năng truy cập Internet cùng với sự tiến bộ của các cơng nghệ tiên
tiến như trí tuệ nhân tạo, Internet of Things (IoT) và tự động hóa đã tạo đà cho sự
tăng trưởng vượt bậc về lượng dữ liệu được tạo ra. Việc sản sinh dữ liệu đang tăng
lên với tốc độ kinh khủng, và dự kiến trong thập kỷ tới, lượng dữ liệu này sẽ tăng
thêm hàng trăm zettabyte. Hạ tầng di động hiện tại không được thiết kế để đáp ứng
tải lượng thơng tin lớn như vậy, do đó, yêu cầu nâng cấp là cần thiết.
Đồng thời, 5G với tốc độ nhanh, khả năng chứa đựng lượng lớn dữ liệu và độ trễ
thấp, có thể hỗ trợ và thúc đẩy triển khai các ứng dụng đa dạng. Với sự kết nối đám
mây, 5G có thể hỗ trợ việc kiểm sốt giao thơng, giao hàng bằng máy bay khơng
người lái, trò chuyện video chất lượng cao và trò chơi di động với trải nghiệm giống
như trên máy chơi game, ngay cả khi di chuyển. 5G mang lại lợi ích và ứng dụng vơ
tận, từ các giao dịch thanh tốn quốc tế, giáo dục từ xa, đến sự linh hoạt của lực
2
lượng lao động. Tiềm năng của 5G là vô cùng lớn, có thể thay đổi cách thức làm
việc, nền kinh tế toàn cầu và cuộc sống hàng ngày của mọi người.
Hiện tại Tập Đồn Cơng Nghiệp - Viễn Thơng Qn Đội (Viettel) đã tổ chức
khai trương dịch vụ di động 5G tại các tỉnh: Thành Phố Hà Nội, Thành phố HCM,
Bắc Ninh, Bình Phước, Bắc Giang, Thừa Thiên Huế, Bến Tre, Cần Thơ, Bình
Dương, Quảng Ninh, Bà Rịa Vũng Tàu, Đà Nẵng, Lào Cai, Thái Nguyên, Sóc
Trăng, Long An, Khánh Hịa, Ninh Thuận, Bình Thuận, Lâm Đồng, Quảng Trị,
Tiền Giang, Bình Định, Gia Lai, Kon Tum, Phú Yên, Quảng Ngãi, Quảng Nam,
Bạc Liêu, Nghệ An, Thanh Hóa. Và trong đó ngày 23/6/2022, tại Trung tâm thương
mại Vincom Plaza, thành phố Tây Ninh, Tập Đồn Cơng Nghiệp - Viễn Thơng
Qn Đội (Viettel) khai trương dịch vụ di động 5G trên địa bàn tỉnh Tây Ninh.
Theo đó, từ 14h ngày 23/06 đến hết ngày 25/06/2022, người dân có thể dùng thử
mạng 5G viettel tại trụ sở UBND Tỉnh, Tỉnh ủy, Sở Thông Tin và Truyền thông,
Trung tâm thương mại Vincom Plaza. Việc triển khai mạng 5G Viettel góp phần
thúc đẩy chiến lược nâng cấp hạ tầng viễn thông, công nghệ thông tin, làm động lực
chuyển đổi số của nhiều tỉnh. Tuy nhiên, hiện nay việc phủ sóng trạm BTS 5G cịn
rất ít và chưa rộng khắp, vì vậy việc phát triển và xây dựng chiến lược quy hoạch
trạm thu phát sóng BTS 5G rất cần thiết.
Đề tài như sau:
Tên tiếng Việt: NGHIÊN CỨU DỮ LIỆU KHÔNG GIAN PHÁT TRIỂN TRẠM
BTS 5G.
Tên tiếng Anh: RESEARCH ON SPATIAL DATA TO DEVELOP 5G BASE
TRANCIEVER STATIONS.
2. Tình hình nghiên cứu liên quan đến đề tài
Các nghiên cứu hiện nay liên quan đến "NGHIÊN CỨU DỮ LIỆU KHÔNG GIAN
PHÁT TRIỂN TRẠM BTS 5G" đang tập trung vào nhiều khía cạnh khác nhau của
mạng 5G và các trạm BTS (Base Transceiver Station) trong không gian. Dữ liệu
không gian trong ngữ cảnh này bao gồm thông tin về vị trí địa lý, đặc điểm mơi
3
trường, thông lượng mạng và các thông số kỹ thuật khác liên quan đến trạm BTS
5G.
Một số nghiên cứu tập trung vào việc phân tích và khai thác dữ liệu không
gian để cải thiện hiệu suất và khả năng phục vụ của mạng 5G. Các phương pháp
phân tích khơng gian được sử dụng để định vị và tối ưu hóa vị trí trạm BTS 5G,
tăng cường độ phủ sóng, giảm nhiễu và tăng cường khả năng truyền dẫn. Nghiên
cứu cũng tập trung vào việc ứng dụng dữ liệu không gian để tối ưu hóa quy hoạch
mạng 5G. Bằng cách sử dụng dữ liệu khơng gian, các mơ hình dự báo có thể được
phát triển để đo đạc nhu cầu sử dụng mạng, xác định tốc độ truyền dẫn, tối ưu hóa
sử dụng tài ngun và quản lý thơng lượng trong mạng 5G.
Trong nghiên cứu này đã sử dụng các kỹ thuật và công nghệ tiên tiến trong
lĩnh vực học máy và trí tuệ nhân tạo để tiến hành phân tích và tận dụng dữ liệu
khơng gian. Các mơ hình học máy được xây dựng để dự đoán và tối ưu hóa hiệu
suất.
Dữ liệu khơng gian có thể giúp cải thiện phạm vi mạng và chất lượng bằng
cách cung cấp thông tin về vị trí trạm cơ sở và mơi trường xung quanh. Thơng tin
này có thể được sử dụng để tối ưu hóa vị trí của trạm cơ sở và đảm bảo hoạt động
với hiệu suất tối đa. Dữ liệu khơng gian cũng có thể được sử dụng để xác định các
khu vực có nhu cầu cao về dịch vụ 5G, giúp các nhà khai thác mạng ưu tiên đầu tư
vào cơ sở hạ tầng mới. Ngoài ra, dữ liệu khơng gian cũng có thể được sử dụng để
xác định các khu vực có thể có sự thiếu sót về phạm vi hoặc các vấn đề khác ảnh
hưởng đến hiệu suất mạng [1]. Bằng cách phân tích dữ liệu này, các nhà khai thác
mạng có thể đưa ra quyết định thông minh về việc đầu tư vào cơ sở hạ tầng mới và
tối ưu hóa mạng hiện có của nhà mạng [2].
3. Mục tiêu, ý nghĩa khoa học và thực tiễn
Mục tiêu nghiên cứu:
Mục tiêu tổng quát: Nghiên cứu dữ liệu không gian nhằm phát triển trạm
BTS 5G.
Mục tiêu cụ thể như sau:
4
o Nghiên cứu và xây dựng mơ hình dự báo học máy bằng cách sử dụng dữ
liệu không gian và GIS kết hợp dữ liệu lưu lượng người dùng qua các
trạm BTS.
o Đánh giá các kết quả dự báo và độ chính xác của mơ hình xây dựng
o Sản phẩm dự kiến: Mơ hình dự báo phát triển trạm 5G theo không gian.
4. Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu:
Đối tượng nghiên cứu chính là dữ liệu khơng gian và dữ liệu lưu lượng
của các trạm BTS
Bên cạnh đó, nghiên cứu các thuật toán dự báo và máy học, học sâu
ứng dụng vào dữ liệu khơng gian.
Ngồi ra, đề tài sẽ sử dụng cơng cụ Rstudio, Google Colab, MatLab để
xây dựng mơ hình dự báo dữ liệu không gian. Đánh giá các kết quả dự
báo và độ chính xác của mơ hình.
4.2 Phạm vi nghiên cứu
Phạm vi nghiên cứu:
Tập dữ liệu không gian trạm BTS tại Viettel Tây Ninh đã được thông
qua ý kiến của lãnh đạo Viettel Tây Ninh cấp duyệt.
Thu thập được trong thời gian từ 2020 đến 2022.
Nghiên cứu các thuật toán machine learning phù hợp với bộ spatial data
thu thập được.
5. Phương pháp nghiên cứu
5.1 Phương pháp nghiên cứu lý thuyết
-
Tìm các tài liệu, sách liên quan tới dữ liệu khơng gian, mơ hình dự đốn sử
dụng dữ liệu không gian, GIS, phân bố không gian trạm BTS 5G, số lượng
người dùng, các thuật tốn dự báo có thể áp dụng được.
5
-
Tìm tham khảo tài liệu từ những hội thảo, cơng trình, đề tài thực hiện trong
và ngồi nước.
-
Tìm tài liệu, sách liên quan tới học sâu, dữ liệu lớn như Python NoteBook,
Google Colab, Rstudio, MatLab.
5.2 Phương pháp nghiên cứu thực nghiệm
-
Sau khi nghiên cứu lý thuyết, các bài toán, đề xuất mơ hình; xây dựng và
phát triển ứng dụng dựa trên mơ hình đề xuất; cài đặt thử nghiệm chương
trình, đánh giá các kết quả đạt được; công bố kết quả nghiên cứu
6. Bố cục đề án
Bên cạnh phần mở đầu, phần kết luận và phần tài liệu tham khảo, phần nội dung
chính của bài nghiên cứu được chia thành 4 chương chính như sau:
Chương 1: Tổng quan đề tài
Chương 2: Các cơng trình liên quan
Chương 3: Thuật tốn đề xuất
Chương 4: Kết quả mô phỏng thực nghiệm
6
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ TRẠM BTS 5G
VÀ KHÔNG GIAN PHÁT TRIỂN
1.1. Tổng quan về trạm BTS 5G
1.1.1. Tổng quan về trạm BTS 5G tại Việt Nam
Trạm thu phát sóng di động (BTS – Base Transciever Station) [3] là một
thiết bị thu phát vô tuyến cố định trong bất kỳ mạng di động nào. BTS kết nối các
thiết bị di động với mạng. Nó gửi và nhận tín hiệu vô tuyến đến các thiết bị di động
và chuyển đổi chúng thành tín hiệu kỹ thuật số mà nó truyền trên mạng để định
tuyến đến các thiết bị đầu cuối khác trong mạng hoặc Internet.
5G là thế hệ tiếp theo của công nghệ di động không dây, mang đến tốc độ tải
xuống và tải lên nhanh hơn, kết nối ổn định hơn và dung lượng cải thiện so với các
mạng trước đây. So với mạng 4G phổ biến hiện nay, 5G cung cấp tốc độ và độ tin
cậy cao hơn đáng kể, và có tiềm năng thay đổi cách chúng ta sử dụng internet để
truy cập ứng dụng, mạng xã hội và thơng tin. Ví dụ, các cơng nghệ như xe tự lái,
ứng dụng trò chơi tiên tiến và phương tiện truyền phát trực tiếp sẽ được hưởng lợi
rất nhiều từ kết nối 5G, đảm bảo kết nối dữ liệu tốc độ cao và đáng tin cậy.
Sự tăng cường về yêu cầu truy cập internet, cùng với sự phát triển của các
cơng nghệ mới như trí tuệ nhân tạo, Internet vạn vật (IoT) và tự động hóa, đã thúc
đẩy sự gia tăng đáng kể về khối lượng dữ liệu được tạo ra. Việc tạo ra dữ liệu này
đang phát triển theo cấp số nhân và dự kiến rằng trong thập kỷ tới, khối lượng dữ
liệu này sẽ tăng thêm hàng trăm zettabyte. Tuy nhiên, cơ sở hạ tầng di động hiện tại
không được thiết kế để xử lý tải lượng thơng tin lớn như vậy, do đó, u cầu nâng
cấp là cần thiết.
5G, với tốc độ cao, dung lượng lớn và độ trễ thấp, có thể hỗ trợ và tăng
cường quy mơ của nhiều ứng dụng. Ví dụ, 5G có thể hỗ trợ kết nối giao thơng kiểm
sốt được liên kết với đám mây, giao hàng bằng máy bay khơng người lái, trị
chuyện video và chơi game di động với chất lượng tương tự như máy chơi game,
ngay cả khi di chuyển. Từ việc thanh tốn tồn cầu, ứng phó khẩn cấp, giáo dục từ
7
xa cho đến sự linh hoạt của lực lượng lao động, 5G mang lại vơ hạn lợi ích và ứng
dụng. 5G có tiềm năng thay đổi cách thức làm việc.
Cũng giống như các mạng di động trước đây, công nghệ 5G sử dụng các
trạm sóng di động để truyền dữ liệu qua sóng vơ tuyến. Các trạm sóng di động kết
nối với mạng bằng công nghệ không dây hoặc kết nối có dây. Cơng nghệ 5G hoạt
động bằng cách sửa đổi cách mã hóa dữ liệu.
OFDM: Ghép kênh phân chia theo tần số trực giao (OFDM) là một phần
thiết yếu của công nghệ 5G. OFDM là một định dạng điều biến mã hóa sóng khơng
khí băng tần cao khơng tương thích với 4G, cung cấp độ trễ thấp hơn và cải thiện
tính linh hoạt so với mạng LTE.
Tháp nhỏ hơn: Công nghệ 5G cũng sử dụng các máy phát nhỏ hơn được đặt
trên các tòa nhà và cơ sở hạ tầng khác. 4G và công nghệ di động trước đây dựa trên
các tháp sóng di động độc lập. Khả năng vận hành mạng từ các tháp sóng nhỏ sẽ hỗ
trợ nhiều thiết bị với tốc độ vượt trội.
Phân chia mạng: Các nhà mạng di động sử dụng công nghệ 5G để triển khai
nhiều mạng ảo độc lập trên cùng một cơ sở hạ tầng. Bạn có thể tùy chỉnh mỗi phần
trong mạng cho các dịch vụ và trường hợp kinh doanh khác nhau, ví dụ như các
dịch vụ truyền phát hoặc các tác vụ của doanh nghiệp. Bằng cách hình thành một
bộ các chức năng mạng 5G cho từng trường hợp sử dụng hoặc mơ hình kinh doanh
cụ thể, bạn có thể hỗ trợ các yêu cầu khác nhau từ tất cả các ngành dọc. Sự tách
biệt về dịch vụ có nghĩa là người dùng được hưởng lợi từ trải nghiệm đáng tin cậy
hơn và hiệu quả cao hơn trên thiết bị của họ.
1.1.2. Tình hình 5G tại Việt Nam [5]
Vào năm 2020, Việt Nam đã đạt thành công khi trở thành quốc gia thứ 5
trên thế giới sở hữu công nghệ 5G. Mặc dù xuất phát từ một điểm khởi đầu thấp,
nhiều người trong và ngồi nước đã khơng tin rằng Việt Nam có thể đạt được điều
này. Tuy nhiên, hiện nay, hai tập đoàn lớn trong nước là Viettel và Vingroup đã
thống nhất hợp tác phát triển công nghệ 5G theo chuẩn mở Open RAN dưới sự chỉ
đạo của Bộ Thơng tin và Truyền thơng. Trong đó, Vingroup tập trung vào phần
8
cứng không dây, trong khi Viettel chú trọng vào xử lý tín hiệu và tích hợp phần
mềm để tạo thành các sản phẩm thương mại.
Hình 1.1:Các mốc thời gian lộ trình phát triển 5G tại Việt Nam
1.2. Tổng quan về dữ liệu không gian (Spatial Data)
Dữ liệu không gian [6] là bất kỳ loại dữ liệu nào tham chiếu trực tiếp hoặc gián tiếp
đến một khu vực hoặc vị trí địa lý cụ thể. Có thể gọi dữ liệu khơng gian theo tên
khác như dữ liệu không gian địa lý hoặc thơng tin địa lý. Nó cũng có thể được biểu
diễn dưới dạng số liệu cho một đối tượng vật lý trong hệ tọa độ địa lý. Tuy nhiên,
dữ liệu không gian không chỉ là một thành phần không gian của bản đồ. Người dùng
có thể lưu dữ liệu khơng gian ở nhiều định dạng khác nhau, vì nó cũng có thể chứa
nhiều hơn dữ liệu về vị trí cụ thể. Phân tích dữ liệu này giúp hiểu rõ hơn về cách
mỗi biến số tác động đến các cá nhân, cộng đồng, quần thể, v.v. Có một số loại dữ
liệu khơng gian, nhưng hai loại dữ liệu khơng gian chính là dữ liệu hình học và dữ
liệu địa lý.
Dữ liệu khơng gian [7] có thể tồn tại ở nhiều định dạng khác nhau và không
chỉ chứa thông tin cụ thể về vị trí. Để hiểu đúng và tìm hiểu thêm về dữ liệu khơng
gian, có một vài thuật ngữ chính:
Vector: Dữ liệu vectơ được mô tả tốt nhất dưới dạng biểu diễn đồ họa của
thế giới thực. Có ba loại dữ liệu vectơ chính: điểm, đường và đa giác. Kết nối các
9
điểm tạo ra các đường và kết nối các đường tạo ra một vùng kín sẽ tạo ra các đa
giác. Các vectơ được sử dụng tốt nhất để trình bày các khái quát của các đối tượng
hoặc tính năng trên bề mặt Trái đất. Dữ liệu vectơ và định dạng tệp được gọi là
shapefiles (.shp) đôi khi được sử dụng thay thế cho nhau vì dữ liệu vectơ thường
được lưu trữ trong tệp .shp.
Hình 1.2:Ví dụ về ảnh vector
Raster: Ví dụ về raster Dữ liệu raster là dữ liệu được trình bày trong một
lưới các pixel. Mỗi pixel trong một raster có một giá trị, cho dù đó là màu sắc hay
đơn vị đo lường, để truyền đạt thông tin về phần tử được đề cập. Raster thường đề
cập đến hình ảnh. Tuy nhiên, trong thế giới khơng gian, điều này có thể đề cập cụ
thể đến hình ảnh trực giao là những bức ảnh được chụp từ vệ tinh hoặc các thiết bị
trên không khác. Chất lượng dữ liệu raster khác nhau tùy thuộc vào độ phân giải và
nhiệm vụ cần giải quyết.
Hình 1.3:Ví dụ về ảnh raster
10
Attributes: Dữ liệu không gian chứa nhiều thông tin hơn là chỉ một vị trí trên
bề mặt Trái đất. Mọi thông tin bổ sung hoặc dữ liệu phi không gian mơ tả một tính
năng được gọi là một thuộc tính. Dữ liệu khơng gian có thể có bất kỳ số lượng
thuộc tính bổ sung nào kèm theo thơng tin về vị trí. Ví dụ: bạn có thể có bản đồ hiển
thị các tòa nhà trong khu vực trung tâm thành phố. Mỗi tịa nhà, ngồi vị trí của
chúng, có thể có các thuộc tính bổ sung như loại hình sử dụng (nhà ở, doanh nghiệp,
chính phủ, v.v.), năm xây dựng và số tầng của tòa nhà.
Hệ tọa độ địa lý (Geographic Coordinate System): được sử dụng để xác
định các vị trí chính xác trên bề mặt của Trái đất. Thơng thường, trục x và y được
sử dụng trong các hệ thống toán học, nhưng trong địa lý, các trục này được gọi là
các đường vĩ độ (các đường nằm ngang chạy theo hướng đông-tây) và kinh độ (các
đường thẳng đứng chạy theo hướng bắc-nam). Mỗi trục biểu thị góc mà đường đó
được định hướng đối với tâm Trái đất và do đó, các đơn vị được đo bằng độ.
1.3. Tổng quan về học máy với dữ liệu không gian
Học máy, hay gọi là Machine Learning [8] được sử dụng để xây dựng một mơ hình
hoặc một cỗ máy bằng cách yêu cầu nó học hỏi từ một tập dữ liệu lớn. Dữ liệu lớn
có thể là dữ liệu dạng bảng và sau đó là dữ liệu khơng gian, khơng bao gồm hình
ảnh và văn bản. Có 3 loại học máy cơ bản học có giám sát, học khơng giám sát và
học sâu. Trong học có giám sát, chúng ta nên có tập dữ liệu huấn luyện và tập dữ
liệu kiểm tra. Tập dữ liệu huấn luyện và kiểm tra ở dạng bảng với các cột là biến và
các hàng là quan sát. Điều làm cho chúng khác biệt là tập dữ liệu huấn luyện có một
biến phụ thuộc/mục tiêu, cũng thường được đặt tên là nhãn và các biến còn lại là
biến độc lập. Tập dữ liệu thử nghiệm, không giống như tập dữ liệu huấn luyện, chỉ
chứa các biến độc lập mà khơng có biến mục tiêu. Chúng ta sử dụng mơ hình
Machine Learning đã được đào tạo với tập dữ liệu huấn luyện để dự đoán biến mục
tiêu cịn thiếu của tập dữ liệu thử nghiệm.
Phân tích dữ liệu không gian: GIS bao gồm thu thập, quản lý, thao tác,
phân tích và trực quan hóa dữ liệu khơng gian dưới dạng một hệ thống. Dữ liệu
không gian, không giống như dữ liệu dạng bảng, có các thuộc tính không gian cho
11
mỗi lần quan sát. Có hai loại dữ liệu khơng gian: vector và raster. Dữ liệu vectơ có
thể có dạng điểm, đường hoặc đa giác. dữ liệu raster bao gồm các pixel dưới dạng
hình ảnh. Dữ liệu khơng gian có thể biểu diễn dưới dạng dữ liệu dạng bảng, nhưng
sự quan sát của nó có các thuộc tính khơng gian. Nói cách khác, mỗi quan sát đại
diện cho một vị trí trong thế giới thực. Kết quả là, các quan sát trong dữ liệu khơng
gian có vĩ độ, kinh độ, diện tích (đa giác), chu vi (đa giác), trọng tâm (đa giác) và độ
dài (đường thẳng). Một nhóm các thuộc tính khơng gian khác có thể có là mật độ,
khoảng cách và centography (điểm). Ví dụ về dữ liệu hình dạng đa giác là các thành
phố, khu dân cư, khu vực sử dụng đất và các khu vực khác. Mạng lưới đường bộ,
đường ống, sông và tuyến đường được thể hiện bằng các hình dạng nội tuyến. Dữ
liệu điểm thường chứa thông tin về điểm độ cao, điểm độ sâu mực nước ngầm và
các điểm quan tâm khác. Dữ liệu đa giác, đường và điểm có thể được chuyển đổi
sang dữ liệu khác tùy thuộc vào những gì chúng ta cần.
Hình 1.4:Ví dụ về phân tích dữ liệu khơng gian và trực quan hóa chúng
Trong dữ liệu dạng bảng, một quan sát khơng có bất kỳ mối quan hệ khơng
gian nào với các quan sát khác. Trong dữ liệu không gian, mỗi quan sát có một
khoảng cách với các quan sát khác. Do thuộc tính khơng gian, chúng ta có thể thực
12
hiện phân tích khơng gian (hoặc thao tác hình học), chẳng hạn như clip, xóa, đệm,
hợp nhất, nội suy, v.v.
Học máy áp dụng vào phân tích dữ liệu khơng gian: Chúng ta có thể chạy
các thuật tốn học máy về hồi quy, phân loại và phân cụm trong xử lý dữ liệu không
gian. Một trong những công cụ trong GIS được sử dụng thường xuyên là phép nội
suy, ví dụ nội suy một tập hợp các điểm chứa thông tin giá nhà thành đa giác hoặc
raster. Trên thực tế, phân tích hồi quy trong dữ liệu khơng gian là để nội suy vì
chúng ta muốn dự đốn các giá trị chưa biết trong các khu vực giữa các điểm. Công
cụ nội suy thường được sử dụng là Kriging. Để nội suy các điểm bằng học máy,
chúng ta có thể thử công cụ Empirical Bayesian Kriging (EBK). Kriging thông
thường chỉ sử dụng một mơ hình bán biến số duy nhất để dự đoán các giá trị chưa
biết, trong khi EBK dự đoán các giá trị chưa biết bằng cách sử dụng nhiều biểu đồ
bán biến và quy tắc Bayes. EBK đã giải thích ở trên nội suy dữ liệu đơn biến.
Chúng ta cũng có thể nhập các biến phụ thuộc có ảnh hưởng đến biến mục tiêu. Ví
dụ: nhập "khoảng cách từ đường chính", "khoảng cách từ cơ sở cơng cộng", "xảy ra
tội phạm" và "rủi ro thiên tai" có thể hỗ trợ nội suy giá nhà bằng cách sử dụng EBK.
Các thuật tốn khác cho phép nội suy khơng gian là Hồi quy bình phương nhỏ nhất
thơng thường (OLS) và Hồi quy theo trọng số địa lý (GWR).
Hình 1.5:Ví dụ về ứng dụng học máy để tách lớp
13
Học máy để nội suy: Hồi quy học máy thông thường, như hồi quy tuyến
tính, hồi quy dựa trên cây hoặc hồi quy Support Vector Machine, cũng có thể dự
đốn các biến mục tiêu theo các biến phụ thuộc, nhưng không thể thấy rằng các biến
mục tiêu ở khoảng cách gần hơn có xu hướng có nhiều giá trị giống nhau hơn. Giá
nhà ở các khu vực gần hơn có xu hướng tương tự nhau. Phép nội suy không gian
tuân theo định luật địa lý đầu tiên do Tobler viện dẫn: “những thứ ở gần thì liên
quan nhiều hơn những thứ ở xa”. Bên cạnh phép nội suy điểm, chúng ta cũng có thể
thực hiện Phép nội suy diện tích. Phép nội suy diện tích trả về một tập hợp các đa
giác lớn hơn thành một tập hợp các đa giác nhỏ hơn tùy theo môi trường xung
quanh chúng. Một đa giác có thể được ghép lại thành một vài đa giác với các giá trị
bị ảnh hưởng bởi các giá trị lân cận. Nhiệm vụ thứ hai của học máy là phân loại.
Trong Machine Leaning thông thường, chúng ta biết các thuật toán phân loại như
Maximum Likelihood, Support Vector Machine, và Decision Tree. Trong phân tích
khơng gian, chúng ta hồn tồn sử dụng tốt các thuật tốn này. Nhiệm vụ phổ biến
của Machine Learning để phân loại không gian là phân loại lớp phủ đất từ hình ảnh
vệ tinh.
Hình 1.6:Ví dụ về sử dụng SVM để phân lớp ảnh raster
14
Hình 1.7:Ví dụ về phân cụm theo khơng gian
CHƯƠNG 2: CÁC CƠNG TRÌNH LIÊN QUAN
2.1. Các cơng trình liên quan trên thế giới
Vùng phủ sóng tín hiệu tối ưu [9] luôn là vấn đề cơ bản đối với các nhà khai
thác mạng di động. Các vấn đề khác liên quan đến năng lực, chất lượng dịch vụ và
hiệu quả chi phí cũng nhanh chóng được quan tâm. Để xác định phạm vi phủ sóng
của tín hiệu, các kỹ sư mạng thường chủ yếu dựa vào bản đồ địa hình hai chiều (2D)
và các mơ hình dự đốn lan truyền theo kinh nghiệm khá đơn giản. Trong nghiên
cứu này, một khung cung cấp tối ưu hóa vùng phủ sóng mạng hiệu quả hơn và tiết
kiệm chi phí hơn cho mơi trường đô thị dày đặc đã được nghiên cứu. Hệ thống
thông tin địa lý 3D (GIS) của khu vực nghiên cứu đã được xây dựng. Cơng cụ dự
đốn lan truyền tín hiệu dựa trên dị tia kết hợp với thơng tin địa lý 3D đã được sử
dụng để lập mơ hình vùng phủ sóng tín hiệu vơ tuyến cho các Trạm thu phát cơ sở
cho một trong những nhà khai thác điện thoại di động được cấp phép cung cấp dịch
vụ điện thoại di động ở Kenya. Để xác định vị trí tốt nhất của các trạm BTS nhằm
phủ sóng tín hiệu tối ưu cho khu vực nghiên cứu, các công cụ phân tích khơng gian
trong GIS đã được sử dụng. So sánh phương pháp được đề xuất với các phương
pháp cổ điển chứng minh rằng phương pháp phân tích khơng gian này có thể được
sử dụng để tối ưu hóa vùng phủ sóng tín hiệu di động trong bất kỳ môi trường đô thị
dày đặc nào mà không cần dùng đến các phép đo trường dài, do đó giảm thiểu chi
phí quy hoạch mạng khơng dây.
Theo [10], với sự phát triển nhanh chóng của truyền thơng khơng dây và quy
mơ ngày càng tăng của mạng di động, nhiệm vụ lập kế hoạch mạng di động và tối
ưu hóa tài nguyên ngày càng trở nên khó khăn hơn. Một quy hoạch mạng tốt sẽ là
một quy hoạch dẫn đến chi phí cơ sở hạ tầng ít hơn bằng cách sử dụng các nguồn
lực tối ưu đồng thời đảm bảo sự hài lòng của khách hàng nhiều hơn. Sự gia tăng số
lượng trạm thu phát sóng di động (BTS) với lượng khách hàng ngày càng tăng,
khơng chỉ làm tăng tổng chi phí của mạng di động mà cịn có tác động lớn đến các
15
vấn đề về nguy cơ bức xạ. Điều quan trọng là lựa chọn tối ưu các trạm BTS trong
thiết kế mạng di động. Việc lựa chọn các trạm BTS ở khu vực địa hình khác nhau
với sự phân bổ người dùng không đồng đều, chẳng hạn như Uttarakhand, là một
thách thức lớn khác. Với ước tính tổn thất đường dẫn cùng với các mơ hình dự đốn
lan truyền kết hợp với phân tích cẩn thận dữ liệu khơng gian và thu thập thơng tin
địa hình từ Hệ thống thơng tin địa lý (GIS), có thể xác định được các vị trí tháp tiềm
năng. Bài báo đề xuất một phương pháp để đánh giá sự phù hợp của vị trí Trạm gốc
của mạng vô tuyến di động BSNL ở Uttarakhand với mục tiêu tối ưu hóa và tự động
hóa quy trình lập kế hoạch mạng. Thông tin địa lý, chẳng hạn như hình ảnh vệ tinh,
bản đồ địa hình, bản đồ kỹ thuật số thành phố, Aster DEM, thông số vị trí của các
tháp BSNL hiện có (như Vĩ độ và Kinh độ, chiều cao ăng-ten, tần số) của khu vực
nghiên cứu được thu thập từ các nguồn khác nhau. Sử dụng những dữ liệu này, các
lớp khác nhau của mạng lưới đường bộ, sơng ngịi, mơi trường sống và độ che phủ
rừng đã được hình thành trong phần mềm ArcGIS để xác định vị trí các địa điểm
phù hợp. Vùng chết và vùng chồng lấn của vùng phủ sóng tháp hiện có đã được
phát hiện. Do đó, việc phân tích các tháp hiện có của khu vực nghiên cứu đã được
thực hiện để tìm ra các vị trí đặt tháp tối ưu.
Một nghiên cứu của Nizamuddin [11] Trạm thu phát cơ sở (BTS) được sử
dụng để tạo tín hiệu phụ cho mục đích sử dụng di động. BTS sẽ hỗ trợ tất cả các
hoạt động liên quan đến trao đổi dữ liệu như nhắn tin và duyệt web. Dữ liệu khơng
gian đóng vai trị quan trọng để hỗ trợ vùng phủ sóng tín hiệu của BTS. Dữ liệu
khơng gian cũng có thể được sử dụng để thiết kế mạng di động mới và xây dựng
trạm BTS mới. Mục đích nghiên cứu này là giúp người quản lý vận hành tìm ra
khoảng cách phân bổ BTS sẽ được sử dụng để lập nhóm vị trí BTS cho người vận
hành. Trong nghiên cứu này, Hệ thống thông tin địa lý (GIS) đã được sử dụng để
phân tích khoảng cách gần nhất và tạo nhóm BTS. Nhà phân tích mạng khơng gian
sử dụng đường dẫn dữ liệu mạng để tìm ra khoảng cách gần nhất từ vị trí của nhà
khai thác đến tất cả BTS ở Banda Aceh bằng cách sử dụng các cơng cụ ở cơ sở gần
nhất và để phân tích nhóm vị trí của nhà khai thác dựa trên giá trị trung bình của
16
khoảng cách BTS bằng cách sử dụng phương pháp đệm. Kết quả nghiên cứu này đã
tính được khoảng cách trung bình từ vị trí của nhà khai thác đến tất cả các trạm BTS
là 6,2 km. Dựa trên khoảng cách trung bình, đội đầu tiên sẽ quản lý 7 BTS và đội
thứ hai sẽ quản lý 14 BTS.
Theo K. Shittu [12] Quản lý thông tin đã trở thành một chủ đề rất quan trọng
trong thời gian gần đây và tiến bộ công nghệ phụ thuộc ngày càng nhiều vào lượng
thông tin có sẵn trong thời gian thực. Các quốc gia vĩ đại ngày nay được đặc trưng
bởi lượng thông tin mà họ khai thác và mức độ tốt và hiệu quả của thông tin này
được phân phối tới công dân của họ. Nhu cầu ngày càng tăng đối với các dịch vụ di
động đòi hỏi phải tăng cơ sở hạ tầng truyền thông như tháp; cần thiết để đảm bảo
rằng có vùng phủ sóng và quyền truy cập mạng đầy đủ để đảm bảo chất lượng dịch
vụ tối thiểu. Không thể đánh giá thấp tầm quan trọng của các cột viễn thơng đối với
việc hiện thực hóa hiệu quả trong giao tiếp. Tuy nhiên, nghiên cứu này tập trung
vào ứng dụng GIS trong việc cung cấp giải pháp phân phối cột viễn thơng và vị trí
của chúng ở khu vực Chính quyền địa phương Nam Ilorin, Bang Kwara, Nigeria.
Khả năng phân tích của GIS đã được khai thác trên một số cột viễn thông được
chọn trong khu vực nghiên cứu, bao gồm; MTN, GLO, 9MOBILE, AIRTEL,
MULTILINK và GOTV. Các đặc điểm khác như đường xá, tòa nhà, cơ sở y tế, trạm
cứu hỏa và đồn cảnh sát đều được đưa về một điểm tham chiếu chung cho mục đích
phân tích. Các phát hiện và kết quả từ các phân tích cho thấy chiều cao trung bình
của cột viễn thơng là 45m trong khi một số tịa nhà gần vị trí của cột viễn thông vi
phạm khoảng cách 10m của Ủy ban Truyền thông Nigeria (NCC) và Cơ quan Thực
thi Quy định Tiêu chuẩn Môi trường Quốc gia (NESREA). Việc phân phối các trạm
gốc GSM ở Ilorin South LGA đều ở dạng cụm. Điều này ngụ ý rằng, các cột được
đặt gần nhau một cách ngẫu nhiên khi nhìn vào nền của chu vi khu vực. Do đó,
nghiên cứu khuyến nghị khoảng cách từ 65m trở lên của vị trí cột viễn thông so với
khu vực công cộng và việc sử dụng sắp xếp thứ tự nên được khuyến khích như HIS
và American Tower Company cho phép một số nhà khai thác viễn thông sử dụng
nhiều cột viễn thông ở cả khu vực thành thị và ngoại ô.