TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
---------------o0o---------------
BÁO CÁO MÔN:
QUÁ TRÌNH NGẪU NHIÊN VÀ ỨNG DỤNG
Đề tài 7: Tìm hiểu quá trình ổn định (Stationary Processes),
quá trình Ergodic và các áp dụng.
Giảng viên: PGS.TS Nguyễn Thị Hoàng Lan
Danh sách nhóm:
Nguyễn Cao Duy
Trần Văn Dương
20164814
20160873
Hoàng Minh Định
20161040
Vũ Ngọc Sơn
20163580
Nguyễn Văn Thanh
20163648
HÀ NỘI, 12 - 2018
MỤC LỤC
MỞ ĐẦU........................................................................................................................... 3
NỘI DUNG....................................................................................................................... 3
I. Quá trình ngẫu nhiên ổn định.................................................................................4
1. Tổng quan về quá trình ổn định.......................................................................4
2.
Quá trình ổn định nghĩa hẹp.............................................................................4
3.
Quá trình ổn định nghĩa rộng...........................................................................4
II. Quá trình dừng Ergodic.........................................................................................7
1.
Khái niệm...........................................................................................................7
2. Tính chất của quá trình Ergodic......................................................................7
III. Áp dụng Python...................................................................................................10
1.
Khái niệm.........................................................................................................10
2. Tính chất của quá trình Ergodic....................................................................10
KẾT LUẬN..................................................................................................................... 16
TÀI LIỆU THAM KHẢO.............................................................................................17
2
3
MỞ ĐẦU
Ngày nay , nhu cầu trong việc thu nhận và xử lí các tín hiệu như: tín hiệu âm
thanh, hình ảnh, video, … trong thế giới tự nhiên đặt ra một vấn đề quan trọng trong
việc xây dựng các cơ sở lí thuyết, các mô hình toán học để ứng dụng và thực tế.
Những tín hiệu như trên là thể hiện các quá trình ngẫu nhiên được quan sát hay đo
lường các giá trị biến ngẫu nhiên tại các thời điểm khác nhau.
Việc nghiên cứu các đặc trưng thống kê của các quá trình ngẫu nhiên cũng như
đưa ra mô hình tổng quát về các dạng quá trình ngẫu nhiên khác nhau (như quá trình
ổn định, quá trình đếm, quá trình hồi phục,…) đem lại cho chúng ta những cơ sơ toán
học để ứng dụng trong xử lí tín hiệu thực.
Trong phạm vi đề tài số 7, nhóm chúng em sẽ nghiên cứu về quá trình ổn định,
quá trình Ergodic và những áp dụng của chúng. Các thành viên trong nhóm được phân
công nhiệm vụ như sau:
Vũ Ngọc Sơn
: làm slide, thuyết trình
Trần Văn Dương
: tìm hiểu lý thuyết
Hoàng Minh Định : tìm hiểu chữa bài tập
Nguyễn Cao Duy
: thực hành, vận dụng Python
Nguyễn Văn Thanh : làm báo cáo tổng kết
Qua báo cáo đề tài, nhóm hi vọng sẽ cung cấp cho người đọc kiến thức cơ sở về
hai loại quá trình trên cũng như những ứng dụng nổi bật của chúng trong thực tế.
Hà Nội, ngày 17 tháng 12 năm
2018
4
PHẦN I: QUÁ TRÌNH ỔN ĐỊNH
1.
Tổng quan quá trình ổn định:
-
Quá trình ngẫu nhiên ổn định (Stationary Stochastic Processes) là quá trình
-
ngẫu nhiên bất biến khi dịch theo hằng số thời gian.
Quá trình ngẫu nhiên ổn định bậc 1 nếu tính chất thống kê của X(ti) và X(ti
-
+ c) là như nhau với bất kỳ hằng số nào.
Quá trình ổn định bậc 2 nếu tính chất thống kê của cặp { X(t1), X(t2)} và
{ X(t1+c), X(t2+c)} là như nhau với bất kỳ hằng số c.
2.
Quá trình ổn định nghĩa hẹp:
2.1. Khái niệm:
Một quá trình ổn định theo nghĩa hẹp hay ổn định chặt bậc n (nth – other Strict –
Sense Stationary – S.S.S ) nếu thỏa mãn điều kiện sau với mọi ti và hằng số c bất kỳ :
Trong đó fx là hàm mật độ đồng thời của các biến: với
2.2. Tính chất :
- Ổn định chặt bậc 1, hàm mật độ phân phối không phụ thuộc thời gian:
+ Hàm mật độ phân phối bậc 1:
+ Kỳ vọng:
- Ổn định chặt bậc 2, hàm mật độ phân phói chỉ phụ thuộc vào sự sai khác thời
gian:
+ Hàm mật độ phân phối bậc 2:
+ Hàm tự tương quan:
3.
Quá trình ổn định nghĩa rộng:
3.1. Khái niệm:
Một quá trình ngẫu nhiên X(t) được gọi là ổn định theo nghĩa rộng hay quá trình
ổn định bậc 2 nếu thỏa mãn:
-
Trung bình theo thời gian bằng hằng số:
5
-
Hàm tự tương quan chỉ phụ thuộc vào khoảng cách giữa 2 thời
điểm:
Đặc biệt , vì thế năng lượng trung bình của quá trình ổn định không phụ thuộc
vào t và có giá trị bằng R(0).
Hai tiến trình và và và được gọi là quá trình WWS đồng thời nếu mỗi quá trình
là WWS và hiệp phương sai chéo chỉ phụ thuộc vào và:
Ví dụ:
Giả sử là một quá trình ổn định theo nghĩa rộng:
Ta có thể xác định các tham số liên quan của 2 biến:
Xét ta có:
Định nghĩa cho ta hàm tương quan của một quá trình ngẫu nhiên theo nghĩa
rộng chỉ phụ thuộc vào
và hệ số hiệp phương sai của nó bằng:
Vì vậy, là hàm tự hiệp phương sai và là hệ số tự hiệp phương sai của các
biến ngẫu nhiên và .
3.2. Tính chất :
6
- Sự ổn định theo nghĩa hẹp luôn ngầm thỏa mãn điều kiện ổn
định theo nghĩa rộng. Tuy nhiên điều ngược lại không phải lúc nào
cũng đúng.
- Xét là quá trình ngẫu nhiên Gausian, thì suy ra được độ ổn
định theo nghĩa rộng kéo theo thõa mãn điều kiện ổn định chặt ( ổn
định theo nghĩa hẹp) khi các biến là Gausian phối hợpvới chỉ số thời
gian bất kỳ, .
- nên
tức hàm tự hiệp phương sai của WSS chỉ phụ thuộc
khoảng cách thời gian giữa 2 thời điểm.
- Quá trình ngẫu nhiên
ổn định theo nghĩa rộng nếu có trung
bình (zero-mean) thì hàm phương sai
cũng là hàm tự tương quan
và chỉ phụ thuộc vào .
- Một quá trình Gauss với trung bình bằng không () và hàm
covariance có dạng
được gọi là quá trình ổn định Ornstein-
Uhlenbeck.
7
PHẦN II: QUÁ TRÌNH ERGODIC
1.
Khái niệm:
Quá trình ổn định bậc hai được gọi là quá trình dừng Ergodic khi trung bình theo
thời gian bằng trung bình theo tập hợp.
Một ví dụ đơn giản về quá trình Ergodic trong thực tế: Xét tín hiệu hình ảnh
của một vật như là thể hiện của một quá trình ngẫu nhiên. Nếu ta chứng minh nó có
tính dừng Ergodic thì khi đó việc ta dùng một cảm biến ảnh (máy ảnh) và “chụp” lấy
tín hiệu ở nhiều thời điểm khác nhau để tính trung bình theo thời gian sẽ có cùng
kết quả với việc ta dùng thật nhiều cảm biến để chụp tín hiệu tại cùng một thời điểm
để tính được trung bình theo không gian.
Tất nhiên trong thực tế việc kiểm tra một quá trình có phải là quá trình dừng
Ergodic hay không thường rất khó. Ngoài ra việc chuyển đổi giữa tính trung bình theo
thời gian và trung bình theo không gian cùng cần được xem xét sao cho hợp lí.
2.
Phân loại:
Tính dừng Ergodic có hai dạng: Ergodic kỳ vọng và Ergodic hiệp
phương sai
2.1 Ergodic kỳ vọng:
Định nghĩa: quá trình ngẫu nhiên dừng nhân giá trị thực {X(t)}
được gọi là ergodic kỳ vọng nếu kỳ vọng µ của quá trình trung bình
thời gian của một quỹ đạo bất kỳ
Giới hạn theo phương trung bình:
Đặt:
Với là giá trị trung bình thời gian trên của .
Khi , giới hạn là giá trị trung bình của quỹ đạo trên toàn trục số.
2.2
Ergodic hiệp phương sai:
8
Định nghĩa: Quá trình dừng nhận giá trị thực {X(t)} được gọi là ergodic
phương sai nếu phương sai V của nó bằng phương sai theo thời gian của một quỹ đạo
bất kỳ, tức là :
Ergodic phương sai được chia theo các trường hợp:
Trường hợp kỳ vọng đã biết
Trường hợp chưa biết kỳ vọng
Ergodic tự hiệp phương sai
Ergodic hiệp phương sai chéo
Giới hạn theo bình phương trung bình:
Trường hợp đã biết kỳ vọng: ta thay kỳ vọng vào công thức tính ra như bình
thường
Trường hợp chưa biết kỳ vọng: Cần dùng trung bình thời gian để ước lượng,
rồi sau đó tính ước lượng
Ergodic hiệp phương sai:
Nếu {} có kỳ vọng đã biết, có thể xét { }.
Nếu {} có kỳ vọng chưa biết,có thể dùng XT để ước lượng và xét
{ } với lưu ý rằng kết quả khác chính xác với T lớn.
Như vậy có thể giả sử rằng quá trình là quy tâm, tức là
Ergodic hiệp phương sai chéo
9
Hai quá trình nhận giá trị thực, dừng đồng thời {X(t)} và {Y(t)} được dọi là
ergodic hiệp phương sai chéo nếu quá trình dừng ergodic tự hiệp phương sai,hơn nữa
hiệp phương sai của chúng:
Chú ý : Tính chất Ergodic kỳ vọng và Ergodic tự hiệp phương sai hay được sử
dụng hơn cả. Chính vì thế quá trình có hai tính chất này còn được gọi là Ergodic suy
rộng.
10
PHẦN III: ÁP DỤNG PYTHON
1. Giới thiệu một vài thư viện của Python :
Numpy và Matplotlib là hai thư viện dành cho ngôn ngữ lập trình Python, giúp
xử lý những bài toán liên quan đến các định dạng dữ liệu kiểu đặc biệt, phân tích và
mô phỏng chúng trên biểu đồ. Khi sử dụng cả hai thư viện, chúng ta có thể sử dụng
những tính năng mô phỏng và tính toán giống như ngôn ngữ MATLAB ngay trên
Python.
1.1 Numpy:
- NumPy là một thư viện mở rộng các định nghĩa về toán học trong lập trình để
tương tác với các kiểu dữ liệu như số lớn, chuỗi số (nhiều chiều), vector và ma trận.
- Numpy cung cấp đầy đủ các phép toán, các hàm hỗ trợ của toán cao cấp để tính
toán trên những kiểu dữ liệu đó.
1.2 Matplotlib:
- Matplotlib là một thư viện hỗ trợ vẽ biểu đồ trong ngôn ngữ lập trình Python.
- Matplotlib cung cấp các phương thức giao tiếp (API) để vẽ, nhúng biểu đồ
thông qua lập trình. Các hàm vẽ của Matplotlib có cú pháp gần giống với các hàm vẽ
có trong MATLAB.
1.3 Bổ sung:
Bên cạnh hai thư viện đã giới thiệu trên, Python cũng thư viện Pandas chuyên để
xử lý các bảng số, các chuỗi phụ thuộc thời gian. Tuy nhiên, trong bài này chúng ta sẽ
không sử dụng Pandas.
2.
Bài toán áp dụng :
Trong thực tế, khi xem xét các quá trình ngẫu nhiên, ta thường xem xét thông
qua các bộ dữ liệu rời rạc. Các bộ dữ liệu có thể có được từ thu thập, hoặc được sinh
từ hàm phân phối có trong NumPy.
Để xém xét các tính chất một quá trình ngẫu nhiên rời rạc nào đó, ta mô phỏng
bộ dữ liệu rời rạc lên các phần mềm vẽ biểu đồ, và tính toán dựa trên các số liệu được
cung cấp từ bộ dữ liệu.
11
Ở đây, ta sử dụng kết hợp hai thư viện NumPy, Matplotlib để thực hiện phân tích
tính toán và mô phỏng.
2.1 - Ví dụ mô phỏng nhiễu trắng Gauss:
Xét thấy, nhiễu trắng Gauss có hàm phân phối không phụ thuộc vào thời gian,
nên nó ta có thể dễ dàng sinh được bộ dữ liệu tương ứng thông qua phân phối Gauss.
Với kỳ vọng và độ lệch chuẩn đã xác định:
μ=7
σ = 2.5
Sinh một chuỗi số theo phân phối Gauss trong 600 đơn vị thời gian. Như vậy,
chuỗi thu được có 600 phần tử.
import numpy as np
from matplotlib import pyplot
mu, sigma = 7, 2.5
x = np.random.normal(mu, sigma, 600) # White Noise
pyplot.xlabel('t')
pyplot.ylabel('x')
pyplot.plot(x)
pyplot.show()
# Sai lech giua ky vong Muy va gia tri trung binh thuc te.
print("muy = ", mu)
print("mean = ", np.mean(x))
print("|muy - mean| = ", abs(mu - np.mean(x)))
Hàm np.random.normal() được cung cấp bởi NumPy, dùng để sinh giá trị
random theo phân phối chuẩn. Ở đây ta sử dụng np.random.normal(mu, sigma, 600)
để sinh 600 số theo hàm phân phối N(mu, sigma).
Hàm pyplot.xlabel, pyplot.ylabel dùng để gán tên cho 2 trục tọa độ của biểu đồ.
Hàm pyplot.plot(x) để vẽ chuỗi x lên biểu đồ. Do chuỗi x không có tham số thời
gian t, nên pyplot.plot() sẽ coi mỗi phần tử của x được tạo ta tại thời điểm t chính là
phần tử thứ t trong chuỗi x.
Hàm pyplot.show() để hiển thị cửa sổ chứa biểu đồ sau khi vẽ.
12
Ba dòng lệnh cuối dùng để in ra giá trị của μ, trung của dãy x, và chênh lệch
giữa chúng.
Ta thu được biểu đồ sau:
Sai lệch giữa kỳ vọng và giá trị trung bình thực tế:
muy = 7
mean = 6.96945242366
|muy - mean| = 0.0305475763426
Chúng ta có thể dễ dàng thấy được sai lệch giữa muy và mean là không đáng kể,
do đó chuỗi được sinh ra chính xác là nhiễu trắng.
2.2 - Ví dụ nhận dạng một quá trình ngẫu nhiên:
Trong ví dụ này, chúng ta xét đến bộ dữ liệu thống kê tổng số ca sinh giới tính
nữ mỗi ngày trong năm 1959 ở California.
Bộ dữ liệu gồm 365 dòng ứng với 365 ngày trong năm 1959.
Mỗi dòng trong bộ dữ liệu được định dạng theo: 1959-mm-dd, x . Trong đó
1959-mm-dd là ngày trong năm 1959, x là số ca sinh giới tính nữ.
Nhận xét:
Biến ngẫu nhiên X: là số ca sinh giới tính nữ trong 1 ngày ở California.
Quá trình ngẫu nhiên x(t) là số ca sinh giới tính nữ mỗi ngày trong năm 1959 ở
California.
13
Mô phỏng quá trình x(t) trên biểu đồ:
import numpy as np
from matplotlib import dates
from matplotlib import pyplot
from datetime import datetime
data_series
=
dtype=['datetime64[D]',
np.genfromtxt('./female-birth.csv',
'i8'],
delimiter=',',
skip_header=1,
skip_footer=1, names=['date', x])
date = data_series['date'].astype(datetime)
x = data_series[x]
def simulate():
pyplot.gca().tick_params(pad=15)
ax = pyplot.gca().xaxis
ax.set_minor_locator(dates.MonthLocator())
ax.set_minor_formatter(dates.DateFormatter('%b'))
ax.set_major_locator(dates.YearLocator())
ax.set_major_formatter(dates.DateFormatter('%Y'))
pyplot.xlabel('t')
pyplot.ylabel('X')
pyplot.plot(date, x)
pyplot.show()
simulate()
Lần này, do dữ liệu có dạng ngày tháng, ta sẽ sử dụng thêm 2 module để định
dạng hiển thị ngày tháng là matplotlib.dates và datetime.
Cú pháp np.genfromtxt() cho phép ta đọc bộ dữ liệu từ file ký tự, và định dạng
về dạng bảng. Ở đây, chúng ta có cột ngày tháng là date, và cột số ca sinh là x. Từ đó,
ta gán cho 2 chuỗi date và x các giá trị tương ứng.
14
Các cú pháp set_major*, set_manor* dùng để thiết lập định dạng hiển thị thông
số trên trục tọa độ. Ở đây, được dùng để thiết lập cho trục ngày tháng (trục t).
Ta thu được biểu đồ sau:
Để đánh giá xem quá trình này có ổn định hay không, ta có thể ta có thể biểu
diễn nó dưới dạng phân phối tần suất. Nếu thấy có dạng phân phối Gauss, ta có thể
đưa ra khẳng định về sự ổn định của nó. Chúng ta thêm đoạn code sau và chương trình
và chỉ gọi hàm check1()
def check1():
pyplot.hist(x)
pyplot.show()
Hàm pyplot.hist(x) cho phép chúng ta vẽ biểu đồ tần suất dưới dạng cột
(histogram).
15
Có thể dễ dàng thấy, phân phối này khá tương đồng với phân phối Gauss.
Ngoài ra, ta vẫn có thể đánh giá thông qua trung bình và phương sai. Khi trung
bình và phương sai của 2 khoảng thời gian bằng nhau liên tiếp không có sự chênh lệch
quá lớn, ta có thể coi là ổn định.
def check2():
split = (int)(x.size/ 2)
x1, x2 = x[0:split], x[split:]
mean1, mean2 = np.mean(x1), np.mean(x2)
var1, var2 = np.var(x1), np.var(x2)
print('mean1=%f, mean2=%f' % (mean1, mean2))
print('variance1=%f, variance2=%f' % (var1, var2))
Các hàm np.mean(), np.var() trả về cho chúng ta giá tri trung bình và phương sai
của một chuỗi số. Từ đó t thu được các kết quả sau:
mean1=39.763736, mean2=44.185792
variance1=49.213410, variance2=48.708651
16
KẾT LUẬN
Quá trình ngẫu nhiên ổn định và quá trình dừng Ergodic là những mô hình lý
thuyết dù đã ra đời từ lâu nhưng đến nay vẫn còn mang nhiều ý nghĩa. Qua việc
nghiên cứu những mô hình này, ta có thêm những phương pháp hữu dụng trong việc
xử lí tín hiệu trong thực tế. Ví dụ, qua bài toán về xử lí tín hiệu ảnh trong phần “Quá
trình Ergodic”, ta thấy rằng việc chọn lựa hợp lí giữa tính trung bình theo thời gian
hay tính trung bình theo không gian sẽ có thể giúp ta tiết kiệm được rất nhiều chi phí
trong việc tính toán, xử lí tín hiệu. Điều này có thể được ứng dụng trong rất nhiều bài
toán xử lí tín hiệu ở nhiều lĩnh vực khác nhau như y tế, tài chính, truyền hình,... Cũng
chính vì tầm quan trọng của những mô hình này trong thực tế mà chúng ta cũng thấy
là đến tận ngày nay chúng vẫn được giảng dạy phổ biến ở nhiều trường Đại học, Cao
đẳng khối kĩ thuật.
Trong phạm vi đề tài, nhóm chúng em cố gắng cung cấp cho người đọc những
kiến thức cơ bản nhât về những mô hình trên đồng thời đưa ra những ví dụ, bài toán
minh họa cho những lí thuyết đó. Trong quá trình đọc và tham khảo nếu nhận thấy có
bất kì sai sót nào, mong các bạn hay liên hệ, góp ý để nhóm có thể cải thiện tài liệu tốt
hơn.
Xin cảm ơn.
17
TÀI LIỆU THAM KHẢO
[1] Jochen Geiger, section 2:
Renewal
processes,
Applied
Stochastic
Processes, 2007.
[2] Athanasios Papoulis, chapter 10: General Concepts, Probability, Random.
[3] Variables, and Stochastic Processes, third edition, McGraw-Hill, Inc.
[4] Documents on: try cập cuối cùng ngày 17/12/2018.
18