Tải bản đầy đủ (.pdf) (27 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - KHẢO SÁT YẾU TỐ TRUNG GIAN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.17 MB, 27 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

SPSS
Khảo sát yếu tố trung gian (Mediator)

BS. Lê Đông Nhật Nam

1


Lời mở đầu
Năm 2005 tôi đến Paris và bắt đầu chặng đường du học của mình. Mùa đông đầu tiên lạnh đến
mức làm tôi co ro suốt ngày trong một góc phòng trọ. Phần lớn thời gian tôi chỉ biết ôm cuốn sách
dược lý học phân tử và nghe nhạc Chopin như một thằng tự kỉ. Kết quả là tôi bị ám ảnh bởi đủ loại
receptor, chất thông tin thứ cấp, inhibitor và stimulator…
Càng đọc nhiều tài liệu, tôi càng nhìn thấy con đường nghiên cứu y học dài vô tận. Thầy tôi nói rằng
để vượt qua hố sâu giữa cơ chế bệnh sinh và hoạt chất điều trị có khi phải mất 10-20 năm và con
đường đó là công trình của rất nhiều nhà khoa học, người thì đặt 1 viên sỏi nhỏ, người thì khuân 1
tảng đá lớn, thế hệ sau tiếp bước thế hệ đi trước. Trên con đường đó, có một câu hỏi luôn làm trăn
trở người nghiên cứu sinh: Giữa viên đá này và viên đá kia là khoảng trống, cái gì có thể lấp đầy
khoảng trống đó ?
Thấm thoát 10 năm trôi qua, hành trình của tôi đã rẽ bước khá xa so với mục tiêu ban đầu, nhưng
câu hỏi đó vẫn còn nằm trong đầu tôi. Trí tưởng tượng và giả thuyết có thể đặt ra là vô hạn; nhưng
để chứng minh giả thuyết bằng thống kê đôi khi rất nan giải. Có lần tôi đã mô tả sức mạnh của mô
hình hồi quy, hệ số tương quan, nhưng đa số trường hợp chúng không cho phép kết luận điều gì
mang tính nhân quả cả.
Một phương pháp thống kê cho phép bạn trả lời câu hỏi : Cái gì ? Tại sao ? … thực sự thú vị. Tài liệu
này sẽ giới thiệu về một phương pháp như vậy. Hy vọng tài liệu này sẽ giải phóng trí tưởng tượng
của các bạn mỗi khi bắt tay vào phân tích số liệu và làm kết quả của bạn vượt ra khỏi phân tích
tương quan thông thường.


Như thường lệ, bác sĩ Khả Nhi sẽ giúp các bạn nhìn mọi thứ một cách đơn giản tối đa.
Chúc các bạn thành công.

2


Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách hồn
nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh
hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả
nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên

cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ

Trong bệnh lý xơ phổi, cấu trúc phế nang mao
mạch bị thay đổi bởi hiện tượng viêm, xơ hóa và
làm giảm khả năng trao đổi khí, dẫn đến tình trạng
suy hô hấp mạn tính.
Một bác sĩ muốn thử nghiệm một phương pháp
thăm dò chức năng hô hấp mới gọi là kỹ thuật đo
khuếch tán đôi. Kỹ thuật này cho phép đo cùng lúc
hệ số khuếch tán của 2 loại khí là CO và NO, sau đó
dựa vào TLNO,TLCO để ước tính thông số Dm hay
độ dẫn xuất của màng phế nang mao mạch. Dm
cho phép đánh giá tổng quát đặc tính vật lý của
màng phế nang mao mạch như độ dày, diện tích
khả dụng, từ đó biết được phẩm chất của lớp màng
này có bị suy giảm hay không. Dm càng giảm thì
khả năng trao đổi khí từ phế nang vào mao mạch
phổi càng kém.


Mao mạch phổi
Mô kẽ

Màng phế nang

Lưu lượng khí

Lòng phế nang

Dm

Sau khi đo Dm ở 14 bệnh nhân xơ phổi, bác sĩ này
cho các bệnh nhân thực hiện nghiệm pháp gắng
sức hô hấp-tim mạch. Bệnh nhân được đo lưu
lượng O2 và CO2 trong khí thở, kết hợp với phân
tích khí máu động mạch và đo độ bão hòa O2
(SpO2). Nghiệm pháp gắng sức cho ra rất nhiều
thông số, giúp đánh giá đồng bộ chức năng hô hấp,
tim mạch để thích nghi với điều kiện tăng nhu cầu
trao đổi chất của cơ thể.
Anh bác sĩ muốn chứng minh một số giả thuyết
sinh lý học có yếu tố nhân quả giữa tính chất màng
phế nang mao mạch (nguyên nhân) và mức độ bão
hòa oxy ngoại biên (hậu quả). Phân tích tương
quan thông thường không cho phép làm việc này.
Chúng ta còn giải pháp nào khác không ?

Bảo thân mến, chúng ta có thể áp dụng phân tích yếu
tố trung gian (Mediator). Phương pháp này dựa trên lý
thuyết về mô hình hồi quy tuyến tính đa biến …



1

1.2 Giới thiệu

Mục đích của việc khảo sát yếu tố trung gian là để giải thích cơ
chế tác động của yếu tố X lên kết quả Y thông qua 1 yếu tố M:

X

Y

Yếu tố X dẫn tới sự thay đổi của yếu tố M, từ đó M gây ra sự
thay đổi của yếu tố Y; hay X tác động lên Y thông qua M. Nói
cách khác: M giữ vai trò trung gian trong quan hệ giữa X và Y.
Mô hình lập luận này rất thường được sử dụng trong những
nghiên cứu sinh lý bệnh học, ví dụ ta có thể dùng nó để chứng
minh: Một hoạt chất X kích thích (hoặc ức chế) quá trình tổng
hợp 1 chất trung gian M, từ đó làm tăng/giảm đáp ứng sinh lý
Y nào đó.
Trong thí dụ nghiên cứu chức năng trao đổi khí ở bệnh nhân
xơ phổi này, ta có thể đặt ra giả thuyết về một cơ chế sinh lý
như sau:

M

X

Độ dẫn xuất màng phế nang mao mạch (Dm) giảm có thể hạn

chế hiệu quả trao đổi khí giữa phế nang và tuần hoàn ngoại vi,
vốn được đánh giá bằng thông số (DA-aO2), từ đó gây ra hiện
tượng thiếu oxy máu ngoại biên (khảo sát bằng PaO2) khi
bệnh nhân thực hiện test gắng sức.

Y

D(A-a)O2

a

b

Để chứng minh giả thuyết này, ta sẽ lập ra mô hình với 3 biến
số:
X = biến số độc lập hay yếu tố dự báo, là Dm: độ dẫn xuất của
màng phế nang mao mạch.
Y= biến số phụ thuộc hay giá trị dự báo, là PaO2 max (ở điều
kiện gắng sức tối đa)
M= biến số trung gian, là chênh lệch áp suất của khí O2 giữa
phế nang và động mạch ; D(A-a)O2 (ở điều kiện cơ bản, nghỉ
tĩnh)

Dm

c’

SaO2



1

1.2 Giới thiệu

Hiệu ứng toàn thể của X  Y

c

X

Biến số độc lập

Y

Biến số phụ thuộc

Yếu tố trung gian

Hiệu ứng gián tiếp
(XM)

a
X
Biến số độc lập

Hiệu ứng gián tiếp
(MY)

M
c’


b
Y
Biến số phụ thuộc

Hiệu ứng trực tiếp XY


2.1 Quy trình thực hiện

2
1

Phân tích hồi quy dựa vào 3 mô hình

Mô hình

Mục đích

Xác định

Y=bo+c*X

Khảo sát hiệu ứng toàn thể

Hệ số hồi quy c và R2Y,X

M = b’o+a*X

Khảo sát hiệu ứng gián tiếp XM


Hệ số hồi quy a và R2M,X

Y=b”o+c’*X+b*M

Khảo sát hiệu ứng gián tiếp MY
và hiệu ứng trực tiếp XY

Hệ số hồi quy c’, b và
R2Y,MX

2
M
a
X

A) Phân tích định lượng:

b

c’

Khảo sát hiệu ứng gián tiếp

Tính hệ số hiệu ứng gián tiếp

Y

Dạng chưa chuẩn hóa: (a*b)
Dạng chuẩn hóa 1 phần: a*b/(SD của Y), theo Mac Kinnon (2008)

Dạng chuẩn hóa toàn phần: = (a*b/SD của Y)*(SD của X)
So sánh giữa hiệu ứng gián tiếp và trực tiếp hay toàn thể:

c

Dựa vào tỉ số

X

Y

Tỉ số hiệu ứng Gián tiếp/Toàn thể = (a*b)/c
Tỉ số hiệu ứng Gián tiếp/Trực tiếp = (a*b)/c’
Dựa vào hệ số Kappa bình phương của Preacher và Kelley (2011)
K2 = (a*b)/max(a*b)
Tính hệ số R2 của hiệu ứng gián tiếp, R2 biểu thị cho phần biến thiên của
Y có thể được giải thích bởi M

R2M = R2Y,M – (R2Y,MX-R2Y,X)
B) Phân tích định tính :
Kiểm định Sobel (1982)


2

2.2 Tiêu chuẩn đánh giá

1) Cách đánh giá dựa vào tỉ số ít khi được sử dụng vì có nhiều nhược điểm như :
- Kém chính xác: chúng đòi hỏi cỡ mẫu lớn (khoảng vài trăm trường hợp)
- Khó diễn giải và dễ gây ngộ nhận: Những tỉ số này không thể được diễn đạt với ý nghĩa

phân phối (chúng là tỉ số, không phải tỉ lệ), (a*b) không có liên quan gì đến c hay c’. Thật
vậy, các tỉ số này có thể > 1, thậm chí nhận giá trị âm (nếu a,b trái dấu). Ví dụ trường
hợp: M tỉ lệ nghịch với X, nhưng tỉ lệ thuận với Y
2) Giá trị R2M có thể được diễn giải như hệ số R2 của một phương trình hồi quy thông
thường, tuy nhiên nó cũng có thể gây ngộ nhận: R2M không bắt buộc phải nằm trong
khoảng 0-1 như ta thường nghĩ, nó thậm chí có thể nhận giá trị âm

3) Hệ số kappa bình phương là giải pháp tối ưu nhất, vì nó biểu thị hiệu ứng gián tiếp như
1 tỉ lệ giữa kích thước hiệu ứng gián tiếp thực tế quan sát được và hiệu ứng gián tiếp tối đa
có thể đạt tới trong quần thể.
Đây là 1 tỉ lệ thực sự, giá trị của K2 dao động từ 0 tới 1
K2 =0 cho thấy hiệu ứng gián tiếp rất nhỏ (1 cách tương đối) so với giá trị lớn nhất theo lý
thuyết
K2 gần bằng 1 cho thấy hiệu ứng gián tiếp rất lớn, gần với giá trị cao nhất mà nó có thể đạt
được
K2 có thể được diễn giải như sau :
0.01 : hiệu ứng gián tiếp rất nhỏ, không đáng kể
0.09 : hiệu ứng gián tiếp trung bình
0.25 : hiệu ứng gián tiếp lớn, quan trọng

4 điều kiện cần có :
(1) X phải cho phép dự báo một cách ý nghĩa giá trị của Y trong mô hình Y(X)
(2) X phải dự báo một cách ý nghĩa giá trị của M trong mô hình M(X)
(3) M phải dự báo có ý nghĩa giá trị của Y trong mô hình Y(X,M)
(4) Hiệu ứng trực tiếp nhỏ hơn hiệu ứng toàn thể (c’ < c), hay nói cách khác, hiệu ứng gián
tiếp có ý nghĩa.


2


2.3 Kiểm định Sobel

Test Sobel
SPSS không hỗ trợ phân tích yếu tố trung gian và dĩ nhiên không tồn tại chứ cnăng test
Sobel, tuy nhiên chúng ta hoàn toàn có thể làm test này một cách thủ công, nó có cùng
nguyên lý như test t hoặc test Z
Đầu tiên ta tính giá trị của t , là tỉ số giữa hệ số hiệu ứng gián tiếp (a*b) và sai số chuẩn
của hiệu ứng gián tiếp :

𝑡=

(𝑎𝑏)
𝑎2 + 𝜎 2 𝑏 + 𝑏 2 + 𝜎 2 𝑎

Trong đó:
a là hệ số hồi quy giữa X và M,
b là hệ số hồi quy giữa Y và M
𝜎 2 là phương sai của a và b
Sau đó ta có thể dùng bảng phân phối t hoặc phân phối bình thường cho giá trị chuẩn
hóa của t (Z) để kiểm tra giả thuyết 0: (a*b) = 0
Nếu test Sobel cho kết quả dương tính (p<0,05) ta loại bỏ giả thuyết H0: (ab)=0, tức là
chấp nhận (ab) ≠ 0 hay nói cách khác hiệu ứng gián tiếp X-M-Y có ý nghĩa thống kê và M
có vai trò trung gian trong quan hệ giữa X và Y.
Nếu test Sobel âm tính (p>0,05) và hoặc khoảng tin cậy của (ab) có chứa giá trị 0, ta có
thể phủ nhận sự tồn tại của hiệu ứng gián tiếp X-M-Y hay nói cách khác M không có vai
trò trung gian
Tuy nhiên, kết quả test Sobel chỉ có ý nghĩa tham khảo. Độ chính xác của test Sobel rất
kém, nó phụ thuộc vào cỡ mẫu, để chắc chắn ta phải áp dụng phương pháp Bootstrap
và tính khoảng tin cậy 95% của hệ số tương quan (a*b).


Quan trọng nhất trong phân tích yếu tố trung gian không phải là giá trị p mà là khoảng
tin cậy 95% của hệ số hồi quy gián tiếp không chứa giá trị 0.


3

3.1 Công cụ Process của Hayes

Trước năm 2013, chúng ta bắt buộc phải làm phân tích
yếu tố trung gian hoàn toàn thủ công, bằng cách thực
hiện 3 lần phân tích hồi quy cho 3 mô hình X-Y, X-M và
X-M-Y, sau đó dựa vào kết quả 3 mô hình này để khảo
sát hiệu ứng gián tiếp, trực tiếp, tính effect size và làm
test Sobel. Quy trình này tốn khá nhiều thời gian và bắt
buộc lập trình cú pháp lệnh trên SPSS nên làm nản lòng
sinh viên; nhất là khi họ có quá nhiều giả thuyết cần
kiểm tra.

Andrew F. Hayes, Ph.D.
Department of Psychology
The Ohio State University
Columbus, OH 43210,
U.S.A.

Tuy nhiên hiện nay quy trình phân tích yếu tố trung gian
trên SPSS trở nên đơn giản và nhanh chóng nhờ vào
công cụ Process của tiến sĩ Andrew F. Hayes (đại học
Ohio, Hoa kỳ).
Như ta biết, SPSS cho phép mở rộng chức năng cơ bản
bằng cách nạp thêm những gói macro syntax được lập

trình sẵn. Ít người tận dụng chức năng lập trình trong
SPSS vì vậy chúng ta không có nhiều package để xài như
trong R. Tuy vậy, package của SPSS có giao diện đồ họa
(GUI) nên rất thân thiện và dễ sử dụng hơn nhiều so với
package của R.

Process là một tập hợp những mã lệnh (syntax) SPSS và
hơn thế nữa, nó đi kèm với giao diện đồ họa tương tác,
cho phép bạn thao tác dễ dàng như vẫn thường làm
trên SPSS. Bạn không cần hiểu về cú pháp lệnh SPSS
nhưng vẫn có thể xuất kết quả chỉ với vài lần nhấn nút.
Nếu không nhờ vào Process, tài liệu hướng dẫn này chắc
phải dài gấp 3 lần.
Để tưởng nhớ công lao của tiến sĩ Hayes, khi thực hiện
luận văn, bài báo khoa học, xin bạn hãy trích dẫn lại
nguồn gốc công trình của ông như dưới đây:
Hayes,AF (2013). Introduction to mediation,
moderation, and conditional process analysis. New York:
The Guilford Press.

Công cụ Process rất mạnh , nó cho phép phân
tích yếu tố trung gian và yếu tố điều tiết trên
74 loại mô hình khác nhau, có những mô hình
phức tạp hơn rất nhiều so với ví dụ cơ bản
mà chúng ta đang thực hiện. Nếu tò mò, bạn
có thể tìm đọc quyển sách này của tác giả để
tìm hiểu sâu hơn.


3.2 Tải và giải nén Process


3

Hướng dẫn cài đặt Process cho SPSS:
Lưu ý: Gói công cụ này chỉ tương thích với SPSS 18 trở lên, nếu bạn đang sử dụng phiên bản cũ hơn,
hãy cài phiên bản SPSS mới nhất trước khi sử dụng Process.
Truy cập trang web sau để tải gói tập tin Process.zip
/>
1

2

Sau khi giải nén, bạn sẽ thấy những tập tin bên trong, quan trọng nhất là file process.psd chứa bộ mã
sử dụng cho SPSS

3


3

3.3 Cài đặt công cụ Process

Bạn khởi động chương trình SPSS với vai trò quản trị,
nhấp chuột phải vào icon SPSS và chọn thi hành với
quyền hạn administrator. Điều này rất cần thiết vì chỉ có
quản trị viên mới có quyền thay đổi cấu trúc những gì có
trong thư mục Programme. Nếu bạn sử dụng SPSS tại
công ty hay thư viện trường, bạn không có quyền cài
Process, bạn chỉ có thể cài cho máy tính của riêng bạn


4

5

6

Tại màn hình chính của SPSS, chọn tab Utilities, sau đó chọn Custom Dialogs, và nhấn Install Custom
Dialog. Một cửa sổ sẽ mở ra cho phép chọn file spd. Bạn mở thư mục process vừa giải nén khi nãy, và
chọn file process.spd, nhấn Open. Gói công cụ sẽ được cài vào SPSS chỉ mất vài giây, một thông báo sẽ
hiện lên báo hiệu việc cài đặt thành công.

8
7


3

3.3 Cài đặt công cụ Process

9

Sau khi cài đặt xong, trong menu Analysis> Regression sẽ xuất hiện thêm chức năng Process
by Andrew F Hayes.


4

Y

4.1 Nhập số liệu


M

M

X

X

Y

Đầu tiên bạn sẽ tạo những biến số cần khảo sát trong SPSS. Đối với phân tích yếu tố trung gian, giả thuyết
nghiên cứu ban đầu của chúng ta gồm có ít nhất 3 biến số :
Biến số kết quả (hay phụ thuộc ) Y : ở đây là PaO2 max = áp suất riêng phần oxy máu động mạch ở trạng thái
gắng sức tối đa. Đây là hiệu quả của quá trình cung cấp oxy nhằm thích ứng với sự tăng nhu cầu chuyển hóa của
cơ thể trong nghiệm pháp gắng sức.
Biến số nguyên nhân (yếu tố dự báo độc lập) X: ở đây là DmCO = khả năng dẫn xuất khí CO của màng phế nang
mao mạch. Thông số này đại diện cho tính chất vật lý của màng phế nang mao mạch.
Biến số trung gian cần khảo sát (M): ở đây là DAaO2base = chênh lệch nồng độ Oxy giữa phế nang và động
mạch, đo ở điều kiện nghỉ tĩnh. Thông số này đại diện cho khả năng trao đổi khí oxy giữa phế nang và tuần hoàn
ngoại biên.
Lưu ý: Để sử dụng được Process, bạn cần chú ý một vài điểm như sau:
- Process chỉ « hiểu » được biến kiểu số, bạn không thể dùng kí tự (string). Nếu có biến số định tính bạn phải
mã hóa nó dưới dạng số (1,2,3,4…) và nó sẽ được hiểu như biến định lượng thứ hạng.
- Process chỉ chấp nhận tên biến số dài tối đa 8 kí tự. Bạn nên rút gọn tên biến số càng ngắn càng tốt và dùng
chức năng Label để giải thích ý nghĩa nếu sợ quên.
- Bạn không được đặt tên biến số là XXX (có vẻ kì cục, nhưng đơn giản là bạn không được dùng tên này, vì đây
là 1 variable riêng trong mã lệnh của Process)

- Tiếp theo bạn có thể nhập số liệu vào bảng SPSS

- như hình bên cạnh


4

4.2 Khởi động

1

2

3
Để kích hoạt gói công cụ Process, bạn lần lượt truy
nhập vào: Analyze > Regression > PROCESS …

Hình bên cạnh là giao diện của Process,
như bạn thấy, nó có cấu trúc tương tự như
bất cứ hộp thoại nào trong SPSS nên bạn sẽ
làm quen với công cụ này rất nhanh.

Tên mô hình

Bước đầu tiên bạn sẽ làm là xác định
mô hình nào sẽ được áp dụng. Theo
mặc định, Process mở sẵn mô hình số 4,
tương ứng với phân tích yếu tố trung
gian đơn giản với X,Y và M mà ta đang
nhắm tới.
Process cho phép phân tích tới 74 mô
hình khác nhau. Để tìm hiểu sâu hơn

bạn có thể đọc thêm tài liệu gốc của
Hayes. Muốn áp dụng mô hình nào, bạn
chỉ cần chọn nó trong danh sách.

4


4

4.3 Xây dựng mô hình

Y

5

X
6

7

M
4
Ta sử dụng mô hình số 4, theo mặc định
Sau đó bạn kéo lần lượt những biến số Y,X, M vào ô tương ứng của chúng.
Y =Outcome, X=biến độc lập, M là yếu tố trung gian cần khảo sát.
Lưu ý:
* Bước này rất quan trọng, bạn cần vẽ sẵn sơ đồ trên giấy để hiểu chính xác vai trò của từng biến số
• Mô hình số 4 cho phép phân tích cùng lúc nhiều biến số M, điều này có thể thú vị nếu bạn muốn
tuyển chọn M trong số danh sách nhiều ứng cử viên. Bản chất của việc làm này là so sánh effect
size giữa các biến này với nhau. Tuy nhiên kiểu phân tích hàng loạt này khá bất tiện vì bảng kết

quả xuất ra sẽ rất dài và phức tạp. Nếu lần đầu làm quen với Process, bạn chỉ nên giới hạn phân
tích 1-2 biến mỗi lần mà thôi.

M

D(A-a)O2

a
Dm

a

b

c’

Ví dụ: Sơ đồ phân tích vẽ sẵn trên giấy

SaO2

X

b

c’

Y


4


4.4 Tùy chỉnh thông kê

8

a
b
c
d
e

9

f

Tiếp theo, bạn nhấn

để mở hộp thoại tùy chỉnh phương pháp thống kê.

a

Heteroscedasticity consistent SE: Theo lý thuyết, cần phải kiểm tra giả định Homoscedasticity mỗi
khi bạn thiết lập 1 mô hình hồi quy tuyến tính. Khi bạn chọn ô này thì không cần phải lo lắng về giả
định đó nữa, kết quả của bạn sẽ tự động được chuẩn hóa ngay cả khi có vi phạm.

b

OLS/ML confidence interval : Chọn mục này để xuất kết quả khoảng tin cậy theo phương pháp
Ordinary least square và maximum likelihood estimator


c

Effect size: Rất quan trọng, chọn mục này để phân tích sâu (định lượng) về hiệu ứng gián tiếp

d

Sobel test: thực hiện kiểm định Sobel nhằm kiểm tra ý nghĩa thống kê của yếu tố trung gian và hiệu
ứng gián tiếp.

e

Total effect model: tính hiệu ứng trực tiếp (toàn phần) của X lên Y

f

Compare indirect effect: Chỉ dùng khi có nhiều yếu tố trung gian (nhiều M), cho phép tính CI95%
của khác biệt giữa hiệu ứng gián tiếp/trực tiếp cho từng mediator M. Nếu bạn chỉ có 1 yếu tố trung
gian M duy nhất, không cần chọn chức năng này.


4

4.5 Chạy phân tích

10

Sau khi thiết lập xong tùy chỉnh, nhấn
Continue để trở về hộp thoại chính của
Process


11
Nhấn OK để chạy phân tích.
Kết quả sẽ có ngay sau vài giây đến vài phút (tùy theo
cỡ mẫu lớn hay nhỏ)


5

5.1 Diễn giải kết quả: Tóm tắt mô hình

Model
Y
X
M

=
=
=
=

Sample size
14

M

D(A-a)O2

4
PaO2max
DmCO

DAaO2bas

a
Dm

a

b

c’

PaO2

X

b

c’

Y

Đầu tiên, chương trình sẽ cho ta biết quy ước về tên gọi của các biến số:
Y = Biến số dự báo. Thường ta sẽ đặt biến số chỉ “hậu quả” vào vị trí Y. Ở đây là PaO2max: áp
suất riêng phần oxy trong máu động mạch ở trạng thái gắng sức tốt đa.

X = yếu tố dự báo. Thông thường X là một yếu tố chỉ “nguyên nhân” trong nghiên cứu mà ta
muốn khảo sát, ví dụ ở đây là DmCO hay độ dẫn xuất màng phế nang mao mạch với khí CO (đo
trước khi thực hiện nghiệm pháp gắng sức).
M = biến số trung gian, hay yếu tố có khả năng giải thích mối tương quan giữa X và Y. Ví dụ ở đây
là DAaO2bas, hay độ chênh lệch áp suất khí oxy giữa phế nang và động mạch ở điều kiện nghỉ

tĩnh (DAaO2 = PAO2 – PaO2).
Sau đó, Process sẽ lần lượt trình bày kết quả của các mô hình hồi quy, những bảng kết quả này có
thể được diễn giải tương tự như bảng kết quả mô hình hồi quy tuyến tính quen thuộc:
Những thông tin được cung cấp cho mỗi mô hình gồm:
Ý nghĩa thống kê của mô hình: hệ số R2, trị số F, độ tự do df1, df2 của F và giá trị P
Nội dung mô hình: Hằng số (constant hay bo), hệ số hồi quy (Coefficient) cho yếu tố dự báo (X
hoặc M), sai số chuẩn (SE) của hệ số này, trị số t và giá trị p để kiểm định giả thuyết hệ số hồi quy
= 0 (kiểm tra ý nghĩa của yếu tố dự báo).

Cỡ mẫu = 14 bệnh nhân, thông tin này cho phép kiểm tra việc mất dữ liệu và phối kiểm giá trị của
độ tự do df2=(n-2) của F trong mô hình.


5.2 Mô hình M(X)

5

Tên của mô hình
Kiểm tra ý nghĩa thống kê của mô hình

Outcome: DAaO2bas
Model Summary
R
,6071

Hệ số R2
R-sq
,3685

MSE

39,3852

F
8,9349

df1
1,0000

df2
12,0000

p
,0113

Model
coeff
24,7114
-,4500

constant
DmCO

hệ số hồi quy
a của X trong M(X)
D(A-a)O2

-0,45

Dm


a

b

c’

se
5,4537
,1506

sai số
chuẩn
(SE)
của a

t
4,5311
-2,9891

trị số t

p
,0007
,0113

giá trị p

LLCI
12,8266
-,7781


ULCI
36,5963
-,1219

Khoảng tin cậy của
hệ số a

để kiểm định giả
thuyết 0: a=0 hay
kiểm tra ý nghĩa của
yếu tố dự báo,

PaO2

Kết quả đầu tiên là mô hình hồi quy tuyến tính M(X) với Outcome = M và yếu tố dự báo = X, nhằm trả lời
câu hỏi đầu tiên : có tương quan giữa X và M hay không ?
Model summary: cho ta biết ý nghĩa thống kê của mô hình M(X). Những thông tin quan trọng là: giá trị p
của test F = 0,0113 chứng tỏ mô hình có ý nghĩa, sau đó là giá trị R2 = 0,3685, có thể được diễn giải như: X
(hay DmCO) cho phép giải thích 36,85% sự biến thiên của M (DAaO2).
Tiếp theo là nội dung của mô hình. Bạn không cần quan tâm tới constant mà chỉ tập trung vào hàng thứ 2:
khảo sát vai trò của biến số X đối với M. Đầu tiên, bạn hãy quan sát giá trị khoảng tin cậy (LLCI và ULCI) của
hệ số hồi quy, kết quả trông đợi là LLCI và ULCI phải cùng dấu (như vậy CI95% không chứa giá trị 0). Sau
đó, ta xem xét giá trị p = 0,0113 (<0,05) cho thấy DmCO đã tác động có ý nghĩa đối với D(Aa)O2.
Cuối cùng, ta ghi nhận hệ số hồi quy (Coeff) của X (DmCO), đây chính là hệ số a trong sơ đồ, ta có a = -0,45
Chắc chắn có bạn thắc mắc về dấu (-), nó cho thấy DmCO và D(Aa)O2 tỉ lệ nghịch với nhau; DmCO giảm
làm tăng D(Aa)O2. Điều này có ý nghĩa gì về mặt sinh lý ? Thực ra không có gì lạ ở đây, dù trong điều kiện
khí quyển, lượng oxy hít vào phế nang không thể tăng, tuy nhiên chênh lệch Oxy giữa phế nang và tuần
hoàn ngoại biên có thể tăng nếu oxy trong mao mạch phổi giảm 1 cách tương đối so với Oxy trong lòng
phế nang, hay nói cách khác là khả năng trao đổi khí Oxy đã bị giảm tương ứng với DmCO giảm.


Kết luận ở bước 1 này là DmCO đã gây ra tác động thay đổi D(Aa)O2 một cách có ý nghĩa, với a=-0,45


5.3 Mô hình Y(X)

5

Outcome: PaO2max
Model Summary
R
,8099

R-sq
,6559

MSE
178,2991

F
21,9207

df1
1,0000

df2
12,0000

p
,0005


Model
constant
DmCO

coeff
30,5980
1,7304

se
13,7026
,3696

t
2,2330
4,6820

p
,0454
,0005

LLCI
,7372
,9250

ULCI
60,4589
2,5359

1,7304


hệ số hồi quy
c của X trong Y(X)

c
Dm

PaO2

Bước thứ 2, ta sẽ đọc kết quả của mô hình hồi quy tuyến tính Y(X) nhằm chứng minh ý nghĩa
của hiệu ứng trực tiếp toàn phần X (DmCO) gây ra cho Y (PaO2max).
Tương tự như mọi mô hình hồi quy khác, kết quả này có thể được diễn giải như sau:
Mô hình có ý nghĩa thống kê với p (test F) = 0,0005; DmCO cho phép giải thích 65,59% sự
biến thiên của PaO2 max. DmCO đã tác động có ý nghĩa đối với PaO2max, với hệ số hồi quy =
1,7304 (hay nói cách khác PaO2max và DmCO quan hệ tỉ lệ thuận, PaO2 giảm tương ứng với
DmCO giảm).
Hệ số hồi quy của DmCO trong mô hình Y(X) chính là hệ số c trong sơ đồ, nó biểu thị cho hiệu
ứng trực tiếp và toàn phần của X gây ra cho Y. ta có : c=1,7304. Bạn sẽ ghi lại giá trị này để so
sánh với hệ số c’ là hiệu ứng trực tiếp bộ phận của X khi có M tham gia, ở bước 3
Như lần trước, bạn nên chú ý đến CI95% của hệ số hồi quy hơn là giá trị p của test t. CI95%
không được chứa giá trị 0.
Ý nghĩa sinh lý của kết quả này là: có sự liên hệ ý nghĩa giữa độ dẫn xuất màng phế nang mao
mạch và áp suất riêng phần Oxy máu động mạch khi gắng sức. Ta có thể suy diễn là tổn
thương xơ phổi làm giảm DmCO và chỉ số này cho phép giải thích 65,6% sự thay đổi nồng độ
oxy máu tuần hoàn ngoại biên khi gắng sức.


5

5.4 Mô hình Y(M,X)


Outcome: PaO2max
Model Summary
R
,9224

R-sq
,8508

MSE
84,3152

F
26,5410

df1
2,0000

df2
11,0000

p
,0001

Model
constant
DAaO2bas
DmCO

coeff

70,1724
-1,6015
1,0097

se
12,3703
,4551
,2874

t
5,6727
-3,5191
3,5138

p
,0001
,0048
,0049

LLCI
42,9396
-2,6033
,3771

ULCI
97,4052
-,5996
1,6423

hệ số hồi quy

b của M trong Y(X,M)
hệ số hồi quy
c’ của X trong Y(X,M)
Trong bước 3, ta sẽ xét mô hình hồi quy tuyến tính
với outcome = Y (PaO2max) và chứa cả 2 yếu tố dự
báo là X (DmCO) và M (DAaO2). Mục tiêu là chứng
minh có hiệu ứng gián tiếp ý nghĩa giữa M và Y, đồng
thời xác nhận có hiệu ứng trung gian X-M-Y, thông
qua việc so sánh giữa 2 hệ số c và c ’.

D(A-a)O2

-0,45

Dm

a

b

c’

-1,6015

PaO2

1,0097
c’1,7304


Nếu bạn đã quen thuộc với việc đọc kết quả phân
tích hồi quy tuyến tính đa biến, bảng kết quả trên
đây không có gì khó hiểu:

c
Dm

Mô hình Y(X,M) có ý nghĩa thống kê (p = 0,0001) với
hệ số R2 = 0,8508. Bạn có thể nhận ra rằng giá trị này
cao hơn R2 của mô hình Y(X) (chỉ có 0,6559), như vậy
có thể nói việc đưa thêm biến số M vào mô hình đã
cải thiện khả năng dự báo tốt hơn. Mô hình kết hợp
DmCO và DAaO2 cho phép giải thích 85% sự biến
thiên của PaO2 max.
Tiếp theo, ta xét hiệu ứng M Y: DAaO2 tương quan
có ý nghĩa với PaO2max (tỉ lệ nghịch) (p=0,0048), chú
ý CI95% không chứa giá trị 0. Hệ số hồi quy của M
chính là giá trị của b trong sơ đồ, như vậy ta có b = 1,6015. Như vậy khi DAaO2 tăng thì PaO2max giảm.
Cuối cùng, ta xét hiệu ứng trực tiếp bộ phận XY .
Kết quả cho thấy DmCO tương quan có ý nghĩa với
PaO2max (p=0,0049), với hệ số hồi quy là 1,0097.
Đây chính là giá trị hệ số c’ trong mô hình. Ta thấy c’<
c (1,0097 < 1,7304).

PaO2

Kết luận: Tất cả 4 điều kiện cần có để xác
lập vai trò trung gian của M đã được thỏa
mãn, bao gồm:
1) X tương quan ý nghĩa với M (hiệu ứng

gián tiếp a)
2) M tương quan ý nghĩa với Y (hiệu ứng
gián tiếp b)
3) X tương quan ý nghĩa với Y (hiệu ứng
toàn phần c)
4) Hiệu ứng trực tiếp của riêng X lên Y
nhỏ hơn hiệu ứng toàn phần : c’< c


5
c

5.5 Phân tích hiệu ứng gián tiếp

***************** TOTAL, DIRECT, AND INDIRECT EFFECTS ********************
Total effect of X on Y
Effect
SE
1,7304
,3696

t
4,6820

p
,0005

LLCI
,9250


ULCI
2,5359

Hiệu ứng toàn thể

Direct effect of X on Y
Effect
SE
1,0097
,2874

t
3,5138

p
,0049

LLCI
,3771

ULCI
1,6423

Hiệu ứng trực tiếp

c’

Bảng kết quả tiếp theo chỉ đơn giản là tóm tắt lại giá trị 2 loại hiệu ứng : Hiệu ứng toàn thể
XY (biểu thị bằng hệ số c), và hiệu ứng trực tiếp riêng phần của XY khi có xét đến M
(hệ số c’). Nếu bạn đã hiểu ý nghĩa của những hệ số này, có thể bỏ qua bảng kết quả này vì

ngay từ kết quả mô hình hồi quy Y(X) và Y(X,M) ở trên ta đã biết giá trị c và c’ rồi.

(a*b)
Indirect effect of X on Y
Effect
Boot SE
DAaO2bas
,7207
,3454

(a*b)/SDY

Completely standardized indirect effect of X on Y
Effect
Boot SE
BootLLCI
BootULCI
DAaO2bas
,3373
,1183
,0896
,5668

Hệ số hiệu ứng gián tiếp
chuẩn hóa toàn phần

a

b


c’

Phần tiếp theo của kết quả là khảo sát hiệu ứng gián tiếp:
Có 3 loại hệ số hiệu ứng gián tiếp :
1) Loại không chuẩn hóa chính là tích số của 2 hệ số (a) và
(b) trong sơ đồ quan hệ giữa bộ 3 X,M,Y.

-1,6015

PaO2

1,0097
1,7304

c
Dm

Hệ số hiệu ứng gián tiếp
không chuẩn hóa
Hệ số hiệu ứng gián tiếp
chuẩn hóa 1 phần

D(A-a)O2

Dm

BootULCI
1,4267

Partially standardized indirect effect of X on Y

Effect
Boot SE
BootLLCI
BootULCI
DAaO2bas
,0330
,0143
,0059
,0602

((a*b)/SDY)*(SDX)

-0,45

BootLLCI
,1180

PaO2

2) Loại chuẩn hóa 1 phần có xét thêm độ lệch chuẩn của Y
3) Loại chuẩn hóa toàn phần xét thêm tỉ số giữa 2 độ lệch
chuẩn của X và Y.
Điều quan trọng ở đây là khoảng tin cậy của hệ số hiệu
ứng gián tiếp. Phương pháp lấy mẫu ngẫu nhiên lặp lại
1000 lần (bootstrap) cho phép xác định giá trị ngưỡng trên
và dưới của CI95% này. Hai ngưỡng này phải cùng dấu,
nếu không có nghĩa là trong quần thể chung có nguy cơ
tồn tại hệ số hiệu ứng gián tiếp = 0.



5

5.5 Phân tích hiệu ứng gián tiếp

Tỉ số (a*b)/c

Tỉ số (a*b)/c’

R2M = R2Y,M –
(R2Y,MX - R2Y,X)

K2 =(a*b)/max(a*b)

Phần cuối của kết quả, cũng là phần thú vị
nhất – chính là khảo sát Effect size của hiệu
ứng gián tiếp và ý nghĩa thống kê của yếu tố
trung gian M. Đây là bước khó khăn nếu bạn
thực hiện theo cách thủ công, nhưng may
mắn là công cụ Process đã làm tất cả một
cách tự động, bạn chỉ cần diễn giải kết quả:

Ratio of indirect to total effect of X on Y
Effect
Boot SE
BootLLCI
BootULCI
DAaO2bas
,4165
,1547
,1019

,7344

So sánh:
Gián tiếp /toàn thể

Ratio of indirect to direct effect of X on Y
Effect
Boot SE
BootLLCI
BootULCI
DAaO2bas
,7138
,8739
,1134
2,7650

So sánh
Gián tiếp/trực tiếp

R-squared mediation effect size (R-sq_med)
Effect
Boot SE
BootLLCI
DAaO2bas
,5149
,1157
,2305

BootULCI
,7078


Preacher and Kelley (2011) Kappa-squared
Effect
Boot SE
BootLLCI
DAaO2bas
,4577
,1268
,1380

BootULCI
,6617

Normal theory tests for indirect effect
Effect
se
Z
p
,7207
,3237
2,2266
,0260

Effect size R2 của yếu
tố trung gian
Hệ số Kappa bình
phương

Kết quả test Sobel


Những kết quả được cung cấp rất phong phú, gồm có:
A) Kết quả định lượng: 2 tỉ số để so sánh hiệu ứng gián tiếp với hiệu ứng toàn thể và hiệu
ứng trực tiếp, hệ số R2 của yếu tố trung gian M, hệ số kappa bình phương theo
Preacher và Kelley (cả 2 có thể được diễn giải như effect size của M)
B) Kết quả định tính là test Sobel.
Thực ra bạn chỉ cần quan tâm đến 3 kết quả sau đây; theo thứ tự quan trọng:
1) Hệ số Kappa bình phương, đây là 1 tỉ lệ thực sự, cho phép ta so sánh hiệu ứng gián tiếp
so với hiệu ứng trực tiếp.
2) Hệ số R2 cho phép ta kết luận về vai trò trung gian của biến số M
3) Giá trị p của test Sobel, cho phép ta kết luận về ý nghĩa thống kê của yếu tố trung gian.
Lưu ý:
+ Ngay cả khi p>0,05 ta vẫn có thể báo cáo Effect size của hiệu ứng trung gian do M gây ra.
Test Sobel không phải là tiêu chuẩn bắt buôc.
+ Chú ý CI95% phải cùng dấu.
Kết quả trong thí dụ có thể được diễn giải như sau:
+ D(Aa)O2 trong điều kiện nghỉ tĩnh có vai trò trung gian trong quan hệ giữa DmCO và
PaO2max. D(Aa)O2 gây ra hiệu ứng trung gian đáng kể (K2=0,4577) và cho phép giải thích
51,49% giá trị biến thiên của PaO2max. Hiệu ứng trung gian có ý nghĩa thống kê với kết
quả test Sobel: t=0,7207; Z=2,22; p=0,026.


6

Diễn đạt văn bản khoa học

Phương pháp thống kê
Số liệu được phân tích trên phần mềm IBM-SPSS 20 với package Process (2013) của Andrew F Hayes.
Tác động của sự thay đổi độ dẫn xuất màng phế nang mao mạch (DmCO) lên mức oxy máu động mạch
khi gắng sức tối đa (PaO2max) được khảo sát theo quy tắc của Barron-Kenny (1986) với yếu tố trung
gian giả định là hiệu quả trao đổi khí Oxy cơ bản giữa phế nang/tuần hoàn ngoại biên (DAaO2base).

Hiệu ứng gián tiếp của DAaO2 được khảo sát dựa vào 3 tiêu chuẩn: khoảng tin cậy của hệ số R2, hệ số
Kappa2 và kết quả kiểm định Sobel . Ngưỡng ý nghĩa được quy định = 0,05.

Kết quả
Ở bệnh nhân xơ phổi, sự suy giảm độ dẫn xuất màng phế nang mao mạch (DmCO) có liên hệ ý nghĩa
với hiện tượng giảm oxy máu trong điều kiện gắng sức tối đa thông qua yếu tố trung gian là độ chênh
lệch áp suất oxy giữa phế nang-tuần hoàn ngoại biên (DAaO2). Hiệu ứng gián tiếp của DAaO2 có ý
nghĩa thống kê (test Sobel: t=0,72; Z=2,22; p=0,03) và khá cao (K2=0,46) , nó cho phép giải thích từ 2371% giá trị biến thiên của PaO2max.
Hệ số ước tính

Khoảng tin cậy 95%

Giá trị p

Hiệu ứng toàn thể

1,73

0,93 – 2,54

0,0005

Hiệu ứng trực tiếp

1,01

0,38 – 1,64

0,0049


Hiệu ứng gián tiếp

0,72

0,12 – 1,43

0,026

K2

0,46

0,14 – 0,66

R2

0,51

0,23 - 0,71

25


×