Tải bản đầy đủ (.pdf) (32 trang)

DATA MINING AND APPLICATION: GOM NHÓM DỮ LIỆU ppsx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (967.21 KB, 32 trang )

1
1
KHAI THÁC
'Ӳ/,ӊ8
Ӭ1*'Ө1*
(DATA MINING)
*91*8<ӈ1+2¬1*7Ò$1+
2
B
BÀI 5 ²
Phҫn 1
GOM NHÓM
DӲ LIӊU
2
3
NӜI DUNG
1. *LӟLWKLӋX
2. 3KѭѫQJSKiSSKkQKRҥFK
3. 3KѭѫQJSKiSSKkQFҩS
4
*,Ӟ,7+,ӊ8
1. Gom nhóm là gì ? :
1KyPFөPOӟS : WұS các ÿӕL WѭӧQJ DL
Gom nhóm là quá trình nhóm các ÿͩL ẂͻQJ thành
QK·QJ QKyPFͽPOͳS có ý QJKƭD. Các ÿͩL ẂͻQJ
trong cùng PͱW nhóm có QKL͙X tính FK̽W chung và
có QK·QJ t ính FK̽W khác YͳL các ÿͩL ẂͻQJ ͷ
nhóm khác.
Cho CSDL D={t
1
,t


2
,«,t
n
}vàVӕ nguyên k, gom
nhóm là bài toán xác ÿӏQK ánh [ҥ f:DJ
J
{1,«,k}
sao cho PӛL t
i
ÿѭӧF gán vào PӝW nhóm OӟS K
j
,
1 d
d
j d
d
k.
Không JLͩQJ bài toán phân OͳS các
QKyPFͽPOͳS không ÿ́ͻF EL͗W WÚͳF.
3
5
3+Æ1/Ӟ3!*201+Ï0
Phân OӟS : KӑF có giám sát (Supervised learning)
Tìm SK˱˯QJ pháp ÿ͋ G͹ ÿRiQ OͣS FͯD P̳X PͣL Wͳ
các P̳X ÿm gán nhãn OͣS (phân OͣS WU˱ͣF
6
Gom nhóm : KӑFNK{QJJLiPViW8QVXSHUYLVHG
learning )
7uPFiFQKyPFͭPOͣS³W͹QKLrQ´FͯDFiFP̳X
FK˱Dÿ˱ͫFJiQQKmQ

3+Æ1/Ӟ3!*201+Ï0
4
&yEDRQKLrXQKyPFөP"
QKyPFөP
QKyPFөP
QKyPFөP
*,Ӟ,7+,ӊ8
Khái QL͟P QKyPFͽP ± QKͅS QK͉QJ
8
*,Ӟ,7+,ӊ8
z ӬQJ GөQJ
1KұQ GҥQJ
Phân tích G· OL͟X không gian
;ӱ lý ҧQK
Khoa KͥF kinh W͗ ( ÿ͏F EL͟W nghiên F΁X WL͗S
WKͣ
WWW
Gom nhóm tài OL͟X liên quan ÿ͛ G͝ tìm NL͗P
Gom G· OL͟X Weblog thành nhóm ÿ͛ tìm các
nhóm có cùng NL͛X truy FͅS
*L̻P kích WḰͳF G· OL͟X OͳQ
5
9
zVí Gө
Gom gen và
protein có cùng
FKӭF QăQJ
Nhóm các Fә
SKLӃX có xu
KѭӟQJ giá dao

ÿӝQJ JLӕQJ nhau
Nhóm các vùng
theo OѭӧQJ PѭD
ӣ Úc

Discovered Clusters Industry Group
1
Applied-Matl-DOWN,Bay-Network-Down,3-COM-DOWN,
Cabletron-Sys-DOWN,CISCO-DOWN,HP-DOWN,
DSC-Comm-DOWN,INTEL-DOWN,LSI-Logic-DOWN,
Micron-Tech-DOWN,Texas-Inst-Down,Tellabs-Inc-Down,
Natl-Semiconduct-DOWN,Oracl-DOWN,SGI-DOWN,
Sun-DOWN


Technology1-DOWN
2
Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN,
ADV-Micro-Device-DOWN,Andrew-Corp-DOWN,
Computer-Assoc-DOWN,Circuit-City-DOWN,
Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN,
Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN


Technology2-DOWN
3
Fannie-Mae-DOWN,Fed-Home-Loan-DOWN,
MBNA-Corp-DOWN,Morgan-Stanley-DOWN

Financial-DOWN

4
Baker-Hughes-UP,Dresser-Inds-UP,Halliburton-HLD-UP,
Louisiana-Land-UP,Phillips-Petro-UP,Unocal-UP,
Schlumberger-UP

Oil-UP


*,Ӟ,7+,ӊ8
10
*,Ӟ,7+,ӊ8
z Ví Gө :
7L͗S WKͣ : phát KL͟Q các nhóm khách hàng
trong CSDL khách hàng ÿ͛ xây GΉQJ
FḰ˿QJ trình WL͗S WKͣ có PͽF tiêu
Ĉ̽W ÿDL :xácÿͣQK các vùng ÿ̽W WUͫQJ WUͥW
JLͩQJ nhau trong CSDL quan sát trái ÿ̽W
%̻R KL͛P : tìm nhóm khách hàng có NK̻
QăQJ hay J͏S tai Q̹Q
Nghiên F΁X ÿͱQJ ÿ̽W : gom nhóm các
tâm FK̽Q ÿͱQJ ÿ̽W quan sát ÿ́ͻF theo Y͗W
Q΁W OͽF ÿͣD
6
11
9Ë'Ө*RPQKyPFiFQJ{LQKj
'ӵDWUrQNKRҧQJFiFKÿӏDOê
12
9Ë'Ө*RPQKyPFiFQJ{LQKj
'ӵDWUrQNtFKWKѭӟF
7

13
9Ë'Ө*RPQKyP
14
*,Ӟ,7+,ӊ8
&iFKELӇXGLӉQ
FiFQKyPFөP
Phân chia EҵQJ
các ÿѭӡQJ ranh
JLӟL
Các NKӕL FҫX
Theo xác VXҩW
6ѫ ÿӗ hình cây
«
1 2 3
I1
I2
«
In
0.5 0.2 0.3
8
15
*,Ӟ,7+,ӊ8
2. 7LrXFKXҭQJRPQKyP
3KѭѫQJ pháp gom nhóm WӕW là SKѭѫQJ pháp VӁ WҥR các
nhóm có FKҩW OѭӧQJ :
6Ή JLͩQJ nhau JL·D ÿͩL ẂͻQJ trong cùng PͱW nhóm cao.
*L·D các nhóm thì VΉ JLͩQJ nhau WK̽S.
.KRɠQJFiFK
JLͯDFiF
nhóm là max

.KRɠQJFiFKErQ
trong nhóm là
min
16
*,Ӟ,7+,ӊ8
2. 7LrXFKXҭQJRPQKyPWW
&KҩW OѭӧQJ FӫD NӃW TXҧ gom nhóm GӵD
trên 2 \ӃX Wӕ :
Ĉͱ ÿR VΉ JLͩQJ nhau dùng trong SḰ˿QJ
pháp gom nhóm và
6Ή thi hành nó
0ͱW Vͩ ÿͱ ÿR FK̽W ÓͻQJ :
Bình SḰ˿QJ sai (Sum of Squared Error -
SSE)
Entropy
9
17
*,Ӟ,7+,ӊ8
3. ĈӝÿRNKRҧQJFiFK
Ĉӝ ÿR NKRҧQJ cách WKѭӡQJ dùng ÿӇ xác ÿӏQK Vӵ
khác nhau hay JLӕQJ nhau JLӳD hai ÿӕL WѭӧQJ .
.KRҧQJ cách Minkowski :
q
q
pp
qq
j
x
i
x

j
x
i
x
j
x
i
xjid )|| |||(|),(
2211

YͣL i=
(x
i1
,x
i2
, «,x
ip
)vàj=(x
j1
,x
j2
, «,x
jp
) : hai ÿ͑L
WɉͣQJ p-FKLɾX và q là V͑ nguyên GɉɇQJ
± 1ӃX q=1, d là NKRҧQJ cách Manhattan :
|| ||||),(
2211 pp
j
x

i
x
j
x
i
x
j
x
i
xjid 
18
*,Ӟ,7+,ӊ8
3. ĈӝÿRNKRҧQJFiFKWW
1ӃX q=2, d là NKRҧQJ cách Euclide :
)|| |||(|),(
22
22
2
11 pp
j
x
i
x
j
x
i
x
j
x
i

xjid 
Tính FKҩW FӫD ÿӝ ÿR NKRҧQJ cách

d(i,j)
t 0

d(i,i)
= 0

d(i,j)
=
d(j,i)

d(i,j)
d
d(i,k)
+
d(k,j)
10
19
*,Ӟ,7+,ӊ8
4. Các NLӇX Gӳ OLӋX
Các NLӇX Gӳ OLӋX khác nhau yêu FҫX ÿӝ
ÿR Vӵ khác nhau FNJQJ khác nhau
.
z Các EL͗Q W΍ O͟ theo NKR̻QJ : .KR̻QJ
cách Euclide
z Các ELӃQ QKӏ phân : KӋ Vӕ so NKӟS
KӋ Vӕ Jaccard
z Các EL͗Q tên, WK΁ WΉ W΍ O͟ : NKR̻QJ

cách Minkowski
z Các ELӃQ GҥQJ KӛQ KӧS : công WKӭF
WUӑQJ OѭӧQJ
20
*,Ӟ,7+,ӊ8
5. 0ӝWVӕSKѭѫQJSKiSJRPQKyP
3KѭѫQJ pháp phân KRҥFK
3KѭѫQJ pháp phân FҩS
3KѭѫQJ pháp GӵD trên PұW ÿӝ
3KѭѫQJ pháp GӵD trên OѭӟL
3KѭѫQJ pháp GӵD trên mô hình
11
21
NӜI DUNG
1. *LӟL WKLӋX
2. 3KѭѫQJSKiSSKkQKRҥFK
3. 3KѭѫQJ pháp phân FҩS
22
3+ѬѪ1*3+È33+Æ1+2Ҥ&+
1. .KiLQLӋPFѫEҧQ
3KѭѫQJ pháp phân KRҥFK :xâyGӵQJ k (k<n) phân
KRҥFK FӫD CSDL D JӗP n ÿӕL WѭӧQJ. 0ӛL phân KRҥFK
± 1 QKyPFөP
Cho Vӕ k, FҫQ tìm k nhóm WKӓD mãn tiêu FKXҭQ phân
KRҥFK ÿm FKӑQ (víGө ÿӝ ÿR bình SKѭѫQJ sai - SSE
QKӓ QKҩW.
%LӇX GLӉQ PӛL nhóm EҵQJ giá WUͣ trung bình FӫD Gӳ
OLӋX trong nhóm ÿy : WKXͅW toán K-means (1967)
%LӇX GLӉQ nhóm EҵQJ PӝW ÿͩL ẂͻQJ QҵP JҫQ
trung tâm FӫD nhóm : WKXͅW toán k-medoids, PAM

(1987)
12
23
3+ѬѪ1*3+È33+Æ1+2Ҥ&+
1. .KiLQLӋPFѫEҧQWW
Công WKӭF tính Bình SḰ˿QJ sai ( Sum of Squared
Error - SSE)
9ͳL xlàPͱW ÿL͛P DL trong nhóm C
i
và m
i
là ÿL͛P ÿ̹L GL͟Q cho
nhóm ÿL͛P TB nhóm KR͏F ÿL͛P trung tâm nhóm), K-Vͩ
nhóm. dist (): NKR̻QJ cách Euclide
¦¦


K
iCx
i
i
xmdistSSE
1
2
),(
z 9tGөWDFyQKyPFөPYӟLFiFWUXQJWkPWѭѫQJӭQJ
m
1
=3, m
2

=4
z K
1
={2,3}, K
2
={4,10,12,20,30,11,25}
z SSE = 1
2
+0+0+6
2
+8
2
+16
2
+26
2
+7
2
+21
2
=1523
24
3+ѬѪ1*3+È33+Æ1+2Ҥ&+
2. 7KXұWWRiQN-means :
Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ giá WUͣ TB FͿD DL
trong nhóm
z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là QKӳQJ trung tâm
FӫD các nhóm .
z B2 : Gán W΃QJ ÿͩL ẂͻQJ còn O̹L vào nhóm có trung tâm
nhóm J̿Q nó QK̽W GΉD trên ÿͱ ÿR NKR̻QJ cách Euclide)

z B3 : Tính OҥL giá WUӏ trung tâm FӫD WӯQJ nhóm
z Di FKX\ӇQ trung tâm nhóm YӅ = giá WUӏ TB PӟL FӫD nhóm
z Cho nhóm K
i
={t
i1
,t
i2
,«,t
im
}, giá WUͣ trung bình FͿD nhóm là
m
i
=(1/m)(t
i1
+ « +t
im
)
z B4 : 1͗X các trung tâm nhóm không có gì thay ÿͭL thì
G΃QJ QJ́ͻF O̹L quay O̹L B2.
13
25
9tGө PHDQV%ѭӟF
k
1
k
2
k
3
X

Y
&KӑQ 3
trung tâm
nhóm EҩW
NǤ :k
1
,k
2
,
k
3
26
k
1
k
2
k
3
X
Y
Gán WӯQJ
ÿLӇP vào
nhóm có
trung tâm
nhóm JҫQ
QKҩW
9tGө PHDQV%ѭӟF
14
27
X

Y
Di FKX\ӇQ
trung tâm
WӯQJ nhóm
YӅ ÿLӇP
trung bình
PӟL FӫD
nhóm
k
1
k
2
k
2
k
1
k
3
k
3
9tGө PHDQV%ѭӟF
28
X
Y
*iQOҥLFiF
ÿLӇPFKRJҫQ
YӟLFiFWUXQJ
WkPQKyPPӟL
4&iFÿL͋P
QjRÿ˱ͫFJiQ

O̩L"
k
1
k
2
k
3
9tGө PHDQV%ѭӟF
15
29
X
Y
ÿL͋P
ÿ˱ͫF
JiQO̩L
k
1
k
3
k
2
9tGө PHDQV%ѭӟF«
30
X
Y
7tQKOҥL
trung
bình
nhóm
k

1
k
3
k
2
9tGө PHDQV%ѭӟFE
16
31
X
Y
Di FKX\ӇQ
trung tâm
nhóm YӅ giá
WUӏ TB nhóm
PӟL «
k
2
k
1
k
3
9tGө PHDQV%ѭӟF
Customer Age Income
(K)
John
0.55 0.175
Rachel
0.34 0.25
Hannah
11

Tom
0.93 0.85
nellie
0.39 0.2
David
0.58 0.25
Age
Income
Ví dө : k-mean
17
%ѭӟF&KӑQ1HOOLHYj'DYLGOjWUXQJWkPQKyPFөP$
và B
Age
A
B
Customer Distance
from
David
Distance
from
Nellie
John 0.08 0.161
Rachel 0.24 0.07
Hannah 0.859 1.006
Tom 0.694 0.845
Nellie
David
9tGөN-mean
Income
7UXQJWkPFӫD&OXVWHU$

z Age 0.37, Income=0.23
7UXQJWkPFӫD&OXVWHU%
z Age 0.77, Income=0.57
'ӵDWUrQFiFWUXQJWkPFөP
PӟLJiQFiFNKiFKKjQJ
YjRFiFQKyPFөP
Age
A
B
%7tQKFiFWUXQJWkPPӟLFӫDQKyPFөP$Yj%
Income
9tGөk-mean
18
Customer Distance A Distance B
John
0.19 0.45
Rachel
0.04 0.53
Hannah
1.00 0.49
Tom
0.84 0.33
Nellie
0.04 0.53
David
0.22 0.37
Age
Income
A
B

9tGөN-mean
7UXQJWkPFӫD&OXVWHU$
z Age 0.47, Income=0.22
7UXQJWkPFӫD&OXVWHU%
z Age 0.97, Income= 0.93
z 9ͳL các trung tâm nhóm
PͳL này, thành SK̿Q FͿD
các nhóm không thay ÿͭL.
z 7KXұW toán GӯQJ.
%7tQKFiFWUXQJWkPPӟLFӫDQKyPFөP$Yj%
Income
Age
A
B
9tGөk-mean
19
37
7KXұWWRiQ means
ѬX ÿLӇP :
z ĈѫQ JLҧQ GӉ KLӇX WѭѫQJ ÿӕL KLӋX TXҧ.
z Các ÿͩL ẂͻQJ WΉ ÿͱQJ gán vào các
nhóm.
z 7KѭӡQJ ÿҥW ÿѭӧF WӕL ѭX FөF Eӝ.
38
7KXұWWRiQ means
1KѭӧF ÿLӇP :
z 7KXӝF tính phi Vӕ ?
z &̿Q xác ÿͣQK Vͩ nhóm (k) WÚͳF
z 7ҩW Fҧ các ÿӕL WѭӧQJ SKҧL gán vào các
nhóm

z 3Kө WKXӝF vào YLӋF FKӑQ các nhóm ÿҫX tiên
z *һS YҩQ ÿӅ khi các nhóm có kích WKѭӟF
PұW ÿӝ khác nhau KRһF hình dáng không
SKҧL là hình FҫX
z 1K̹\ F̻P YͳL DL QKL͝X cá EL͟W
20
39
3+ѬѪ1*3+È33+Æ1+2Ҥ&+
3. 7KXұWWRiQN-medoids : PAM
Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ PͱW
trong các ÿӕL WѭӧQJ JҫQ trung tâm nhóm QK̽W
z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là
QKӳQJ WUͥQJ tâm FӫD các nhóm .
z B2 : gán W΃QJ ÿͩL ẂͻQJ còn O̹L vào nhóm có
WUͥQJ tâm FͽP J̿Q nó QK̽W .
z B3 : &KӑQ PӝW ÿӕL WѭӧQJ EҩW NǤ. Hoán ÿәL nó
YӟL WUӑQJ tâm FӫD nhóm. 1ӃX FKҩW OѭӧQJ FӫD
các nhóm WăQJ lên thì quay OҥL B2. 1JѭӧF OҥL
WLӃS WөF WKӵF KLӋQ B3 cho ÿӃQ khi không còn có
thay ÿәL.
40
3+ѬѪ1*3+È33+Æ1+2Ҥ&+
3. 7KXұWWRiQN-medoids (tt):
1KͅQ xét :
z 7KXͅW toán PAM KL͟X TX̻ K˿Q so YͳL k-means
khi có P͏W DL QKL͝X cá EL͟W.
z PAM KLӋX TXҧ YӟL WұS DL QKӓ QKѭQJ không co
dãn WӕW YӟL WұS DL OӟQ
z Phát WUL͛Q :
z CLARA (Clustering LARge Applications) : GӵD trên

SKѭѫQJ pháp Oҩ\ PүX (1990)
z CLARANS(Clustering LARge Application based upon
RANdomized Search) : Oҩ\ PүX ÿӝQJ (1994)
21
41
NӜI DUNG
1. *LӟLWKLӋX
2. 3KѭѫQJSKiSSKkQKRҥFK
3. 3KѭѫQJSKiSSKkQFҩS
42
3+ѬѪ1*3+È33+Æ1&Ҩ3
1. *LӟLWKLӋX
3KѭѫQJ pháp phân FҩS :xâyGӵQJ các nhóm và Wә
FKӭF QKѭ cây phân FҩS.
%LӇX GLӉQ GѭӟL GҥQJ Vѫ ÿӗ hình cây (dendrogram):
OѭX OҥL quá trình gom OҥL / phân chia nhóm
1 3 2 5 4 6
0
0.05
0.1
0.15
0.2
1
2
3
4
5
6
1
2

34
5
22
43
3+ѬѪ1*3+È33+Æ1&Ҩ3
1. *LӟLWKLӋXWW
Không F̿Q xác ÿͣQK WÚͳF Vͩ nhóm k.
Xác ÿͣQK Vͩ nhóm F̿Q WKL͗W E͉QJ YL͟F F͇W ngang V˿ ÿͫ
hình cây W̹L P΁F thích KͻS.
Hai ORҥL phân FҩS chính :
Tích Wө : Wӯ GѭӟL lên trên, PӛL ÿӕL WѭӧQJ là PӝW nhóm
Chia QKӓ : Wӯ trên [XӕQJ WҩW Fҧ các ÿӕL WѭӧQJ là 1 nhóm
7KXͅW toán :
AGNES, DIANA
BIRCH (Balance Iterative Reducing & Clustering using
Hierachies)
CURE (Clustering Using Representative)
ROCK (Robust Clustering using linKs)
CHAMELEON
44
3+ѬѪ1*3+È33+Æ1&Ҩ3
1. *LӟLWKLӋXWW
Cách xác ÿͣQK NKR̻QJ cách JL·D các nhóm :
Single Link : NKR̻QJ cách J̿Q QK̽W JL·D hai ÿͩL
ẂͻQJ WKXͱF hai nhóm
Complete Link : NKR̻QJ cách xa QK̽W JL·D hai
ÿͩL ẂͻQJ WKXͱF hai nhóm
23
45
3+ѬѪ1*3+È33+Æ1&Ҩ3

Step
0
Step
1
Step
2
Step
3
Step
4
b
d
c
e
a
a b
d e
c d e
a b c d e
Step
4
Step
3
Step
2
Step
1
Step
0
7tFKWө

(agglomerative)
&KLDQKӓ
(divisive)
46
3+ѬѪ1*3+È33+Æ1&Ҩ3
2. 7KXұWWRiQ$*1(6$JJORPHUDWLYH
Nesting):
B1: 0ӛL ÿӕL WѭӧQJ là PӝW nhóm.
B2: +ͻS QK̽W các nhóm có NKR̻QJ cách JL·D
các nhóm là QKͧ QK̽W (Si ngle Link/ Complete
Link)
B3 : 1ӃX thu ÿѭӧF nhóm ³WRjQ Eӝ´ thì GӯQJ
QJѭӧF OҥL quay OҥL B2.
0
1
2
3
4
5
6
7
8
9
10
012345678910
0
1
2
3
4

5
6
7
8
9
10
012345678910
0
1
2
3
4
5
6
7
8
9
10
012345678910
24
47
3+ѬѪ1*3+È33+Æ1&Ҩ3
3. 7KXұWWRiQ',$1$'LYLVLYH$QDO\VLV
B1: 7ҩW Fҧ các ÿӕL WѭӧQJ là PӝW nhóm.
B2 : Chia QKͧ nhóm có NKR̻QJ cách JL·D QK·QJ
ÿͩL ẂͻQJ trong nhóm là OͳQ QK̽W.
B3 : 1ӃX PӛL nhóm FKӍ FKӭD 1 ÿӕL WѭӧQJ thì
GӯQJ QJѭӧF OҥL quay OҥL B2.
0
1

2
3
4
5
6
7
8
9
10
012345678910
0
1
2
3
4
5
6
7
8
9
10
012345678910
0
1
2
3
4
5
6
7

8
9
10
012345678910
48
9Ë'Ө7+8Ұ772È1$*1(6
z Cho WұS DL JӗP 6
ÿLӇP trong không
gian 2 FKLӅX. 6ӱ
GөQJ WKXұW toán
AGNES YӟL Single
link NKRҧQJ cách
JҫQ QKҩW JLӳD 2
ÿLӇP FӫD 2 nhóm
khác nhau) ÿӇ gom
nhóm
ĈLӇP 7ӑDÿӝ[ 7ӑDÿӝ\
P1 0.40 0.53
P2 0.22 0.38
P3 0.353 0.32
P4 0.26 0.19
P5 0.08 0.41
P6 0.45 0.30
25
49
9Ë'Ө7+8Ұ772È1$*1(6
z Xây GӵQJ ma WUұQ NKRҧQJ cách ÿӝ ÿR Euclide)
JLӳD các ÿLӇP
P1 P2 P3 P4 P5 P6
P1

0.00 0.23 0.22 0.37 0.34 0.24
P2
0.23 0.00 0.15 0.19 0.14 0.24
P3
0.22 0.15 0.00 0.16 0.29 0.10
P4
0.37 0.19 0.16 0.00 0.28 0.22
P5
0.34 0.14 0.29 0.28 0.00 0.39
P6
0.24 0.24 0.10 0.22 0.39 0.00
50
9Ë'Ө7+8Ұ772È1$*1(6
6ӱ GөQJ Single Link :
1. %ѭӟF 1:PӛL ÿLӇP là PӝW nhóm
2. %ѭӟF 2:
 Trong Vӕ các nhóm JӗP PӝW ÿLӇP thì dist(3,6) - min
nên JӝS ÿLӇP P3 và P6 YӟL nhau thành PӝW nhóm
 Thu ÿѭӧF các nhóm : {1}, {4}, {2}, {5}, {3,6},
3. Quay OҥL EѭӟF 2doFKѭD thu ÿѭӧF nhóm ³WRjQ Eӝ´
4. Tính NKRҧQJ cách JLӳD các nhóm . Ví Gө :
 Dist({3,6},{1}) =min(dist(3,1),dist(6,1))
=min(0.22, 0.24) = 0.22

×