BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------Nguyễn Xuân Thịnh
TRÍ TUỆ NGHIỆP VỤ VÀ CÁC ỨNG DỤNG NGÂN HÀNG
LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. Vũ Thị Hƣơng Giang
Hà Nội – Năm 2015
MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................... iii
LỜI CẢM ƠN ........................................................................................................... iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ..............................................v
DANH MỤC CÁC HÌNH ......................................................................................... vi
DANH MỤC CÁC BẢNG....................................................................................... vii
MỞ ĐẦU .....................................................................................................................1
CHƢƠNG 1. TỔNG QUAN .......................................................................................2
1.1 Bài toán xét duyệt hồ sơ tín dụng thẻ FLC .........................................................2
1.1.1
Giới thiệu sản phẩm thẻ tín dụng FLC.......................................................2
1.1.2
Quy trình nghiệp vụ xử lý hồ sơ tín dụng khách hàng FLC ......................4
1.1.3
Hiện trạng cách thức xét duyệt hồ sơ tín dụng khách hàng .......................5
1.2 Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng .................11
1.2.1
Trí tuệ nghiệp vụ (Business Intelligence – BI) ........................................11
1.2.1.1
Khái niệm BI [1] .............................................................................11
1.2.1.2
Mục tiêu và nhiệm vụ của BI ..........................................................11
1.2.1.3
Kiến trúc và thành phần BI [1] ........................................................12
1.2.1.4
Kho dữ liệu (Datawarehouse) .........................................................13
1.2.1.5
Xử lý dữ liệu trực tuyến (OLAP)[4] ...............................................15
1.2.1.6
Khai phá dữ liệu(Data mining) [1] ..................................................16
1.2.2
Ứng dụng BI trong lĩnh vực ngân hàng ...................................................20
1.2.2.1
Môi trƣờng các hoạt động ngân hàng và công nghệ BI [2].............20
1.2.2.2
Một số ứng dụng BI trong lĩnh vực ngân hàng [2] .........................22
1.3 Mục tiêu của luận văn .......................................................................................25
1.4 Định hƣớng giải pháp .......................................................................................26
1.4.1
Cách tiếp cận ............................................................................................26
1.4.2
Mô hình ứng dụng BI vào bài toán xét duyệt hồ sơ tín dụng FLC ..........28
CHƢƠNG 2. MÔ HÌNH XÂY DỰNG CÂY QUYẾT ĐỊNH .................................30
2.1 Mô hình dữ liệu ................................................................................................30
i
2.1.1
Dữ liệu nguồn ..........................................................................................30
2.1.1.1
Mô hình khai thác dữ liệu ...............................................................30
2.1.1.2
Dữ liệu hồ sơ tín dụng khách hàng FLC .........................................30
2.1.1.3
Dữ liệu thông tin trả nợ thẻ .............................................................33
2.1.2
Mô hình dữ liệu đa chiều .........................................................................33
2.2 Mô hình xây dựng cây quyết định ....................................................................35
2.2.1
Mô hình ra quyết định ..............................................................................35
2.2.2
Giải thuật C4.5 xây dựng cây quyết định ................................................37
2.2.3
Entropy đo độ thuần nhất của tập huấn luyện ..........................................38
2.2.4
Độ lợi thông tin – Information Gain (Gain).............................................39
2.2.5
Đo tỷ suất lợi ích Gain Ratio của thuộc tính ............................................39
2.2.6
Cơ chế xử lý thuộc tính số (thuộc tính liên tục) ......................................40
2.2.7
Triển khai giải thuật C4.5 xây dựng cây quyết định ................................41
2.2.8
Cắt tỉa cây quyết định ..............................................................................52
2.3 Xây dựng tập luật .............................................................................................57
CHƢƠNG 3. XÂY DỰNG ỨNG DỤNG WEB HỖ TRỢ RA QUYẾT ĐỊNH XÉT
DUYỆT HỒ SƠ TÍN DỤNG FLC ............................................................................59
3.1 Phân tích yêu cầu ứng dụng ..............................................................................59
3.2 Thiết kế ứng dụng .............................................................................................60
3.2.1
Mô hình dữ liệu ........................................................................................60
3.2.2
Thiết kế các bảng dữ liệu .........................................................................61
3.2.3
Thiết kế các chức năng ứng dụng ............................................................68
3.2.3.1
Mô hình chức năng ..........................................................................68
3.2.3.2
Mô hình xây dựng ứng dụng ...........................................................70
3.3 Cài đặt ứng dụng...............................................................................................71
3.4 Giới thiệu các chức năng ứng dụng ..................................................................71
3.5 Kết quả thử nghiệm ..........................................................................................76
KẾT LUẬN VÀ KIẾN NGHỊ...................................................................................78
TÀI LIỆU THAM KHẢO .........................................................................................80
ii
LỜI CAM ĐOAN
Tôi là Nguyễn Xuân Thịnh, học viên lớp 12BCNTT2, Trƣờng Đại học Bách
khoa Hà nội xin cam kết Luận văn này là công trình nghiên cứu của bản thân dƣới
sự hƣớng dẫn khoa học của TS. Vũ Thị Hƣơng Giang, Viện Công nghệ thông tin và
Truyền thông, Trƣờng Đại học Bách khoa Hà nội.
Các kết quả trong Luận văn là trung thực và không sao chép từ bất kỳ công
trình nào khác.
Hà Nội, ngày 15 tháng 09 năm 2015
Học viên : Nguyễn Xuân Thịnh
Lớp
iii
: 12BCNTT2
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn sâu sắc tới TS. Vũ Thị Hƣơng Giang, Bộ môn Công
nghệ phần mềm, Viện Công nghệ Thông tin và Truyền thông, Đại học Bách khoa
Hà nội đã động viên và tận tình hƣớng dẫn tôi trong suốt quá trình thực hiện luận
văn. Những ý kiến quý báu của TS đã định hƣớng và góp phần lớn tạo nên kết quả
của đề tài.
Xin trân trọng cảm ơn tập thể các thầy, cô giáo Trƣờng Đại học Bách khoa
Hà nội nói chung và Viện Công nghệ Thông tin và Truyền thông nói riêng đã tận
tình giảng dạy, truyền đạt cho tôi những kiến thức trong suốt quá trình học tập tại
trƣờng.
Cuối cùng, tôi xin chân thành cảm ơn bạn bè, ngƣời thân và gia đình đã hết
lòng giúp đỡ, hỗ trợ tôi trong quá trình nghiên cứu và thực hiện luận văn.
iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Ký hiệu và viết tắt
Diễn giải
BI
Business Intelligence
FLC
Fix Limit Card
VRB
Vietnam - Russia Joint Venture Bank
OLAP
On-Line Analysis Processing
OLTP
On-Line Transaction Processing
CSDL
Cơ Sở Dữ Liệu
ETL
Extract – Transform - Load
v
DANH MỤC CÁC HÌNH
Hình 1: Sản phẩm thẻ FLC..........................................................................................2
Hình 2: Quy trình xét duyệt hồ sơ tín dụng tại Ngân hàng Việt-Nga .........................4
Hình 3: Kiến trúc của một hệ thống trí tuệ nghiệp vụ...............................................12
Hình 4: Lƣợc đồ hình sao ..........................................................................................14
Hình 5: Lƣợc đồ hình bông tuyết ..............................................................................15
Hình 6: Khai phá dữ liệu trong ngữ cảnh BI .............................................................17
Hình 7: Các pha của qui trình khai phá dữ liệu.........................................................18
Hình 8: Các bƣớc trong quy trình xét duyệt hồ sơ FLC ...........................................25
Hình 9: Mô hình ứng dụng trí tuệ nghiệp vụ ............................................................28
Hình 10: Mô hình khai thác dữ liệu ..........................................................................30
Hình 11: Lƣợc đồ hình sao thông tin phát hành thẻ ..................................................34
Hình 12: Thông tin trả nợ thẻ ....................................................................................34
Hình 13: Mô hình xây dựng cây quyết định .............................................................35
Hình 14: Cây quyết định mức 1 ................................................................................45
Hình 15: Cây quyết định mức 2 ................................................................................47
Hình 16: Triển khai cây quyết định tại nút C ............................................................49
Hình 17: Cây quyết định sau khi triển khai tiếp tại nút E .........................................50
Hình 18: Cây quyết định hoàn chỉnh ........................................................................52
Hình 19: Cây trƣớc khi cắt tỉa ...................................................................................55
Hình 20: Cây sau khi cắt tỉa ......................................................................................57
Hình 21: Lƣợc đồ dữ liệu hồ sơ khách hàng .............................................................60
Hình 22: Lƣợc đồ dữ liệu thông tin trả nợ thẻ ..........................................................61
Hình 23: Mô hình chức năng ứng dụng ....................................................................68
Hình 24: Mô hình xây dựng ứng dụng ......................................................................70
Hình 25: Mô hình cây quyết định .............................................................................72
Hình 26: Màn hình xét duyệt hồ sơ tín dụng khách hàng .........................................73
Hình 27: Màn hình tra cứu danh mục .......................................................................74
Hình 28: Màn hình dữ liệu xét duyệt lịch sử ............................................................75
vi
DANH MỤC CÁC BẢNG
Bảng 1: Tiêu chí tính điểm hồ sơ tín dụng khách hàng ............................................10
Bảng 2: Bảng các thông tin định danh khách hàng ...................................................31
Bảng 3: Bảng thông tin chấm điểm tín dụng ............................................................32
Bảng 4: Bảng thông tin phân lớp hồ sơ .....................................................................33
Bảng 5: Bảng thông tin trả nợ thẻ .............................................................................33
Bảng 6: Bảng dữ liệu mẫu huấn luyện ......................................................................42
Bảng 7: Bảng sự kiện dữ liệu HoSoKH_FACT .......................................................62
Bảng 8: Bảng chiều ViTriCongTac_DIM .................................................................63
Bảng 9: Bảng chiều LoaiHinhCongTyLamViec_DIM .............................................63
Bảng 10: Bảng chiều TinhTrangHonNhan_DIM......................................................63
Bảng 11: Bảng chiều LoaiHinhCuTru_DIM ............................................................64
Bảng 12: Bảng chiều NgheNghiep_DIM ..................................................................64
Bảng 13: Bảng chiều TinhTrangCV_DIM ................................................................64
Bảng 14: Bảng chiều LinhVucKinhDoanhCty_DIM................................................65
Bảng 15: Bảng chiều TrinhDo_DIM ........................................................................65
Bảng 16: Bảng chiều HinhThucTraLuong_DIM ......................................................65
Bảng 17: Bảng chiều DoTuoiCon_DIM ...................................................................65
Bảng 18: Bảng chiều ThoiGian_DIM ......................................................................66
Bảng 19: Bảng sự kiện dữ liệu ThongTinTraNo_FACT ..........................................66
Bảng 20: Bảng dữ liệu cây quyết định Nut ...............................................................67
Bảng 21: Kết quả phân lớp tập huấn luyện ...............................................................76
Bảng 22: Kết quả thử nghiệm với hồ sơ khách hàng mới .........................................76
Bảng 23: Kết quả thử nghiệm phân lớp các khách hàng không đủ điểm tín dụng ...77
vii
MỞ ĐẦU
Tín dụng bán lẻ ngày càng trở nên quan trọng đối với các Ngân hàng, trong đó
sản phẩm thẻ tín dụng là một trong những sản phẩm bán lẻ đem lại doanh thu, lợi
nhuận rất tiềm năng vì nhu cầu thanh toán qua thẻ tín dụng có xu hƣớng ngày một
tăng. Nhƣng cùng với đó là vấn đề nợ xấu từ tín dụng thẻ cũng phát sinh nhiều hơn
bởi vì những hợp đồng tín dụng này hầu hết là không có tài sản đảm bảo, chủ yếu
dựa trên chữ “tín” với khách hàng. Mặc dù nợ xấu phát sinh từ hình thức thẻ tín
dụng ảnh hƣởng lớn tới kết quả kinh doanh của Ngân hàng, nhƣng Ngân hàng
không thể không hoặc ngừng cho vay, cấp tín dụng mới, vì đây là một trong những
nghiệp vụ chính, cốt yếu của Ngân hàng.
Ngân hàng cần tìm kiếm đƣợc nhiều khách hàng, tìm đƣợc rồi thì phải lựa chọn
đƣợc những khách hàng tốt để bán sản phẩm thẻ tín dụng. Có thể nói trong quy
trình bán hàng thì khâu xét duyệt hồ sơ khách hàng để quyết định phê duyệt hoặc từ
chối cấp tín dụng là một yếu tố then chốt quyết định một sự lựa chọn đúng đắn,
mang về một khách hàng tốt, đem lại lợi nhuận cho Ngân hàng. Vậy vấn đề đặt ra ở
đây là gì? Đó là việc phải hoàn thiện hơn quy trình xét duyệt, lựa chọn khách hàng
để giải ngân, cấp tín dụng. Ngân hàng luôn mong muốn tìm đƣợc giải pháp để giải
quyết bài toán này, trong số đó thì giải pháp ứng dụng trí tuệ nghiệp vụ hứa hẹn sẽ
đem lại hiệu quả.
Trí tuệ nghiệp vụ (Business Intelligence – BI) là một giải pháp công nghệ khai
thác dữ liệu từ các nguồn dữ liệu khác nhau (Excel, CSDL quan hệ, file text,..), từ
các hệ thống tác nghiệp khác nhau (Core Banking, Card System, CRM…), thông
qua các mô hình toán học, các kỹ thuật khai phá dữ liệu (data mining) để xử lý
thành những thông tin hữu ích nhằm hỗ trợ ra quyết định kinh doanh hiệu quả.
Qua những phân tích trên, tác giả đi đến quyết định lựa chọn ứng dụng giải pháp
BI vào giải quyết bài toán hỗ trợ ra quyết định phê duyệt hồ sơ tín dụng khách hàng
tại ngân hàng Liên doanh Việt - Nga.
1
CHƢƠNG 1. TỔNG QUAN
Chƣơng này sẽ trình bày các vấn đề sau:
Bài toán xét duyệt hồ sơ tín dụng thẻ FLC
Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng
Mục tiêu của luận văn
Định hƣớng giải pháp
1.1 Bài toán xét duyệt hồ sơ tín dụng thẻ FLC
1.1.1 Giới thiệu sản phẩm thẻ tín dụng FLC
Hình 1: Sản phẩm thẻ FLC
-
Sản phẩm thẻ tín dụng hạn mức thấp (Fix Limit Card – FLC) của Ngân hàng
Liên doanh Việt – Nga là một loại trong bộ sản phẩm tín dụng của Ngân
hàng. Hạn mức tín dụng của sản phẩm FLC theo quy định hiện tại của Ngân
2
hàng là 15 triệu đồng và phân khúc khách hàng mục tiêu là những ngƣời có
thu nhập trung bình, cho phép khách hàng thực hiện các giao dịch trong nƣớc
hoặc quốc tế trong hạn mức tín dụng thấp quy định bởi VRB và/hoặc hạn
mức giao dịch theo quy định của ngân hàng phát hành và ngân hàng đại lý.
-
Khách hàng mục tiêu của sản phẩm gồm những đối tƣợng khách hàng sau:
o Ngƣời có thu nhập trung bình làm việc ở các công sở chƣa có thẻ tín
dụng
o Khách hàng có thu nhập trung bình trở lên không làm việc ở công sở,
chƣa có thẻ tín dụng.
o Khách hàng có thu nhập cao (thậm chí có ô tô) đã có thẻ tín dụng
nhƣng thiếu hụt tài chính tạm thời vì đã sử dụng hết hạn mức thẻ đó.
o Khách hàng đang phải trả nợ 1 khoản vay mua nhà/ô tô nên thiếu hụt
tài chính cho nhu cầu sinh hoạt hàng ngày, mua sắm vật dụng gia đình
có giá trị nhỏ.
-
Lợi ích sản phẩm FLC đối với khách hàng
o Phù hợp với khả năng thu nhập của nhiều đối tƣợng khách hàng.
o Đáp ứng nhu cầu thiếu hụt tạm thời tài chính cá nhân của khách hàng.
o Đƣợc hƣởng các ƣu đãi của các đối tác của VRB (theo thỏa thuận
giảm giá các sản phẩm và dịch vụ).
o Khách hàng đƣợc hƣởng tiện ích dịch vụ ngân hàng an toàn và hiện
đại nhƣ Internet Banking và SMS Banking.
3
1.1.2 Quy trình nghiệp vụ xử lý hồ sơ tín dụng khách hàng FLC
Quy trình xét duyệt hồ sơ tín dụng
Tiếp nhận hồ sơ khách hàng
Giao dịch viên
Tiếp nhận hồ
sơ mới/hồ sơ
bổ sung của
KH
Thẩm định hồ sơ khách hàng
Thông báo tới KH
không đạt thẩm
định
Thông báo tới
KH không đạt
điểm tín dụng
Hồ sơ thiếu
Tiếp nhận kết quả
thẩm định
Tiếp nhận kết quả
tính điểm
Quyết định
Hồ sơ khách
hàng
Kiểm tra
thông tin đã
đầy đủ
Hồ sơ đầy đủ
Thẩm định hồ
sơ khách hàng
Không đạt
Kiểm
tra đạt
kết quả
thẩm
định?
Kết quả thẩm
định
Cán bộ quản lý rủi ro
Cán bộ tín dụng
Chấm điểm hồ sơ khách hàng
Thông báo
KH bổ sung
hồ sơ
Đạt
Không đạt
Chấm điểm hồ
sơ KH
Trưởng phòng giao dịch
Kết quả
chấm điểm
Kiểm tra
đạt điểm
tín dụng?
Đạt
Ra quyết định
cấp tín dụng
Quyết định
tín dụng
Hình 2: Quy trình xét duyệt hồ sơ tín dụng tại Ngân hàng Việt-Nga
Quy trình xét duyệt hồ sơ tín dụng khách hàng đƣợc minh họa trong Hình 2, cụ thể
nhƣ sau:
Bước 1: Giao dịch viên tiếp nhận hồ sơ khách hàng và thực hiện kiểm tra hồ sơ đã
đầy đủ và đúng với qui định của Ngân hàng chƣa? Nếu hồ sơ bị thiếu, giao dịch
viên sẽ thông báo để khách hàng bổ sung cho đầy đủ. Ngƣợc lại, hồ sơ khách hàng
sẽ đƣợc chuyển tới bộ phận tín dụng để thực hiện thẩm định.
Bước 2: Cán bộ tín dụng thực hiện thẩm định lại các thông tin trên hồ sơ khách
hàng. Nếu phát hiện các thông tin là thiếu trung thực, sai lệch…cán bộ tín dụng sẽ
gửi lại Giao dịch viên để chuyển kết quả tới khách hàng. Nếu đạt thẩm định, hồ sơ
khách hàng đƣợc chuyển tới bộ phận quản lý rủi ro để chấm điểm tín dụng.
4
Bước 3: Cán bộ quản lý rủi ro thực hiện chấm điểm theo các thông tin của hồ sơ
khách hàng nhƣ: tuổi, trình độ, vị trí công tác,…Nếu hồ sơ có điểm tín dụng đạt từ
75 trở lên (thang điểm 100) thì hồ sơ sẽ đƣợc chuyển lên lãnh đạo phòng giao dịch
để ra quyết định tín dụng. Và nếu không đạt thì kết quả chấm điểm sẽ đƣợc gửi tới
Giao dịch viên để thông báo kết quả cho khách hàng.
Bước 4: Lãnh đạo phòng giao dịch (Trƣởng phòng/ phó phòng giao dịch) trên cơ sở
điểm tín dụng của khách hàng sẽ ra quyết định cấp tín dụng hay không.
1.1.3 Hiện trạng cách thức xét duyệt hồ sơ tín dụng khách hàng
-
Cách thức xét duyệt hồ sơ tín dụng khách hàng sử dụng sản phẩm FLC tại
Ngân hàng Liên doanh Việt - Nga dựa vào điểm số tính toán từ các thông tin
(Tuổi, nghề nghiệp, thu nhập hàng tháng, số ngƣời phụ thuộc,..) trên hồ sơ
đăng ký của khách hàng sau khi đã thẩm định.
-
Điểm tín dụng khách hàng cho hồ sơ FLC đƣợc tính theo công thức sau:
S= ∑
Mi*Wi
Trong đó:
S: là điểm tín dụng của khách hàng
Mi : là điểm của thông tin i
Wi: là trọng số của thông tin i
N: là số thông tin đánh giá, n = 20
-
Chi tiết tiêu chí tính điểm đƣợc thể hiện ở bảng sau:
STT
1.
Vị trí công tác
Điểm
Giá trị
Tên thông tin
Nhân viên
Công chức/Viên chức
Giám đốc/ Quản lý
Lao động lành nghề
Khác
5
M
W
48
48
100
38
0
7%
STT
Điểm
Giá trị
Tên thông tin
M
2.
Nguồn thu nhập
3.
Loại hình cƣ trú
4.
5.
6.
Tuổi
Trình độ
Số ngƣời phụ thuộc
Lƣơng
Lƣơng và các thu nhập khác
Thu nhập ngoài lƣơng
Nhà riêng
Nhà sở hữu chung
Đƣợc thừa kế
Ở với cha mẹ
Nhà thuê
Khác
Nhà riêng
18-20 (>60)
Số con (<18 tuổi)
0
21-25
34.4
26-35
100
36-55
75.2
56-60
36
Chƣa tốt nghiệp phổ thông
9.6
Trung học phổ thông
44
Cao đẳng/ Đại học
100
Sau đại học
82
0
100
1
97.6
2
57.6
3
35.2
>3
7.
80
100
44
100
82.4
36.8
64
24.4
0
100
W
7%
6%
6%
5%
5%
0
0
100
1
95.2
2
59.6
6
5%
STT
Điểm
Giá trị
Tên thông tin
M
8.
9.
Độ tuổi của con
Tình trạng công việc
>2
15.2
0
100
1 (0-6)
74.4
2 (7-10)
95.2
3 (11-14)
78.8
4 (15-17)
55.2
Toàn thời gian
100
Bán thời gian
48
Nghề tự do
54.8
Sinh viên
30.4
Giúp việc
17.6
Nghỉ hƣu
19.6
Khác
10.
Loại hình công ty
đang làm việc
W
5%
5%
0
Công ty thuộc sở hữu nhà
nƣớc
Công ty nƣớc ngoài
84.8
Công ty cổ phần
65.6
Công ty Trách nhiệm hữu
hạn
Công ty liên doanh
100
52.8
24.8
Công ty thuộc sở hữu gia
đình
Khác
4.8
Nông nghiệp
39.6
Lĩnh vực kinh doanh
Thủy sản
11.
của công ty
Năng lƣợng
7
5%
40
45.6
69.6
5%
STT
Điểm
Giá trị
Tên thông tin
M
Dệt may
74.8
Bất động sản
29.6
Vật liệu xây dựng
37.6
Khai khoáng/mỏ
62
Du lịch/ Nhà hàng/ Khách
sạn
Giáo dục
Y tế
12.
Nghề nghiệp
Số năm công tác
88
61.2
88
Vận tải/ kho bãi
63.2
Viễn thông
92.8
Tài chính/ Ngân hàng
100
Khác
9.6
Nhân sự/ Quản trị văn phòng
100
Marketing/ PR
100
Công nghệ thông tin
100
Kế toán
57.6
Bán hàng
100
Kỹ sƣ
55.2
Giáo viên/ Giảng viên
13.
W
54
Luật sƣ
39.2
Khác
19.2
<1
17.2
1-2y
78.4
2-5 y
100
>5
62
14. Thu nhập hàng tháng < 3
0
8
5%
5%
5%
STT
Điểm
Giá trị
Tên thông tin
M
(triệu đồng)
15.
Số dƣ tài khoản
thanh toán gần nhất
tại tổ chức tín dụng
khác (triệu đồng)
3-5
45.6
5-7
100
>7
89.6
<3
7.2
3-5
36.8
5 - 10
> 10
76
100
Không có
100
< 150
16.
17.
18.
19.
Tình trạng dƣ nợ
(triệu đồng)
Hình thức trả lƣơng
Số sản phẩm thẻ
đang sử dụng
Số năm công tác
công việc trƣớc
20. Tình trạng hôn nhân
W
5%
5%
94
150 - 300
34.4
300 - 500
34.8
> 500
12
Trả qua tài khoản tại VRB
Trả qua tài khoản tại ngân
hàng khác
Tiền mặt
Khác
Không có
100
76
64.8
17.6
100
1-2
55.6
3
26.4
>3
0
Không có
<1y
1-2y
2-5 y
>5
Chƣa kết hôn
Đã kết hôn
9
4%
0
41.6
74.4
100
56
100
92.8
4%
3%
3%
STT
Điểm
Giá trị
Tên thông tin
M
Đã ly dị
Góa
Khác
W
62.4
54.4
0
100%
Bảng 1: Tiêu chí tính điểm hồ sơ tín dụng khách hàng
-
Đánh giá điểm và xét duyệt hồ sơ
Khách hàng đạt số điểm từ 75% trở lên sẽ đƣợc cấp tín dụng và đƣợc phép
sử dụng sản phẩm thẻ tín dụng hạn mức thấp. Còn lại, trƣờng hợp khách hàng
đạt ít hơn 75% sẽ bị từ chối cấp tín dụng.
Nhận xét về cách tính điểm đang áp dụng này:
-
Việc xét duyệt thực hiện dựa chủ yếu vào yếu tố kinh nghiệm của cán bộ tín
dụng, thể hiện qua việc đánh giá điểm chủ quan theo từng tiêu chí.
-
Nợ xấu, nợ khó đòi phát sinh chỉ có thể phát hiện đƣợc sau khi khách hàng
đã đƣợc phê duyệt cấp tín dụng và sử dụng sản phẩm. Đối với tín dụng thẻ
FLC thì nợ xấu phát sinh chính là việc khách hàng chậm hoặc không trả nợ
thẻ. Với cách thức xét duyệt dựa trên chấm điểm hiện tại việc đánh giá có
hạn chế là chƣa tận dụng đƣợc dữ liệu lịch sử (dữ liệu xét duyệt hồ sơ tín
dụng và dữ liệu trả nợ thẻ) để điều chỉnh, nâng cao chất lƣợng kết quả xét
duyệt.
-
Hiện tại, các dữ liệu liên quan tới FLC đƣợc Ngân hàng Liên doanh Việt –
Nga quản lý trên các hệ thống:
o Hệ thống quản lý phát hành thẻ FLC (sử dụng giải pháp Microsoft
Sharepoint)
o Hệ thống quản lý thẻ CMS & TWO (giải pháp của Compass Plus)
Các hệ thống này lƣu trữ dữ liệu theo cách thức, định dạng khác nhau và sử
dụng hai hệ thống CSDL khác nhau là Microsoft SQL Server và Oracle
10
Để giải quyết bài toán xét duyệt hồ sơ tín dụng khách hàng và khắc phục những
hạn chế của cách thức hiện tại, qua nghiên cứu giải pháp Trí tuệ nghiệp vụ tác giả
đề xuất áp dụng giải pháp này để xây dựng mô hình mới để hỗ trợ cán bộ nghiệp vụ
ra quyết định xét duyệt hồ sơ tín dụng FLC. Vậy giải pháp Trí tuệ nghiệp vụ là gì?
Mô hình ứng dụng cho bài toán này ra sao? Tác giả sẽ trình bày chi tiết ở các phần
tiếp theo của chƣơng viết này.
1.2 Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng
1.2.1 Trí tuệ nghiệp vụ (Business Intelligence – BI)
1.2.1.1 Khái niệm BI [1]
Trí tuệ nghiệp vụ (Business Intelligence – BI) là một giải pháp công nghệ
khai thác dữ liệu từ các nguồn dữ liệu khác nhau (Excel, CSDL quan hệ, file text,..),
từ các hệ thống tác nghiệp khác nhau (Core Banking, Card System, CRM…), thông
qua các mô hình toán học, các kỹ thuật khai phá dữ liệu (data mining) để xử lý
thành những thông tin hữu ích nhằm hỗ trợ ra quyết định kinh doanh hiệu quả.
1.2.1.2 Mục tiêu và nhiệm vụ của BI
Mục đích của hệ thống BI là giải pháp biến đổi dữ liệu từ kho dữ liệu hoặc dữ
liệu chủ đề thành thông tin và tri thức, từ cách tổng hợp, phân tích các thông tin đó
doanh nghiệp có đƣợc các tƣ duy chiến lƣợc, hành động hiệu quả hoặc giá trị của hệ
thống BI mang đến sự đúc kết các ý tƣởng đem lại.
11
1.2.1.3 Kiến trúc và thành phần BI [1]
Kiến trúc đặc trƣng của một hệ thống BI đƣợc thể hiện nhƣ mô hình sau:
Hình 3: Kiến trúc của một hệ thống trí tuệ nghiệp vụ
Giải pháp trí tuệ nghiệp vụ gồm các thành phần nhƣ sau:
1. Data sources (Nguồn dữ liệu)
Chứa các nguồn dữ liệu từ nhiều loại, nhiều hệ thống khác nhau. Các nguồn
dữ liệu này còn thô sơ chƣa chuẩn hóa.
2. Data warehouse/Data mart (Kho dữ liệu và khối dữ liệu)
Dữ liệu sau khi đƣợc xử lý từ các công cụ trích xuất và chuyển đổi và nạp dữ
liệu (ETL) sẽ đƣợc lƣu trữ trong các cơ sở dữ liệu để cung cấp cho việc phân
tích trong hệ thống trí tuệ nghiệp vụ
3. Data exploration (Thăm dò dữ liệu)
Bao gồm các công cụ thực hiện việc phân tích một cách bị động nhƣ: các hệ
thống báo cáo, thống kê. Nó đƣợc coi là bị động vì phụ thuộc vào yêu cầu từ
ngƣời ra quyết định tạo ra các giả thuyết hoặc các tiêu chí trích xuất dữ liệu,
sau đó sử dụng công cụ để tìm ra câu trả lời.
12
4. Data mining (Khai phá dữ liệu)
Các kỹ thuật dùng để khai phá dữ liệu và phát hiện tri thức nhƣ phân loại
(classification), phân nhóm (clustering), phát hiện luật kết hợp (association
rule), dự đoán (prediction),…
5. Optimization (Tối ƣu hóa)
Mô hình tối ƣu cho phép chúng ta xác định đƣợc giải pháp tốt nhất trong 1
loạt các giải pháp đƣa ra.
6. Decisions (Quyết định)
Sau khi đã lựa chọn phƣơng án tốt nhất, ngƣời sử dụng sẽ ra quyết định cuối
cùng.
1.2.1.4 Kho dữ liệu (Datawarehouse)
a) Khái niệm:
Kho dữ liệu (Data Warehouse) là tập hợp của các cơ sở dữ liệu tích hợp,
hƣớng chủ đề, đƣợc thiết kế để hỗ trợ cho chức năng trợ giúp quyết định mà mỗi
đơn vị dữ liệu đều liên quan tới một khoảng thời gian cụ thể.
Một data warehouse thƣờng có các tính chất sau:
-
Dữ liệu có tính tích hợp: kho dữ liệu đƣơc xây dựng từ việc tích hợp các
nguồn dữ liệu phức, không đồng nhất nhƣ cơ sở dữ liệu quan hệ, file phẳng,
excel,…
-
Dữ liệu gắn thời gian và có tính lịch sử: Chiều thời gian đối với kho dữ liệu
là đáng kể dài hơn so với hệ thống cơ sở dữ liệu tác nghiệp.
-
Dữ liệu hƣớng chủ đề: Kho dữ liệu tập trung vào xây dựng mô hình và phân
tích dữ liệu để tạo quyết định; không phải quá trình tác nghiệp hoặc giao dịch
hàng ngày. Cung cấp một khung nhìn đơn giản và ngắn gọn về các đề tài
thuộc chủ đề cụ thể.
-
Dữ liệu tổng hợp và chi tiết: Dữ liệu đƣợc tích hợp vào các bảng tổng hợp
trong kho dữ liệu nhằm phục vụ có các mục đích xử lý và phân tích. Ngoài ra
13
còn có các bảng dữ liệu chi tiết các sự kiện nhằm cung cấp các thông tin chi
tiết.
-
Tính bền vững, không thay đổi: Dữ liệu đƣợc lƣu trữ vật lý riêng biệt với các
dữ liệu đƣợc chuyển từ môi trƣờng tác nghiệp sang. Cập nhật tác nghiệp dữ
liệu không xuất hiện trong môi trƣờng kho dữ liệu.
b) Các mô hình lƣu trữ dữ liệu trong kho dữ liệu
Có 2 mô hình lƣu trữ dữ liệu trong kho dữ liệu đó là: lƣợc đồ lƣu trữ hình
sao, lƣợc đồ lƣu trữ hình bông tuyết.
-
Lƣợc đồ lƣu trữ hình sao (Star schema): Trong mô hình này thì một bảng sự
kiện ở trung tâm đƣợc kết nối với một tập các bảng chiều, ví dụ:
ThoiGian_Dim
ChiNhanh_Dim
HosoKH_Fact
LoaiHinhCuTru_Dim
ViTriCongTac_Dim
Hình 4: Lược đồ hình sao
-
Lƣợc đồ lƣu trữ hình bông tuyết (Snowflake schema): Mô hình này là một
mở rộng của sơ đồ hình sao trong đó một vài cấu trúc chiều đƣợc chuẩn hóa
thành một tập các bảng chiều nhỏ hơn, hình thức tƣơng tự nhƣ bông tuyết, ví
dụ:
14
ThoiGian_Dim
ChiNhanh_Dim
LoaiChiNhanh_Dim
HosoKH_Fact
LoaiHinhCuTru_Dim
ViTriCongTac_Dim
Hình 5: Lược đồ hình bông tuyết
c) Kho dữ liệu chủ đề (Datamart)
Có 2 loại kho dữ liệu chủ đề, cụ thể nhƣ sau:
-
Kho dữ liệu chủ đề phụ thuộc: chứa những dữ liệu đƣợc lấy từ kho dữ liệu và
những dữ liệu này sẽ đƣợc trích lọc, tinh chế, tích hợp lại ở mức cao hơn để
phục vụ một chủ đề nhất định.
-
Kho dữ liệu chủ đề độc lập: không giống nhƣ Datamart phụ thuộc, nó đƣợc xây
dựng trƣớc kho dữ liệu và dữ liệu đƣợc lấy từ các nguồn dữ liệu tác nghiệp
1.2.1.5 Xử lý dữ liệu trực tuyến (OLAP)[4]
a) Khái niệm
OLAP là một kỹ thuật sử dụng các biểu diễn dữ liệu đa chiều gọi là các khối
(cube) nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Tạo
khối (cube) cho dữ liệu trong các bảng chiều (dimension table) và bảng sự kiện (fact
table) trong kho dữ liệu và cung cấp khả năng thực hiện các truy vấn tinh vi và phân
tích cho ứng dụng client.
OLAP đƣợc xây dựng để xử lý các truy vấn liên quan tới lƣợng dữ liện rất lớn
mà nếu cho thực thi trong hệ thống xử lý giao dịch trực tuyến (On-Line Transaction
Processing – OLTP) sẽ khổng thể ra kết quả hoặc mất rất nhiều thời gian.
15
Khối (cube): khối là phần tử chính trong phân tích trực tuyến, là tập con
(subset) dữ liệu từ kho dữ liệu, đƣợc tổ chức và tổng hợp trong các cấu trúc đa
chiều.
Chiều (Dimension): Chiều là cách mô tả chủng loại, theo đó các dữ liệu số
trong khối đƣợc phân bố để phân tích.
Đơn vị đo lƣờng (Measures): Đơn vị đo của khối là cột trong bảng sự kiện
(fact table). Các đơn vị đo xác định những giá trị số từ bảng sự kiện, đƣợc tổng hợp
phân tích nhƣ định giá, trị giá, hoặc số lƣợng,..
Các phân hoạch (Partitions): Tất cả các khối đều có tối thiểu một phân hoạch
để chứa dữ liệu của nó; một phân hoạch đơn đƣợc tự động tạo ra khi khối đƣợc định
nghĩa.
b) Phân tích đa chiều
Các thao tác phân tích trên dữ liệu đa chiều:
-
Cuộn lên (Roll up): Dựa trên quan hệ phân cấp của chiều dữ liệu ta có thể
thực hiện cuộn lên để xem dữ liệu ở cấp cao hơn, tổng quát hơn
-
Truy xuống (Drill down): Ngƣợc lại với cuộn lên, từ mức độ tổng quát của
quan hệ cấp bậc của chiều ta có thể truy xuống để xem đƣợc chi tiết của dữ
liệu.
-
Chọn và chiếu (Slide and Dice): Chọn là thực hiện một phép chọn trên một
chiều của khối dữ liệu trung tâm để có đƣợc một khối con. Chiếu là thao tác
thực hiện chọn trên nhiều chiều để tìm ra một khối con.
-
Xoay chiều (Pivot): Là thao tác xoay khối dữ liệu để có thể xem dữ liệu ở
nhiều khía cạnh, chiều khác nhau.
1.2.1.6 Khai phá dữ liệu(Data mining) [1]
a) Khái niệm [1]
-
Các hoạt động khai phá dữ liệu là một quy trình lặp đi lặp lại để hỗ trợ việc
phân tích các dữ liệu lớn, với mục đích trích xuất thông tin và tri thức chính
xác và hữu ích cho việc hỗ trợ ra quyết định và xử lý vấn đề.
16
-
Quy trình khai phá dữ liệu dựa trên các mô hình học quy nạp, mục đích
chính của mô hình là tìm ra những luật tổng quát khởi đầu từ một tập các
mẫu, bao gồm cả các mẫu trong một hoặc nhiều cơ sở dữ liệu quá khứ. Nói
cách khác, mục đích của phân tích khai phá dữ liệu là để rút ra những kết
luận từ những mẫu quan sát từ quá khứ dữ liệu, tới việc khái quát hóa chúng
với việc tham chiếu tới toàn bộ đối tƣợng dữ liệu.
-
Các hoạt động khai phá dữ liệu có thể đƣợc chia ra làm 2 luồng phân tích
chính, theo mục đích phân tích là: thông hiểu (Interpretation) và dữ đoán
(Prediction).
o Thông dịch dữ liệu (Interpretation): Mục đích của hoạt động này là
xác định những mẫu có quy tắc trong dữ liệu và mô tả chúng thông
qua các luật và các tiêu chí mà các chuyên gia trong lĩnh vực ứng
dụng có thể hiểu đƣợc một cách dễ dàng.
o Dự đoán (Prediction): Mục đích của hoạt động này là để đoán trƣớc
đƣợc giá trị mà một biến ngẫu nhiên sẽ có trong tƣơng lai hoặc để
đánh giá khả năng xảy ra của các sự kiện tƣơng lai.
-
Trong ngữ cảnh BI thì khai phá dữ liệu có vai trò phân tích dữ liệu thực hiện
khai phá tri thức từ kho dữ liệu
Hình 6: Khai phá dữ liệu trong ngữ cảnh BI
17