Tải bản đầy đủ (.pdf) (89 trang)

Trí tuệ nghiệp vụ và các ứng dụng ngân hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.32 MB, 89 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------Nguyễn Xuân Thịnh

TRÍ TUỆ NGHIỆP VỤ VÀ CÁC ỨNG DỤNG NGÂN HÀNG

LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. Vũ Thị Hƣơng Giang

Hà Nội – Năm 2015


MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................... iii
LỜI CẢM ƠN ........................................................................................................... iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ..............................................v
DANH MỤC CÁC HÌNH ......................................................................................... vi
DANH MỤC CÁC BẢNG....................................................................................... vii
MỞ ĐẦU .....................................................................................................................1
CHƢƠNG 1. TỔNG QUAN .......................................................................................2
1.1 Bài toán xét duyệt hồ sơ tín dụng thẻ FLC .........................................................2
1.1.1

Giới thiệu sản phẩm thẻ tín dụng FLC.......................................................2

1.1.2

Quy trình nghiệp vụ xử lý hồ sơ tín dụng khách hàng FLC ......................4



1.1.3

Hiện trạng cách thức xét duyệt hồ sơ tín dụng khách hàng .......................5

1.2 Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng .................11
1.2.1

Trí tuệ nghiệp vụ (Business Intelligence – BI) ........................................11

1.2.1.1

Khái niệm BI [1] .............................................................................11

1.2.1.2

Mục tiêu và nhiệm vụ của BI ..........................................................11

1.2.1.3

Kiến trúc và thành phần BI [1] ........................................................12

1.2.1.4

Kho dữ liệu (Datawarehouse) .........................................................13

1.2.1.5

Xử lý dữ liệu trực tuyến (OLAP)[4] ...............................................15


1.2.1.6

Khai phá dữ liệu(Data mining) [1] ..................................................16

1.2.2

Ứng dụng BI trong lĩnh vực ngân hàng ...................................................20

1.2.2.1

Môi trƣờng các hoạt động ngân hàng và công nghệ BI [2].............20

1.2.2.2

Một số ứng dụng BI trong lĩnh vực ngân hàng [2] .........................22

1.3 Mục tiêu của luận văn .......................................................................................25
1.4 Định hƣớng giải pháp .......................................................................................26
1.4.1

Cách tiếp cận ............................................................................................26

1.4.2

Mô hình ứng dụng BI vào bài toán xét duyệt hồ sơ tín dụng FLC ..........28

CHƢƠNG 2. MÔ HÌNH XÂY DỰNG CÂY QUYẾT ĐỊNH .................................30
2.1 Mô hình dữ liệu ................................................................................................30

i



2.1.1

Dữ liệu nguồn ..........................................................................................30

2.1.1.1

Mô hình khai thác dữ liệu ...............................................................30

2.1.1.2

Dữ liệu hồ sơ tín dụng khách hàng FLC .........................................30

2.1.1.3

Dữ liệu thông tin trả nợ thẻ .............................................................33

2.1.2

Mô hình dữ liệu đa chiều .........................................................................33

2.2 Mô hình xây dựng cây quyết định ....................................................................35
2.2.1

Mô hình ra quyết định ..............................................................................35

2.2.2

Giải thuật C4.5 xây dựng cây quyết định ................................................37


2.2.3

Entropy đo độ thuần nhất của tập huấn luyện ..........................................38

2.2.4

Độ lợi thông tin – Information Gain (Gain).............................................39

2.2.5

Đo tỷ suất lợi ích Gain Ratio của thuộc tính ............................................39

2.2.6

Cơ chế xử lý thuộc tính số (thuộc tính liên tục) ......................................40

2.2.7

Triển khai giải thuật C4.5 xây dựng cây quyết định ................................41

2.2.8

Cắt tỉa cây quyết định ..............................................................................52

2.3 Xây dựng tập luật .............................................................................................57
CHƢƠNG 3. XÂY DỰNG ỨNG DỤNG WEB HỖ TRỢ RA QUYẾT ĐỊNH XÉT
DUYỆT HỒ SƠ TÍN DỤNG FLC ............................................................................59
3.1 Phân tích yêu cầu ứng dụng ..............................................................................59
3.2 Thiết kế ứng dụng .............................................................................................60

3.2.1

Mô hình dữ liệu ........................................................................................60

3.2.2

Thiết kế các bảng dữ liệu .........................................................................61

3.2.3

Thiết kế các chức năng ứng dụng ............................................................68

3.2.3.1

Mô hình chức năng ..........................................................................68

3.2.3.2

Mô hình xây dựng ứng dụng ...........................................................70

3.3 Cài đặt ứng dụng...............................................................................................71
3.4 Giới thiệu các chức năng ứng dụng ..................................................................71
3.5 Kết quả thử nghiệm ..........................................................................................76
KẾT LUẬN VÀ KIẾN NGHỊ...................................................................................78
TÀI LIỆU THAM KHẢO .........................................................................................80

ii


LỜI CAM ĐOAN

Tôi là Nguyễn Xuân Thịnh, học viên lớp 12BCNTT2, Trƣờng Đại học Bách
khoa Hà nội xin cam kết Luận văn này là công trình nghiên cứu của bản thân dƣới
sự hƣớng dẫn khoa học của TS. Vũ Thị Hƣơng Giang, Viện Công nghệ thông tin và
Truyền thông, Trƣờng Đại học Bách khoa Hà nội.
Các kết quả trong Luận văn là trung thực và không sao chép từ bất kỳ công
trình nào khác.
Hà Nội, ngày 15 tháng 09 năm 2015
Học viên : Nguyễn Xuân Thịnh
Lớp

iii

: 12BCNTT2


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn sâu sắc tới TS. Vũ Thị Hƣơng Giang, Bộ môn Công
nghệ phần mềm, Viện Công nghệ Thông tin và Truyền thông, Đại học Bách khoa
Hà nội đã động viên và tận tình hƣớng dẫn tôi trong suốt quá trình thực hiện luận
văn. Những ý kiến quý báu của TS đã định hƣớng và góp phần lớn tạo nên kết quả
của đề tài.
Xin trân trọng cảm ơn tập thể các thầy, cô giáo Trƣờng Đại học Bách khoa
Hà nội nói chung và Viện Công nghệ Thông tin và Truyền thông nói riêng đã tận
tình giảng dạy, truyền đạt cho tôi những kiến thức trong suốt quá trình học tập tại
trƣờng.
Cuối cùng, tôi xin chân thành cảm ơn bạn bè, ngƣời thân và gia đình đã hết
lòng giúp đỡ, hỗ trợ tôi trong quá trình nghiên cứu và thực hiện luận văn.

iv



DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Ký hiệu và viết tắt

Diễn giải

BI

Business Intelligence

FLC

Fix Limit Card

VRB

Vietnam - Russia Joint Venture Bank

OLAP

On-Line Analysis Processing

OLTP

On-Line Transaction Processing

CSDL

Cơ Sở Dữ Liệu


ETL

Extract – Transform - Load

v


DANH MỤC CÁC HÌNH
Hình 1: Sản phẩm thẻ FLC..........................................................................................2
Hình 2: Quy trình xét duyệt hồ sơ tín dụng tại Ngân hàng Việt-Nga .........................4
Hình 3: Kiến trúc của một hệ thống trí tuệ nghiệp vụ...............................................12
Hình 4: Lƣợc đồ hình sao ..........................................................................................14
Hình 5: Lƣợc đồ hình bông tuyết ..............................................................................15
Hình 6: Khai phá dữ liệu trong ngữ cảnh BI .............................................................17
Hình 7: Các pha của qui trình khai phá dữ liệu.........................................................18
Hình 8: Các bƣớc trong quy trình xét duyệt hồ sơ FLC ...........................................25
Hình 9: Mô hình ứng dụng trí tuệ nghiệp vụ ............................................................28
Hình 10: Mô hình khai thác dữ liệu ..........................................................................30
Hình 11: Lƣợc đồ hình sao thông tin phát hành thẻ ..................................................34
Hình 12: Thông tin trả nợ thẻ ....................................................................................34
Hình 13: Mô hình xây dựng cây quyết định .............................................................35
Hình 14: Cây quyết định mức 1 ................................................................................45
Hình 15: Cây quyết định mức 2 ................................................................................47
Hình 16: Triển khai cây quyết định tại nút C ............................................................49
Hình 17: Cây quyết định sau khi triển khai tiếp tại nút E .........................................50
Hình 18: Cây quyết định hoàn chỉnh ........................................................................52
Hình 19: Cây trƣớc khi cắt tỉa ...................................................................................55
Hình 20: Cây sau khi cắt tỉa ......................................................................................57
Hình 21: Lƣợc đồ dữ liệu hồ sơ khách hàng .............................................................60
Hình 22: Lƣợc đồ dữ liệu thông tin trả nợ thẻ ..........................................................61

Hình 23: Mô hình chức năng ứng dụng ....................................................................68
Hình 24: Mô hình xây dựng ứng dụng ......................................................................70
Hình 25: Mô hình cây quyết định .............................................................................72
Hình 26: Màn hình xét duyệt hồ sơ tín dụng khách hàng .........................................73
Hình 27: Màn hình tra cứu danh mục .......................................................................74
Hình 28: Màn hình dữ liệu xét duyệt lịch sử ............................................................75

vi


DANH MỤC CÁC BẢNG
Bảng 1: Tiêu chí tính điểm hồ sơ tín dụng khách hàng ............................................10
Bảng 2: Bảng các thông tin định danh khách hàng ...................................................31
Bảng 3: Bảng thông tin chấm điểm tín dụng ............................................................32
Bảng 4: Bảng thông tin phân lớp hồ sơ .....................................................................33
Bảng 5: Bảng thông tin trả nợ thẻ .............................................................................33
Bảng 6: Bảng dữ liệu mẫu huấn luyện ......................................................................42
Bảng 7: Bảng sự kiện dữ liệu HoSoKH_FACT .......................................................62
Bảng 8: Bảng chiều ViTriCongTac_DIM .................................................................63
Bảng 9: Bảng chiều LoaiHinhCongTyLamViec_DIM .............................................63
Bảng 10: Bảng chiều TinhTrangHonNhan_DIM......................................................63
Bảng 11: Bảng chiều LoaiHinhCuTru_DIM ............................................................64
Bảng 12: Bảng chiều NgheNghiep_DIM ..................................................................64
Bảng 13: Bảng chiều TinhTrangCV_DIM ................................................................64
Bảng 14: Bảng chiều LinhVucKinhDoanhCty_DIM................................................65
Bảng 15: Bảng chiều TrinhDo_DIM ........................................................................65
Bảng 16: Bảng chiều HinhThucTraLuong_DIM ......................................................65
Bảng 17: Bảng chiều DoTuoiCon_DIM ...................................................................65
Bảng 18: Bảng chiều ThoiGian_DIM ......................................................................66
Bảng 19: Bảng sự kiện dữ liệu ThongTinTraNo_FACT ..........................................66

Bảng 20: Bảng dữ liệu cây quyết định Nut ...............................................................67
Bảng 21: Kết quả phân lớp tập huấn luyện ...............................................................76
Bảng 22: Kết quả thử nghiệm với hồ sơ khách hàng mới .........................................76
Bảng 23: Kết quả thử nghiệm phân lớp các khách hàng không đủ điểm tín dụng ...77

vii


MỞ ĐẦU
Tín dụng bán lẻ ngày càng trở nên quan trọng đối với các Ngân hàng, trong đó
sản phẩm thẻ tín dụng là một trong những sản phẩm bán lẻ đem lại doanh thu, lợi
nhuận rất tiềm năng vì nhu cầu thanh toán qua thẻ tín dụng có xu hƣớng ngày một
tăng. Nhƣng cùng với đó là vấn đề nợ xấu từ tín dụng thẻ cũng phát sinh nhiều hơn
bởi vì những hợp đồng tín dụng này hầu hết là không có tài sản đảm bảo, chủ yếu
dựa trên chữ “tín” với khách hàng. Mặc dù nợ xấu phát sinh từ hình thức thẻ tín
dụng ảnh hƣởng lớn tới kết quả kinh doanh của Ngân hàng, nhƣng Ngân hàng
không thể không hoặc ngừng cho vay, cấp tín dụng mới, vì đây là một trong những
nghiệp vụ chính, cốt yếu của Ngân hàng.
Ngân hàng cần tìm kiếm đƣợc nhiều khách hàng, tìm đƣợc rồi thì phải lựa chọn
đƣợc những khách hàng tốt để bán sản phẩm thẻ tín dụng. Có thể nói trong quy
trình bán hàng thì khâu xét duyệt hồ sơ khách hàng để quyết định phê duyệt hoặc từ
chối cấp tín dụng là một yếu tố then chốt quyết định một sự lựa chọn đúng đắn,
mang về một khách hàng tốt, đem lại lợi nhuận cho Ngân hàng. Vậy vấn đề đặt ra ở
đây là gì? Đó là việc phải hoàn thiện hơn quy trình xét duyệt, lựa chọn khách hàng
để giải ngân, cấp tín dụng. Ngân hàng luôn mong muốn tìm đƣợc giải pháp để giải
quyết bài toán này, trong số đó thì giải pháp ứng dụng trí tuệ nghiệp vụ hứa hẹn sẽ
đem lại hiệu quả.
Trí tuệ nghiệp vụ (Business Intelligence – BI) là một giải pháp công nghệ khai
thác dữ liệu từ các nguồn dữ liệu khác nhau (Excel, CSDL quan hệ, file text,..), từ
các hệ thống tác nghiệp khác nhau (Core Banking, Card System, CRM…), thông

qua các mô hình toán học, các kỹ thuật khai phá dữ liệu (data mining) để xử lý
thành những thông tin hữu ích nhằm hỗ trợ ra quyết định kinh doanh hiệu quả.
Qua những phân tích trên, tác giả đi đến quyết định lựa chọn ứng dụng giải pháp
BI vào giải quyết bài toán hỗ trợ ra quyết định phê duyệt hồ sơ tín dụng khách hàng
tại ngân hàng Liên doanh Việt - Nga.

1


CHƢƠNG 1. TỔNG QUAN
Chƣơng này sẽ trình bày các vấn đề sau:
 Bài toán xét duyệt hồ sơ tín dụng thẻ FLC
 Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng

 Mục tiêu của luận văn
 Định hƣớng giải pháp

1.1 Bài toán xét duyệt hồ sơ tín dụng thẻ FLC
1.1.1 Giới thiệu sản phẩm thẻ tín dụng FLC

Hình 1: Sản phẩm thẻ FLC
-

Sản phẩm thẻ tín dụng hạn mức thấp (Fix Limit Card – FLC) của Ngân hàng
Liên doanh Việt – Nga là một loại trong bộ sản phẩm tín dụng của Ngân
hàng. Hạn mức tín dụng của sản phẩm FLC theo quy định hiện tại của Ngân

2



hàng là 15 triệu đồng và phân khúc khách hàng mục tiêu là những ngƣời có
thu nhập trung bình, cho phép khách hàng thực hiện các giao dịch trong nƣớc
hoặc quốc tế trong hạn mức tín dụng thấp quy định bởi VRB và/hoặc hạn
mức giao dịch theo quy định của ngân hàng phát hành và ngân hàng đại lý.
-

Khách hàng mục tiêu của sản phẩm gồm những đối tƣợng khách hàng sau:
o Ngƣời có thu nhập trung bình làm việc ở các công sở chƣa có thẻ tín
dụng
o Khách hàng có thu nhập trung bình trở lên không làm việc ở công sở,
chƣa có thẻ tín dụng.
o Khách hàng có thu nhập cao (thậm chí có ô tô) đã có thẻ tín dụng
nhƣng thiếu hụt tài chính tạm thời vì đã sử dụng hết hạn mức thẻ đó.
o Khách hàng đang phải trả nợ 1 khoản vay mua nhà/ô tô nên thiếu hụt
tài chính cho nhu cầu sinh hoạt hàng ngày, mua sắm vật dụng gia đình
có giá trị nhỏ.

-

Lợi ích sản phẩm FLC đối với khách hàng
o Phù hợp với khả năng thu nhập của nhiều đối tƣợng khách hàng.
o Đáp ứng nhu cầu thiếu hụt tạm thời tài chính cá nhân của khách hàng.
o Đƣợc hƣởng các ƣu đãi của các đối tác của VRB (theo thỏa thuận
giảm giá các sản phẩm và dịch vụ).
o Khách hàng đƣợc hƣởng tiện ích dịch vụ ngân hàng an toàn và hiện
đại nhƣ Internet Banking và SMS Banking.

3



1.1.2 Quy trình nghiệp vụ xử lý hồ sơ tín dụng khách hàng FLC
Quy trình xét duyệt hồ sơ tín dụng
Tiếp nhận hồ sơ khách hàng

Giao dịch viên

Tiếp nhận hồ
sơ mới/hồ sơ
bổ sung của
KH

Thẩm định hồ sơ khách hàng
Thông báo tới KH
không đạt thẩm
định

Thông báo tới
KH không đạt
điểm tín dụng

Hồ sơ thiếu

Tiếp nhận kết quả
thẩm định

Tiếp nhận kết quả
tính điểm

Quyết định


Hồ sơ khách
hàng

Kiểm tra
thông tin đã
đầy đủ

Hồ sơ đầy đủ

Thẩm định hồ
sơ khách hàng

Không đạt

Kiểm
tra đạt
kết quả
thẩm
định?

Kết quả thẩm
định

Cán bộ quản lý rủi ro

Cán bộ tín dụng

Chấm điểm hồ sơ khách hàng

Thông báo

KH bổ sung
hồ sơ

Đạt

Không đạt

Chấm điểm hồ
sơ KH

Trưởng phòng giao dịch

Kết quả
chấm điểm

Kiểm tra
đạt điểm
tín dụng?

Đạt

Ra quyết định
cấp tín dụng

Quyết định
tín dụng

Hình 2: Quy trình xét duyệt hồ sơ tín dụng tại Ngân hàng Việt-Nga
Quy trình xét duyệt hồ sơ tín dụng khách hàng đƣợc minh họa trong Hình 2, cụ thể
nhƣ sau:

Bước 1: Giao dịch viên tiếp nhận hồ sơ khách hàng và thực hiện kiểm tra hồ sơ đã
đầy đủ và đúng với qui định của Ngân hàng chƣa? Nếu hồ sơ bị thiếu, giao dịch
viên sẽ thông báo để khách hàng bổ sung cho đầy đủ. Ngƣợc lại, hồ sơ khách hàng
sẽ đƣợc chuyển tới bộ phận tín dụng để thực hiện thẩm định.
Bước 2: Cán bộ tín dụng thực hiện thẩm định lại các thông tin trên hồ sơ khách
hàng. Nếu phát hiện các thông tin là thiếu trung thực, sai lệch…cán bộ tín dụng sẽ
gửi lại Giao dịch viên để chuyển kết quả tới khách hàng. Nếu đạt thẩm định, hồ sơ
khách hàng đƣợc chuyển tới bộ phận quản lý rủi ro để chấm điểm tín dụng.

4


Bước 3: Cán bộ quản lý rủi ro thực hiện chấm điểm theo các thông tin của hồ sơ
khách hàng nhƣ: tuổi, trình độ, vị trí công tác,…Nếu hồ sơ có điểm tín dụng đạt từ
75 trở lên (thang điểm 100) thì hồ sơ sẽ đƣợc chuyển lên lãnh đạo phòng giao dịch
để ra quyết định tín dụng. Và nếu không đạt thì kết quả chấm điểm sẽ đƣợc gửi tới
Giao dịch viên để thông báo kết quả cho khách hàng.
Bước 4: Lãnh đạo phòng giao dịch (Trƣởng phòng/ phó phòng giao dịch) trên cơ sở
điểm tín dụng của khách hàng sẽ ra quyết định cấp tín dụng hay không.
1.1.3 Hiện trạng cách thức xét duyệt hồ sơ tín dụng khách hàng
-

Cách thức xét duyệt hồ sơ tín dụng khách hàng sử dụng sản phẩm FLC tại
Ngân hàng Liên doanh Việt - Nga dựa vào điểm số tính toán từ các thông tin
(Tuổi, nghề nghiệp, thu nhập hàng tháng, số ngƣời phụ thuộc,..) trên hồ sơ
đăng ký của khách hàng sau khi đã thẩm định.

-

Điểm tín dụng khách hàng cho hồ sơ FLC đƣợc tính theo công thức sau:


S= ∑

Mi*Wi

Trong đó:
S: là điểm tín dụng của khách hàng
Mi : là điểm của thông tin i
Wi: là trọng số của thông tin i
N: là số thông tin đánh giá, n = 20
-

Chi tiết tiêu chí tính điểm đƣợc thể hiện ở bảng sau:

STT

1.

Vị trí công tác

Điểm

Giá trị

Tên thông tin

Nhân viên
Công chức/Viên chức
Giám đốc/ Quản lý
Lao động lành nghề

Khác

5

M

W

48
48
100
38
0

7%


STT

Điểm

Giá trị

Tên thông tin

M
2.

Nguồn thu nhập


3.

Loại hình cƣ trú

4.

5.

6.

Tuổi

Trình độ

Số ngƣời phụ thuộc

Lƣơng
Lƣơng và các thu nhập khác
Thu nhập ngoài lƣơng
Nhà riêng
Nhà sở hữu chung
Đƣợc thừa kế
Ở với cha mẹ
Nhà thuê
Khác
Nhà riêng
18-20 (>60)

Số con (<18 tuổi)


0

21-25

34.4

26-35

100

36-55

75.2

56-60

36

Chƣa tốt nghiệp phổ thông

9.6

Trung học phổ thông

44

Cao đẳng/ Đại học

100


Sau đại học

82

0

100

1

97.6

2

57.6

3

35.2

>3

7.

80
100
44
100
82.4
36.8

64
24.4
0
100

W
7%

6%

6%

5%

5%

0

0

100

1

95.2

2

59.6


6

5%


STT

Điểm

Giá trị

Tên thông tin

M

8.

9.

Độ tuổi của con

Tình trạng công việc

>2

15.2

0

100


1 (0-6)

74.4

2 (7-10)

95.2

3 (11-14)

78.8

4 (15-17)

55.2

Toàn thời gian

100

Bán thời gian

48

Nghề tự do

54.8

Sinh viên


30.4

Giúp việc

17.6

Nghỉ hƣu

19.6

Khác

10.

Loại hình công ty
đang làm việc

W

5%

5%

0

Công ty thuộc sở hữu nhà
nƣớc
Công ty nƣớc ngoài


84.8

Công ty cổ phần

65.6

Công ty Trách nhiệm hữu
hạn
Công ty liên doanh

100

52.8
24.8

Công ty thuộc sở hữu gia
đình
Khác

4.8

Nông nghiệp

39.6

Lĩnh vực kinh doanh
Thủy sản
11.
của công ty
Năng lƣợng


7

5%

40

45.6
69.6

5%


STT

Điểm

Giá trị

Tên thông tin

M
Dệt may

74.8

Bất động sản

29.6


Vật liệu xây dựng

37.6

Khai khoáng/mỏ

62

Du lịch/ Nhà hàng/ Khách
sạn
Giáo dục
Y tế

12.

Nghề nghiệp

Số năm công tác

88
61.2
88

Vận tải/ kho bãi

63.2

Viễn thông

92.8


Tài chính/ Ngân hàng

100

Khác

9.6

Nhân sự/ Quản trị văn phòng

100

Marketing/ PR

100

Công nghệ thông tin

100

Kế toán

57.6

Bán hàng

100

Kỹ sƣ


55.2

Giáo viên/ Giảng viên

13.

W

54

Luật sƣ

39.2

Khác

19.2

<1

17.2

1-2y

78.4

2-5 y

100


>5

62

14. Thu nhập hàng tháng < 3

0

8

5%

5%

5%


STT

Điểm

Giá trị

Tên thông tin

M
(triệu đồng)

15.


Số dƣ tài khoản
thanh toán gần nhất
tại tổ chức tín dụng
khác (triệu đồng)

3-5

45.6

5-7

100

>7

89.6

<3

7.2

3-5

36.8

5 - 10
> 10

76

100

Không có

100

< 150
16.

17.

18.

19.

Tình trạng dƣ nợ
(triệu đồng)

Hình thức trả lƣơng

Số sản phẩm thẻ
đang sử dụng

Số năm công tác
công việc trƣớc

20. Tình trạng hôn nhân

W


5%

5%

94

150 - 300

34.4

300 - 500

34.8

> 500

12

Trả qua tài khoản tại VRB
Trả qua tài khoản tại ngân
hàng khác
Tiền mặt
Khác
Không có

100
76
64.8
17.6
100


1-2

55.6

3

26.4

>3

0

Không có
<1y
1-2y
2-5 y
>5
Chƣa kết hôn
Đã kết hôn

9

4%

0
41.6
74.4
100
56

100
92.8

4%

3%

3%


STT

Điểm

Giá trị

Tên thông tin

M
Đã ly dị
Góa
Khác

W

62.4
54.4
0
100%


Bảng 1: Tiêu chí tính điểm hồ sơ tín dụng khách hàng
-

Đánh giá điểm và xét duyệt hồ sơ
Khách hàng đạt số điểm từ 75% trở lên sẽ đƣợc cấp tín dụng và đƣợc phép

sử dụng sản phẩm thẻ tín dụng hạn mức thấp. Còn lại, trƣờng hợp khách hàng
đạt ít hơn 75% sẽ bị từ chối cấp tín dụng.
Nhận xét về cách tính điểm đang áp dụng này:
-

Việc xét duyệt thực hiện dựa chủ yếu vào yếu tố kinh nghiệm của cán bộ tín
dụng, thể hiện qua việc đánh giá điểm chủ quan theo từng tiêu chí.

-

Nợ xấu, nợ khó đòi phát sinh chỉ có thể phát hiện đƣợc sau khi khách hàng
đã đƣợc phê duyệt cấp tín dụng và sử dụng sản phẩm. Đối với tín dụng thẻ
FLC thì nợ xấu phát sinh chính là việc khách hàng chậm hoặc không trả nợ
thẻ. Với cách thức xét duyệt dựa trên chấm điểm hiện tại việc đánh giá có
hạn chế là chƣa tận dụng đƣợc dữ liệu lịch sử (dữ liệu xét duyệt hồ sơ tín
dụng và dữ liệu trả nợ thẻ) để điều chỉnh, nâng cao chất lƣợng kết quả xét
duyệt.

-

Hiện tại, các dữ liệu liên quan tới FLC đƣợc Ngân hàng Liên doanh Việt –
Nga quản lý trên các hệ thống:
o Hệ thống quản lý phát hành thẻ FLC (sử dụng giải pháp Microsoft
Sharepoint)

o Hệ thống quản lý thẻ CMS & TWO (giải pháp của Compass Plus)

Các hệ thống này lƣu trữ dữ liệu theo cách thức, định dạng khác nhau và sử
dụng hai hệ thống CSDL khác nhau là Microsoft SQL Server và Oracle

10


Để giải quyết bài toán xét duyệt hồ sơ tín dụng khách hàng và khắc phục những
hạn chế của cách thức hiện tại, qua nghiên cứu giải pháp Trí tuệ nghiệp vụ tác giả
đề xuất áp dụng giải pháp này để xây dựng mô hình mới để hỗ trợ cán bộ nghiệp vụ
ra quyết định xét duyệt hồ sơ tín dụng FLC. Vậy giải pháp Trí tuệ nghiệp vụ là gì?
Mô hình ứng dụng cho bài toán này ra sao? Tác giả sẽ trình bày chi tiết ở các phần
tiếp theo của chƣơng viết này.
1.2 Giải pháp trí tuệ nghiệp vụ và ứng dụng trong lĩnh vực ngân hàng
1.2.1 Trí tuệ nghiệp vụ (Business Intelligence – BI)
1.2.1.1 Khái niệm BI [1]
Trí tuệ nghiệp vụ (Business Intelligence – BI) là một giải pháp công nghệ
khai thác dữ liệu từ các nguồn dữ liệu khác nhau (Excel, CSDL quan hệ, file text,..),
từ các hệ thống tác nghiệp khác nhau (Core Banking, Card System, CRM…), thông
qua các mô hình toán học, các kỹ thuật khai phá dữ liệu (data mining) để xử lý
thành những thông tin hữu ích nhằm hỗ trợ ra quyết định kinh doanh hiệu quả.
1.2.1.2 Mục tiêu và nhiệm vụ của BI
Mục đích của hệ thống BI là giải pháp biến đổi dữ liệu từ kho dữ liệu hoặc dữ
liệu chủ đề thành thông tin và tri thức, từ cách tổng hợp, phân tích các thông tin đó
doanh nghiệp có đƣợc các tƣ duy chiến lƣợc, hành động hiệu quả hoặc giá trị của hệ
thống BI mang đến sự đúc kết các ý tƣởng đem lại.

11



1.2.1.3 Kiến trúc và thành phần BI [1]
Kiến trúc đặc trƣng của một hệ thống BI đƣợc thể hiện nhƣ mô hình sau:

Hình 3: Kiến trúc của một hệ thống trí tuệ nghiệp vụ
Giải pháp trí tuệ nghiệp vụ gồm các thành phần nhƣ sau:
1. Data sources (Nguồn dữ liệu)
Chứa các nguồn dữ liệu từ nhiều loại, nhiều hệ thống khác nhau. Các nguồn
dữ liệu này còn thô sơ chƣa chuẩn hóa.
2. Data warehouse/Data mart (Kho dữ liệu và khối dữ liệu)
Dữ liệu sau khi đƣợc xử lý từ các công cụ trích xuất và chuyển đổi và nạp dữ
liệu (ETL) sẽ đƣợc lƣu trữ trong các cơ sở dữ liệu để cung cấp cho việc phân
tích trong hệ thống trí tuệ nghiệp vụ
3. Data exploration (Thăm dò dữ liệu)
Bao gồm các công cụ thực hiện việc phân tích một cách bị động nhƣ: các hệ
thống báo cáo, thống kê. Nó đƣợc coi là bị động vì phụ thuộc vào yêu cầu từ
ngƣời ra quyết định tạo ra các giả thuyết hoặc các tiêu chí trích xuất dữ liệu,
sau đó sử dụng công cụ để tìm ra câu trả lời.

12


4. Data mining (Khai phá dữ liệu)
Các kỹ thuật dùng để khai phá dữ liệu và phát hiện tri thức nhƣ phân loại
(classification), phân nhóm (clustering), phát hiện luật kết hợp (association
rule), dự đoán (prediction),…
5. Optimization (Tối ƣu hóa)
Mô hình tối ƣu cho phép chúng ta xác định đƣợc giải pháp tốt nhất trong 1
loạt các giải pháp đƣa ra.
6. Decisions (Quyết định)

Sau khi đã lựa chọn phƣơng án tốt nhất, ngƣời sử dụng sẽ ra quyết định cuối
cùng.
1.2.1.4 Kho dữ liệu (Datawarehouse)
a) Khái niệm:
Kho dữ liệu (Data Warehouse) là tập hợp của các cơ sở dữ liệu tích hợp,
hƣớng chủ đề, đƣợc thiết kế để hỗ trợ cho chức năng trợ giúp quyết định mà mỗi
đơn vị dữ liệu đều liên quan tới một khoảng thời gian cụ thể.
Một data warehouse thƣờng có các tính chất sau:
-

Dữ liệu có tính tích hợp: kho dữ liệu đƣơc xây dựng từ việc tích hợp các
nguồn dữ liệu phức, không đồng nhất nhƣ cơ sở dữ liệu quan hệ, file phẳng,
excel,…

-

Dữ liệu gắn thời gian và có tính lịch sử: Chiều thời gian đối với kho dữ liệu
là đáng kể dài hơn so với hệ thống cơ sở dữ liệu tác nghiệp.

-

Dữ liệu hƣớng chủ đề: Kho dữ liệu tập trung vào xây dựng mô hình và phân
tích dữ liệu để tạo quyết định; không phải quá trình tác nghiệp hoặc giao dịch
hàng ngày. Cung cấp một khung nhìn đơn giản và ngắn gọn về các đề tài
thuộc chủ đề cụ thể.

-

Dữ liệu tổng hợp và chi tiết: Dữ liệu đƣợc tích hợp vào các bảng tổng hợp
trong kho dữ liệu nhằm phục vụ có các mục đích xử lý và phân tích. Ngoài ra


13


còn có các bảng dữ liệu chi tiết các sự kiện nhằm cung cấp các thông tin chi
tiết.
-

Tính bền vững, không thay đổi: Dữ liệu đƣợc lƣu trữ vật lý riêng biệt với các
dữ liệu đƣợc chuyển từ môi trƣờng tác nghiệp sang. Cập nhật tác nghiệp dữ
liệu không xuất hiện trong môi trƣờng kho dữ liệu.
b) Các mô hình lƣu trữ dữ liệu trong kho dữ liệu
Có 2 mô hình lƣu trữ dữ liệu trong kho dữ liệu đó là: lƣợc đồ lƣu trữ hình
sao, lƣợc đồ lƣu trữ hình bông tuyết.

-

Lƣợc đồ lƣu trữ hình sao (Star schema): Trong mô hình này thì một bảng sự
kiện ở trung tâm đƣợc kết nối với một tập các bảng chiều, ví dụ:
ThoiGian_Dim

ChiNhanh_Dim

HosoKH_Fact

LoaiHinhCuTru_Dim

ViTriCongTac_Dim

Hình 4: Lược đồ hình sao

-

Lƣợc đồ lƣu trữ hình bông tuyết (Snowflake schema): Mô hình này là một
mở rộng của sơ đồ hình sao trong đó một vài cấu trúc chiều đƣợc chuẩn hóa
thành một tập các bảng chiều nhỏ hơn, hình thức tƣơng tự nhƣ bông tuyết, ví
dụ:

14


ThoiGian_Dim

ChiNhanh_Dim

LoaiChiNhanh_Dim

HosoKH_Fact

LoaiHinhCuTru_Dim

ViTriCongTac_Dim

Hình 5: Lược đồ hình bông tuyết
c) Kho dữ liệu chủ đề (Datamart)
Có 2 loại kho dữ liệu chủ đề, cụ thể nhƣ sau:
-

Kho dữ liệu chủ đề phụ thuộc: chứa những dữ liệu đƣợc lấy từ kho dữ liệu và
những dữ liệu này sẽ đƣợc trích lọc, tinh chế, tích hợp lại ở mức cao hơn để
phục vụ một chủ đề nhất định.


-

Kho dữ liệu chủ đề độc lập: không giống nhƣ Datamart phụ thuộc, nó đƣợc xây
dựng trƣớc kho dữ liệu và dữ liệu đƣợc lấy từ các nguồn dữ liệu tác nghiệp

1.2.1.5 Xử lý dữ liệu trực tuyến (OLAP)[4]
a) Khái niệm
OLAP là một kỹ thuật sử dụng các biểu diễn dữ liệu đa chiều gọi là các khối
(cube) nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Tạo
khối (cube) cho dữ liệu trong các bảng chiều (dimension table) và bảng sự kiện (fact
table) trong kho dữ liệu và cung cấp khả năng thực hiện các truy vấn tinh vi và phân
tích cho ứng dụng client.
OLAP đƣợc xây dựng để xử lý các truy vấn liên quan tới lƣợng dữ liện rất lớn
mà nếu cho thực thi trong hệ thống xử lý giao dịch trực tuyến (On-Line Transaction
Processing – OLTP) sẽ khổng thể ra kết quả hoặc mất rất nhiều thời gian.

15


Khối (cube): khối là phần tử chính trong phân tích trực tuyến, là tập con
(subset) dữ liệu từ kho dữ liệu, đƣợc tổ chức và tổng hợp trong các cấu trúc đa
chiều.
Chiều (Dimension): Chiều là cách mô tả chủng loại, theo đó các dữ liệu số
trong khối đƣợc phân bố để phân tích.
Đơn vị đo lƣờng (Measures): Đơn vị đo của khối là cột trong bảng sự kiện
(fact table). Các đơn vị đo xác định những giá trị số từ bảng sự kiện, đƣợc tổng hợp
phân tích nhƣ định giá, trị giá, hoặc số lƣợng,..
Các phân hoạch (Partitions): Tất cả các khối đều có tối thiểu một phân hoạch
để chứa dữ liệu của nó; một phân hoạch đơn đƣợc tự động tạo ra khi khối đƣợc định

nghĩa.
b) Phân tích đa chiều
Các thao tác phân tích trên dữ liệu đa chiều:
-

Cuộn lên (Roll up): Dựa trên quan hệ phân cấp của chiều dữ liệu ta có thể
thực hiện cuộn lên để xem dữ liệu ở cấp cao hơn, tổng quát hơn

-

Truy xuống (Drill down): Ngƣợc lại với cuộn lên, từ mức độ tổng quát của
quan hệ cấp bậc của chiều ta có thể truy xuống để xem đƣợc chi tiết của dữ
liệu.

-

Chọn và chiếu (Slide and Dice): Chọn là thực hiện một phép chọn trên một
chiều của khối dữ liệu trung tâm để có đƣợc một khối con. Chiếu là thao tác
thực hiện chọn trên nhiều chiều để tìm ra một khối con.

-

Xoay chiều (Pivot): Là thao tác xoay khối dữ liệu để có thể xem dữ liệu ở
nhiều khía cạnh, chiều khác nhau.

1.2.1.6 Khai phá dữ liệu(Data mining) [1]
a) Khái niệm [1]
-

Các hoạt động khai phá dữ liệu là một quy trình lặp đi lặp lại để hỗ trợ việc

phân tích các dữ liệu lớn, với mục đích trích xuất thông tin và tri thức chính
xác và hữu ích cho việc hỗ trợ ra quyết định và xử lý vấn đề.

16


-

Quy trình khai phá dữ liệu dựa trên các mô hình học quy nạp, mục đích
chính của mô hình là tìm ra những luật tổng quát khởi đầu từ một tập các
mẫu, bao gồm cả các mẫu trong một hoặc nhiều cơ sở dữ liệu quá khứ. Nói
cách khác, mục đích của phân tích khai phá dữ liệu là để rút ra những kết
luận từ những mẫu quan sát từ quá khứ dữ liệu, tới việc khái quát hóa chúng
với việc tham chiếu tới toàn bộ đối tƣợng dữ liệu.

-

Các hoạt động khai phá dữ liệu có thể đƣợc chia ra làm 2 luồng phân tích
chính, theo mục đích phân tích là: thông hiểu (Interpretation) và dữ đoán
(Prediction).
o Thông dịch dữ liệu (Interpretation): Mục đích của hoạt động này là
xác định những mẫu có quy tắc trong dữ liệu và mô tả chúng thông
qua các luật và các tiêu chí mà các chuyên gia trong lĩnh vực ứng
dụng có thể hiểu đƣợc một cách dễ dàng.
o Dự đoán (Prediction): Mục đích của hoạt động này là để đoán trƣớc
đƣợc giá trị mà một biến ngẫu nhiên sẽ có trong tƣơng lai hoặc để
đánh giá khả năng xảy ra của các sự kiện tƣơng lai.

-


Trong ngữ cảnh BI thì khai phá dữ liệu có vai trò phân tích dữ liệu thực hiện
khai phá tri thức từ kho dữ liệu

Hình 6: Khai phá dữ liệu trong ngữ cảnh BI

17


×