1/Biên soạn: Ngô Đức Chiến
CHƯƠNG 4:
BIG DATA TRONG HOẠT ĐỘNG NGÂN HÀNG
Thông qua việc tìm hiểu học phần Công nghệ số trong hoạt động Ngân hàng, các
học viên sẽ tìm hiểu rõ hơn về Big Data trong hoạt động ngành Ngân hàng.
Nội dung Chương 4 tập trung vào việc trình bày chi tiết các nội dung liên quan
đến Big Data như khái niệm, các đặc trưng, vai trò, các cơ hội và thách thức Big
Data mang lại. Quan trọng hơn hết, trong Chương 4, các học viên sẽ nắm bắt được
các ứng dụng Big Data trong ngành Ngân hàng, các điều kiện để ứng dụng Big
Data trong ngành Ngân hàng và các nguồn dữ liệu Big Data torng hoạt động tiếp
thị của ngành Ngân hàng.
4.1. Tổng quan về Big Data
Thuật ngữ Big data (dữ liệu lớn) được sử dụng từ những năm 1990 và thực sự
bùng nổ trong khoảng 10 năm trở lại đây. Vào năm 2001, nhà phân tích Doug Laney
của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner) đã nói rằng
những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả
bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng
loại/sự đa dạng (variety). Giờ đây, Gartner cùng với nhiều công ty và tổ chức khác
trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định
nghĩa nên Big Data.
Các công ty và chính phủ ứng dụng big
data:
- Data.gov - nơi mà mọi người được
phép tự do truy cập tất cả các dữ liệu của
Chính phủ Mỹ bao gồm các thông tin khác nhau, từ khí hậu đến tội phạm đang giam
giữ.
- Data.gov.uk – nơi tương tự của Chính phủ Anh. Tại đây, mọi người có thể tập
hợp được siêu dữ liệu trên tất cả các sách và các ấn phẩm của Anh kể từ năm 1950.
2/Biên soạn: Ngô Đức Chiến
- Ngoài ra còn có Cục Điều tra Dân số Mỹ - bao gồm các thông tin có giá trị như
dân số, địa lý và dữ liệu khác. Tương tự là kho dữ liệu mở Liên minh châu Âu, bao
gồm các dữ liệu điều tra dân số của các tổ chức Liên minh châu Âu…
Các lĩnh vực ứng dụng big data: truyền thông xã hội, giao dịch chứng khoán,
điện lực, giao thông, các thiết bị tìm kiếm…
Tại Việt Nam, các tổ chức ứng dụng Big Data có thể kể đến đó là:
Internet: FPT, VNG, VCCorp
Telecom: FPT Telecom, Viettel
Banking: Vietcombank
Media: VnExpress, eClick.vn
Retail & Distribution: TheGioiDiDong, FPT Retail/FPT Shop
Transport: Vietnam Airline
4.1.1. Khái niệm Big Data
Thuật ngữ Big Data (dữ liệu lớn) được sử dụng từ những năm 1990 và thực sự
bùng nổ trong khoảng 10 năm trở lại đây. Big Data (Dữ liệu lớn) là thuật ngữ dùng
để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp đến nỗi những công cụ, ứng dụng
xử lí dữ liệu truyền thống không thể nào đảm đương được (Kevin Taylor-Sakyi,
2016; Memon & cộng sự, 2017). Kích cỡ của Big Data đang từng ngày tăng lên, và
tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều
petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu mà thôi.
Hay, Big data là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn mà
bằng các công cụ phân tích dữ liệu thông thường không thể xử lý. Dữ liệu lớn bao
gồm các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu
trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Thuật ngữ này thường chỉ đơn
giản đề cập đến việc việc sử dụng các phân tích dự báo, phân tích hành vi người
dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị
từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu.
Bằng việc tổng hợp một lượng thông tin lớn từ các nguồn khác nhau khiến cho
Big Data trở thành một công cụ rất mạnh cho việc ra các quyết định kinh doanh,
3/Biên soạn: Ngô Đức Chiến
nhận diện hành vi và xu hướng nhanh hơn và tốt hơn rất nhiều so với cách thức
truyền thống.
Chúng ta có thể lấy các thí nghiệm của Máy gia tốc hạt lớn (LHC) ở Châu Âu
làm ví dụ cho Big Data. Khi các thí nghiệm này được tiến hành, kết quả sẽ được ghi
nhận bởi 150 triệu cảm biến với nhiệm vụ truyền tải dữ liệu khoảng 40 triệu lần mỗi
giây. Kết quả là nếu như LHC ghi nhận hết kết quả từ mọi cảm biến thì luồng dữ
liệu sẽ trở nên vô cùng lớn, có thể đạt đến 150 triệu petabyte mỗi năm, hoặc 500
exabyte mỗi ngày, cao hơn 200 lần so với tất cả các nguồn dữ liệu khác trên thế giới
gộp loại.
Trong mỗi giây như thế lại có đến khoảng 600 triệu vụ va chạm giữa các hạt vật
chất diễn ra, nhưng sau khi chọn lọc lại từ khoảng 99,999% các luồng dữ liệu đó,
chỉ có tầm 100 vụ va chạm là được các nhà khoa học quan tâm. Điều này có nghĩa
là cơ quan chủ quản LHC phải tìm những biện pháp mới để quản lý và xử lí hết mớ
dữ liệu khổng lồ này.
Hoặc như công tác giải mã di truyền của con người chẳng hạn. Trước đây công
việc này mất đến 10 năm để xử lí, còn bây giờ người ta chỉ cần một tuần là đã hoàn
thành. Còn Trung tâm giả lập khí hậu của NASA thì đang chứa 32 petabyte dữ liệu
về quan trắc thời tiết và giả lập trong siêu máy tính của họ. Việc lưu trữ hình ảnh,
văn bản và các nội dung đa phương tiện khác trên Wikipedia cũng như ghi nhận
hành vi chỉnh sửa của người dùng cũng cấu thành một tập hợp Big Data lớn.
Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày
cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng
một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn
nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB.
Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên,
YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng
cùng nhiều loại thông tin khác có liên quan.
Còn theo tập đoàn SAS, chúng ta có một vài số liệu thú vị về Big Data như sau:
4/Biên soạn: Ngô Đức Chiến
-
Các hệ thống RFID (một dạng kết nối tầm gần, như kiểu NFC nhưng có tầm
hoạt động xa hơn và cũng là thứ dùng trong thẻ mở cửa khách sạn) tạo ra lượng dữ
liệu lớn hơn 1.000 lần so với mã vạc truyền thống.
-
Chỉ trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart
đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản 5.000 giao diện mỗi giây.
-
Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầu từ khách hàng của
mình mỗi ngày.
-
Dịch vụ thẻ VISA xử lí hơn 172.800.000 giao dịch thẻ chỉ trong vòng một
ngày mà thôi.
-
Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15 tỉ
thành viên tạo ra một mớ khổng lồ dữ liệu văn bản, tập tin, video…
Hình 4.1: Hình ảnh minh họa về Big Data
(Hoạt động của người dùng Wikipedia được mô hình hóa và với kích thước hàng
terabyte, đây cũng có thể được xem là một dạng Big Data)
Nguồn: Viện Khoa học và Công nghệ Tính toán
5/Biên soạn: Ngô Đức Chiến
Trong tương lai, chúng ta sẽ còn tiếp tục chứng kiến sự tăng trưởng của Big Data.
Hiện nay có thể bạn cũng đã nghe đến khái niệm Internet of Things, tức là mang
Internet đến với mọi thứ trong đời sống hằng ngày.
Dữ liệu từ Internet of Things thực chất cũng là được thu thập từ một mạng lưới
rất nhiều các cảm biến và thiết bị điện tử, và nó cũng là một trong những nguồn của
Big Data. Lượng dữ liệu khổng lồ này có thể cho các nhà nghiên cứu biết được
hành vi tiêu dùng của khách hàng, từ đó tinh chỉnh những thiết bị Internet of Things
cho phù hợp hơn, bắt chúng phục vụ đời sống hằng ngày của chúng ta một cách
hiệu quả hơn. Nó cũng có thể được dùng cho việc sản xuất, từ đó giảm sự liên quan
của con người.
4.1.2. Các yếu tố nhận diện Big Data
Big Data được nhận diện trên ba khía cạnh chính: Dữ liệu (Data), Công nghệ
(Technology), Quy mô (Size).
-
Thứ nhất, dữ liệu (data) bao gồm các dữ liệu thuộc nhiều định dạng khác
nhau như hình ảnh, video, âm nhạc… trên Internet; gồm các dữ liệu thu thập từ các
hệ thống cảm biến có kết nối với hệ thống máy chủ; dữ liệu của khách hàng ở các
ứng dụng thông minh và các thiết bị có kết nối mạng; dữ liệu của người dùng để lại
trên các flatform của mạng xã hội. Vì các dữ liệu được cập nhật qua các thiết bị kết
nối mạng từng giờ, từng phút, từng giây và đến từ nhiều nguồn khác nhau nên khối
lượng dữ liệu này là rất lớn (Big). Hiện nay, Big Data được đo lường theo đơn vị
Terabytes (TB), Petabytes (PB) và Exabytes (EB). Có thể dễ dàng lấy một vài ví dụ
như Walmart xử lý hơn 1 triệu giao dịch của khách hàng mỗi giờ, dữ liệu nhập vào
ước tính hơn 2,5 PB; Twitter tạo ra 12 TB dữ liệu mỗi ngày hay Airbus A380 tạo ra
10 TB dữ liệu mỗi 30 phút bay.
-
Yếu tố nhận diện thứ hai của Big Data là công nghệ (technology). Công nghệ
thường được thiết kế và hình thành một hệ sinh thái từ dưới đi lên để có khả năng
xử lý các dữ liệu lớn và phức tạp. Một trong những hệ sinh thái mạnh nhất hiện nay
phải kể đến Hadoop với khả năng xử lý dữ liệu có thể được tăng lên cùng mức độ
6/Biên soạn: Ngô Đức Chiến
phức tạp của dữ liệu, năng lực này là một công cụ vô giá trong bất kỳ ứng dụng Big
Data nào.
-
Yếu tố nhận diện thứ ba của Big Data là quy mô dữ liệu. Hiện nay vẫn chưa
có câu trả lời chính xác cho câu hỏi dữ liệu thế nào gọi là lớn. Theo ngầm hiểu thì
khi dữ liệu vượt quá khả năng xử lý của các hệ thống truyền thống thì sẽ được xếp
vào Big Data.
Việc bản thân các doanh nghiệp cũng đang sở hữu Big Data của riêng mình đã
trở nên phổ biến. Chẳng hạn, như trang bán hàng trực tuyến eBay thì sử dụng hai
trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm
kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình. Hay nhà
bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như
những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Tương tự, Facebook cũng phải
quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết
các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên
quan. Theo kết quả khảo sát được thực hiện bởi Qubole - công ty hàng đầu về cung
cấp giải pháp, nền tảng quản lí dữ liệu hạ tầng đám mây phục vụ phân tích - và bởi
Dimensional Research - một tổ chức nghiên cứu thị trường công nghệ, lĩnh vực
chăm sóc khách hàng, kế hoạch công nghệ thông tin, quy trình bán hàng và hoạt
động tài chính là các lĩnh vực thu lợi nhiều nhất từ Big Data. Qua đó, thấy được là
mục đích khai thác Big Data của các nhà cung ứng hàng hóa, dịch vụ toàn cầu là
hướng đến chăm sóc khách hàng, phân tích dữ liệu khách hàng để phát triển sản
phẩm, dịch vụ; ứng dụng thông minh để tăng trải nghiệm của khách hàng và giữ
chân khách hàng khi sự cạnh tranh ngày càng gay gắt giữa các nhà cung ứng ở hầu
hết các lĩnh vực kinh doanh. Với các công cụ phân tích, đặc biệt là công cụ phân
tích dự báo (Predictive Analytics) và khai thác dữ liệu (Data mining), Big Data giúp
các doanh nghiệp đo lường, phân tích các vấn đề liên quan đến sản phẩm, phát hiện
các cơ hội và nguy cơ rủi ro, đồng thời, dự báo doanh thu từ hoạt động kinh doanh
hàng ngày.
7/Biên soạn: Ngô Đức Chiến
4.1.3. Các đặc trưng của Big Data
Dữ liệu lớn có 5 đặc trưng cơ bản như sau (mô hình 5V):
(1) Khối lượng dữ liệu (Volume)
Đây là đặc điểm tiêu biểu nhất của dữ liệu lớn, khối lượng dữ liệu rất lớn. Kích
cỡ của Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm
trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte)
chỉ cho một tập hợp dữ liệu. Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa
mềm, đĩa cứng. Nhưng với dữ liệu lớn chúng ta sẽ sử dụng công nghệ “đám mây”
mới đáp ứng khả năng lưu trữ được dữ liệu lớn.
(2) Tốc độ (Velocity)
Tốc độ có thể hiểu theo 2 khía cạnh: (a) Khối lượng dữ liệu gia tăng rất nhanh
(mỗi giây có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web bán hàng của
Amazon); (b) Xử lý dữ liệu nhanh ở mức thời gian thực (real-time), có nghĩa dữ liệu
được xử lý ngay tức thời ngay sau khi chúng phát sinh (tính đến bằng mili giây).
Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không,
Quân sự, Y tế – Sức khỏe như hiện nay phần lớn dữ liệu lớn được xử lý real-time.
Công nghệ xử lý dữ liệu lớn ngày nay đã cho phép chúng ta xử lý tức thì trước khi
chúng được lưu trữ vào cơ sở dữ liệu.
(3) Đa dạng (Variety)
Đối với dữ liệu truyền thống chúng ta hay nói đến dữ liệu có cấu trúc, thì ngày
nay hơn 80% dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, vi deo, bài
hát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe…). Big Data cho
phép liên kết và phân tích nhiều dạng dữ liệu khác nhau. Ví dụ, với các bình luận
của một nhóm người dùng nào đó trên Facebook với thông tin video được chia sẻ từ
Youtube và Twitter.
Ngoài ra, khi đề cập đến tính đa dạng (Variety) của dữ liệu cho thấy, dữ liệu của
Big Data được thu thập từ nhiều nguồn, có thể khái quát thành ba nguồn cơ bản sau
đây (như Hình 4.2).
8/Biên soạn: Ngô Đức Chiến
B i
D ữ l i ệ ug
c ủ a b ê nD
t h ứ c D b ữaa t
l i ệ u taừ
I n te r n
e t
D ữ liệ u
b ê n
tr o n g tổ
c h ứ c
Hình 4.2: Nguồn dữ liệu của Big Data
Nguồn: Kevin Taylor-Sakyi (2016)
(4) Độ tin cậy/chính xác (Veracity)
Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ tin cậy/chính xác
của dữ liệu. Với xu hướng phương tiện truyền thông xã hội (Social Media) và mạng
xã hội (Social Network) ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ
của người dùng Mobile làm cho bức tranh xác định về độ tin cậy & chính xác của
dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính
xác và nhiễu đang là tính chất quan trọng của Big Data.
(5) Giá trị (Value)
Giá trị là đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khai xây
dựng dữ liệu lớn thì việc đầu tiên chúng ta cần phải làm đó là xác định được giá trị
của thông tin mang lại như thế nào, khi đó chúng ta mới có quyết định có nên triển
khai dữ liệu lớn hay không. Nếu chúng ta có dữ liệu lớn mà chỉ nhận được 1% lợi
ích từ nó, thì không nên đầu tư phát triển dữ liệu lớn. Kết quả dự báo chính xác thể
hiện rõ nét nhất về giá trị của dữ liệu lớn mang lại. Ví dụ, từ khối dữ liệu phát sinh
trong quá trình khám, chữa bệnh sẽ giúp dự báo về sức khỏe được chính xác hơn, sẽ
giảm được chi phí điều trị và các chi phí liên quan đến y tế.
4.1.4. Vai trò của Big Data
Big Data hiện nay đã được ứng dụng rộng rãi trong nhiều lĩnh vực như: Bán lẻ,
ngân hàng, dịch vụ chăm sóc sức khỏe, viễn thông, giải trí, bảo hiểm, giao thông,
giáo dục,…
9/Biên soạn: Ngô Đức Chiến
Big
Dat
a
Giao
thông
Bảo
hiể
m
Ngân hàng và
Chứng khoán
Truyền thông
và giải trí
Giá
o
dục
Chăm sóc
sức khỏe
Sản
Năng lượng xuất
và tiện ích
Hình 4.3: Các lĩnh vực ứng dụng Big Data
Nguồn: Kasipuri (2018), Memon và cộng sự (2017)
Nhiều người vẫn chưa biết tầm quan trọng của Big Data là gì? và có thể giải
thích tầm quan trọng của dữ liệu lớn không nằm ở lượng dữ liệu mà chúng ta có, nó
nằm ở việc chúng ta làm gì với những dữ liệu đó. Ta có thể sử dụng nguồn dữ liệu
lớn phân tích để tìm ra câu trả lời cho các câu hỏi: giảm chi phí, giảm thời gian,
phát triển sản phẩm mới và dịch vụ tối ưu, ra quyết định thông minh. Khi việc phân
tích nguồn dữ liệu lớn được hỗ trợ tối đa ta có thể hoàn thành tốt một số tác vụ như:
xác định nguyên nhân gốc rễ của những thất bại, tạo các chương trình khuyến mại
hợp lí dựa trên thói quen của khách hàng đối với công việc kinh doanh, tính toán
được những rủi ro gặp phải, phát hiện hành vi gian lận trước khi nó có ảnh hưởng
đến chúng ta.
Big Data thu thập các thông tin quy mô lớn từ website, các doanh nghiệp có thể
dùng công cụ phân tích dữ liệu này để phục vụ cho công việc phân tích thị trường
10/Biên soạn: Ngô Đức Chiến
giúp đưa ra các chiến lược nâng cao chất lượng sản phẩm, dịch vụ hiện tại hay tìm
hiểu về hành vi khách hàng đề ra mắt các sản phẩm mới.
Đối với các tổ chức, doanh nghiệp thì tầm quan trọng của Big Data là gì? đó là
họ có thể tận dụng Big Data để xây dựng một nội dung trang web thu hút người truy
cập hơn, có được cái nhìn toàn cảnh và sâu sắc về hành vi mua hàng. Dữ liệu càng
nhiều thì những phân tích càng chính xác. Các doanh nghiệp cũng nên cung cấp nội
dung trên nhiều kênh xã hội để thu thập dữ liệu từ nhiều nguồn hơn.
Xa hơn một chút Big Data có thể giúp các cơ quan Chính phủ dự đoán được tỉ lệ
thất nghiệp, xu hướng nghề nghiệp của tương lai để tập trung đầu tư cho các hạng
mục đó, cắt giảm chi phí, kích thích tăng trưởng kinh tế, thậm chí là ra phương án
phòng ngừa trước một dịch bệnh nào đó.
4.1.5. Sự khác biệt giữa Big Data (Dữ liệu lớn) và Dữ liệu truyền thống
Dữ liệu lớn khác với dữ liệu truyền thống (ví dụ, kho dữ liệu - Data Warehouse)
ở 4 điểm cơ bản: Dữ liệu đa dạng hơn; lưu trữ dữ liệu lớn hơn; truy vấn nhanh hơn;
độ chính xác cao hơn.
(1) Dữ liệu đa dạng hơn: Khi khai thác dữ liệu truyền thống (Dữ liệu có cấu
trúc), chúng ta thường phải trả lời các câu hỏi: Dữ liệu lấy ra kiểu gì? định dạng dữ
liệu như thế nào? Đối với dữ liệu lớn, không phải trả lời các câu hỏi trên. Hay nói
khác, khi khai thác, phân tích dữ liệu lớn chúng ta không cần quan tâm đến kiểu dữ
liệu và định dạng của chúng; điều quan tâm là giá trị mà dữ liệu mang lại có đáp
ứng được cho công việc hiện tại và tương lai hay không.
(2) Lưu trữ dữ liệu lớn hơn: Lưu trữ dữ liệu truyền thống vô cùng phức tạp và
luôn đặt ra câu hỏi lưu như thế nào? dung lượng kho lưu trữ bao nhiêu là đủ? gắn
kèm với câu hỏi đó là chi phí đầu tư tương ứng. Công nghệ lưu trữ dữ liệu lớn hiện
nay đã phần nào có thể giải quyết được vấn đề trên nhờ những công nghệ lưu trữ
đám mây, phân phối lưu trữ dữ liệu phân tán và có thể kết hợp các dữ liệu phân tán
lại với nhau một cách chính xác và xử lý nhanh trong thời gian thực.
(3) Truy vấn dữ liệu nhanh hơn: Dữ liệu lớn được cập nhật liên tục, trong khi
đó kho dữ liệu truyền thống thì lâu lâu mới được cập nhật và trong tình trạng không
11/Biên soạn: Ngô Đức Chiến
theo dõi thường xuyên gây ra tình trạng lỗi cấu trúc truy vấn dẫn đến không tìm
kiếm được thông tin đáp ứng theo yêu cầu.
(4) Độ chính xác cao hơn: Dữ liệu lớn khi đưa vào sử dụng thường được kiểm
định lại dữ liệu với những điều kiện chặt chẽ, số lượng thông tin được kiểm tra
thông thường rất lớn, và đảm bảo về nguồn lấy dữ liệu không có sự tác động của
con người vào thay đổi số liệu thu thập
4.1.6. Những cơ hội và thách thức khi ứng dụng Big data trong thống kê
chính thức
Cơ hội khi ứng dụng Big data trong thống kê chính thức
(1) Tiếp cận và nghiên cứu về dữ liệu lớn sẽ giúp cho chúng ta có thêm phương
án giải quyết, xử lý và đối phó với những thách thức đối sản xuất số liệu thống kê
chính thức trong hiện tại và tương lai. Những nghiên cứu thực nghiệm cần phải
được tiến hành để khám phá những ứng dụng tiềm năng của dữ liệu lớn trong số
liệu thống kê chính thức, và nghiên cứu thực nghiệm đó phải là một phần trong quy
trình sản xuất số liệu thống kê.
(2) Nghiên cứu về dữ liệu lớn cần phải có cơ sở hạ tầng công nghệ thông tin hiện
đại, đáp ứng các yêu cầu xử lý khối lượng lớn dữ liệu và nhanh, đồng thời có thể tập
hợp dữ liệu từ nhiều nguồn khác nhau. Thực hiện được điều này chúng ta có được
đội ngũ nguồn nhân lực về quản lý và khai thác Big data vững vàng về chuyên môn
và được trải qua kinh nghiệm thực tế.
(3) Tiếp cận và nghiên cứu về dữ liệu lớn sẽ giúp chúng ta có được những văn
bản pháp lý bổ sung có thể giúp cho cơ quan thống kê chính thức có điều kiện để
thực hiện được khai thác dữ liệu thông qua hồ sơ hành chính, ngoài ra dữ liệu cũng
được bảo đảm và giữ bí mật nhờ những văn bản pháp lý bổ sung này.
(4) Sử dụng dữ liệu lớn đem lại niềm tin của cộng đồng với thống kê chính thức
do quá trình trình sản xuất số liệu thống kê chính thức với dữ liệu lớn hoàn toàn
không có sự tác động chủ ý của con người.
Thách thức khi ứng dụng Big data trong thống kê chính thức
12/Biên soạn: Ngô Đức Chiến
(1) Tài chính: Nhiều đơn vị, tổ chức không đo lường được vấn đề sẽ phát sinh
trong quá trình triển khai thực hiện, dự toán kinh phí chưa chính xác, do vậy dự án
không thực hiện được. Để triển khai được thành công, yếu tố tài chính có ý nghĩa
rất quan trọng, một số tập đoàn thương mại lớn có tiềm lực tài chính vững chắc đã
xây dựng thuận lợi hệ thống dữ liệu Big data như IBM, website bán hàng thương
mại điện tử Amazon...
(2) Chính sách, quy định Luật pháp về truy cập và sử dụng dữ liệu: Việc sử
dụng và khai thác dữ liệu lớn phụ thuộc vào luật quy định của mỗi quốc gia.
Ví dụ: ở Canada người dùng có thể được tiếp cận dữ liệu từ cả hai tổ chức chính
phủ và phi chính phủ, nhưng ở những nước khác như Ireland thì phải được sự cho
phép từ các cơ quan chính phủ. Điều này có thể dẫn đến những hạn chế để truy cập
vào một số loại dữ liệu lớn.
(3) Trình độ khai thác và quản lý dữ liệu: Do luật pháp quy định sử dụng và
khai thác ở mỗi quốc gia là khác nhau nên cách quản lý là cũng khác nhau tuy
nhiên, Một vấn đề liên quan đến quản lý thông tin hiện nay là nguồn nhân lực. Khoa
học dữ liệu lớn đang phát triển mạnh trong những tổ chức tư nhân, trong khi đó bộ
phận này chưa được liên kết với những tổ chức của chính phủ một cách chặt chẽ
dẫn đến việc quản lý vẫn còn nhiều vướng mắc.
(4) Hạ tầng Công nghệ thông tin: Cần phải cải thiện tốc độ dữ liệu truy cập vào
các dữ liệu hành chính nghĩa là có thể sử dụng giao diện ứng dụng của Chương
trình chuyên sâu tiêu chuẩn (API) để truy cập dữ liệu. Bằng cách này, nó có thể kết
nối các ứng dụng cho dữ liệu thu về và xử lý dữ liệu trực tiếp với dữ liệu hành
chính. Ngoài ra hệ thống khai thác dữ liệu lớn cũng cần phải được tính toán để có
thể kết nối vào được kho cơ sở dữ liệu truyền thống, đó cũng là một trong những
thách thức lớn cần được giải quyết.
4.2. Các ứng dụng của Big Data trong hoạt động ngân hàng
Hiện nay, hầu hết các tổ chức chức ngân hàng, dịch vụ tài chính và bảo hiểm
đang nỗ lực để áp dụng một cách tiếp cận mới theo hướng khai thác dữ liệu để phát
triển và đổi mới sản phẩm. Mặc dù, các tổ chức đang thay đổi cách thức khai thác
13/Biên soạn: Ngô Đức Chiến
dữ liệu bằng cách thu thập một khối lượng dữ liệu khổng lồ và tiến hành phân tích,
thực hiện bước đầu tiên trong quy trình khai thác Big Data. Khi khối lượng khách
hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả năng cung cấp dịch vụ của
từng tổ chức. Thực tiễn cho thấy việc phân tích dữ liệu hiện tại đã đơn giản hóa quá
trình theo dõi và đánh giá khách hàng tín dụng của các ngân hàng và các tổ chức tài
chính, dựa trên khối lượng lớn dữ liệu như thông tin, hồ sơ cá nhân và các thông tin
bảo mật khác. Với sự giúp đỡ của Big Data, các ngân hàng có thể theo dõi hành vi
của khách hàng, xác định các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc
đưa ra giải pháp.
Các ứng dụng của Big Data trong lĩnh vực ngân hàng bao gồm:
Thứ nhất, phân tích các thói quen chi tiêu của khách hàng
Các ngân hàng có khả năng truy cập trực tiếp nguồn thông tin, dữ liệu lịch sử dồi
dào liên quan đến các thói quen, hành vi chi tiêu của khách hàng. Các ngân hàng
còn nắm thông tin chi tiết về nguồn thu của khách hàng trong một năm, khoản chi
tiêu, các dịch vụ ngân hàng mà khách hàng sử dụng… Điều này cung cấp cơ sở, cơ
hội để các ngân hàng tiếp cận và phân tích dữ liệu sâu hơn. Áp dụng các chức năng
sàng lọc thông tin, ví dụ như, khi lọc ra thời điểm dịp lễ hay mùa lễ và điều kiện vĩ
mô (lạm phát, tỷ lệ thất nghiệp…) mà nhân viên ngân hàng có thể hiểu được nguyên
nhân của biến động trong thu nhập hay chi tiêu của ngân hàng. Đây là một trong các
yếu tố quan trọng trong quá trình đánh giá rủi ro, thẩm định hồ sơ cho vay, mở rộng
dịch vụ cung cấp hay bán chéo sản phẩm đến khách hàng. Bên cạnh đó, nhờ nắm
được thông tin về nguồn tiền nhàn rỗi của khách hàng, ngân hàng có thể tận dụng
thu hút tiền gửi để thực hiện các hoạt động đầu tư.
Thứ hai, phân khúc khách hàng và thẩm định hồ sơ
Phân khúc khách hàng là một trong những nhân tố quan trọng trong chiến lược
marketing và thiết kế sản phẩm của ngân hàng. Một khi các phân tích ban đầu về
thói quen chi tiêu của khách hàng cùng với xác định các loại hình dịch vụ, kênh
giao dịch được khách hàng ưu tiên (ví dụ khách hàng muốn gửi tiết kiệm hay muốn
đầu tư các khoản vay) được hoàn tất thì các ngân hàng sẽ có được một cơ sở dữ liệu
14/Biên soạn: Ngô Đức Chiến
phục vụ cho quá trình phân khúc, phân loại khách hàng một cách phù hợp dựa vào
thông tin và hồ sơ khách hàng cung cấp. Big Data sẽ cung cấp cho các ngân hàng
những hiểu biết, kiến thức chuyên môn sâu về nhu cầu tiềm ẩn bên trong, thói quen
và xu hướng chi tiêu của khách hàng, trợ giúp cho nhiệm vụ xác định nhu cầu và
mong muốn của họ. Bằng cách nắm các thông tin liên quan đến giao dịch, ngân
hàng có thể xác định được khách hàng của mình thuộc các nhóm nào, ví dụ nhóm
có chi tiêu dễ dàng, nhóm nhà đầu tư thận trọng, nhóm thanh toán nợ nhanh chóng,
nhóm khách hàng trung thành… Bên cạnh đó, biết được hồ sơ cá nhân của tất cả
các khách hàng giúp ngân hàng đánh giá chi tiêu và thu nhập dự kiến trong tháng
tới và lập kế hoạch chi tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi ích cho
chính khách hàng.
Thứ ba, bán chéo thêm các dịch vụ khác
Dựa vào cơ sở dữ liệu ngân hàng có được, ngân hàng có thể thu hút thêm, hay
giữ chân khách hàng bằng cách giới thiệu thêm các dịch vụ khác. Ví dụ, ngân hàng
có thể giới thiệu các khoản đầu tư có lãi suất hấp dẫn đến các khách hàng có lượng
tiền nhàn rỗi hoặc những nhà đầu tư thận trọng. Ngân hàng cũng có thể đề xuất các
khoản vay ngắn hạn cho các khách hàng có thói quen chi tiêu dễ dàng để đáp ứng
nhu cầu hàng ngày hoặc những khoản vay đáp ứng nhu cầu thanh khoản ngắn hạn
của doanh nghiệp. Phân tích một cách chính xác về hồ sơ cá nhân của khách hàng,
ngân hàng có thể bán kèm các dịch vụ khác với các ưu đãi được tập trung chính xác
vào nhu cầu khách.
Thứ tư, nâng cao chất lượng dịch vụ thông qua xây dựng hệ thống thu thập các
phản hồi khách hàng và phân tích chúng
Khách hàng có thể để lại phản hồi sau mỗi lần giao dịch hay mỗi lần nhận được
tư vấn từ trung tâm hỗ trợ chăm sóc khách hàng hoặc qua các biểu mẫu phản hồi;
nhưng thường xuyên (hay có thể nói nhiều khả năng) chia sẻ ý kiến thông qua các
phương tiện truyền thông xã hội hơn, ví dụ Facebook, Zalo,…Các công cụ Big Data
có thể tìm kiếm chọn lọc thông qua các thông tin, feedback công khai trên các
phương tiện truyền thông và thu thập tất cả những dữ liệu đề cập về thương hiệu
15/Biên soạn: Ngô Đức Chiến
của ngân hàng để có thể phản hồi nhanh chóng và đầy đủ đến khách hàng, ngoài ra,
cũng hỗ trợ ngăn chặn các tin đồn thất thiệt ảnh hưởng đến hoạt động kinh doanh và
niềm tin nơi khách hàng. Khi khách hàng cảm thấy ngân hàng lắng nghe, đánh giá
cao ý kiến và thực hiện những cải tiến, thay đổi theo yêu cầu của họ thì sự trung
thành dành cho thương hiệu sẽ gia tăng, hơn nữa cải thiện hình ảnh của ngân hàng.
Thứ năm, marketing theo hướng cá nhân hóa.
Sau khi có được phân khúc khách hàng thì các ngân hàng cần tận dụng để
marketing nhắm tới mục tiêu khách hàng dựa trên trên những hiểu biết về thói quen
chi tiêu cá nhân của họ. Ngoài việc thu thập dữ liệu về lịch sử giao dịch của khách
hàng, ngân hàng có thể kết hợp dữ liệu phi cấu trúc được lấy ra từ mạng xã hội để
có được một bức tranh đầy đủ hơn về nhu cầu của khách hàng dựa trên các phân
tích về tâm lý, mong muốn khách hàng ở mọi thời điểm. Từ đó, ngân hàng có thể
đưa ra các giải pháp, kế hoạch marketing phù hợp để có được tỷ lệ phản hồi cao hơn
từ khách hàng. Ví dụ, các ngân hàng sử dụng công cụ email marketing để gửi đến
khách hàng các thông tin mới nhất về những dịch vụ cho vay ngắn hạn với lãi suất
vừa phải hay gửi tiết kiệm với lãi suất hấp dẫn, hoặc các chương trình ưu đãi khác,
…
Thứ sáu, thay đổi cách thức cung cấp dịch vụ đến khách hàng
Hệ thống Big Data có thể là một hệ thống phức tạp liên kết giữa nhiều bộ phận
chức năng khác nhau với vai trò đơn giản hóa các nhiệm vụ trong một tổ chức. Bất
cứ khi nào tên một khách hàng hoặc số tài khoản được nhập vào hệ thống, hệ thống
Big Data sẽ hỗ trợ sàng lọc tất cả các dữ liệu và chỉ truyền đi hay cung cấp các dữ
liệu được yêu cầu để phục vụ cho quá trình phân tích. Điều này cho phép các ngân
hàng tối ưu hóa quy trình làm việc và tiết kiệm cả thời gian và chi phí. Big Data
cũng cho phép các tổ chức xác định và khắc phục các vấn đề trước khi khách hàng
bị ảnh hưởng.
Thứ bảy, phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật
Big Data sẽ cho phép các ngân hàng đảm bảo không có giao dịch trái phép nào
được thực hiện, cung cấp mức độ an toàn, nâng cao tiêu chuẩn bảo mật của toàn bộ
16/Biên soạn: Ngô Đức Chiến
ngành. Nhờ vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân
hàng có thể nhận diện những bất thường trong quá trình cung cấp dịch vụ đến khách
hàng. Ví dụ, khoản rút tiền lớn bất thường từ thẻ ATM có thể do thẻ bị mất cắp, từ
đó, ngân hàng có những biện pháp an ninh để xác minh giao dịch. Ngân hàng khai
thác Big Data để phân biệt giữa các giao dịch là hành vi phạm tội với các giao dịch
hợp pháp bằng các thuật toán phân tích dữ liệu và machine learing (học máy). Các
hệ thống phân tích sẽ tự động phát hiện, trích xuất các giao dịch bất hợp pháp ở thời
gian thực và đề xuất các hành động ngay lập tức.
Thứ tám, kiểm soát rủi ro, tuân thủ luật pháp và minh bạch trong báo cáo tài
chính
Các thuật toán của Big Data còn giúp giải quyết các vấn đề về tuân thủ quy định
pháp luật về kế toán, kiểm toán và báo cáo tài chính, từ đó giảm được các chi phí
quản lý. Bên cạnh đó, hệ thống Big Data thu thập và lưu trữ dữ liệu lớn giúp ngân
hàng tiến hành phân tích một cách nhanh nhất khi có các dấu hiệu về rủi ro xảy ra,
từ đó đưa ra các biện pháp xử lý. Big Data cũng đóng một vai trò quan trọng trong
việc phối hợp giữa các bộ phận, phòng, ban và yêu cầu xử lý dữ liệu của ngân hàng
vào một hệ thống trung tâm duy nhất; qua đó, hỗ trợ kiểm soát, ngăn chặn vấn đề
mất dữ liệu, giảm thiểu rủi ro và gian lận.
Thứ chín, tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc
của nhân viên
Hệ thống Big Data hỗ trợ thu thập phân tích, đánh giá và truyền tải dữ liệu về
hiệu quả làm việc của nhân viên. Trước đây, để thu thập các thông tin này cần rất
nhiều công đoạn mang tính thủ công, thì nay, Big Data sẽ giúp xử lý các công việc
này một cách nhanh chóng và chính xác. Kết quả phân tích sẽ giúp các nhà lãnh đạo
có cái nhìn về tình hình, thực trạng làm việc hiện tại của nhân viên, đặc biệt xem xét
mức độ hài lòng của ngân viên về môi trường làm việc, phúc lợi… của ngân hàng
dành cho họ.
17/Biên soạn: Ngô Đức Chiến
Đọc thêm
Các ứng dụng Big Data trong các ngành/lĩnh vực khác
Ngành y tế: Khoa học dữ liệu đang dần khẳng định vai trò khá quan trọng trong
việc cải thiện sức khỏe con người ngày nay. Big Data không chỉ được ứng dụng để
xác định phương hướng điều trị mà giúp cải thiện quá trình chăm sóc sức khỏe.
Ngành y tế ứng dụng Big Data:
Cho phép người quản lý ca dự đoán các bác sĩ cần thiết vào những thời điểm
cụ thể
Theo dõi tình trạng bệnh nhân bằng để theo dõi hồ sơ sức khỏe điện tử.
Sử dụng các thiết bị kỹ thuật số có thể đeo, hệ thống Big Data có thể theo dõi
bệnh nhân và gửi báo cáo cho các bác sĩ liên quan.
Big Data có thể đánh giá các triệu chứng và xác định nhiều bệnh ở giai đoạn
đầu.
Có thể lưu giữ các hồ sơ nhạy cảm được bảo mật và lưu trữ lượng dữ liệu
khổng lồ một cách hiệu quả.
Các ứng dụng Big Data cũng có thể báo trước khu vực có nguy cơ bùng phát
dịch như: sốt xuất huyết hoặc sốt rét.
Thương mại điện tử: Thương mại điện tử không chỉ tận hưởng những lợi ích
của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được
các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã
tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ. Big Data có
thể tạo lợi thế cạnh tranh cho doanh nghiệp bằng cách cung cấp thông tin chuyên
sâu và các bản báo cáo phân tích xu hướng tiêu dùng.
Thương mại điện tử ứng dụng Big Data:
Có thể thu thập dữ liệu và yêu cầu của khách hàng ngay cả trước khi khách
thực sự bắt đầu giao dịch.
Tạo ra một mô hình tiếp thị hiệu suất cao.
Nhà quản lý trang thương mại điện tử có thể xác định các sản phẩm được
xem nhiều nhất và tối ưu thời gian hiển thị của các trang sản phẩm này.
18/Biên soạn: Ngô Đức Chiến
Đánh giá hành vi của khách hàng và đề xuất các sản phẩm tương tự. Điều
này làm tăng khả năng bán hàng, từ đó tạo ra doanh thu cao hơn.
Nếu bất kỳ sản phẩm nào được thêm vào giỏ hàng nhưng cuối cùng không
được khách hàng mua, Big Data có thể tự động gửi code khuyến mại cho khách
hàng cụ thể đó.
Các ứng dụng Big Data còn có thể tạo một báo cáo tùy chỉnh theo các tiêu
chí: độ tuổi, giới tính, địa điểm của khách truy cập, v.v.
Xác định các yêu cầu của khách hàng, những gì họ muốn và tập trung vào
việc cung cấp dịch vụ tốt nhất để thực hiện nhu cầu của họ.
Phân tích hành vi, sự quan tâm của khách hàng và theo xu hướng của họ để
tạo ra các sản phẩm hướng đến khách hàng.
Cung cấp các sản phẩm tốt hơn với chi phí thấp hơn.
Có thể thu thập nhiều dữ liệu về hành vi khách hàng để thiết kế mô hình tiếp
thị tối ưu dành được tùy biến theo đối tượng hoặc nhóm đối tượng, tăng khả năng
bán hàng.
Tìm ra sự tương đồng giữa khách hàng và nhu cầu của họ. Từ đó, việc nhắm
mục tiêu các chiến dịch quảng cáo có thể được tiến hành dễ dàng hơn dựa trên
những phân tích đã có trước đó.
Ngành bán lẻ: Big Data mang lại cơ hội cho lĩnh vực bán lẻ bằng cách phân tích
thị trường cạnh tranh và sự quan tâm của khách hàng. Nó giúp xác định hành trình
trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng bằng cách thu thập
dữ liệu đa dạng. Từ những dữ liệu thu thập được có thể cải thiện hiệu suất và hiệu
quả bán hàng.
Ngành bán lẻ ứng dụng Big Data:
Big data giúp nhà quản lý xây dựng mô hình chi tiêu của từng khách hàng.
Với sự trợ giúp của các phân tích dự đoán, ngành công nghiệp có thể so sánh
tỷ lệ cung – cầu và có thể tránh tiếp tục tung ra thị trường các sản phẩm không được
hầu hết khách hàng đón nhận.
19/Biên soạn: Ngô Đức Chiến
Ngành bán lẻ có thể xác định vị trí bố trí sản phẩm trên kệ hàng tùy thuộc
vào thói quen mua hàng và nhu cầu của khách hàng và đưa ra các chiến lược kinh
doanh mới để cải thiện.
Kết hợp phân tích cùng lúc các dữ liệu về thời điểm, dữ liệu giao dịch, dữ
liệu truyền thông xã hội, dự báo thời tiết để xác định chính xác nhất sản phẩm phù
hợp để luôn sẵn sàng cung ứng cho khách hàng.
Digital Marketing: Digital Marketing là chìa khóa để cánh cửa thành công cho
bất kỳ doanh nghiệp nào. Giờ đây, không chỉ các công ty lớn có thể điều hành các
hoạt động quảng cáo tiếp thị mà cả các doanh nhân nhỏ cũng có thể chạy các chiến
dịch quảng cáo thành công trên các nền tảng truyền thông xã hội và quảng bá sản
phẩm của họ. Big Data đã tiếp sức cho Digital Marketing phát triển thực sự mạnh
mẽ, và nó đã trở thành một phần không thể thiếu của bất kỳ doanh nghiệp nào.
Digital Marketing ứng dụng Big Data:
Phân tích thị trường, đối thủ cạnh tranh và đánh giá mục tiêu kinh doanh.
Điều này giúp cho doanh nghiệp xác định rõ hơn, đâu là cơ hội tốt để tiếp tục tiến
hành các kế hoạch kinh doanh tiếp theo.
Có thể xác định người dùng trên các phương tiện truyền thông xã hội và
nhắm mục tiêu cho họ dựa trên nhân khẩu học, giới tính, thu nhập, tuổi tác và sở
thích.
Tạo báo cáo sau mỗi chiến dịch quảng cáo bao gồm hiệu suất, sự tham gia
của khán giả và những gì có thể được thực hiện để tạo kết quả tốt hơn.
Khoa học dữ liệu được sử dụng cho các khách hàng nhắm mục tiêu và nuôi
dưỡng chu trình khách hàng.
Tập trung vào các chủ đề được tìm kiếm cao và tư vấn cho các chủ doanh
nghiệp thực hiện chúng trên chiến lược nội dung để xếp hạng trang web doanh
nghiệp trên cao hơn trên google (SEO).
Có thể tạo đối tượng tương tự bằng cách sử dụng cơ sở dữ liệu đối tượng
hiện có để nhắm mục tiêu các khách hàng tương tự và kiếm được lợi nhuận.
20/Biên soạn: Ngô Đức Chiến
4.3. Các điều kiện để ứng dụng Big Data trong hoạt động Ngân hàng
Thứ nhất, cần thay đổi tư duy trong đội ngũ quản lí ngân hàng về tầm quan trọng
của dữ liệu và các phương pháp xử lý dữ liệu hiện đại
Trong các cuộc phỏng vấn quản lý một số ngân hàng, có một quan điểm vẫn còn
tồn tại là quyết định có thể đưa ra dựa trên kinh nghiệm mà không cần dựa vào các
kết quả phân tích dữ liệu lớn. Quan điểm trên không sai trong quá khứ. Thực tế cho
thấy, những nhà quản lý có thâm niên trong lĩnh vực tài chính, ngân hàng đã từng
đưa ra được nhiều quyết định chính xác. Tuy nhiên, đó là khi thị trường ngân hàng
với các dịch vụ còn đơn giản, khi nhu cầu của khách hàng chưa nhiều và đặc biệt là
khi khách hàng chưa tiếp cận được với các công nghệ thông minh và hiện đại. Ngày
nay, khi mà các công ty công nghệ, các công ty viễn thông, các nhà bán lẻ không
ngừng thay đổi, đầu tư và áp dụng công nghệ mới để đáp ứng nhu cầu ngày càng
cao của khách hàng thì một làn sóng không nhỏ khách hàng truyền thống của ngân
hàng đã và đang chuyển dần sang sử dụng dịch vụ được cung ứng từ các đối thủ của
ngân hàng. Nổi bật là các dịch vụ thanh toán với tốc độ xử lý giao dịch nhanh, an
toàn, tiện lợi và đặc biệt là chi phí thấp với những cái tên tiêu biểu như Momo,
ViettelPay… rồi ngày nay là các dịch vụ tín dụng P2P.
Trên thế giới, các nhà quản lý ngân hàng đã sớm nhận ra mình không phải là
người duy nhất để khách hàng có thể cho vay, nhận tiền gửi và cung cấp dịch vụ
thanh toán. Các bên cho vay khác xuất hiện như công ty tài chính, cửa hàng cầm đồ
hay các bên trung gian kết nối người cho vay với người vay tiền. Khách hàng cũng
có thể đầu tư trái phiếu, chứng chỉ quỹ thay cho gửi tiết kiệm. Dịch vụ thanh toán
cũng được cung cấp bởi nhiều công ty trung gian sử dụng công nghệ hiện đại. Khi
khách hàng có nhiều sự lựa chọn, nhu cầu của họ cũng tăng lên. Điều này khiến cho
ngân hàng buộc phải thay đổi mình. Chẳng hạn, trước kia quá trình thẩm định khách
hàng được thực hiện một cách thủ công, qua nhiều bước và tốn kém thời gian. Các
hồ sơ vay vốn hoặc khoản thanh toán từ khi đệ trình tới khi được phê duyệt có thể
phải trải qua nhiều cuộc họp kéo dài trong nhiều ngày. Tuy nhiên, với sự hỗ trợ của
21/Biên soạn: Ngô Đức Chiến
công nghệ lưu trữ và phân tích dữ liệu, ngân hàng có thể nhanh chóng so sánh, đánh
giá tín dụng đối với khách hàng. Việc áp dụng công nghệ Big Data giúp một số
ngân hàng giảm thời gian thẩm định khách hàng từ nhiều ngày xuống chỉ còn vài
phút. Mạng lưới dữ liệu liên kết và công nghệ nhận diện danh tích khách hàng
thông qua các trang mạng xã hội thậm chí còn có thể giúp ngân hàng xác định được
khách hàng đang ở đâu, làm gì và có các mối quan hệ nào. Điều này giúp quá trình
quản lý sau giải ngân trở nên hiệu quả hơn. Các ngân hàng cũng áp dụng công nghệ
phân tích dữ liệu lớn để lựa chọn vị trí thuận lợi nhất khi mở chi nhánh mới.
Thứ hai, ngân hàng phải xây dựng được quy trình liên quan đến dữ liệu từ khâu
thu thập dữ liệu đến sử dụng kết quả xử lý dữ liệu
Ngân hàng thu thập thông tin từ rất nhiều nguồn khác nhau về một hệ thống giám
sát xử lý tập trung, nhưng việc duy trì chất lượng dữ liệu về tính chính xác, kịp thời
và các yếu tố khác ngày càng trở nên khó khăn. Để giải quyết vấn đền này thì ngân
hàng cần thiết lập một quy trình thu thập (collect), rà soát (screening), làm sạch
(clean), tổng hợp (reconcile) và phân loại dữ liệu vào một đầu mối tập trung; sau đó
lại phân phối dữ liệu đến những bộ phân liên quan để phân tích và đưa ra các thông
tin hữu ích. Trong đó, bước rà soát và làm sạch dữ liệu là rất quan trọng để nâng cao
chất lượng dữ liệu. Ví dụ như, dữ liệu về tài khoản khách hàng và giao dịch, thường
được sử dụng bởi các bộ phận quản lý gian lận, được thu thập từ nhiều nguồn khác
nhau ở dưới dạng thô. Quá trình sàng lọc và rà soát sẽ giúp giảm đáng kể số lượng
các giao dịch sai, nhờ đó làm giảm thời gian và công sức để xử lý. Bên cạnh đó,
ngân hàng cũng cần phải nâng cao công tác quản trị dữ liệu, thiết lập các cơ sở trách
nhiệm rõ ràng giữa các bộ phận tham gia vào trong quy trình đảm bảo an toàn an
ninh dữ liệu.
Cụ thể, quy trình xây dựng dữ liệu cho Big Data sẽ gồm các bước như sau:
- Bước 1: Xác định nguồn dữ liệu (từ website, ứng dụng, thiết bị thông minh,
mạng xã hội, truyền thông, chính phủ…). Ngân hàng cần phải nắm rõ nguồn dữ liệu
cần tìm và cách thức thu thập.
22/Biên soạn: Ngô Đức Chiến
- Bước 2: Xây dựng các hệ thống thu thập Big Data: xây dựng các phần mềm,
ứng dụng hay các thiết bị có thể kết nối với máy chủ để truyển tải thông tin, dữ liệu.
Dữ liệu của Big Data thuộc nhiều định dạng khác nhau nên hệ thống thu thập cần
phải tiên tiến, tích hợp các công nghệ mới.
- Bước 3: Xây dựng hệ thống lưu trữ và quản lý để phục vụ cho việc phân tích
sau này. Dữ liệu Big Data cần một hệ thống máy chủ lưu trữ. Hệ thống lữu trữ hiện
tại gồm 2 loại lưu trữ trên đám mây (cloud) và lưu trữ tại công ty. Để lựa chọn phù
hợp thì ngân hàng cần dự báo được khối lượng thông tin cần lưu trữ và các biện
pháp bảo mật.
- Bước 4: Xây dựng hệ thống sàng lọc, làm sạch, phân tích dữ liệu và hệ thống
phục vụ báo cáo. Bước này đòi hỏi chất lượng của đội ngũ nhân sự trong việc xây
dựng các thuật toán khai thác dữ liệu, ứng dụng các mô hình định lượng thông minh
để phân tích đa chiều và đưa ra các dự báo.
- Bước 5: Sử dụng kết quả phân tích để đưa ra các quyết định.
Thứ ba, chuẩn bị đội ngũ chuyên viên khoa học dữ liệu là điều kiện không thể
thiếu được
Hiện nay, có một thực tế về nhân sự trong ngành Ngân hàng là cán bộ ngân hàng
thì không hiểu rõ về công nghệ thông tin, còn người làm công nghệ thông tin thì
không hiểu rõ về nghiệp vụ ngân hàng. Thêm nữa, các mô hình phân tích Big Data
tại Việt Nam hiện nay chủ yếu là ứng dụng lại các mô hình có sẵn trên thế giới,
phần lớn các chuyên gia về khoa học dữ liệu của Việt Nam còn hạn chế về khả năng
phân tích mô hình. Do vậy, các ngân hàng muốn phát triển công nghệ đều phải thuê
nhân lực nước ngoài với chi phí đắt đỏ.
Chuyên viên khoa học dữ liệu (Data scientist) là một nghề khá mới mẻ không chỉ
ở Việt Nam mà ở nhiều nước trên thế giới. Nhóm nhân sự này đòi hỏi phải được đào
tạo chuyên môn cao và phải có một sự đam mê tìm tới thế giới Big Data. Họ là
những người hiểu rõ làm cách nào để tìm ra câu trả lời cho những quyết định quan
trọng từ một khối lượng thông tin khổng lồ không hề có cấu trúc đang “dồn dập ập
đến như những cơn sóng thần”. Với sự thành thạo về lĩnh vực kỹ thuật số, họ có thể
23/Biên soạn: Ngô Đức Chiến
nhận thấy và biết cách hình thành những cấu trúc từ khối lượng khổng lồ các dữ liệu
sơ khởi và nhờ đó việc phân tích dữ liệu trở nên khả thi. Họ tìm ra những nơi có
nguồn dữ liệu phong phú kết hợp với các nguồn dữ liệu chưa hoàn chỉnh khác và
làm sạch bảng lưu kết quả truy vấn cơ sở dữ liệu.
Các nền kinh tế trong khu vực như Hàn Quốc, Đài Loan đã chuẩn bị lực lượng
chất lượng cao, trong khi ở Việt Nam nguồn nhân lực phân khúc này vẫn còn hạn
chế. Theo khảo sát của IDG, tại Việt Nam, nhân lực sẵn sàng cho công nghệ số chưa
cao, các chương trình đào tạo đại học thay đổi rất chậm so với xu thế. Trong khi đó,
nhiều trường đại học tại Mỹ đã đưa các giáo trình về trí tuệ nhân tạo, học máy
(machine learning) vào giảng dạy MBA, một chuyên gia cho hay. Khoảng cách về
khả năng kỹ thuật số sẽ chỉ ngày càng rộng thêm và ngân hàng nào không thể bắt
kịp với xu hướng sẽ bị bỏ lại sau lưng. Bởi thế, việc đào tạo, quan tâm tới chất
lượng nguồn nhân lực công nghệ cao cần được thực hiện trong toàn hệ thống tài
chính - ngân hàng, đảm bảo đủ khả năng ứng dụng công nghệ thông tin, phương
thức làm việc tiên tiến trong điều kiện hội nhập quốc tế sâu rộng.
Một trong những lợi thế của ngân hàng truyền thống là khối lượng thông tin tài
chính khổng lồ mà các ngân hàng lưu trữ về hàng triệu khách hàng của mình. Hơn
thế nữa, ngân hàng có lợi thế về cấu trúc và vốn để khai thác nguồn tài nguyên mới
này. Tiềm năng cho việc phân tích dữ liệu đã được nhìn nhận rộng rãi trong ngành
tài chính với doanh thu từ Big Data và phân tích dữ liệu kinh doanh tăng từ 130 tỷ
đô la Mỹ năm 2016 lên ước tính khoảng 203 tỷ đô la Mỹ năm 2020. Trong đó, lĩnh
vực ngân hàng đóng góp tỷ trọng doanh thu lớn nhất khi dành 17 tỷ đô la Mỹ cho
các giải pháp về Big Data và phân tích dữ liệu chỉ riêng trong năm 2016. Ứng dụng
dữ liệu và phân tích trong ngân hàng là vô cùng. Chúng ta có thể sử dụng dữ liệu
cho tiếp thị, phân phối và đa dạng hóa các dịch vụ cá nhân hóa, đáp ứng chính xác
nhu cầu của từng khách hàng riêng lẻ. Big Data cũng cho phép các ngân hàng có thể
thực hành quản trị rủi ro tốt hơn từ quản trị rủi ro tín dụng truyền thống đến những
loại rủi ro thị trường phức tạp khác, từ rủi ro hoạt động nội bộ đến rủi ro từ yếu tố
bên ngoài… Không chỉ có vậy, Big Data còn trợ giúp trong việc nâng cao chất
24/Biên soạn: Ngô Đức Chiến
lượng dịch vụ, đưa ra các dự báo về tình hình kinh doanh và lập kế hoạch kinh
doanh. Với vô vàn ứng dụng của Big Data và sự phổ biến của nó trong các ngân
hàng hiện đại, các ngân hàng ở Việt Nam nếu muốn nâng cao năng lực cạnh tranh,
cải thiện lợi nhuận thì không còn lựa chọn nào khác ngoài việc gia nhập xu thế này.
Và để có thể đảm bảo được tận dụng mọi lợi thế của Big Data thì yếu tố về chính
sách, vốn, con người và công nghệ cần được chuẩn bị chu đáo cho bước phát triển
này.
4.4. Xác định các nguồn dữ liệu Big Data cho hoạt động tiếp thị của Ngân
hàng
Big data có ở khắp mọi nơi bao gồm cả dữ liệu nội bộ của ngân hàng và doanh
nghiệp và các nguồn bên ngoài mà ở đó có chứa nhiều thông tin nhiễu. Các dữ liệu
có thể bao gồm dữ liệu có cấu trúc và không có cấu trúc, chẳng hạn như trong các
dạng tài liệu, văn bản, nhận xét, đánh giá có sử dụng ngôn ngữ tự nhiên.
Hoạt động khai thác dữ liệu Big data giúp các ngân hàng và doanh nghiệp có thể
thu được các dữ liệu để phân tích nhằm đạt được các mục tiêu trong kinh doanh một
cách hiệu quả hơn. Thực tế, các tổ chức dịch vụ tài chính tạo ra một khối lượng lớn
các dữ liệu chẳng hạn như những thông tin về hồ sơ ngân hàng, các dữ liệu về cá
nhân khách hàng, khách hàng đã mua những gì trước đây, các giao dịch thẻ tín
dụng, các hành vi như duyệt web, tìm kiếm trực tuyến, các ý kiến, quan điểm của cá
nhân, tổ chức trên các phương tiện thông tin xã hội. Câu hỏi đặt ra là: với mỗi mục
tiêu kinh doanh, dữ liệu sẽ nên lấy từ nguồn nào, lấy những gì, lấy như thế nào và
phương pháp thực hiện để thu được các dữ liệu có ý nghĩa.
Phần này này, tập hợp và trình bày các chiến lược mà Big data có thể thực hiện
và áp dụng được trong các ngân hàng nhằm nâng cao hiệu quả tiếp thị kinh doanh.
Bên cạnh đó, nội dung này cũng giới thiệu các thuật toán để thực hiện với từng
trường hợp cũng như các nguồn dữ liệu có thể thu thập.
4.4.1. Nắm vững thông tin khách hàng
Các thông tin cá nhân của khách hàng cho phép ngân hàng và doanh nghiệp tiếp
cận họ, làm cho họ cảm thấy được quan tâm. Bên cạnh đó, các hành vi của khách
25/Biên soạn: Ngô Đức Chiến
hàng trước đây và hiện tại được sử dụng để dự đoán xu hướng của khách hàng trong
tương lai và những hành động tiếp theo của họ về các sản phẩm. Ngoài ra, các giao
dịch và thói quen của khách hàng rất quan trọng để xây dựng một hình
ảnh đầy đủ toàn diện về lối sống, hiểu biết của khách hàng đó. Hiểu được họ, ngân
hàng và doanh nghiệp sẽ vượt qua được các đối thủ cạnh tranh.
4.4.1.1. Xác định thông tin cá nhân của khách hàng
Khai thác hồ sơ khách hàng giúp ngân hàng và doanh nghiệp có thể sử
dụng để đưa ra các hành động dành cho khách hàng. Chẳng hạn, với các thông tin
cá nhân, nó cho phép các ngân hàng và doanh nghiệp gửi tin nhắn riêng tới khách
hàng một cách thân thiện bằng cách đưa thêm tên của khách hàng ở đầu tin nhắn,
thêm thông tin chi tiết của khách hàng mà chỉ những ngân hàng và doanh nghiệp đó
biết, làm cho khách hàng cảm thấy được quan tâm, yên tâm hơn khi chắc rằng đó
không phải là các tin nhắn spam hay tiếp thị lừa đảo. Đây có thể là một phương
pháp tốt để củng cố thương hiệu, cải thiện sự tham gia của khách hàng, làm cho
khách hàng gắn bó hơn với sản phẩm và giữ được khách hàng.
* Phương pháp trích rút thông tin: Các thuật toán phân lớp như mạng neural hoặc
cây quyết định có thể được sử dụng để xác định những nội dung mà khách hàng có
thể hoặc không quan tâm đến. Từ đó, nó cho phép ngân hàng và doanh nghiệp đưa
tới khách hàng các sản phẩm mà họ có thể quan tâm. Các thuật toán như hồi quy
tuyến tính và láng giềng gần nhất nên được sử dụng để so sánh phản ứng của khách
hàng khi họ cùng nhận được thông tin giống nhau. Hồi quy logistic cũng có
thể được sử dụng để đo xác suất mà khách hàng sẽ kích vào một quảng cáo.
* Dữ liệu: Hồ sơ khách hàng, dữ liệu giao dịch được sử dụng để thêm thông tin
cá nhân vào các tin nhắn tiếp thị. Nó bao gồm các thông tin của khách hàng như họ
tên, địa chỉ, sản phẩm khách hàng hay dùng...
4.4.1.2. Xác định mức độ tham gia của khách hàng đối với sản phẩm
Phân tích Big data có thể xác định được những khách hàng không sử dụng, đang
sử dụng, hoặc đang dự định sử dụng một sản phẩm, từ đó người tiếp thị đưa ra
quyết định phù hợp. Cụ thể, các thông tin thu được có thể giúp điều chỉnh, gửi các