Tải bản đầy đủ (.docx) (21 trang)

Nghiên cứu thương mại điện tử KHO DỮ LIỆU THƯƠNG MẠI

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (286.48 KB, 21 trang )

BÀI TẬP NHĨM
Mơn: Nghiên cứu thương mại điện tử

Đề tài: KHO DỮ LIỆU THƯƠNG MẠI

Giáo viên hướng dẫn: Nguyễn Văn Cang
Danh sách thành viên:
1.
2.
3.
4.
5.

Nguyễn Thị Hồng Dung
Hồ Thị Bích Phương
Nguyễn Thị Thanh Thủy
Nguyễn Anh Khoa
Nguyễn Thành Hậu


MỤC LỤC

I.

4.4. Kho dữ liệu

1. 4.4.1. Kho dữ liệu là gì?

Một kho dữ liệu là một trung tâm lưu trữ cho tất cả các thông tin quan trọng mà
một tổ chức thu thập; do đó, nó thường được gọi là một "kho thông tin". Dữ liệu từ các
bộ phận chức năng khác nhau của tổ chức được lưu giữ và kiểm kê trên một máy tính


trung tâm lớn, do đó các thơng tin có thể được chia sẻ giữa tất cả các phịng ban chức
năng của doanh nghiệp.
Mục đích chính của một kho dữ liệu là các ý nghĩa chính của kho dữ liệu đó. Từ
quan điểm về thu thập dữ liệu, một kho dữ liệu phục vụ hai mục đích. Đầu tiên, dữ liêu
về các hoạt động hằng ngày của một doanh nghiêp được thu thập và lưu trữ tại kho dữ
liệu. Loại dữ liệu này được gọi là dữ liệu hoạt động, và các hệ thống xử lý giao dịch trực
tuyến được sử dụng để thu thập dữ liệu hoạt động, được viết tắt là OLTP( hệ thống quản
lý cơ sở dữ liệu hoạt động). Dữ liệu hoạt động không chỉ đại diện cho những thông tin
thu thập được từ khách hàng, nó cịn đại diện cho các dữ liệu thu thập từ các nhà cung
cấp và các trung gian.
Mục đích thứ hai của kho dữ liệu là thu thập, tổ chức, và thiết kế sao cho dữ liệu
sẵn sàng để phân tích. Điều này cho phép các doanh nghiệp sử dụng kho dữ liệu như là
một công cụ ra quyết định cho các chương trình Marketing. Loại dữ liệu này thường được
gọi là dữ liệu thông tin, và các hệ thống xử lý phân tích trực tuyến được sử dụng để thu
thập và tổ chức dữ liệu thơng tin, gọi là OLAP. Q trình này liên quan đến sự phát triển
của các loại khách hàng dựa trên các mối quan hệ giữa các dữ liệu.
Ví dụ, tất cả thông tin về lịch sử mua hàng, tần số, số lần thăm viếng cửa hàng và
sở thích thương hiệu có thể chia sẻ trong một mối quan hệ chung giữa các nhóm khách
hàng và từ đó các khách hàng được phân nhóm, phân loại để tạo thành một cái nhìn khái
qt về nhóm khách hàng cụ thể, tương tự như khái quát của một phân khúc thị trường.
Kho dữ liệu cung cấp cho doanh nghiệp một hệ thống theo hướng chia sẻ thơng
tin, thơng tin đó có thể được sử dụng bởi bất kỳ hoặc tất cả các phòng ban chức năng của
doanh nghiệp. Một kho dữ liệu có thể so sánh với một thư viện của trường, cả hai đều là
các nguồn tài nguyên dùng để phục vụ và là một dịch vụ cho toàn bộ các trường đại học.
Giá trị tài nguyên của thư viện trường bạn được xác định bởi sự đa dạng và việc phân loại
sách, tạp chí, và các thơng tin chun ngành mà nó chứa đựng.


Các giá trị của dịch vụ thư viện của trường bạn được đánh giá dựa trên cách mà
các nhân viên có thể hỗ trợ bạn trong việc tìm kiếm và sử dụng những gì bạn cần một

cách dễ dàng và nhanh chóng. Trong một kho dữ liệu, giá trị của tài nguyên được xác
định bởi số lượng và sự đa dạng của các dữ liệu thu thập và lưu trữ trong kho dữ liệu đó.
Các giá trị của các dịch vụ được xác định bởi sự dễ dàng sử dụng và mức độ chia sẻ
thơng tin trong tồn bộ doanh nghiệp.
2. 4.4.2. Các loại kho dữ liệu
3. 4.4.3. Các đặc điểm của kho dữ liệu

Thông tin trong một kho dữ liệu phải tuân theo các chủ đề định hướng, tích hợp,
thời gian thay đổi, và được lưu trữ khi gặp sự cố. Bốn đặc điểm, như mô tả trên, chỉ ra
rằng một kho dữ liệu là một quá trình diễn ra liên tục. Khi lên kế hoạch một dự án kho dữ
liệu cũng phải giải quyết được các vấn đề như các kho dữ liệu đang được sử dụng và có
khả năng mở rộng thêm.
Thơng tin theo chủ đề định hướng
Chức năng chính của các dữ liệu được thu thập và lưu trữ trong một kho dữ liệu là
cung cấp cho các doanh nghiệp các thông tin về các chủ đề cụ thể chứ không phải là hoạt
động kinh doanh. Các dữ liệu thu thập và lưu trữ trong kho dữ liệu phải bao gồm thông
tin về khách hàng, các dịch vụ được cung cấp bởi các công ty, mô hình mua hàng, sử
dụng sản phẩm, và / hoặc ý kiến của khách hàng.
Ví dụ, các kho dữ liệu cho HCIA, một nhà cung cấp các dịch vụ chăm sóc y tế ở
Baltimore dựa theo việc dõi hàng trăm bệnh nhân tại các bệnh viện, ghi lại các kết quả
của các loại thuốc theo toa đặc biệt, và kết quả giám sát từ một loạt các thủ tục phẫu
thuật. Thông tin này sau đó được chia sẻ với người mua bảo hiểm, công ty bảo hiểm,
HMO, và các công ty dược phẩm.
Thông tin tổng hợp
Dữ liệu thu thập được từ nhiều nguồn khác nhau được sáp nhập để tạo thành một
đơn vị thống nhất của thông tin và lưu vào kho dữ liệu. Điều này ngụ ý rằng dữ liệu thu
thập được nhóm lại theo một số đặc điểm nhất định cho trước và được lưu vào cho một
kho dữ liệu.
Như vậy, các dữ liệu thu thập được sẽ được lưu trữ một cách rất đồng nhất trong
nhóm và khơng đồng nhất giữa các nhóm khác nhau. Ví dụ, kho dữ liệu của nhóm HCIA

thu thập dữ liệu nhập kho bằng các thủ tục phẫu thuật đặc biệt thực hiện trên bệnh nhân
(phẫu thuật tim, phẫu thuật não, phẫu thuật ruột già, vv). Những nhóm này có đặc điểm
tương tự nhau, và họ cũng có các đặc điểm đa dạng riêng biệt giữa các nhóm.


Thời gian thay đổi của thông tin( thời gian nhập dữ liệu)
Tất cả các dữ liệu trong kho dữ liệu phải được nhận dạng bởi một khoảng thời
gian cụ thể. Đặc điểm này có nghĩa rằng tất cả các dữ liệu phải được nhập với ngày và
thời gian tương ứng. Ví dụ, tất cả các bệnh nhân có phẫu thuật tim vào ngày 10 tháng 9
khác với tất cả các bệnh nhân có phẫu thuật tim vào ngày 20 tháng 9 cần phải được nhận
dạng và được ghi nhận bằng những ngày thích hợp của thủ tục.
Thơng tin được lưu trữ khi gặp sự cố
Dữ liệu trong một kho dữ liệu phải được ổn định. Có nghĩ là, dữ liệu mới luôn
được thêm vào, nhưng dữ liệu cũ không bao giờ được xóa bỏ. Điều này cho phép người
sử dụng của các kho dữ liệu có được một cái nhìn nhất quán và theo chiều dọc của các
mối quan hệ giữa các dữ liệu. Vì vậy, đối với HCIA, trong kho dữ liệu của nó, sẽ có dữ
liệu về thủ tục phẫu thuật thực hiện trên bệnh nhân cách đây hơn 10 năm, hoặc dữ liệu
tính từ thời điểm khi mà các kho dữ liệu đầu tiên được phát triển.
Dữ liệu Marketing quan hệ và kho dữ liệu
Bên cạnh rất nhiều các quyết định liên quan đến công nghệ máy tính và xử lý
thơng tin trong một kho dữ liệu, các loại dữ liệu được thu thập và lưu trữ là một yếu tố
quyết định quan trọng trong sự thành công của bất kỳ kho dữ liệu nào. Rõ ràng, các loại
dữ liệu được thu thập cho một kho dữ liệu của doanh nghiệp là rất cụ thể, tuy nhiên đặc
trưng phổ biến của tất cả các dữ liệu của bất kỳ doanh nghiệp nào là tập trung vào khách
hàng.
Bệnh viện rất có thể sẽ thu thập dữ liệu về thủ tục của bệnh nhân, các tổ chức tài
chính sẽ có nhiều khả năng thu thập dữ liệu về các dịch vụ tài chính được sử dụng, và các
cơng ty bảo hiểm sẽ thu thập dữ liệu của các loại chính sách và các cơng cụ đầu tư được
ban hành. Mặc dù cả ba khác nhau về sản phẩm / dịch vụ của họ,tuy nhiên họ tương tự
nhau trong việc thu thập dữ liệu liên quan đến khách hàng. Ngoài dữ liệu thứ cấp và sơ

cấp được lưu trữ trong kho, hai hình thức duy nhất thường được dùng để thu thập dữ liệu
khách hàng cho một nhà kho là (1) dữ giao dịch theo thời gian thực và (2) dữ liệu khách
hàng tình nguyện.
Dữ liệu giao dịch theo thời gian thực
Dữ liệu giao dịch theo thời gian thực là dữ liệu được thu thập tại các điểm bán
hàng. Loại dữ liệu này thường được thu thập thường xuyên nhất thơng qua chương trình
lịng trung thành của khách hàng hoặc các chương trình mua được ưa thích. Thường được
sử dụng nhất là thẻ thành viên của khách hàng để nhận dạng khách hàng là ai, khách hàng
đang mua cái gì, số lượng là bao nhiêu, cái gì được mua thường xuyên và những mặt
hàng nào được bán ở các cửa hàng bán lẻ (hoặc bán lẻ hỗn hợp hoặc bán lẻ điện tử).


Khía cạnh then chốt là dữ liệu được thu thâp tại thời điểm mua sắm, do đó các nhà
sản xuất có thể nhận biết được thái độ khách hàng cho chương trình marketing rõ ràng
được sử dụng tại điểm thời gian đó như thế nào. Chẳng hạn như, doanh số bán bia Miller
có thể được theo dõi thơng qua dữ liệu các điểm bán hàng nơi mà giá cả có thể thay đổi
theo ngày nào đó cùng với hoạt động khuyến mãi của điểm bán lẻ. Trong trường hợp này,
các nhà bán lẻ có thể nhận biết sự tác động của giá và sự biến đổi khuyến mãi về việc bán
hàng của bia Miller.
Dữ liệu khách hàng tình nguyện
Thơng tin khách hàng tình nguyện là dữ liệu được cung cấp bởi những khách hàng
mà khơng có bất cứ sự nài nỉ. Đây là loại dữ liệu sẽ bao gồm các bài bình luận hoặc phàn
nàn của khách hàng, thơng tin khách hàng đăng kí từ web. Giao tiếp khách hàng thơng
qua các phịng chat, và đạt được thơng qua nhóm khách hàng tư vấn. Như vậy dữ liệu đầu
cuối là hồn tồn khơng có kết cấu (phi cấu trúc) và khơng được tìm kiếm bởi doanh
nghiệp.
Khai Phá dữ liệu: Chuyển đổi dữ liệu thành thơng tin
Như đã trình bày trước đó, nhiều doanh nghiệp ngày nay đã thực hiện các quy
trình có hệ thống để trích xuất dữ liệu từ nhiều nguồn khác nhau.
Để chứng minh cho những nỗ lực này, mặc dù nhiều thay đổi trong quy trình

nhưng doanh nghiệp vẫn tập trung vào câu hỏi marketing đặc thù mà có khả năng đối mặt
trong q trình kinh doanh.
Kho dữ liệu được thiết kế với mục đích nhằm trả lời câu hỏi liên quan đến
marketing đặc thù của doanh nghiệp.
Trong thời đại công nghệ thông tin ngày nay, nhiều doanh nghiệp đã chết đuối
trong sự thiếu hụt dữ liệu về thơng tin thực của khách hàng.
Đó là xu thế phổ biến rộng rãi hiện nay dẫn đến việc quan tâm tới việc khai thác
dữ liệu, còn được biết đến như là sự thăm dò cơ sở dữ liệu, khám phá thông tin, hoặc
khám phá tri thức.
Định nghĩa một cách đơn giản, khai phá dữ liệu là quá trình tìm kiếm các mơ hình
ẩn dấu và mối quan hệ giữa các biến số/đặc điểm của dữ liệu được lưu trữ trong kho dữ
liệu. Khai phá dữ liệu là quá trình phân tích dữ liệu được biết đến chủ yếu cho việc cơng
nhận các mơ hình dữ liệu trọng yếu khi mà dữ liệu liên quan đến khách hàng cụ thể hoặc
các nhóm khách hàng.
Trong những năm qua thì q trình trên đã thực hiện khả năng nghiên cứu thị
trường, các quy trình thơng thường đã được thực hiện trên các bộ dữ liệu nhỏ chứa rất ít


các câu trả lời khoảng từ 500 đến 1000 bảng ghi chép. Ngày nay, với sự phát triển của
kho dữ liệu ảo, kích cỡ của gói dữ liệu được phân tích đã tăng lên hàng ngàn, thậm chí là
hàng trăm ngàn bảng ghi chép các câu trả lời.
Đặc biệt công cụ khai phá dữ liệu đã được phát triển cho mục đích cụ thể là phân
tích khách hàng mục tiêu và các mối quan hệ đặc trưng được tìm thấy trong các bộ dữ
liệu quá lớn. Các công cụ khai phá dữ liệu hoạt động để phân tích đồng thời mối quan hệ
trọng yếu giữa nhiều khía cạnh của khách hàng trong kho dữ liệu rộng lớn. Quy trình này
được thực hiện khi nghiên cứu những thị trường có sự hiểu biết mơ hồ hoặc hạn chế liên
quan đối với một đối tượng cụ thể.
Ví dụ, khi quản lý việc kinh doanh sịng bạc có thể đặt những câu hỏi như “Các
thuộc tính đặc trưng của khách hàng đang chơi là gì từ việc phân tích những người mà có
ngân sách cờ bạc lớn trong sòng bạc của chúng ta vào năm ngoái?”. Kỹ thuật khai thác

dữ liệu sẽ được sử dụng để tìm kiếm trong kho dữ liệu, giúp nắm bắt dữ liệu có liên quan,
phân loại các thuộc tính quan trọng, và tạo thành bảng ghi chép của các con bạc có ngân
sách cao.
Quy trình khai thác dữ liệu
Hình 6.9 mơ tả một quy trình chuẩn đơn giản, giải thích những vấn đề liên quan
trong q trình khai thác dữ liệu. Quy trình này có 5 yếu tố trọng tâm: các câu hỏi nghiên
cứu thị trường, phương pháp khai thác dữ liệu, kỹ thuật khai phá dữ liệu, quá trình thực
hiện khai thác, và sản phẩm khai thác trực quan.
Bảng 6.9 Bảng cơ sở dữ liệu cho các quyết định Marketing


Các câu hỏi nghiên cứu thị trường
Đây là việc đầu tiên trong bất cứ việc phân tích khai phá dữ liệu nào. Chẳng hạn,
nhà quản trị có thể cần có câu trả lời cho các câu hỏi như là “Khách hàng nào muốn ghé
thăm sòng bạc của chúng ta vào tháng 7 nhất và tại sao?”. Để cung cấp câu trả lời, cơng
cụ phân tích khai thác dữ liệu phải phân tích hai u cầu quan trọng: mơ tả và dự báo.
Mơ tả là q trình khám phá các mơ hình mẫu, sự kết hợp và mối quan hệ giữa đặc
điểm quan trọng của khách hàng như các biến số nhân khẩu học, số tiền trong ngân sách
cờ bạc, tần suất ghé thăm casino, số lượng các vụ đánh cược chiến thắng/ thất bại, số
ngày ghé trong tuần, tháng, số lượng giờ tham gia vào cờ bạc trong một ngày.
Dự báo là sử dụng các mơ hình mẫu và mối quan hệ để dự báo xu hướng tương lai
và cách xử lý, chẳng hạn như là tại sao khách hàng ghé thăm trong một tháng nhất định,
họ tham gia các hoạt động nào trong một tháng đó, có bao nhiêu người chơi bài trong
tháng, những sự kiện đặc biệt họ quan tâm (nếu có), trong thời gian cụ thể nào.
Phương pháp khai phá dữ liệu


Điều này gồm có sự phân loại của phương pháp khai phá dữ liệu được thiết kế để
mô tả và dự báo. Phương thức đầu tiên trong sáu phương thức chủ yếu là sự phân loại,
miêu tả sơ lược tiến trình phát triển của nhóm dựa vào sự đo lường thuộc tính.

Ví dụ, nhà quản trị có thể mong muốn biết được những yếu tố của nhóm nhân
khẩu học dựa trên tuổi, giới tính, thu nhập, dân tộc, và nghề nghiệp. Hoặc nhà quản trị có
thể mong muốn biết được các yếu tố về mức độ thỏa mãn dựa trên tính thân thiện của
nhân viên, sự sạch sẽ của mơi trường xung quanh, chất lượng phục vụ và thương hiệu của
doanh nghiệp.
Phương thức khai phá dữ liệu thứ hai là hồi quy. Điều này liên quan đến việc thiết
lập một mối quan hệ giữa các nhóm phân loại cho mục đích dự báo. Trong trường hợp
này tất cả nhóm nhân khẩu học và mức độ của sự hài lòng sẽ được kiểm tra để xác định
các mối quan hệ (nếu có), điều đó có thể tồn tại giữa các nhóm, và giữa các nhóm thì có
sự khác nhau như thế nào trong cách hành xử với khách hàng thân thiết tương lai.
Chuỗi thời gian là phương thức thứ ba, hoạt động tương tự hồi quy, nhưng nó sử
dụng các biện pháp bổ sung dựa vào mức độ thời gian. Chuỗi thời gian sẽ được khảo sát
theo mơ hình của mối quan hệ, điều đó có thể tồn tại giữa các nhóm nhân khẩu học và
mức độ hài lịng khi phân tích tồn bộ các thời điểm cụ thể (ngày, tháng hoặc năm).
Phân cụm (ghép nhóm) là phương thức thứ tư trong khai phá dữ liệu, phân cụm
mục tiêu là việc trình bày các hành vi nhất qn hoặc đặc tính trong các nhóm. Chẳng
hạn, trong phạm vi nhóm nhân khẩu học và sự hài lịng, phân cụm có thể xác định rằng
một nhóm duy nhất tồn tại hiển thị các đặc điểm sau: nam, tuổi 24-30, với thu nhập
khoảng 100,000$ có mức độ hài lịng thấp với sự thân thiện của nhân viên và sự sạch sẽ
của môi trường xung quanh.
Hiệp hội phân tích nhận ra rằng một số mục (mặt hàng) hoặc các đặc tính kéo theo
sự hiện diện của một số mục hoặc đặc tính khác. Đặc biệt, điều này sẽ kéo theo ở bất kì
tháng nào, khi tất cả các mục gắn liền với sự thỏa mãn được đánh giá cao bởi khách hàng
thân thiết, nhóm nhân khẩu học ghé thăm doanh nghiệp thường xuyên nhất là phụ nữ, độ
tuổi 50-60, đã về hưu, với thu nhập hằng năm 50,000$.
Cuối cùng, sau những nỗ lực khám phá thì nhận ra rằng một số mục này sẽ được
theo sau một tập hợp các mục khác. Chẳng hạn, mỗi khi một nhóm nhỏ xuất hiện được
xác định là nam, 45-50, với thu nhập 35,000$, đánh giá sự thỏa mãn cao được tìm thấy
giữa chất lượng của sự phục vụ và danh tiếng của doanh nghiệp.
Sự phân loại, sự hồi quy, và chuỗi thời gian chủ yếu được sử dụng để mô tả, trong

khi sự phân cụm, sự kết hợp và phát hiện trình tự một chuỗi sẽ được sử dụng để mô tả
mối quan hệ tồn tại trong dữ liệu.


Kỹ thuật khai phá dữ liệu
Đây là kỹ thuật căn bản cho tất cả các nổ lực khai phá dữ liêu. Chức năng chủ
yếu của chúng là khảo sát dữ liệu từ thống kê quan điểm để khám phá ra kiểu mẫu tồn tại
trong dữ liệu. Hình 6.10 là danh sách các kỹ thuật khai phá dữ liệu phổ biến nhất và các
ứng dụng nghiệp vụ trong đó dữ liệu được áp dụng.
Hình 6.10 kỹ thuật khai phá dữ liệu
Các kỹ thuật được sử dụng phổ biến nhất trong khai phá dữ liệu, cùng với các ứng
dụng tiềm năng là:
CÂY QUYẾT ĐỊNH
Cây quyết định là một cấu trúc hình cây trực quan mô tả tập hợp các quy tắc (điều
kiện) đó là nguyên nhân gây ra một quyết định được làm, như là quyết định mua sản
phẩm. từ cây quyết định chúng ta có thể tạo ra quy tắc cho sự tự động phân loại toàn bộ
dữ liệu, chẳng hạn, để phân đoạn dữ liệu khách hàng.
Phương phá p cây quyết định cụ thể bao gồm cây hồi quy và phân loại (CART) và
cây quyết định kỹ thuật (CHAID). Các ứng dụng tiềm năng cho cây quyết định bao gồm:
• Chẩn đốn y khoa: những gì là nhân tố ảnh hưởng đến tỉ lệ sống sót của các ca
ghép thận?
• Phân tích hàng bán lẻ: Các kết quả từ một cuộc khảo sát khách hàng là gì?
Cây quyết định thường được kết hợp với mạng lưới thông tin để giải thích tại sao
mạng lưới thơng tin đã ảnh hưởng đến một kết luận nào đó. Chúng cũng có thể được kết
hợp với quy tắc cảm ứng (xem phía dưới) để tạo ra logic cho ra quyết định lặp lại.
Chẳng hạn, để giúp nhân viên bán hàng qua điện thoại hạn chế bán nợ cho khách
hàng đó và nhận biết những người mang lại nhiều rủi ro trong tương lai vì các thông tin
sơ lược của họ được kết nối một cách tự động để khai thác từ dữ liệu.
THUẬT TOÁN DI TRUYỀN
Thuật toán di truyền là kỹ thuật tối ưu có thể được dùng để cải thiện thuật tốn

khai phá dữ liệu sao cho họ có mơ hình tốt nhất cho cho bộ dữ liệu. Mơ hình kết quả
sau đó được áp dụng cho dữ liệu để khám phá kiểu mẫu ẩn hoặc dự đoán.
Thuật toán di truyền phù hợp nhất với phân đoạn / ứng dụng phân nhóm nhưng có
thể được áp dụng cho hầu hết tình huống liên quan học tập . Lưu ý việc sử dụng từ tối ưu


trong câu hỏi dưới đây là dấu hiệu đặc trưng của thuật tốn di truyền có thể là kỹ thuật
sử dụng để trả lời kiểu câu hỏi này. Các ứng dụng tiềm năng bao gồm :


Thư Trực tiếp: Những gì là yếu tố quan trọng nhất trong hồ sơ của khách hàng lý
tưởng có khả năng đầu tư hơn 25,000 đơ-la Mỹ vào quỹ tương hỗ năm nay?



Phân tích rủi ro: Những điều gì là quan trọng trong hồ sơ của về khoản vay nhà ở
ít rủi ro cho người kiếm ít hơn $75,000 và muốn sống ở San Jose trong tương lai ?



Chẩn đốn Y khoa : Kế hoạch điều trị tối ưu cho một chẩn đoán cụ thể là gì?



Phân tích Bán lẻ : Thiết kế cửa hàng tối ưu cho một địa điểm cụ thể là gì?
MẠNG NEURAL

Đây là mơ hình dự báo phi tuyến tính mà nghiên cứu bằng cách phát hiện một mơ
hình phù hợp để kết nối hồ sơ cụ thể thông qua quy trình đào tạo bao gồm học lặp lại, sử
dụng tập hợp các dữ liệu mơ tả những gì bạn muốn họ tìm kiếm. Chúng được đặt tên như

vậy bởi các nhà quản lý cấp thấp,hoạt động của chúng tương tự bộ não con người.
Các ứng dụng tiềm năng bao gồm :





Thư Trực tiếp : Ai sẽ đáp lại thư này?
Phân tích rủi ro : Những khách hàng tiềm năng nào khơng quỵt nợ?
Chẩn đốn Y khoa : Những bệnh gì là người này có thể mắc phải?
Phân tích Bán lẻ : Những sản phẩm gì mà khách hàng hay mua?

Mạng lưới thơng tin phù hợp với cụm, trình tự, và vấn đề dự đốn. Nhược điểm
chính của nó là tính khơng rõ ràng - mạng lưới này khơng giải thích tại sao nó đã đạt
đến một kết luận nào đó. Nhưng trong một số ứng dụng nào đó ( như trường hợp mẫu
chữ viết tay ) thì nó khơng phải là quan trọng.
MƠ HÌNH DỰ ĐỐN
Các kỹ thuật đa dạng có thể được sử dụng để xác định các mẫu , mà sau đó có thể
được ứng dụng để dự đoán tương lai. Chúng bao gồm các hồi quy tuyến tính cổ điển và
dẫn xuất của nó , phân tích hồi quy logistic , và mở rộng hơn nữa như tổng qt hóa mơ
hình phụ gia (GAM) và mơ hình hồi quy đa biến thích nghi (MARS).
Những kỹ thuật này thường được sử dụng để dự đoán tỷ lệ cược của một kết quả
cụ thể, dựa trên các dữ liệu quan sát. Ví dụ như:


• Gửi thư trực tiếp: Những khu vực địa lý có nhiều khả năng để đáp ứng với một sáng
kiến gửi thư mới ?
• Phân tích bán lẻ: Những khách hàng nào có khả năng quan tâm nhiều đến một sản
phẩm mới?
QUY TẮC CẢM ỨNG

Quy tắc cảm ứng là quá trình khai thác hữu ích Nếu . . . sau đó. . quy tắc từ dữ
liệu, dựa trên ý nghĩa thống kê. Các ứng dụng tiềm năng bao gồm :
• Thư Trực tiếp: Những phản hồi từ việc gởi mail cho khách hàng sẽ lớn hơn 5%
phải khơng?


Phân tích rủi ro: Lợi nhuận đầu tư của cổ phiếu trên một năm sẽ lớn hơn, bằng,
hay ít hơn 10 phần trăm?



Quản lý rủi ro : Những tiêu chuẩn và ngưỡng nào là "đáng tin cậy" trước khi đưa
ra cho một khách hàng vay thế chấp?
LOGIC MỜ

Logic mờ nhạt xử lý khái niệm mơ hồ ( như nhỏ, lớn, trẻ, cũ, cao, thấp ) và linh
hoạt hơn là kỹ thuật khác. Nó cung cấp các khái niệm về tập mờ chứ không phải là ranh
giới phân định rõ: ví dụ như khoảng giữa của 0 hoặc 1 cũng có 0.9, 0.85, 0.93, 0.21,
0.05.
Ứng dụng tiềm năng có thể là thư trực tiếp: Ai có thể là một người có khả năng để
chúng tôi gởi mail trong chiến dịch mới của chúng tôi?
K – LÁNG GIỀNG GẦN NHẤT (K-NN)
Kỹ thuật này đặt một đối tượng quan tâm vào một lớp hoặc nhóm bằng cách kiểm
tra các thuộc tính của nó và nhóm nó với những đối tượng khác mà thuộc tính này là gần
nhất với nó. K-NN là một kỹ thuật cổ điển để khám phá ra các luật kết hợp và các trình
tự khi các thuộc tính dữ liệu được số hóa. Với thuộc tính khơng được số hóa hoặc các
biến, nó là khó khăn hơn rất nhiều để áp dụng kỹ thuật này, vì gặp khó khăn trong việc
xác định một đơn vị đo lường hơn là có thể được sử dụng để xác định số lượng khoảng
cách giữa một cặp giá trị khơng phải là số hóa.



Quy trình thực hiện khai phá dữ liệu
Quy trình này yêu cầu nhà nghiên cứu phải hiểu dữ liệu chứa trong kho dữ liệu
được lưu trữ và phân loại như thế nào. Sự phân loại và lưu trữ sẽ xác định kỹ thuật khai
phá dữ liệu nào là thích hợp nhất để sử dụng để tìm trả lời cho câu hỏi về marketing.
Trong quy trình này vấn đề quan tâm chính của nhà nghiên cứu là xác định kỹ thuật khai
phá dữ liệu được dùng nhiều nhất để xác định các đặc tính quy mơ của dữ liệu lưu trữ
trong kho dữ liệu.
Một vài kỹ thuật khai phá dữ liệu chỉ có thể được sử dụng khi tính đặc thù trong
kho dữ liệu được đo bằng cách sử dụng đặc tính mở rộng quy mơ chính xác. Các kỹ thuật
khác có thể được sử dụng hiệu quả hơn nếu một loạt các thuộc tính quy mơ đã được sử
dụng để thu thập và đo lường các đặc điểm.
Sản phẩm trực quan khai phá dữ liệu
Khơng có loại kỹ thuật nào khai thác dữ liệu được sử dụng mà có thể xác định
trước kết quả sẽ được trình bày thế nào và cung cấp kết quả là một thủ tục quan trọng
trong mọi hoạt động khai thác dữ liệu. Hãy nhớ rằng, khai thác dữ liệu là sự kết hợp của
hai khái niệm, mơ hình tự động phát hiện các đặc điểm của khách hàng và trình bày hình
ảnh của những đối tượng mẫu.
Cơng cụ khai phá dữ liệu có thể là để khám phá ra mơ hình cho dù hiểu quả thế
nào đi nữa, nếu những mơ hình khơng được hình dung một cách hiệu quả, người ra quyết
định có thể đưa ra quyết định chiến lược trên thông tin bị mất. Do đó, thành cơng của bất
kỳ thủ tục khai phá dữ liệu nào phụ thuộc nhiều vào khả năng của nhà nghiên cứu để tiếp
cận và thấu hiểu kết quả phân tích liên quan đến câu hỏi marketing đã được trả lời.
II.

4.5. Mơ hình hóa cơ sở dữ liệu

Trước khi tiến hành bất cứ thủ tục mô phỏng thống kê, nhà nghiên cứu cần xem
xét, tinh lọc, và định dạng dữ liệu sơ cấp trong cơ sở dữ liệu để nó có thể được xử lý dễ
dàng bằng phần mềm thống kê sẵn có. Các tiến trình dữ liệu này là cần thiết cho hoạt

động mô phỏng câu hỏi và truy vấn dữ liệu thành cơng.
Mơ hình hóa và phân tích cơ sở dữ liệu được thiết kế để tóm tắt những gì cơng ty
đã biết về khách hàng tốt nhất của họ và cùng lúc cho biết những gì họ cần biết về những
người này. Khi mơ hình cơ sở dữ liệu khơng dự đốn hành vi trong tương lai của khách
hàng, nhà phân tích cơ sở dữ liệu cần đặt ra những câu hỏi cho dù công ty thực sự biết đủ
về khách hàng của họ. ( Kho dữ liệu của hãng In the Field nổi bật là một trong những kho
dữ liệu lớn nhất thế giới).


Nhiều cơng ty thấy mình giàu dữ liệu và nghèo thơng tin. Q trình mơ phỏng
khách hàng có thể thường chỉ vào thơng tin cịn thiếu của cơng ty và tạo ra các ý tưởng
mới cho nỗ lực nghiên cứu marketing trong tương lai. Một phương pháp hiệu
quả để xử
lý cơ
sở

hình
dữ
liệu là để bắt
đầu với
sự kết thúc trong tâm trí. Andreasen mô tả điều này như là nghiên cứu marketing
ngược lại.
Anh ấy nói rằng để sử dụng thiết kế nghiên cứu cách tốt nhất là bắt đầu nơi quá
trình sẽ chấm dứt rồi làm việc và ngược lại. Câu hỏi sau đó trở thành: thơng tin sẽ dược
tập hợp sử dụng như thế nào? Hoặc, thông tin này cho phép chúng tơi nên làm gì? Hoạch
định ngược lại để nhà nghiên cứu hiểu rõ hơn có những mơ phỏng kết quả đầu ra nào sẽ
sử dụng cho người có quyền quyết định.
Giữa nhiều thủ tục mô phỏng tồn tại trong phân tích cơ sở dữ liệu, hai trong số các
phương pháp truyền thồng là mơ hình cho điểm và mơ hình giá trị suốt đời.
4. 4.5.1. Mơ hình cho điểm


Mơ hình cho điểm được dùng để dự đốn hành vi tiêu dùng. Mỗi cá nhân trong cơ
sở dữ liệu được phân công lo điểm số dựa trên của anh ấy hay của cô ấy xu hướng đáp lại
đến marketing thay đổi hoặc làm mua thực tế. Điểm số cao là dấu hiệu của khách hàng rất
hấp dẫn ; điểm số thấp đại diện cho ít hấp dẫn hơn đoạn. Mục tiêu ban đầu là để xếp hạng
phân khúc khách hàng dựa trên khả năng sinh lợi tiềm năng của họ đến cơng ty. Đặc điểm
chính của mơ hình cho điểm được gọi là bảng lợi nhuận.
Ví dụ bảng lợi nhuận được trình bày trong hình 6.11. Sử dụng bảng lợi nhuận, một
nhà phân tích cơ sở dữ liệu có thể dự đốn và quản lý các lợi ích của các phân khúc thị
trường khác nhau.
Hình 6.11 ví dụ về bảng lợi nhuận

Chẳng hạn như, theo dữ liệu trong hình 6.11, nguồn khách hàng gồm 500.000
người. Họ được chia thành năm phân khúc bằng nhau,mỗi phân đoạn gồm 100.000
người, hoặc năm công đoạn,mỗi phân đoạn là 20 phần trăm thị trường. Xếp hạng cho mỗi


phân đoạn của bảng lợi nhuận dựa trên tiềm năng tạo ra lợi nhuận của nó. Nhóm 1 khách
hàng có tiềm năng tạo ra lợi nhuận cao nhất, và nhóm 5 tạo giá trị thấp nhất. Nhóm 1
được ước tính thu hút khoảng 2 triệu đô-la lợi nhuận trong tương lai, hoặc ước tính lợi
nhuận từ mỗi khách hàng là $20,... Tóm lại, nhóm 1, 2 và 3 được ước tính tạo ra 4.5 triệu
đơ-la tổng lợi nhuận tương lai, hoặc ước tính $20, $17.50, và $3.50, lần lượt cho mỗi
khách hàng tương ứng với các nhóm 1,2,3. Thơng qua bảng 6.11, khi khách hàng dịch
chuyển từ nhóm cao xuống nhóm thấp ( nhóm 1 sang nhóm 2), tỷ lệ phần trăm của khả
năng sinh lời mỗi phân khúc bắt đầu giảm. Do đó bảng này củng cố nguyên tắc tiếp thị cơ
bản cho khách hàng là không đồng nhất và cụ thể hơn nữa, quan niệm thông thường 20
phần trăm khách hàng chiếm 80 phần trăm của thu nhập của cơng ty.
Các biến số chính trong những mơ hình cho điểm
Biến số quan trọng trong mơ hình chấm điểm cho phép một nhà nghiên cứu chứng
minh các yếu tố có thể được kết hợp để phân chia khách hàng thành các nhóm khách

hàng mua hàng hoặc những danh mục hàng hóa. Mơ hình cho điểm sử dụng một loạt các
trọng số mà có thể được nhận giá trị được gán trong hồ sơ của từng khách hàng trên cơ sở
dữ liệu.
Ví dụ, hãy giả sử rằng chúng ta phát hiện ra 5 yếu tố hữu ích trong việc tách những
người sử dụng thường xuyên từ người sử dụng của keo xịt tóc bóng: tuổi tác, thu nhập,
nghề nghiệp, số trẻ em dưới 18 tuổi, và giá trị tài sản. Trên cơ sở phân tích các đặc điểm
của khách hàng trong cơ sở dữ liệu, mơ hình cho điểm xác định người sử dụng nhiều keo
xịt tóc, các biến được sắp xếp theo thứ tự sau đây và được giao một trọng số tương ứng:
giá trị tài sản: 0,130; tuổi: 0,050; nghề nghiệp: 0,042; số trẻ em dưới 18 tuổi: 0,022; và
thu nhập: 0,012.
Rõ ràng, kết quả thực tế được tạo ra bởi các mơ hình sẽ là khá khác nhau, vì chúng
sẽ được nhân với các con số (ví dụ, tuổi tính theo năm, nghề nghiệp được chuyển thành
giá trị mã hố, thu nhập được tính theo hàng ngàn đôla). Tuy nhiên, để dễ cho cuộc thảo
luận của chúng ta, chúng ta hãy giả sử đây là những giá trị thực. Trong ví dụ này, giá trị
“tài sản” là một yếu tố rất quan trọng, với “thu nhập” là một yếu tố ít quan trọng hơn, để
phân loại khách hàng vào một nhóm người sử dụng nhiều.
Mơ hình này cho phép một nhà nghiên cứu để chạy một chương trình mà mỗi yếu
tố có liên quan trong hồ sơ của khách hàng trên cơ sở dữ liệu và nhân nó với trọng số
thích hợp. Các trọng số này sau đó được thêm vào với nhau để có được một điểm số tổng
thể. Tỉ số đại diện cho khả năng của một khách hàng là một người sử dụng nhiều (hoặc
một người dùng trung bình, vv) của sản phẩm.
Như ở hầu hết các kỹ thuật cơ sở dữ liệu, các biến số được sử dụng để tạo ra lợi
nhuận trong mơ hình cho điểm phải được thu thập từ dữ liệu hành vi mua thực tế. Biến số
chính sẽ bao gồm nhân khẩu học, lối sống và thói quen mua bao gồm tần số, khối lượng,
và số tiền chi tiêu tại một thời điểm nhất định.


Các biến này sau đó sẽ được gán trọng số hay điểm tùy thuộc vào khả năng của nó
để dự đốn hành vi mua. Ví dụ, những người đàn ơng có thể mua sắm nhiều các đồ dùng
điện hơn so với phụ nữ; do đó, trên cơ sở các biến số nhân khẩu học về giới tính, người

đàn ơng sẽ được chỉ định là 10, phụ nữ là 4. Mỗi biến phân loại sẽ được chỉ định một
trọng lượng hoặc số. Cơ cấu trọng số ghi điểm cho hai nhóm khách hàng có thể trơng
giống như sau:

Trên cơ sở dữ liệu khách hàng thực tế, người tiêu dùng nhóm B (với 34 điểm) có
các biến số kết nối tốt hơn so với nhóm người tiêu dùng nhóm A (với chỉ 17 điểm).Khi tất
cả các khách hàng được xác định một cách tồn bộ, những người có số điểm cao nhất sẽ
tạo thành nhóm 1 (20% của lượng khách hàng) trong bảng lợi nhuận.
Nhóm cao nhất tiếp theo trong cơ sở dữ liệu khách hàng sẽ hình thành nhóm 2
(thêm 20 phần trăm), và v.v. Tổng điểm cho mỗi khách hàng mỗi nhóm sau đó sẽ được
chuyển đổi sang đơ la. Vì vậy, 34 điểm sẽ trở thành $ 34, và 17 điểm sẽ trở thành $ 17.
Việc chuyển đổi này sẽ trở thành nền tảng cho dự đoán những lợi ích tương lai trong bảng
phân tích lợi nhuận. Mơ hình cho điểm cần được thiết kế với việc xem xét rằng các nhóm
này có hiệu quả trong một khoảng thời gian hạn chế.
Vịng đời của mơ hình này là có liên quan trực tiếp đến những thay đổi trong nhu
cầu khách hàng. Vì vậy, mơ hình cho điểm cần phải được sửa đổi và thay đổi như những
thay đổi của thị trường. Nhiều nhà phân tích tranh luận rằng một khi một mơ hình cho
điểm đã được phát triển, nó sẽ tự động trở nên lỗi thời. Các sự minh họa nghiên cứu thị
trường ở cuối chương này thảo luận về giá trị của mơ hình tính điểm cho các tổ chức tài
chính.
5. 4.5.2. Mơ hình giá trị lâu dài

Những tiền đề cơ bản đằng sau mơ hình giá trị lâu dài là khách hàng, giống như
các yếu tố vật lý và máy móc hữu hình, đại diện cho tài sản công ty. Điều quan trọng hơn,
khách hàng đại diện cho một dòng liên tục của dòng tiền dựa trên các giao dịch mà họ
tiến hành với doanh nghiệp.


Thơng thường, kết quả của nhiều cơng trình nghiên cứu thị trường là bao gồm các
thông tin được sử dụng chỉ tạo ra các khách hàng mới. Mơ hình giá trị lâu dài chứng

minh rằng nó có giá trị hơn cho các doanh nghiệp để tập trung vào cải thiện chất lượng
khách hàng đầu tiên, sau đó tập trung vào trao dồi họ hơn là liên tục tìm kiếm những
khách hàng mới. Ba mục tiêu nghiên cứu là rất cần thiết cho các mơ hình giá trị lâu dài:
1. Để có được thơng tin phải thiết lập các biến số cho việc chất lượng hóa hoặc chọn lọc
của khách hàng hiện tại.
2. Để có được thơng tin về sự hài lòng của khách hàng. (Trong thực tế, dữ liệu thu được
về sự hài lịng ngồi sản phẩm hay dịch vụ còn phải bao gồm các biện pháp dựa trên sự
hài lịng tổng cộng của khách hàng.)
3. Để tạo thơng tin đó các doanh nghiệp cho phép xây dựng các mối quan hệ với khách
hàng lặp lại.
Trong hầu hết các mô hình giá trị lâu dài, thơng tin từ cơ sở dữ liệu được thiết kế
để đạt được những mục tiêu này sẽ bao gồm những điều sau đây:
1. Biến Giá: Chi phí sản phẩm hoặc dịch vụ ban đầu và giá xảy ra thay đổi.
2. Biến quảng cáo bán hàng: Loại sử dụng, chi phí ưu đãi, tăng giá trị cho khách hàng.
3. Chi phí quảng cáo: Chi phí trực tiếp cho quảng cáo.
4. Chi phí sản phẩm: Chi phí trực tiếp, cộng với chất lượng hàng hoá / dịch vụ.
5. Nỗ lực xây dựng mối quan hệ: Loại và chi phí của các thiết bị xây dựng mối quan hệ,
giá trị của việc xây dựng mối quan hệ lâu dài.
Các cơ sở dữ liệu, nếu đúng thiết kế,có thể các kênh thơng tin được gọi là một lộ
trình khách hàng phức tạp. Hình 6.12 đại diện cho các đầu ra từ một mơ hình giá trị lâu
dài giả định cho một nhà hàng thức ăn nhanh.
Hình 6.12 Mơ hình giá trị thời gian cho một nhà hàng thức ăn nhanh


Trong ví dụ này 10.000 khách hàng mới là mục tiêu cho các nỗ lực marketing. Số
tiền trung bình chi tiêu của khách hàng là khoảng $ 4,30, và một bánh sandwich miễn phí
(với chi phí 90 cent) là động lực để thu hút khách hàng. Vì vậy, doanh thu ước tính là
khoảng $ 34,000. Chi phí lên tới khoảng 60 phần trăm của tổng doanh thu, tổng cộng chi
phí là 20.400 $. Trung bình hoạt động kinh doanh này giữ lại được 35% khách hàng.
Do đó, việc gửi mail cho 10.000 phiếu giảm giá bánh sandwich miễn phí nên năng

suất 3.500 phản ứng với chi phí 3.800 $. Tổng chi phí cho nỗ lực quy hoạch này hiện nay
được ước tính khoảng $ 24,200. Với một khoản đầu tư ban đầu là $ 3800, tổng số đóng
góp nên kết quả trong một sự trở lại $ 9,800 cho các doanh nghiệp.
Điều này, đến lượt nó, tương đương với giá trị vòng đời khách hàng tổng cộng $
6,000, tương đương 60 cent cho mỗi khách hàng trong thời gian đầu tiên của chương
trình khuyến mãi. Với giá dự kiến của khách hàng trở lại trong ba giai đoạn khuyến mại
tiếp theo, tổng số đóng góp sẽ giảm xuống cịn 652 $, với chi phí đầu tư giảm xuống
162$. Tổng giá trị vòng đời qua bốn giai đoạn sẽ tăng lên đến 11.527$, hoặc 1.15$ cho
mỗi khách hàng. Các giá trị suốt đời bốn giai đoạn cho một khách hàng cá nhân là 1.15$.


Tóm lại, như một cơng cụ phân tích cơ sở dữ liệu, mơ hình giá trị lâu đời đánh
đồng giá trị tài sản của khách hàng. Ngược lại với ý định mua dữ liệu, mơ hình giá trị lâu
dài chỉ có thể dựa trên dữ liệu mua hàng thực tế. Các giá trị của kỹ thuật này không dựa
trên các ước tính xác suất mà là dựa trên hành vi mua thực tế và do đó là một yếu tố dự
báo tốt về hành vi của người tiêu dùng.
III.

4.6. Chuyển đổi dữ liệu thành thông tin

Hầu hết các công ty đều có dữ liệu gần như mọi khía cạnh hoạt động của mình.
Nhiều cơng ty hầu hết dùng dữ liệu trong số dữ liệu mà họ có. Dữ liệu là gì? Dữ liệu là
những sự kiện bằng lời nói hoặc bằng số,nó có thể được sử dụng để lý luận hay tính tốn.
Trong thuật ngữ cơ sở dữ liệu, một mục dữ liệu hoặc file dữ liệu là một đặc trưng cơ bản
về một khách hàng (ví dụ, giới tính, tuổi tác, tên, địa chỉ).

Hầu hết các công ty đều có dữ liệu trên hầu hết mọi khía cạnh hoạt động của mình.
Nhiều cơng ty thậm chí có dữ liệu trên bao nhiêu dữ liệu mà họ có. Dữ liệu là gì?
Dữ liệu là những sự kiện bằng lời nói hoặc bằng số mà có thể được dùng để lý luận
hay tính tốn. Trong thuật ngữ cơ sở dữ liệu, mục dữ liệu hoặc trường dữ liệu là

một đặc điểm cơ bản về một khách hàng (ví dụ, giới tính, tuổi tác, tên, địa chỉ).
Khi chúng tôi thảo luận trong phần trước, trường dữ liệu ít có giá trị khi
được đề cập một cách riêng lẻ.. Khi chúng được kết hợp để làm cho chúng hữu ích
cho việc ra quyết định, sau đó chúng tạo thành giá trị và có thể được coi là thông
tin. Một bước quan trọng trong quá trình phát triển cơ sở dữ liệu là chuyển đổi dữ
liệu thành thông tin. Công nghệ cung cấp các động cơ mang lại sức mạnh cho bước
này.
Công nghệ cơ sở dữ liệu
Công nghệ cơ sở dữ liệu đề cập đến các công cụ được sử dụng để biến đổi
dữ liệu thành thông tin. Trong khi công nghệ cơ sở dữ liệu trong định nghĩa có vẻ
đơn giản, trong ứng dụng của nó có thể hơi phức tạp. Một cái nhìn tổng quan ngắn
gọn sẽ cho phép cho một sự hiểu biết rõ ràng hơn về những gì thực sự thúc đẩy
một cơ sở dữ liệu.
Công nghệ cơ sở dữ liệu cho phép dữ liệu được xử lý và lưu trữ trong một
kho. Nó bao gồm hai tính năng độc đáo: một hệ thống quản lý cơ sở dữ liệu và một
từ điển dữ liệu. Một hệ thống quản lý cơ sở dữ liệu là một chương trình máy tính
tạo ra, thay đổi và điều khiển truy cập tới dữ liệu trong cơ sở dữ liệu. Người sử
dụng các chương trình chỉ cần làm theo các hướng dẫn cơ bản để kết hợp dữ liệu


để tạo ra một số kết quả mong muốn. Thông thường hệ thống quản lý cơ sở dữ liệu
được sử dụng là ACCESS.
Một từ điển dữ liệu cung cấp các mô tả của các dữ liệu trong cơ sở dữ liệu.
Nó định dạng dữ liệu và gán ý nghĩa cho các trường dữ liệu hoặc các biên. Cùng
với nhau, các hệ thống quản lý cơ sở dữ liệu và từ điển dữ liệu là những gì được
gọi là hệ thống xử lý cơ sở dữ liệu. Hai loại hệ thống xử lý cơ sở dữ liệu tồn tại:
tuần tự (chuỗi) và quan hệ.
4.6.1. Hệ thống cơ sở dữ liệu chuỗi
Một hệ thống cơ sở dữ liệu chuỗi tổ chức các dữ liệu trong một mơ hình rất
đơn giản, đó là một đường dẫn đơn giản, liên kết, hoặc mạng. Trong một cơ sở dữ

liệu chuỗi chỉ có hai trường dữ liệu đơn mới có thể được ghép đơi. Sau khi ghép
đơi, chúng có thể được liên kết với một trường dữ liệu thứ ba. Sau khi nhóm này
được kết nối, nó có thể được liên kết với một trường thứ tư, tạo thành nhóm thứ
năm, và v.v, như minh họa trong hình 6.6.
EXHIBIT 6.6 An Example of a Sequential Database

Nhiều công ty lựa chọn để phát triển cơ sở dữ liệu chuỗi bởi vì chúng cho
phép người dùng dễ dàng truy cập dữ liệu chi tiết liên quan đến một trường dữ liệu
đặc biệt hoặc biến (ví dụ, khu vực của đất nước). hơn nữa, hệ thống cơ sở dữ liệu


thường được sử dụng trong các cơng ty có u cầu báo cáo dựa trên dữ liệu thống
nhất trong một định dạng nhất định.
4.6.2. Hệ thống cơ sở dữ liệu quan hệ
Hệ thống cơ sở dữ liệu quan hệ hoạt động hơi khác với hệ thống cơ sở dữ
liệu chuỗi. Sự khác biệt chính là cơ sở dữ liệu quan hệ địi hỏi phải có mối quan hệ
trực tiếp giữa các trường dữ liệu hoặc biến. Dữ liệu có cấu trúc trong các bảng với
các hàng và cột, với các bảng (không phải là các trường dữ liệu) được liên kết với
nhau tùy thuộc vào các đầu ra mong muốn. Với một hệ thống cơ sở dữ liệu quan
hệ, bảng trở thành tập tin riêng, các hàng tương ứng với các hồ sơ (chiều rộng), và
cột đại diện cho trường dữ liệu hoặc biến (độ sâu) trong mỗi bản ghi.
Trong hình 6.7, ví dụ, mỗi hàng đại diện cho số lượng khách hàng là một
trường cụ thể; các thuộc tính thị trường sơ cấp, ví dụ, được chia thành các khu vực,
quốc gia và quốc tế. Mỗi cột có chứa các phân tích về mỗi khách hàng bằng nghề
nghiệp kinh doanh chính của họ (bánh kẹo, hóa chất, dược phẩm, vv). Các hàng và
cột gộp lại với nhau tạo thành các bảng, mà mô tả sơ lược hồ sơ khách hàng bằng
phân khúc ngành.
Bảng 6.7 Một cơ sở dữ liệu quan hệ cho thấy hồ sơ khách hàng bằng
phân đoạn ngành.



Cơ sở dữ liệu quan hệ cung cấp sự linh hoạt lớn hơn cơ sở dữ liệu chuỗi
trong việc kiểm tra nhiều mối quan hệ dữ liệu phức tạp. Ngoài ra, cơ sở dữ liệu
quan hệ cho phép các nhà phân tích xem xét tất cả các biến hoặc các trường dữ liệu
cùng một lúc chứ không phải là một biến tại một thời điểm. Nhìn chung, cơ sở dữ
liệu quan hệ là tốt nhất cho tình huống năng động trong đó các cơ sở dữ liệu phải
mở rộng theo thời gian và trong đó nhiều ứng dụng biến là cần thiết
Trong khi thảo luận này đã chỉ chạm vào chóp của tảng băng trơi trên cơng
nghệ cơ sở dữ liệu, nó sẽ cung cấp một sự hiểu biết cơ bản về các loại hệ thống cơ
sở dữ liệu có sẵn. Bây giờ chúng ta sẽ chuyển sự chú ý của chúng ta với lý do
chính đằng sau sự phát triển cơ sở dữ liệu: dữ liệu nhập kho.



×