Tải bản đầy đủ (.pdf) (52 trang)

Dự án kết thúc học phần bộ môn khoa học dữ liệu đề tài vận dụng thực tiễn vấn đề lập dự phòng nợ khó đòi trong gian lận báo cáo tài chính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.28 MB, 52 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>ĐẠI HỌC UEH </b>

<b>TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ </b>

<b>đòi trong gian lận báo cáo tài chính </b>

<b>Giảng viên giảng dạy : </b> ThS. Nguy n M nh Tuễ ạ <b>ấn </b> Ngô Nhung Huy n ề Dương Công Quyết

<b>Nguyễn Văn Quang Phú </b>

<i>Thành ph H ố ồ Chí Minh, ngày 18 tháng 12 năm 2022 </i>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

LỜI CẢM ƠN

Chúng em muốn gửi lời cảm ơn chân thành nhất đến Ths Nguyễn Mạnh. Tuấn Thầy. là người đã giúp chúng em tiếp cận và hiểu rõ hơn về bộ môn Khoa học dữ liệu.

Th y ầ đã giúp chúng em tích lũy thêm nhiều kiến thức, làm cơ sở để hoàn thành d án này. Cự ảm ơn thầy đã luôn tận tình hướng d n, ch b o chúng em cách ẫ ỉ ả thức để thực hiện dự án, để chúng em hoàn thành t t d án này. ố ự

Đặc bi t, nh s gi ng d y nhi t tình và tâm huy t c a th y trong su t quá ệ ờ ự ả ạ ệ ế ủ ầ ố trình học, chúng em đã họ ập và được t c ti p c n v i các ph n m m thú vế ậ ớ ầ ề ị như Word, Excel, Orange… Chúng em tin chắ ằng, đây sẽc r là nh ng hành trang vơ ữ cùng b ích cho ngh nghi p c a chúng em sau này. M t l n n a, chúng em xin ổ ề ệ ủ ộ ầ ữ gửi l i chân thành nhờ ất đến th y. ầ

Và cuối cùng, là những sinh viên năm hai - chưa có nhiều kinh nghiệm trong làm dự án. Do vậy, bài báo cáo cũng không tránh khỏi sai sót. Nên nhờ thầy bổ sung, sửa chữa những sai sót để chúng em có thể hồn thành tốt hơn ở những bài báo cáo tiếp theo.

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

NHẬN XÉT CỦA GIẢNG VIÊN

Nguyễn Phước Thiện 31211022161 100%

Nguyễn Vũ Nhật Hạ 31211024580 100%

Nguyễn Văn Quang Phú 31211024708 100%

Ngô Nhung Huyền 31211022916 100%

Dương Công Quyết 31211022149 100%

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>DANH M C B NG BI U, HÌNH NH MINH HO </b>ỤẢỂẢẠ

<b>BẢNG BIỂU </b>

Bảng 1. 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction ... 7 ả ả ấ ủ ộ ữ ệ Bảng 1. 2: B ng mô t c u trúc c a b d li u Audit risk ... 9 ả ả ấ ủ ộ ữ ệ

<b>HÌNH NH </b>Ả

Hình 2. 1: Minh ho ạ phương pháp hồi quy Losgistic ... 10

Hình 2. 2: Minh ho ạ phương pháp SVM (Support Vector Machine) ... 11

Hình 2. 3: Minh ho ạ phương pháp Neural Network ... 12

Hình 2. 4: Minh ho v thu t toán K-Means ... 13ạ ề ậ Hình 2. 5: Mơ t x lí d li u b m t ... 15ả ử ữ ệ ị ấ Hình 2. 6: Mơ t phân tách b d li u ... 16ả ộ ữ ệ Hình 2. 7: Mơ hình xây d ng Bài tốn 1 ... 20ự Hình 2. 8: K t qu ế ả đánh giá Bài tốn 1 theo Logistic Regression ... 21

Hình 2. 9: K t qu ế ả đánh giá Bài toán 1 theo Neural Network ... 22

Hình 2. 10: K t qu ế ả đánh giá Bài toán 1 theo SVM ... 22

Hình 2. 11: K t qu ế ả đánh giá Bài toán 1 và quyết định chọn phương pháp nghiên cứu ... 23

Hình 2. 12: K t qu d báo c a Bài toán 1 t Prediction ... 24ế ả ự ủ ừ Hình 2. 13: K t qu d báo v kho n ph i thu Bài toán 1 ... 25ế ả ự ề ả ả Hình 2. 14: Mơ hình xây d ng Bài tốn 2 ... 26ự Hình 2. 15: K t qu nghiên c u Bài toán 2 ... 26ế ả ứ Hình 2. 16 Mơ hình xây d ng Bài tốn 3 ... 28ự Hình 2. 17: Biểu đồ ự: s chênh l ch giệ ữa báo cáo điều tra và báo cáo tóm t t A ... 29ắ Hình 2. 18: S chênh l ch giự ệ ữa báo cáo điều tra và báo cáo tóm t t B ... 29ắ Hình 2. 19: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo A ... 30ị ủ ệ ủ Hình 2. 20: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo B ... 30ị ủ ệ ủ Hình 2. 21: Biểu đồ 5: T ng s ổ ố lượng khác bi t c a các báo cáo khác. ... 31ệ ủ Hình 2. 22: Biểu đồ 6: Giá tr khác bi t l ch s ... 32ị ệ ị ử Hình 2. 23: Biểu đồ 7: Ch s tiỉ ố ền liên quan đến sai sót ... 32 Hình 2. 24 B qua các thu c tính khác ngo i tr Audit risk ... 33ỏ ộ ạ ừ Hình 2. 25 Hình nh minh h a tìm k t qu có Audit risk > 1 ... 34ả ọ ế ả

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Hình 2. 26 K t qu Risk khi Audit risk > 1 ... 34ế ả Hình 2. 27: T ng h p biổ ợ ểu đồInherent_Risk, CONTROL_Risk, Detection_Risk, Audit_risk ... 35 Hình 2. 28 K t qu Mơ hình quy trình bài tốn ... 35ế ả Hình 2. 29: K t qu Test and Score ... 36ế ả Hình 2. 30: B ng k t qu c a ả ế ả ủ Confusion Matrix theo phương pháp Logistic Regression ... 37 Hình 2. 31: B ng k t qu c a Confusion ả ế ả ủ Matrix theo phương pháp SVM ... 38 Hình 2. 32: B ng k t qu cả ế ả ủa Confusion Matrix theo phương pháp Neutral Network ... 38 Hình 2. 33: B ng k t qu d báo ... 39ả ế ả ự Hình 2. 34: Bảng kết quả dự báo ... 40

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<b>MỤC L C </b>Ụ

CHƯƠNG 1: TỔNG QUAN DỰ ÁN ... 1

1. Tổng quan về Kiểm toán và Doanh nghiệp ... 1

1.1. Khái niệm Báo cáo tài chính ... 1

1.2. Nghiệp vụ kiểm tốn ... 1

<b>1.3. Thực trạng gian lận của các công ty hiện nay ... 3 </b>

2. Lý do chọn đề tài ... 4

<b>3. M c tiêu nghiên c</b>ụ <b>ứu ... 5 </b>

<b>4. Đối tượng nghiên cứu ... 6 </b>

<b>5. Mô t d li u và c u trúc d li</b>ả ữ ệ ấ <b>ữ ệu ... 6 </b>

<b>CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ K T QU</b>Ế Ả ... 10

1. Các phương pháp dự đoán và quy trình cụ<b> thể ... 10 </b>

<b>3.2 Bài tốn 1: D </b>ự đốn khả năng dự<b> phịng n ph</b>ợ <b>ải thu khó địi bị chi ph i b i các công ty </b>ố ở <b>trong gian l n Báo cáo tài chính.</b>ậ ... 18

<b>3.3. Bài tốn 2: Phát hi n gian l n kho n ph i thu c</b>ệ ậ ả ả <b>ủa các khách hàng có cùng tính ch t </b>ấ <b>trong báo cáo tài chính. ... 25 </b>

<b>3.4. Bài toán 3: Phát hiện các đặc điểm đặc thù dễ lợi d</b>ụng để<b> gian lận trong d liữ ệu ... 27 </b>

<b>3.5. Bài toán 4: Dự báo nguy cơ gian lận của các báo cáo tài chính ... 35 </b>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>4. Gi i pháp h n ch</b>ả ạ <b>ế gian l n trong báo cáo tài chính</b>ậ

<b>TÀI LI U THAM KH</b>Ệ <b>ẢO ... 45 </b>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b>CHƯƠNG 1: TỔNG QUAN DỰ ÁN </b>

<b>1. Tổng quan về Kiểm toán và Doanh nghiệp </b>

<b>1.1. Khái niệm Báo cáo tài chính </b>

Theo điều 3, Lu t k toán - 2015, ậ ế <i><b>“Báo cáo tài chính là hệ th ng thơng tin kinh </b></i>ố

<i><b>tế, tài chính c</b></i>ủa đơn vị ế<i><b> k toán </b></i>được lập theo biểu mẫu ghi trong chuẩn mực kế toán và ch ế độ ế k tốn. Báo cáo tài chính là <i><b>nhằm thu th p thơng tin</b></i>ậ ph n ánh tình hình tài ả chính, tình hình hoạt động và các lu ng ti n c a m t doanh nghi p, ph c v yêu c u ồ ề ủ ộ ệ ụ ụ ầ điều hành của chủ doanh nghiệp, cơ quan Nhà nước và nhu cầu cần thiết của cá nhân người dùng cho việc đề ra những quyết định kinh tế. Báo cáo tài chính cần bao gồm những thông tin sau: Tài s n, N ph i tr và V n ch s h u; Doanh thu, thu nh p ròng, ả ợ ả ả ố ủ ở ữ ậ chi phí kinh doanh và chi phí hoạt động; Lãi, l và phân ph i k t qu kinh doanh; Các ỗ ố ế ả luồng ti n. Ngồi ra, doanh nghiề ệp cũng giải thích rõ hơn các chỉ tiêu đã thể ệ hi n trên báo cáo tài chính h p nh t và m t s chính sách kợ ấ ộ ố ế toán đã áp dụng trên “Bản thuy t ế minh báo cáo tài chính nh m xác nh n nh ng nghi p v kinh t hình thành, l p và trình ” ằ ậ ữ ệ ụ ế ậ bày báo cáo tài chính. ”<small>1</small>

<b>1.2. Nghiệp vụ kiểm toán </b>

Kiểm toán là c quá trình tìm kiả ếm và xem xét, đánh giá những b ng ch ng có ằ ứ liên quan đến thơng tin tài chính của doanh nghiệp, tổ chức nhằm xác định và so sánh mức độ phù hợp giữa các thơng tin đó đố ới các chu n mi v ẩ ực đã được thi t l p. ế ậ

Kiểm tốn viên có vai trị xem xét báo cáo tài chính và xác định s minh b ch ự ạ của báo cáo tài chính căn cứ trên việc đánh giá đó. Kết quả của hoạt động này thể hiện bằng nh n xét và ý ki n cậ ế ủa kiểm toán viên đối với Báo cáo kiểm toán.

Báo cáo ki m tốn s phân tích các vể ẽ ấn đề ụ ể ễ c th di n ra trên báo cáo tài chính, như việc khơng thực hiện chuẩn mực, thơng tin khơng đầy đủ, hay có sự hạn chế của

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

quá trình sốt xét. Trong q trình sốt xét, ki m tốn viên s phân tích khể ẽ ả năng phát triển b n v ng c a doanh nghi p. ề ữ ủ ệ

Nếu phát hi n có hành vi không tuân th pháp luệ ủ ật theo quy định, ki m toán viên ể phải t cáo v hành vi trên vố ề ới b t kấ ỳ cơ quan nhà nước có th m quy n hay trình báo ẩ ề với đại diện chủ sở hữu của đơn vị được ki m tốn cùng mể ột số đối tượng bên ngồi đơn vị được kiểm toán. N u nghi ng có hành vi khơng tn th pháp luế ờ ủ ật và quy định, kiểm toán viên s hoàn thành mẽ ột s th tố ủ ục điều tra khác để ch ng minh rõ s nghi ứ ự ngờ trên. Đây là một trong những trách nhiệm của kiểm toán viên đối với gian lận và sai sót.

- Gian lận trên báo cáo tài chính:

Ủy ban Kiểm tốn viên nội bộ của M (2004) cho rằỹ ng: Gian l n báo cáo tài ậ chính (BCTC) liên quan đến việc lãnh đạo các cấp cố tình trình bày sai hoặc trình bày khơng thích h p hoợ ặc che đậy nh ng sai phữ ạm liên quan đến BCTC.

Trong khi đó, theo Hiệp hội các nhà điều tra gian lận, gian lận trên BCTC là trường h p các thông tin trên BCTC b bóp méo, phản ánh khơng trung thực tình hình ợ ị tài chính c a doanh nghi p (DN) m t cách c ý nhủ ệ ộ ố ằm lường gạt ngườ ử ụi s d ng thơng tin. Trong s các hình th c gian l n trên, các nhà nghiên c u t p trung nhi u vào gian ố ứ ậ ứ ậ ề lận v l p BCTC. ề ậ

Như vậy, gian lận trên BCTC là sự trình bày sai lệch có chủ định các thơng tin trên BCTC, do m t hoộ ặc nhiều người trong Ban Giám đốc công ty, các nhân viên ho c ặ bên th ba th c hi n. ứ ự ệ

Những dấu hiệu gian lận Báo cáo tài chính bao gồm:

- Doanh thu tăng trưởng cao bất thường so với các công ty cùng ngành nghề - Lượng hàng bán bị trả lại cao hơn so với các công ty cùng ngành nghề và so với quá khứ: Bình thường, hàng bán sẽ bị trả lại khi chất lượng kém, không đạt yêu cầu trong hợp đồng đã cam kết. Tuy nhiên, một số công ty dùng những khoản này để che đậy các khoản doanh thu ảo được ghi nhận trong kỳ kế toán trước.

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

- Giá trị doanh thu của 1 quý cao một cách bất thường so với các quý còn lại và so với cùng ký năm trước: thông qua dấu hiệu này, có thể một số doanh nghiệp đã thực hiện gian lận ghi nhận doanh thu ảo để đạt được những mục đích khác của cơng ty như là niêm yết hoặc chuẩn bị hồ sơ đấu thầu, kêu gọi vốn đầu tư,...

- Sự tăng lên trong các khoản phải trả và sự giảm đi trong hàng tồn kho và các khoản phải thu: dấu hiệu này cho thấy sự thu hẹp về quy mô doanh nghiệp, giảm sút về hiệu quả kinh doanh trong khi các khoản chi phí, phải trả lại tăng lên, dự đoán một dấu hiệu bất thường về khả năng chi trả, thanh toán các khoản nợ của doanh nghiệp. Ngồi những đặc điểm trên, cịn có th ể xác định sai ph m b ng nhi u cách khác ạ ằ ề nhau, nhưng việc áp dụng thực tiễn kiểm toán vào thực tế yêu cầu một nhà nghiên cứu phải tìm được phương pháp để dễ dàng sử dụng và tiếp cận đối với các dự đoán của sự gian l n trên báo cáo tài chính. ậ

<b>1.3. Thực trạng gian lận của các công ty hiện nay </b>

Ngày nay, sai ph m báo cáo tài chính trên th gi i nói chung và Vi t Nam nói ạ ế ớ ệ riêng đã xuất hiện và đang trở thành vấn đề đáng lưu tâm của cả doanh nghiệp, chính phủ và cộng đồng nhà đầu tư. Và trong bố ải c nh ngày nay, quá trình l a ch n thông tin ự ọ đăng tải trên báo cáo tài chính đã chứng tỏ vai trị cần thiết cho nhà quản lý và doanh nghiệp. Vi t Nam, hiỞ ệ ện tượng cách bi t gi a nhệ ữ ững báo cáo tài chính trước và sau kiểm toán đã tạo thành tâm lý quan ngại. Đặc biệt v vi c gian l n báo cáo tài chính g n ụ ệ ậ ầ đây của cơng ty Cổ phần tập đồn FLC cùng công ty Cổ phần NTACO tại một loạt các công ty thành viên n m trên sàn ch ng khằ ứ oán đã bị phanh phui đã tăng thêm tâm lý nghi ngờ đối với nhà đầu tư sẽ ảnh hưởng tiêu cực hơn cho hoạt động c a thủ ị trường v n. ố

Các doanh nghi p ngày càng s d ng nhi u th thu t gian l n báo cáo tài chính ệ ử ụ ề ủ ậ ậ tinh vi, như là tăng vốn ảo thông qua sử dụng các cơng ty con cịn gọi tắt là SPE, điều chỉnh doanh thu, l i nhu n thông qua SPE, th c hi n các giao d ch khợ ậ ự ệ ị ống để rút ti n ề vay ngân hàng thơng qua SPE và cịn r t nhi u hình th c gian l n khác. ấ ề ứ ậ

Đây là một thực trạng đáng quan ngại mà chúng ta cần ngăn chặn ngay từ bây giờ.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>1.4. Yêu cầu của ngành </b>

Trong đạo đức nghề nghiệp, người làm kế toán cũng như kiểm toán phải trung thực, khách quan, thận trọng, bảo mật và đảm bảo năng lực chuyên môn. Và công việc của những người làm kiểm toán liên quan đến quyết định kinh tế của rất nhiều người sử dụng thơng tin, theo đó u cầu đặt ra đối với kiểm tốn viên là ngồi các thông tin cần phải công bố theo đúng quy định nghề nghiệp và yêu cầu của pháp luật thì thơng tin cịn cần phải được bảo mật để bảo vệ quyền lợi doanh nghiệp cũng như các bên liên quan.

Ngoài ra, xét trên phương diện tổng thể, kiểm tốn viên có trách nhiệm đảm bảo hợp lý rằng liệu báo cáo tài chính có cịn sai sót trọng yếu do gian lận hoặc nhầm lẫn hay khơng. Nếu phát hiện có hành vi không tuân thủ pháp luật và các quy định, kiểm toán viên phải báo cáo những hành vi này với các cơ quan nhà nước có thẩm quyền, thông báo với đại diện chủ sở hữu của đơn vị được kiểm toán và các đối tượng bên ngồi đơn vị được kiểm tốn (nếu có). Đồng thời, kiểm toán viên phải thực hiện các thủ tục kiểm toán bổ sung để làm rõ những nghi ngờ này.

<b>2. Lý do chọn đề tài </b>

Trong n n kinh t thề ế ị trường, thông tin, đặc bi t là thơng tin v tài chính chi m ệ ề ế phần quan tr ng trong viọ ệc đưa ra các quyết định kinh tế của các nhà đầu tư, các doanh nghiệp. Vi c nh ng thông tin bệ ữ ị sai l ch s dệ ẽ ẫn đến nhiều nguy cơ, rủi ro đố ới nhi u i v ề đối tượng sử dụng trong nền kinh tế. Vì vậy việc xác thực, minh bạch trong các thơng tin tài chính là m t trong nh ng vộ ữ ấn đề được quan tâm hàng đầu.

Tại Vi t Nam, hiệ ện nay cũng xảy ra khơng ít v gian l n trong các báo cáo tài ụ ậ chính. Việc khơng phát hiện ra được các sai sót, gian l n này là do nhiậ ều lí do trong đó trách nhi m m t ph n thu c v các ki m tốn viên và các cơng ty ki m toán. Tuy nhiên, ệ ộ ầ ộ ề ể ể vì đây là một lĩnh vực khá mới mẻ đối với nước ta nên trình độ chuyên môn, các kiến thức liên quan đến chuyên ngành cũng như là một số các chu n m c trên th gi i ta v n ẩ ự ế ớ ẫ chưa theo kịp. Hành lang v pháp lý cho vi c th c hi n ki m tốn t i Vi t Nam v n cịn ề ệ ự ệ ể ạ ệ ẫ nhiều b t c p. ấ ậ

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Về hậu quả mà một sai lầm tỏn báo cáo tài chính để lại đối với các yếu tố không thuộc về công ty như các nhà đầu tư, những người cho vay và cơ quan thuế là rất lớn đối với các nhà đầu tư, khi xuất hiện gian lận báo cáo tài chính thì các nhà đầu tư sẽ đánh giá quá cao hoặc quá thấp nguồn lực của công ty và điều này sẽ gây nên sự e dè cho các nhà đầu tư, gây ảnh hưởng đến khả năng sinh lời và vốn đầu tư. Đối với người cho vay, khi việc gian lận báo cáo tài chính dẫn đến việc doanh nghiệp mất khả năng thanh toán nợ điều này sẽ gây tồn đọng những khoản nợ xấu đối với người cho vay, ngân hàng và các tổ chức tín dụng. Đối với cơ quan thuế, thì việc gian lận báo cáo tài chính sẽ làm giảm số thuế mà doanh nghiệp phải nộp (thuế thu nhập doanh nghiệp, thuế tiêu thụ đặc biệt,...) gây giảm thu ngân sách quốc gia và ảnh hưởng xấu đến sự tăng trưởng đến tăng trưởng và thu nhập của quốc gia đó.

Chung quy lại, việc gian lận báo cáo tài chính đều sẽ gây ra những hậu quả nghiêm trọng cho từng cá nhân tổ chức là nạn nhân và rộng hơn nữa là sự tăng trưởng và thịnh vượng của quốc gia đó. Vì vậy, việc nâng cao chất lượng hoạt động kiểm toán độc lập, tăng cường trách nhiệm lẫn khả năng chuyên môn dành cho các kiểm toán viên trong việc phát hiện những sai sót, gian lận trong báo cáo tài chính là một vấn đề hết sức cấp bách và thời sự nhằm nâng cao tính minh bạch, thơng tin đáng tin cậy dành cho các đối tượng sử dụng trong nền kinh tế. Dự án tập trung ứng dụng khoa học dữ liệu vào việc phát hiện các sai lầm trong dữ liệu từ các báo cáo tài chính từ đó có thể giúp các tốn viên dễ dàng phân tích, dự đốn các hướng đi cũng nhưng khả năng phát triển bền vững của doanh nghiệp

<b>3. M c tiêu nghiên c u </b>ụ ứ

Mục tiêu nghiên cứu của đề tài tương ứng với b n bài toán c n gi i quy t ố ầ ả ế

<i><b>❖ Bài toán 1: D </b></i>ự đốn kh ả năng khoản dự phịng n phợ ải thu khó địi bị chi phối bởi các công ty trong gian l n Báo cáo tài chính ậ

<i><b>❖ Bài tốn 2: Phát hi n gian l n kho n ph i thu c a các khách hàng có cùng </b></i>ệ ậ ả ả ủ tính ch t trong Báo cáo tài chính. ấ

<i><b>❖ Bài toán 3: Phát hi</b></i>ện các đặc điểm đặc thù d l i dễ ợ ụng để gian l n trong ậ dữ li u ệ

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<i><b>❖ Bài toán 4: D </b></i>ự báo nguy cơ gian lận c a các báo cáo tài chính ủ

<b>4. Đối tượng nghiên c u </b>ứ

Dự án c a nhóm chúng tơi nh m nghiên c u v Gian l n trong báo cáo tài chính ủ ằ ứ ề ậ của các công ty được niêm yết trên th ị trường ch ng khoán Vi t Nam. ứ ệ

<b>5. Mô t d li u và c u trúc d li u </b>ả ữ ệ ấ ữ ệ

Nguồn d li u mà nhóm thu th p phữ ệ ậ ục vụ cho nghiên c u: ứ

• Bộ d li u v thanh tốn tài chính D báo khữ ệ ề – ự ả năng thanh toán khoản ph i thu: ả Bộ d li u dữ ệ ự đoán khả năng gian lận trong Báo cáo tài chính c a ủ Kiểm toán:

Hai b d liộ ữ ệu được lấy t Kaggle và UCI, là nh ng ngu n thu thừ ữ ồ ập đáng tin cậy được dùng trong nghiên c u và h c t p. Nhóm s d ng b d li u th nhứ ọ ậ ử ụ ộ ữ ệ ứ ất để gi i quy t ả ế hai bài toán 1 và 2, đối với bộ dữ liệu thứ 2 dùng nó vào giải quyết bài toán 3 và 4. Từ việc ng d ng b d li u vào gi i quyứ ụ ộ ữ ệ ả ết bài tốn đặt ra, chúng ta có th thể ấy được mối tương quan giữa <b>Khoản d phòng n ph i thu </b>ự ợ ả <b>khó địi ới Gian l n trong Báo cáo </b> v ậ

<b>tài chính và đưa ra kết luận cuối cùng cho bài Dự án nghiên cứu của nhóm. Cấu trúc c a hai b d li u: </b>ủ ộ ữ ệ

▪ Finance Factoring IBM Late Payment Histories. Accounts Receivable – Data Predict which customers will pay fastest. –

(Khoản thanh tốn tài chính L ch s thanh toán tr c a IBM. D li u tài kho n – ị ử ễ ủ ữ ệ ả phải thu D báo khách hàng thanh toán nhanh nh t) – ự ấ

1 Country Code Mã s quố ốc gia Số nguyên 2 Customer ID Mã khách hàng Chuỗi ký t ự

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

3 Paperless Date Ngày không cần gi y t ấ ờ Ngày tháng 4 Invoice Number Số hiệu hóa đơn Số nguyên 5 Invoice Date Ngày trên hóa đơn Ngày tháng 6 Due Date Ngày đáo hạn thanh toán Ngày tháng 7 Invoice Amount Số tiền hóa đơn – Giá trị thanh toán Số nguyên 8 Disputed Tranh chấp:

Khoản phải thu này có được tr ả đúng thời h n hay không, n u x y ra tranh ạ ế ả chấp ph i l p 1 kho n d phòng cho ả ậ ả ự khoản ph i thu này. ả

Có ho c Khơng ặ (Yes or No)

9 Settled Date Ngày giải quy t ế Ngày tháng 10 Paperless Bill Hóa đơn không giấy tờ Chuỗi ký t ự 11 Days To Settle Thời gian gi i quy t ả ế Số nguyên 12 Days Late Số ngày tr h n thanh toán ễ ạ Số nguyên

<i><b>Bảng 1. 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction </b></i>ả ả ấ ủ ộ ữ ệ

Sự khác biệt được tìm thấy trong kế hoạch kiểm tra và báo cáo

tóm tắt của A <sup>Số khơng ngun </sup> Score_A Điểm của A Số không nguyên Risk_A Rủi ro của A Số không nguyên

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

PARA_B

Sự khác biệt được tìm thấy trong kế hoạch kiểm tra và báo cáo

tóm tắt của B <sup>Số không nguyên </sup> Score_B Điểm của B Số không nguyên Risk_B Rủi ro của B Số không nguyên

TOTAL Tổng số lượng chênh lệch được

tìm thấy trong các báo cáo khác <sup>Số không nguyên </sup> numbers Những khác biệt trong lịch sử Số thực Score_B Điểm của B Số không nguyên Risk_C Rủi ro của C Số không nguyên Money_Value Gía trị tiền Số khơng ngun Score_MV Điểm của MV Số không nguyên Risk_D Rủi ro của D Số không nguyên District_Loss Dữ liệu của quận bị mất Số thực PROB Vấn đề Số không nguyên Risk_E Rủi ro của E Số không ngun History Lịch sử Có hoặc khơng Prob Vấn đề Số không nguyên Risk_F Rủi ro của F Số không nguyên Score Điểm số Số không nguyên

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Inherent_Risk Rủi ro tiềm tàng Số khơng ngun CONTROL_RISK Rủi ro kiểm sốt Số không nguyên Detection_Risk Rủi ro phát hiện Số không nguyên Audit_Risk Rủi ro kiểm tốn Số khơng ngun Risk Rủi ro Có hoặc khơng

<i><b>Bảng 1. 2: B ng mô t c u trúc c a b d li u Audit risk </b></i>ả ả ấ ủ ộ ữ ệ

Audit Risk = Inherent Risk × Control Risk × Detection Risk (%)

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ KẾT QUẢ</b>

<b>1. Các phương pháp dự đoán và quy trình cụ thể 1.1 Phân l p d li u </b>ớ ữ ệ

Phân l p d li u là m t chớ ữ ệ ộ ức năng khai thác dữ ệ li u chỉ định các m c trong ụ một t p hậ ợp cho các danh m c ho c l p mụ ặ ớ ục tiêu. Mục tiêu c a phân lủ ớp d li u là ữ ệ dự đốn chính xác lớp mục tiêu cho từng trường hợp trong dữ liệu. Ví dụ, một mơ hình phân lo i có th ạ ể được sử ụng để xác đị d nh những người xin vay là r i ro tín. ủ

<b>Phương pháp hồi quy logistic (Logistic Regression) </b>

Phương pháp hồi quy logistic là một phương pháp dựa vào xác suất để ểm đị ki nh tính hi u qu c a các mơ hình phân lo i d liệ ả ủ ạ ữ ệu mang tính đặc thù. Là mơ hình d cài ễ đặt, dễ huấn luyện, phân loại nhanh và dễ diễn giải kết quả ( tuy nhiên ch áp dụng v i ỉ ớ các bi n r i r c). ế ờ ạ

<i><b>Hình 2. 1: Minh ho </b></i>ạ phương pháp hồ<i><b>i quy Losgistic </b></i>

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

Phương pháp SVM (Support Vector Machine)

Đây là một thuật toán chuyên sâu được giám sát để phân loại hoặc h i quy các ồ nhóm d li u. Trong trí tu nhân t o và h c máy, m t h th ng hữ ệ ệ ạ ọ ộ ệ ố ọc có giám sát được cung c p d liấ ữ ệu đầu vào và đầu ra và được gắn nhãn để phân lo i. S phân lo i này ạ ự ạ cung cấp cơ sở nghiên c u cho vi c x lý d liứ ệ ử ữ ệu trong tương lại. Máy vecto h tr ỗ ợ được sử dụng để ếp hạng hai bộ dữ liệu vào các danh m x ục tương tự nhau. Thuật tốn vẽ các đường siêu ph ng trong khơng gian nhi u chiẳ ề ều để tách nhóm theo chế độ.

<b> Phương pháp Neural Network </b>

Đây là chuỗi thuật tốn nhằm tìm kiếm quan hệ trong tập hợp dữ liệu hệ thống dựa theo cách thức hoạt động não bộ con người.

<i><b>Hình 2. 2: Minh ho </b></i>ạ phương pháp SVM (Support Vector Machin<i><b>e) </b></i>

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<i><b>Hình 2. 3: Minh ho </b></i>ạ phương pháp Neural Network

<b>1.2 Phân c m d li u </b>ụ ữ ệ

Phân c m d li u là q trình phân cụ ữ ệ ụm/nhóm các đối tượng/dữ liệu có đặc điểm tương tự thành các cụm/nhóm tương tự. Trong đó: Các đối tượng trong cùng một cụm sẽ có các thu c tính giộ ống nhau, trong khi các đối tượng thu c các c m/nhóm khác nhau ộ ụ sẽ có các thuộc tính khác nhau.

Đặc điểm:

• Nhiệm vụ chính là tìm và đo lường s khác bi t giự ệ ữa các đối tượng d li u ữ ệ • Phân c m thuụ ộc nhóm phương pháp học không giám sát, do không bi t ế

trước số ợlư ng nhóm (khác v i bài tốn phân l p) ớ ớ

<b>Thuật tốn K-means: Thu c nhóm thu t tốn phân c m d</b>ộ ậ ụ ựa trên phân hoạch.

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<i><b>Hình 2. 4: Minh ho v thu t toán K-Means </b></i>ạ ề ậ

<b>Các bước quy trình c a K-means </b>ủ

Bước 1: Xử lý dữ liệu: Loại bỏ các hàng có dữ liệu bị khuyết Bước 2: Chọn k điểm bất kỳ làm các trung tâm ban đầu của k cụm.

Bước 3: Phân mỗi điểm dữ liệu vào cụm có trung tâm gần nó nhất. Nếu các điểm dữ liệu ở từng cụm vừa được phân chia không thay đổi so với kết quả của lần phân chia trước nó thì ta dừng thuật toán.

Bước 4: Cập nhật lại trung tâm cho từng cụm: Lấy trung bình cộng của tất các các điểm dữ liệu đã được gán vào cụm đó sau khi phân chia ở bước 2.

Bước 5: Quay lại bước 2.

<b>Các bước quy trình của SVM, NN, LR: </b>

Bước 1: Nhập dữ liệu cần huấn luyện vào orange.

Bước 2: Nối widget dữ liệu huấn luyện và SVM, NN, LR với Test and score, sau đó nối widget vào Confusion Matrix để thực hiện đánh giá kết quả và đánh giá ma trận nhầm lẫn.

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

Bước 3: Sau khi chọn được phương pháp dự báo tốt nhất, nối dữ liệu huấn luyện vào SVM, hoặc NN, hoặc LR. Đồng thời nhập dữ liệu dùng để dự báo vào orange.

Bước 4: Liên kết phương pháp dự báo tốt nhất và dữ liệu dự báo với Predictions để đánh giá và phân loại dữ liệu đầu vào.

Bước 5: Xuất kết quả dự báo bằng Data Table

<b>2. Tìm hi u v d li u </b>ể ề ữ ệ

<b>2.1 Phân tính d li u </b>ữ ệ

<b>Đối với bộ dữ liệu Audit risk: </b>

+ Mỗi hàng đại diện cho một doanh nghiệp và mỗi cột chứa các thuộc tính khác nhau của đối tượng.

+ Dữ liệu thô chứa 776 hàng (đối tượng) và 25 cột (đặc trưng)

+ Trong bảng dữ liệu về các thuộc tính, nhóm nhận thấy rằng 5 thuộc tính chính, có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của một số doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk (Rủi ro kiểm toán), Risk (Nguy cơ gian lận).

Trong đó Audit_Risk = Inherent Risk x Control Risk x Detection Risk vì vậy Audit risk là target (biến phụ thuộc) sẽ ảnh hưởng phần lớn đến nguy cơ doanh nghiệp có gian lận (Risk1) hoặc khơng gian lận (Risk0).

Ta có thể thấy từ bộ dữ liệu, nhóm doanh nghiệp có nguy cơ gian lận trong kiểm tốn khi nhóm doanh nghiệp đó có chỉ số của những biến Audit risk càng cao (lớn hơn 1). Mặt khác, các chỉ số càng nhỏ (bé hơn 1) thì doanh nghiệp khơng có nguy cơ gian lận.

<b>Đối với bộ dữ liệu Account Receivable Prediction </b>

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

<b>+ Mỗi hàng đại diễn cho 1 đơn vị, khoản lập dự phòng phải thu và mỗi cột chứa </b>

các thuộc tính khác nhau của đối tượng

+ Dữ liệu thô chứa 2466 hàng (đối tượng) và 12 cột (đặc trưng)

+ Mỗi đơn vị bao gồm những thuộc tính Disputed, Invoice Date, Due Date, Settled Date, country Code, customer ID, paperless Date, invoice Number, Invoice Amount, Paperless Bill, DaysToSettle, DaysLate thể hiện thông tin chi tiết về khoản lập dự phịng của nợ khó địi.

<b>2.2 Ti n x lý d li u </b>ề ử ữ ệ

Hai trang web <b>archive.ics.uci.edu</b> và <b>kaggle.com đượ</b>c nhóm s d ng trong ử ụ việc ch n d li u cho 4 bài toán. ọ ự ệ

B d li u Audit risk mà nhóm tộ ữ ệ ừ trang archive.ics.uci.edu để nghiên c u phát ứ hiện gian l n các c t d li u hay thông tin c n thi t không b thi u, b mậ ộ ữ ệ ầ ế ị ế ị ất nên nhóm đã bỏ qua bước tiền x lý d liử ữ ệu đố ớ ộ d li u này. i v i b ữ ệ

Đố ới b d li u Account Receivable Prediction do d li u khá l n và m t s i v ộ ữ ệ ữ ệ ớ ộ ố dữ li u b thi u ho c b m t, chính vì vệ ị ế ặ ị ấ ậy nhóm đã dùng chức năng preprocessing để xố b các hàng có chị ứa các dữ ệ li u b m t. ị ấ

<i><b>Hình 2. 5: Mơ t x lí d li u b m t </b></i>ả ử ữ ệ ị ấ

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<b>2.3 Phân tách d li u </b>ữ ệ

- Trong bài nghiên cứu, nhóm đã sử dụng cơng cụ Data Sampler để tách dữ liệu gốc t 2 bừ ộ d liữ ệu “Audit_risk” và “Account Receivable Prediction” thành hai file riêng bi t: 70% c a m i b d liệ ủ ỗ ộ ữ ệu đượ ử ụng đểc s d làm d li u m u cho mơ hình phân ữ ệ ẫ lớp d li u, 30% c a d li u còn l i cữ ệ ủ ữ ệ <b>ạ ủa mỗ ộ được dùng trong dự báo. </b>i b

<i><b>Hình 2. 6: Mô t phân tách b d li u </b></i>ả ộ ữ ệ

<b>3. Th c nghi m </b>ự ệ

<b>3.1 Ki n th c chuyên ngành </b>ế ứ

<b> </b>Một<b> là,</b> bằng cách vận dụng các kiến thức đã học và kiến thức vế kế toán – kiểm toán về các khoản phải thu và dự phịng nợ phải thu khó địi, tiêu biểu là các

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

nguyên tắc kế toán trong hệ thống kế toán theo VAS(chuẩn mực kế toán Việt Nam) như thận trọng, trọng yếu.

<b> Hai là, sử dụng c</b>ác công thức sử dụng trong Bảng cân đối kế toán:

<b>Tài sản = Nợ phải trả + Vốn Chủ sở hữu </b>

Khoản phải thu thuần = Khoản phải thu – Dự phịng phải thu khó địi Ngày nay, các thủ thuật gian lận trong Báo cáo tài chính ngày càng nhiều, thủ thuật và tinh vi hơn các công ty thường sử dụng một số cách như ghi nhận sai doanh thu, che dấu các công nợ và chi phí, nhằm một số mục đích như thu hút đầu tư, trốn thuế…., và một trong những yếu tố quan trọng mà nhóm nhắc đến ở đây là khoản Dự phòng các khoản phải thu, thông thường vào cuối năm các công ty sẽ lập các khoản dự phịng phải thu khó địi, và một số doanh nghiệp sẽ định giá cao nợ phải thu khó địi => Số thực tế phải thu thấp hơn, tăng chi phí => Tài sản cơng ty thấp hơn so với thực tế và làm giảm vốn chủ sở hữu, bên cạnh đó làm thu nhập trước thuế thấp hơn, gây ra khả năng cao các doanh nghiệp trốn thuế. Các doanh nghiệp còn dùng cách này để điều khiển thu nhập sau thuế theo nhịp độ tăng dần đều để khiến cho các nhà đầu tư thấy rằng công ty đang phát triển rõ rệt.

Như vậy, nhóm sẽ thực hiện phân nhóm giữa các khách hàng có cùng tính chất và so sánh các chỉ tiêu với nhau thơng qua chạy mơ hình trên phần mềm Orange để từ đó cho thấy ảnh hưởng của Khoản phải thu trong Báo cáo tài chính

<b>Ba là, ằng cách vận dụng các kiến thức đã học và kiến thức vế kế toán –</b> b kiểm toán xem xét các hành vi gian lận trong việc làm sai lệch kết quả báo cáo tài chính, nhận biết được Rủi ro kiểm tốn và các yếu tố ảnh hưởng đến nó.

<b>Audit Risk (Rủi ro kiểm tốn): là</b>rủi ro do q trình kiểm tra và đánh giá, đưa ra ý kiến của kiểm tốn viên khơng phản ánh đúng hay sai lệch khi Báo cáo tài chính được kiểm tốn mà cịn chứa đựng những sai sót trọng yếu.”

<b>Audit Risk = Inherent Risk × Control Risk × Detection Risk </b>

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

Trong những cột dữ liệu về những thuộc tính, nhóm cho rằng 5 thuộc tính chính, tổng hợp từ những đặc trưng cịn lại, có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của các doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm

<b>soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk (Rủi ro kiểm toán) (Với Audit </b>

<b>Risk = Inherent Risk × Control Risk × Detection Risk) là yếu tố quan trọng quyết </b>

định đến Risk, Risk (Nguy cơ gian lận) cho kết quả Risk (1) nguy cơ doanh nghiệp có gian lận và Risk (0) nguy cơ doanh nghiệp khơng gian lận.

Nhìn chung từ bộ dữ liệu, hầu hết nhóm doanh nghiệp có chỉ số của những biến, InherentRisk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk càng nhỏ (bé hơn 1) thì đa số kết quả của biến Risk là 0 (doanh nghiệp khơng có nguy cơ gian lận). Ngược lại, chỉ số biến Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk của nhóm doanh nghiệp thể hiện trên bộ dữ liệu càng cao (lớn hơn 1) thì kết quả xảy ra ở biến Risk là 1 (doanh nghiệp có nguy cơ gian lận)

Ngồi các thu c tính chính trên cịn có các thuộ ộc tính sau cũng khơng kém phần quan tr ng trong kiọ ểm tra và đánh giá việc gian l n trong ki m toán: ậ ể <b>Numbers (Giá tr ịkhác bi t l ch s ), District Loss</b>ệ ị ử (Tổn thất mà doanh nghiệp trong quận phải chịu trong

<b>10 năm qua), Money value (Số tiền của những sai phạm của kiểm tốn trong q khứ… </b>

Và thơng qua các đặc thù tác động yếu tố rủi ro sẽ giúp cho doanh nghiệp có cách nhìn khách quan hơn và đưa ra các giải pháp nhằm hạn chế rủi ro gian lận trong kiểm toán. V r i ro gian l n trong ki m tốn, khơng chể ủ ậ ể ỉ ph thu c vào m t thu c tính ụ ộ ộ ộ duy nhất như Audit_Risk mà bởi tất cả những thuộc tính được đưa ra, ngồi ra cịn có những yếu tố ngoại cảnh mà dữ liệu không thể cho thấy.

<b>3.2 Bài toán 1: D </b>ự đoán khả năng dự<b> phịng n ph</b>ợ ải thu khó địi bị<b> chi ph i </b>ố

<b>bởi các công ty trong gian l n Báo cáo tài chính. </b>ậ

<b>a) Mơ t bài tốn</b>ả

Gian lận trên Báo cáo tài chính là trường hợp các thông tin được đưa ra trên bản báo cáo tài chính b bóp méo, ph n ánh khơng trung th c tình hình tài chính m t cách ị ả ự ộ

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

cố ý nh m l a gằ ừ ạt ngườ ử ụi s d ng thông tin. Nh m mằ ục đích trụ ợ ủc l i c a mình, m t s ộ ố công ty đã sử dụng một số thủ thuật như: che dấu công nợ, chi phí; ghi nhận doanh thu khơng có th t hay khai kh ng doanh thu (l p ch ng t gi mậ ố ậ ứ ừ ả ạo); định giá sai tài sản… Tại đây, nhóm đề cập t i <b>ớ khoản d phòng ph i thu n </b>ự ả ợ khó địi – khoản dự phòng này được ghi nh n b i tài kho n 2293 (D phòng phậ ở ả ự ải thu khó địi) đồng thời tài kho n 642 ả (Chi phí qu n lý doanh nghi p). Có th nh n th y, vi c l p d phòng m t kho n n ph i ả ệ ể ậ ấ ệ ậ ự ộ ả ợ ả thu sẽ tác động t i <i><b>ớ hai y u t</b></i>ế <b>ố Tài sản</b> và <b>Chi phí</b> trong Báo cáo tài chính. Vi c c ý ệ ố làm trái quy định v vi c ghi nh n Kho n d phòng phề ệ ậ ả ự ải thu khó địi tạo nên tình trạng phóng đại doanh thu và lờ đi khoản chi phí hoặc ngượ<b>c lại, khiến Lợi nhu</b>ận trướ<b>c và sau thuế c a công ty b thao túng. T</b>ủ ị ừ đó, những ngườ ử ụi s d ng b n báo cáo tài chính ả của nh ng doanh nghiữ ệp này để có cái nhìn t ng qt cho mổ ục đích đầu tư, quản tr s ị ẽ có đánh giá lệch chu n và bất l i. ẩ ợ

Vậy nên, ở đây nhóm sử ụ d ng b d li u: <i>ộ ữ ệ Khoản thanh tốn tài chính L ch s </i>– ị ử

<i>thanh toán tr c a IBM. D li u tài kho n ph i thu D báo khách hàng thanh toán </i>ễ ủ ữ ệ ả ả – ự

<i>nhanh nh t </i>ấ để xem xét khả năng sai sót trong dự báo kho n phả ải thu khó địi của các cơng ty.

<b>b) Ch y mơ hình và k t qu </b>ạ ế ả

<b>- Xây d ng mơ hình </b>ự

Sau bước xử lý tiền dữ liệu (Chọn thuộc tính <b>Disputed</b> làm <b>biến phụ thuộc ử </b>, x lý d li u khuy t thi u, phân tách d li u t o hai bữ ệ ế ế ữ ệ ạ ộ để làm d li u hu n luy n và d ữ ệ ấ ệ ữ liệu d báo), chúng ta ti n hành phân lự ế ớp d liữ ệu để ự d báo nh ng khách hàng nào s ữ ẽ có khoản phải thu khó địi.

Tại đây chúng ta sử ụng 3 phương pháp Hồ d i quy logistic (Logistic Regression), Support Vector Machine (SVM), Neural Network để đánh giá xem phương pháp nào hiệu qu nh t và ng dả ấ ứ ụng nó d báo. ự

</div>

×