Μεθοδολογία ελέγχου οικονομικών δεδομένων μέσω μηχανικής μάθησης

Methodology for auditing economic data through machine learning (Αγγλική)

  1. MSc thesis
  2. Γιακουμής, Ιπποκράτης
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 24 Σεπτεμβρίου 2022 [2022-09-24]
  5. Ελληνικά
  6. 104
  7. ΡΕΦΑΝΙΔΗΣ, ΙΩΑΝΝΗΣ
  8. ΜΑΥΡΟΜΜΑΤΗΣ, ΓΕΩΡΓΙΟΣ | ΤΑΜΠΟΥΡΗΣ, ΕΥΘΥΜΙΟΣ
  9. Μηχανική Μάθηση | οικονομικός έλεγχος | κατηγοριοποίηση δεδομένων | έλεγχος οικονομικών δεδομένων
  10. 2
  11. 5
  12. 18
  13. Περιέχει : πίνακες, διαγράμματα, εικόνες
    • Ο έλεγχος οικονομικών δεδομένων (συνήθως γενικών και αναλυτικών καθολικών και άλλων λογιστικών καταστάσεων και δεδομένων) γίνεται συνήθως από τους ελεγκτές/ορκωτούς λογιστές χειρωνακτικά, με τα δεδομένα να βρίσκονται σε φύλλα εργασίας (π.χ., μορφής MS-Excel). Πρόκειται για μια δύσκολη και χρονοβόρα διαδικασία, η οποία θα μπορούσε να υποβοηθηθεί με χρήση προγραμματισμού και μεθόδων μηχανικής μάθησης. Στο πλαίσιο αυτής της διπλωματικής εργασίας θα εξεταστούν τρόποι διευκόλυνσης της διαδικασίας με χρήση μηχανικής μάθησης, χρησιμοποιώντας τη γλώσσα προγραμματισμού C# σε Microsoft Visual Studio 2019 καθώς και τη βιβλιοθήκη μηχανικής μάθησης Microsoft ML.NET η οποία δεν έχει εξερευνηθεί με επαρκείς εφαρμογές. Σκοπός είναι η υποστήριξη του ορκωτού ελεγκτή λογιστή στην κατηγοριοποίηση των δεδομένων σε συνήθη και μη (δυαδική ταξινόμηση). Τα μη συνήθη δεδομένα θα πρέπει να επισημανθούν για περαιτέρω έλεγχο. Στην πορεία αυτής της εργασίας διερευνήθηκαν οι τρόποι εξυπηρέτησης του σκοπού αυτού, και δοκιμάστηκαν δύο διαφορετικοί αλγόριθμοι δυαδικής ταξινόμησης (συγκεκριμένα ο Local Deep Support Vector Machine /Ld-SVM – αλγόριθμος μηχανής διανυσμάτων υποστήριξης και ο Fast Forest – αλγόριθμος δένδρου απόφασης), σε συνδυασμό βοηθητικά με τον αλγόριθμο συσταδοποίησης Κ-μέσων, επάνω σε δεδομένα πλασματικά και δημιουργημένα στο πνεύμα βιβλίων μιας τυπικής ναυτιλιακής εταιρείας. Η εφαρμογή που δημιουργήθηκε εκπαίδευσε τα απαραίτητα μοντέλα και έδωσε ικανοποιητικά αποτελέσματα με θετικές ανακλήσεις του εύρους 85%-100% που χρήζουν περαιτέρω διερεύνησης και επέκτασης δυνατοτήτων.
    • The audit of financial data (usually general and analytical general ledgers and other accounting statements and data) is usually done manually by auditors/accountants, with the data residing in spreadsheets (e.g., MS-Excel format). This is a difficult and time-consuming process, which could be assisted by the use of programming and machine learning methods. This thesis will explore ways of facilitating the process using machine learning, using the C# programming language in Microsoft Visual Studio 2019 and the Microsoft ML.NET machine learning library which has not been properly explored with sufficient applications. The purpose is to support the chartered accountant in categorizing data into ordinary and non-ordinary (binary classification). Non-routine data should be flagged for further review. In the course of this work, ways to serve this purpose were investigated, and two different binary classification algorithms (namely the Local Deep Support Vector Machine /Ld-SVM - support vector machine algorithm and the Fast Forest - decision tree algorithm) were tested, in combination with the K-means clustering algorithm, on fictitious data created in the spirit of accounting records of a typical shipping company. The resulting application trained the necessary models and yielded satisfactory results with positive recalls in the range of 85%-100% that need further exploration and feature expansion.
  14. Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές