- MSc thesis
- Τραπεζική, Λογιστική και Χρηματοοικονομική (ΤΛΧ)
- 15 Σεπτεμβρίου 2024
- Ελληνικά
- 74
- Γουνόπουλος, Δημήτριος
- Μηχανική Μάθηση, Χρεοκοπία, Πρόβλεψη, Μοντελοποίηση, Απόδοση ακρίβειας
- Χρηματοοικονομική / ΤΛΧ52
- 189
-
-
Η πρόβλεψη της χρεοκοπίας περιλαμβάνει την εκτίμηση της πιθανότητας μιας εταιρείας να αντιμετωπίσει οικονομική δυσκολία ή ακόμα και να οδηγηθεί σε πτώχευση, καθιστώντας το σημαντικό πεδίο μελέτης στο πλαίσιο της χρηματοοικονομικής και λογιστικής. Η σημαντικότητα του πεδίου ανάγεται στην ανάγκη των πιστωτών και των επενδυτών να αξιολογούν τις πιθανότητες χρεοκοπίας μιας εταιρείας. Στόχο της πρόβλεψης της οικονομικής κρίσης αποτελεί η ανάπτυξη ενός προγνωστικού μοντέλου, το οποίο συνδυάζει διάφορες οικονομετρικές παραμέτρους που επιτρέπουν την πρόβλεψη της χρηματοοικονομικής κατάστασης μιας επιχείρησης. Με την πάροδο του χρόνου, έχουν προκύψει διαφορετικές μεθοδολογίες, που κυμαίνονται από παραδοσιακές στατιστικές προσεγγίσεις όπως η δοκιμή υποθέσεων και τα γενικευμένα γραμμικά μοντέλα σε πιο πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη όπως τα νευρικά δίκτυα, οι μηχανές υποστήριξης και τα δέντρα λήψης αποφάσεων. Η συγκεκριμένη μελέτη επικεντρώνεται στην τεκμηρίωση των παρατηρήσεων, καθώς εξερευνούμε, κατασκευάζουμε και συγκρίνουμε μερικά από τα πιο ευρέως διαδεδομένα μοντέλα ταξινόμησης: Gaussian Naïve Bayes, Λογιστική Παλινδρόμηση, Δέντρα Απόφασης και Τυχαία Δάση. Η ανάλυσή μας διεξάγεται χρησιμοποιώντας ένα σύνολο δεδομένων των πολωνικών εταιρειών που αντιμετωπίζουν πτώχευση, ενισχυμένο με συνθετικά για να αντικατοπτρίζουν στατιστικά στοιχεία υψηλότερης τάξης. Ένα συνθετικό χαρακτηριστικό είναι ένας συνδυασμός των οικονομετρικών μετρήσεων χρησιμοποιώντας αριθμητικές όπως προσθήκη, αφαίρεση, πολλαπλασιασμός και διχοτόμηση. Για να προετοιμάσουμε τα δεδομένα για ανάλυση, εκτελούμε πρώτα την προεπεξεργασία δεδομένων και την εξερευνητική ανάλυσή τους, όπου υπολογίζουμε τις τιμές των δεδομένων που λείπουν χρησιμοποιώντας δημοφιλείς τεχνικές αποτίμησης όπως η Μέση Τιμή, k-Πλησιέστερων Γειτόνων, και Πολυμεταβλητή αποτίμηση με αλυσίδες εξισώσεων(MICE). Για την αντιμετώπιση του προβλήματος της ανισορροπίας των δεδομένων, εφαρμόζουμε την τεχνική υπερβολικής δειγματοληψίας συνθετικών μειονοτήτων (Synthetic Minority Oversampling Technique - SMOTE) για να υπερεξετάζουμε τις ετικέτες των τάξεων των μειονοτήτων. Στη συνέχεια, χρησιμοποιούμε την μέθοδο k-Fold Διασταυρούμενης Επικύρωσης (k-fold Cross Validation) για να εκπαιδεύσουμε και να δοκιμάσουμε τα επιλεγμένα μοντέλα χρησιμοποιώντας τόσο τα αρχικά όσο και τα ενισχυμένα σύνολα δεδομένων. Τέλος, αξιολογούμε την απόδοση του μοντέλου σε σύνολα δεδομένων επικύρωσης χρησιμοποιώντας διάφορες μετρήσεις όπως η ακρίβεια, η ευστοχία και η ορθότητα επιτρέποντάς μας να ταξινομήσουμε αναλόγως τα μοντέλα με βάση την αποτελεσματικότητά τους. Συνοψίζοντας, συζητάμε τις προκλήσεις που αντιμετωπίσαμε και προτείνουμε πιθανούς τρόπους βελτίωσης της πρόβλεψης, συμπεριλαμβανομένου του εύρους για μελλοντική εργασία.
-
Bankruptcy prediction involves estimating the probability of a company facing financial distress or even insolvency, making it a significant field of study within finance and accounting. Creditors and investors rely heavily on bankruptcy prediction models to assess the risk associated with lending to or investing in a company. The objective of bankruptcy prediction is to develop a predictive model that combines various econometric parameters to forecast a company's financial health. Over time, numerous methodologies have emerged, ranging from traditional statistical approaches like hypothesis testing and generalized linear models to recent advancements in artificial intelligence such as neural networks, support vector machines, and decision trees. This study focuses on empirically validating these observations by exploring, constructing, and comparing some of the most widely used classification models: Gaussian Naïve Bayes, Logistic Regression, Decision Trees, and Random Forests. Our analysis is conducted using a dataset of Polish companies facing bankruptcy, augmented with synthetic data to account for higher-order statistics. A synthetic feature is a combination of econometric measures using arithmetic operations such as addition, subtraction, multiplication, and division. To prepare the data for analysis, we first perform data preprocessing and exploratory data analysis, where we impute missing values using popular imputation techniques like Mean, k-Nearest Neighbors, and Multivariate Imputation by Chained Equations (MICE). To address the issue of data imbalance, we apply the Synthetic Minority Oversampling Technique (SMOTE) to oversample the minority class labels. Subsequently, we employ the k-fold Cross-Validation method to train and test the selected models using both the original and augmented datasets. Finally, we evaluate the model performance on validation sets using various metrics such as accuracy, precision, and recall, allowing us to rank the models based on their effectiveness. In conclusion, we discuss the challenges encountered and propose potential ways to improve prediction, including avenues for future work.
-
- Hellenic Open University
- Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές
Μηχανική Μάθηση στην πρόγνωση της χρεοκοπίας
Machine Learning in bankruptcy prediction (Αγγλική)
Κύρια Αρχεία Διατριβής
- Μηχανική Μάθηση στην πρόγνωση της χρεοκοπίας
Περιγραφή: Μηχανική Μάθηση στην πρόγνωση της χρεοκοπίας.pdf (pdf) Book Reader
Μέγεθος: 3.3 MB