Στην παρούσα εργασία γίνεται αρχικά μια εισαγωγή στην έννοια και τις κατηγορίες του τραπεζικού κινδύνου, ενώ εξετάζεται ειδικότερα ο πιστωτικός κίνδυνος και αναλύονται οι παράμετροί του. Το κύριο αντικείμενο της εργασίας εστιάζει στην πιθανότητα αθέτησης (PD) και στις ποσοτικές μεθόδους εκτίμησής της στην Λιανική Τραπεζική οι οποίες περιγράφονται με τον γενικό όρο credit scoring. Οι μέθοδοι που χρησιμοποιούνται στο credit scoring για σκοπούς εκτίμησης της πιστοληπτικής ικανότητας των πελατών περιλαμβάνουν τις παραδοσιακές μεθόδους όπως η logistic regression, εναλλακτικές μεθόδους που έχουν προταθεί στο παρελθόν όπως η survival analysis και, κυρίως τα τελευταία χρόνια με την εξέλιξη της υπολογιστικής ισχύς και την αύξηση της διαθέσιμης πληροφορίας, τεχνικές από τον κλάδο της Artificial Intelligence και του Machine Learning όπως τα random forests, τα neural networks και τα support vector machines. Παράλληλα, περιγράφεται το εποπτικό και θεσμικό πλαίσιο μέσα στο οποίο καλούνται οι τραπεζικοί οργανισμοί να εφαρμόσουν τις διάφορες αυτές μεθόδους. Με στόχο την διασφάλιση της εύρυθμης λειτουργίας του χρηματοπιστωτικού συστήματος και την ελαχιστοποίηση του συστημικού κινδύνου, οι εποπτικές αρχές ειδικά μετά και από την κρίση του 2008, έχουν αυξήσει τις εποπτικές απαιτήσεις για τις τράπεζες είτε μέσω της αναβάθμισης υπαρχόντων πλαισίων όπως αυτό της Βασιλείας, είτε μέσω ανάπτυξης νέων frameworks για την ρύθμιση και εποπτεία των τραπεζικών δραστηριοτήτων. Έπειτα από την βιβλιογραφική ανασκόπηση, την αναλυτική παρουσίαση των βασικών μεθόδων εκτίμησης της πιθανότητας αθέτησης και την εξέταση των πλεονεκτημάτων και της κριτικής που έχει δεχθεί η κάθε μέθοδος, πραγματοποιείται μια εμπειρική ανάλυση περίπτωσης με χρήση δεδομένων από χαρτοφυλάκιο δανειοδοτήσεων. Σε αυτή γίνεται σύγκριση τριών βασικών υποδειγμάτων – logistic regression, random forest και neural network - ως προς τη διαχωριστική ικανότητα και την ακρίβεια εκτίμησης χρησιμοποιώντας τα αντίστοιχα στατιστικά μέτρα απόδοσης υποδειγμάτων. Τα αποτελέσματα αυτής της ανάλυσης υπέδειξαν ότι το random forest μοντέλο πέτυχε με διαφορά τις καλύτερες εκτιμήσεις στο δείγμα ανάπτυξης σε σχέση με τις άλλες δύο μεθόδους, η διαφορά όμως μετριάστηκε αρκετά όταν εφαρμόσθηκαν οι εκτιμήσεις των μοντέλων σε δείγματα εκτός του δείγματος ανάπτυξης.
The present thesis initially provides an introduction to the concept and the categories of banking risk, while credit risk in particularly is further examined and its parameters are analyzed. The main objective of the thesis focuses on the probability of default (PD) and the quantitative methods of its estimation in the Retail Banking which are described by the general term credit scoring. The methods used in credit scoring for customers’ credit rating purposes include traditional methods such as logistic regression, alternative methods proposed in the past such as survival analysis and, especially in recent years with the development of computing power and the increase of the available information, techniques from the field of Artificial Intelligence and Machine Learning such as random forests, neural networks and support vector machines. At the same time, the supervisory and regulatory framework in which banking organizations are called upon to implement these various methods is described. In order to ensure the proper functioning of the financial system and minimize systemic risk, supervisory authorities, especially after the 2008 crisis, have increased supervisory requirements for banks either by upgrading existing frameworks such as Basel or by developing new frameworks for the regulation and supervision of the several banking activities. Following the review in bibliography, the detailed presentation of the basic methods for the estimation of the probability of default and the examination of the advantages and the critique that each method has received, an empirical case study is performed using data from a loan portfolio. In this study a comparison of three basic models is performed - logistic regression, random forest and neural network - in terms of discriminative power and estimations accuracy using the corresponding statistics that measure models’ performance. The results of this analysis indicated that the random forest model achieved by far the best estimates in the development sample compared to the other two methods, though the difference was significantly reduced when the models’ estimates were applied to samples out of the development sample.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Credit Scoring και Μοντέλα Πιστωτικού Κινδύνου στην Λιανική Τραπεζική, Σύγκριση Μεθόδων Εκτίμησης της Πιθανότητας Αθέτησης Περιγραφή: 129877_ΓΡΑΜΜΑΤΙΚΟΣ_ΧΡΗΣΤΟΣ.pdf (pdf)
Book Reader Πληροφορίες: Κυρίως σώμα διπλωματικής Μέγεθος: 2.1 MB
Credit Scoring και Μοντέλα Πιστωτικού Κινδύνου στην Λιανική Τραπεζική, Σύγκριση Μεθόδων Εκτίμησης της Πιθανότητας Αθέτησης - Identifier: 148872
Internal display of the 148872 entity interconnections (Node labels correspond to identifiers)