Επιστήμη των Δεδομένων, Επιχειρηματική Ευφυΐα, Μεγάλα Δεδομένα, Εξόρυξη Δεδομένων, Εντοπισμός Τραπεζικής Απάτης, Apache Spark, Spark Scala. | Data Science, Business Intelligence, Big Data, Fraud Detection, Apache Spark, Spark Scala.
3
17
Περιέχει : πίνακες, εικόνες, γραφήματα
Η ραγδαία εξέλιξη της τεχνολογίας, αποτελεί επιτακτική ανάγκη για την ανάπτυξη μεθοδολογιών αποθήκευσης και διαχείρισης δεδομένων μεγάλης κλίμακας. Η χρησιμοποίηση δεδομένων στη λήψη έγκυρων και έγκαιρων αποφάσεων έχει αναχθεί σε «εκ των ουκ άνευ» παράγοντα επιτυχίας για την πλειονότητα των σύγχρονων οργανισμών και επιχειρήσεων.
Τα τελευταία χρόνια, παρατηρείται μεγάλη μεταβολή στην μορφή και στον όγκο των δεδομένων, λόγω της ταχύτατης ανάπτυξης νέων τεχνολογιών και εφαρμογών, ενώ ταυτόχρονα οι δυνατότητες αποθήκευσης, ανάλυσης και επεξεργασίας αυτών είναι εντυπωσιακές.
Οι όροι Επιστήμη των Δεδομένων (Data Science), Επιχειρηματική Ευφυΐα (Business Intelligence) και Μεγάλα Δεδομένα (Big Data), εντοπίζονται στην καθημερινή δραστηριότητα των ΙΤ τμημάτων, μικρών και μεγάλων οργανισμών.
Με την παρούσα πτυχιακή εργασία παρουσιάζονται προηγμένα θέματα εξόρυξης, μοντέρνες τεχνικές ανάλυσης και διαχείρισης δεδομένων μεγάλης κλίμακας και των εφαρμογών τους σε μεγάλα χρηματοπιστωτικά ιδρύματα, για την υποστήριξη λήψης αποφάσεων για τον εντοπισμό απάτης (Fraud Detection).
Το τραπεζικό σύστημα, αποτελεί τη ραχοκοκαλιά της παγκόσμιας οικονομίας. Ταυτόχρονα, ο όγκος και η πολυπλοκότητα των δεδομένων που συλλέγονται απαιτεί πολύ μεγάλη υπολογιστική προσπάθεια και ο κίνδυνος σφαλμάτων είναι ιδιαίτερα υψηλός.
Η ευθύνη τόσο των εσωτερικών όσο και εξωτερικών ελέγχων είναι ιδιαίτερα μεγάλη στα χρηματοπιστωτικά ιδρύματα, τα οποία σήμερα επηρεάζουν την γενικότερη οικονομική κατάσταση των χωρών.
Ενδεικτικός στόχος της παρούσας πτυχιακής είναι ο σχεδιασμός και η υλοποίηση μια πλατφόρμας λογισμικού, η οποία θα χρησιμοποιηθεί ώστε να επιφέρει χρήσιμα και καλύτερα συμπεράσματα, για την ανίχνευση της απάτης στα χρηματοπιστωτικά ιδρύματα. Για το λόγο αυτό θα χρησιμοποιηθούν κατανεμημένοι αλγόριθμοι αποθήκευσης, ανάλυσης και επεξεργασίας δεδομένων μεγάλου όγκου, προσδοκώντας στην αισθητή μείωση του χρόνου επεξεργασίας και λήψης στρατηγικών αποφάσεων. Επιπλέον, στο πλαίσιο της διπλωματικής εργασίας, θα αποτυπωθεί επιγραμματικά και μερικώς η εννοιολογική συσχέτιση του εσωτερικού και εξωτερικού ελέγχου, για την μέγιστη δυνατή ελαχιστοποίηση των τραπεζικών απατών.
The rapid development of technology is an imperative for the development of large-scale storage and management methodologies. The use of data in making timely and timely decisions has become a "sophisticated" success factor for the majority of modern organizations and businesses.
In recent years, there has been a large change in form and volume of data due to the rapid development of new technologies and applications, while the storage, analysis and processing capabilities are impressive.
The terms Data Science, Business Intelligence and Big Data are found in the day-to-day activity of IT departments, small and large organizations.
This diploma thesis presents advanced mining issues, advanced large-scale data analysis and management techniques and their applications in large financial institutions to support Fraud Detection.
The banking system is the backbone of the global economy. At the same time, the volume and complexity of the data collected requires a great deal of computational effort and the risk of errors is particularly high.
The responsibility for both internal and external controls is particularly high in financial institutions, which currently affect the overall economic situation of countries.
An indicative goal of this paper is the design and implementation of a software platform that will be used to provide useful and better conclusions for detecting fraud in financial institutions. For this reason, distributed storage, analysis and processing of large volume data algorithms will be used, expecting a significant reduction in processing time and strategic decision making.
In addition, in the context of thesis, the conceptual correlation of internal and external control, in order to maximize the minimization of bank frauds, will be outlined in part and in part.