ΑΝΑΠΤΥΞΗ ΜΟΝΤΕΛΟΥ ΕΝΙΣΧΥΤΙΚΗΣ ΜΑΘΗΣΗΣ ΚΑΙ ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΜΟΝΤΕΛΩΝ ΣΥΝΤΗΡΗΣΗΣ ΟΔΟΣΤΡΩΜΑΤΩΝ

DEVELOPMENT OF A REINFORCEMENT LEARNING MODEL AND COMPARATIVE ANALYSIS OF ROAD MAINTENANCE MODELS (Αγγλική)

  1. MSc thesis
  2. ΚΩΝΣΤΑΝΤΙΝΟΣ ΓΕΡΟΝΙΚΟΣ
  3. Διαχείριση Τεχνικών Έργων (ΔΧΤ)
  4. 21 Σεπτεμβρίου 2024
  5. Ελληνικά
  6. 124
  7. ΚΟΥΛΟΥΡΙΩΤΗΣ ΔΗΜΗΤΡΙΟΣ
  8. ΚΟΥΛΟΥΡΙΩΤΗΣ ΔΗΜΗΤΡΙΟΣ | ΤΣΙΡΚΑΣ ΣΩΤΗΡΙΟΣ
  9. Διαχείριση οδοστρωμάτων, συντήρηση οδοστρωμάτων, βέλτιστος προγραμματισμός, γραμμικός προγραμματισμός, βελτιστοποίηση, ενισχυτική μάθηση
  10. ΔΧΤ51 - Τεχνική της Κατασκευής, ΔΧΤ50 - Αρχές Οργάνωσης και Διοίκησης Έργων
  11. 10
  12. 60
    • Το ερευνητικό αντικείμενο της παρούσας μεταπτυχιακής διπλωματικής εργασίας είναι η ανάπτυξη και η συγκριτική ανάλυση μοντέλων συντήρησης οδοστρωμάτων με το βέλτιστο προγραμματισμό των εργασιών συντήρησης. Ο σκοπός της παρούσας μεταπτυχιακής διπλωματικής διατριβής είναι η μαθηματική μοντελοποίηση και η επίλυση της με σκοπό τον βέλτιστο προγραμματισμό των εργασιών συντήρησης οδοστρωμάτων, με ταυτόχρονη ελαχιστοποίηση του κόστους επισκευής και μεγιστοποίηση της κατάστασης του οδοστρώματος. Ως επιπλέον στόχος ήταν η βελτίωση και η επέκταση μέσω περαιτέρω έρευνας - ανάπτυξης της διπλωματικής εργασίας που εκπόνησα στο πολυτεχνείο κατά την διάρκεια των σπουδών μου.

      Πραγματοποιήθηκε έρευνα στο πως θα μπορούσε να τροποποιηθεί το αρχικό μοντέλο ώστε να μας δώσει πιο αξιόπιστα, γενικευμένα και εύρωστα αποτελέσματα. Αυτό επιτεύχθηκε προσαρμόζοντας την αρχική αντικειμενική συνάρτηση, βελτιώνοντας τους περιορισμούς, επίλυση με την βοήθεια της μεθοδολογίας της ενισχυτικής μάθησης και υλοποίηση του μοντέλου σε επίπεδο κώδικα. Έγινε ανάπτυξη μοντέλων βελτιστοποίησης κατανομής πόρων για την συντήρηση, την επιδιόρθωση και την αναβάθμιση του οδοστρώματος σε μια αστική περιοχή του οδικού δικτύου της Αλεξανδρούπολης, αποτελούμενο από 50 συνδέσμους. Επιλέχθηκαν 4 είδη εργασιών συντήρησης για την επισκευή των βλαβών στα 50 τμήματα οδοστρώματος στις 30 μέρες του μήνα, ώστε να μπορεί να γίνει σύγκριση με το προ υπάρχον μοντέλο και να δούμε διαφορές στα αποτελέσματα που θα προκύψουν. Για τον λόγο αυτό αναπτύσσεται μαθηματικό μοντέλο βελτιστοποίησης με εφαρμογή στον επιστημονικό κλάδο της επιχειρησιακής έρευνας και βελτιστοποίησης για μηχανικούς. Συγκεκριμένα βασίζεται στο πρόβλημα του γραμμικού προγραμματισμού της μορφής με πράκτορα που δημιουργεί μια αλληλουχία ενεργειών, η οποία ονομάζεται πολιτική στην ενισχυτική μάθηση.

      Για την επίλυση του γραμμικού προβλήματος, αναπτύχθηκε ένας πράκτορας ενισχυτικής μάθησης. Ο πράκτορας αλληλοεπιδρά με το οδικό δίκτυο σε τακτά χρονικά διαστήματα. Στόχος του πράκτορα ενισχυτικής μάθησης είναι η βελτιστοποίηση του προγραμματισμού εργασιών συντήρησης, στοχεύοντας ταυτόχρονα στην ελαχιστοποίηση του σχετικού κόστους και την βελτίωση της κατάστασης του οδοστρώματος. Για την επίτευξη αυτού του στόχου, ο πράκτορας λαμβάνει πληροφορίες για την κατάσταση κάθε τμήματος του οδικού δικτύου σε κάθε χρονική στιγμή. Η κατάσταση αυτή εκφράζεται διάνυσμα τεσσάρων μεταβλητών.

    • The research object of this master thesis is the development and comparative analysis of pavement maintenance models with optimal scheduling of maintenance work. The purpose of the of this master thesis is the mathematical modeling and problem solving for optimal scheduling of pavement maintenance work while minimizing repair costs and maximizing the condition of the pavement. An additional objective was to improve and extend through further research - development the thesis work that I carried out at the National Technical University of Athens during my studies.

      Research was carried out on how the original model could be modified to give us more reliable, generalized and robust results. This was achieved by adapting the original objective function, improving the constraints, solving using reinforcement learning methodology and implementing the model at the code level. The development of resource allocation optimization models for the maintenance, repair and upgrading of the pavement was based in an urban area of the road network of Alexandroupolis, consisting of 50 links.Four types of maintenance activities were selected to repair the damage on 50 pavement sections in a 30- day period in order to detect  the differences of  the emerged results when compared with the existing model. For this purpose, a mathematical optimization model is developed with application to the discipline of operations research and optimization for engineers. In particular, it is based on the linear programming problem of the form with an agent that generates a sequence of actions, called policy in reinforcement learning.

      To solve the linear problem, a reinforcement learning agent was developed. The agent interacts with the road network at regular intervals. Its objective is to optimize the scheduling of maintenance tasks, while aiming to minimize the associated costs and improve the condition of the pavement. For this purpose, it obtains information about the state of each road segment at any given time. This state is expressed as a vector of four variables.

  13. Hellenic Open University
  14. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.