Μοντελοποίηση και Κατηγοριοποίηση της Ποιότητας Αέρα σε Βιομηχανικές και Κατοικημένες περιοχές με Χρήση Τεχνικών Μηχανικής Μάθησης

Modeling and Categorization of Air Quality in Industrial and Residential Areas Using Machine Learning Techniques (english)

  1. MSc thesis
  2. ΑΝΑΣΤΑΣΙΑ ΤΑΡΑΖΩΝΑ
  3. Δημόσια Διοίκηση και Ηλεκτρονική Διακυβέρνηση (ΔΜΔ)
  4. 07 March 2026
  5. Ελληνικά
  6. 135
  7. Αλέξανδρος Τζάλλας
  8. Γιαννακέας Νικόλαος
  9. Μηχανική Μάθηση, WEKA, Ατμοσφαιρική Ρύπανση, Ατμοσφαιρικοί Ρύποι, Βιομηχανικές και Κατοικημένες Περιοχές,
  10. Αναλυτική Δεδομένων, Σημασιολογικός Ιστός και ΑΡΙs/ΔΜΔ60
  11. 26
  12. 34
  13. Περιλαμβάνει: Πίνακες, Διαγράμματα, Εικόνες
    • Η παρούσα διπλωματική εργασία εστιάζει στη μοντελοποίηση και κατηγοριοποίηση της ποιότητας του αέρα σε βιομηχανικές και κατοικημένες περιοχές, με τη χρήση τεχνικών μηχανικής μάθησης. Για τον σκοπό αυτό αξιοποιείται εκτεταμένο σύνολο δεδομένων που περιλαμβάνει συγκεντρώσεις βασικών ατμοσφαιρικών ρύπων, όπως CO, NO₂, SO₂, O₃, PM2.5 και PM10, προερχόμενες από έξι διαφορετικές πόλεις ήτοι η Μόσχα, το Πεκίνο, το Δελχί, τη Ζυρίχη, το Βανκούβερ και τη Στοκχόλμη και τύπους περιοχών, όπως βιομηχανικές και αστικές. Αρχικά πραγματοποιείται εκτενής περιγραφική στατιστική ανάλυση, με στόχο την κατανόηση της κατανομής, της μεταβλητότητας και της ύπαρξης ακραίων τιμών στα δεδομένα. Στη συνέχεια εφαρμόζονται διαδικασίες προεπεξεργασίας, καθαρισμού και κανονικοποίησης στο περιβάλλον WEKA, ώστε να διασφαλιστεί η ποιότητα και η αξιοπιστία του τελικού συνόλου δεδομένων. Η κατηγοριοποίηση των περιοχών υλοποιείται μέσω εποπτευόμενων αλγορίθμων μηχανικής μάθησης, συγκεκριμένα της Λογιστικής Παλινδρόμησης, του Random Forest και του Support Vector Machine (SMO), ενώ συμπληρωματικά εφαρμόζονται μη εποπτευόμενες τεχνικές, όπως η ομαδοποίηση K-Means, καθώς και τεχνικών μείωσης διαστάσεων και διερεύνησης της εσωτερικής δομής των δεδομένων. Τα αποτελέσματα δείχνουν ότι όλοι οι αλγόριθμοι παρουσιάζουν υψηλή απόδοση στην κατηγοριοποίηση των περιοχών, με τον αλγόριθμο Random Forest να υπερέχει σε όρους ακρίβειας και συνολικής σταθερότητας. Η ανάλυση αναδεικνύει τη σημαντική συμβολή συγκεκριμένων ρύπων στη διάκριση μεταξύ βιομηχανικών και κατοικημένων περιοχών και επιβεβαιώνει την καταλληλότητα των τεχνικών μηχανικής μάθησης για την ανάλυση σύνθετων περιβαλλοντικών δεδομένων. Συνοπτικά, η εργασία καταδεικνύει ότι η συνδυαστική χρήση στατιστικής ανάλυσης και μηχανικής μάθησης μπορεί να αποτελέσει αξιόπιστο εργαλείο για την αξιολόγηση της ποιότητας του αέρα και να υποστηρίξει τον περιβαλλοντικό σχεδιασμό και τη λήψη αποφάσεων σε αστικά περιβάλλοντα.

    • This thesis focuses on the modeling and categorization of air quality in industrial and residential areas, using machine learning techniques. For this purpose, an extensive dataset is utilized that includes concentrations of key air pollutants, such as CO, NO₂, SO₂, O₃, PM2.5 and PM10, originating from six different cities, namely Moscow, Beijing, Delhi, Zurich, Vancouver and Stockholm, and types of areas, such as industrial and urban. Initially, an extensive descriptive statistical analysis is performed, aiming to understand the distribution, variability and the existence of extreme values in the data. Then, preprocessing, cleaning and normalization procedures are applied in the WEKA environment, in order to ensure the quality and reliability of the final dataset. The categorization of the regions is implemented through supervised machine learning algorithms, specifically Logistic Regression, Random Forest and Support Vector Machine (SMO), while unsupervised techniques are additionally applied, such as K-Means clustering, as well as dimensionality reduction techniques and exploration of the internal structure of the data. The results show that all algorithms exhibit high performance in classifying the areas, with the Random Forest algorithm excelling in terms of accuracy and overall stability. The analysis highlights the significant contribution of specific pollutants in the distinction between industrial and residential areas and confirms the suitability of machine learning techniques for the analysis of complex environmental data. In summary, the work demonstrates that the combined use of statistical analysis and machine learning can be a reliable tool for air quality assessment and support environmental planning and decision-making in urban environments.

  14. Hellenic Open University
  15. Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές