Αλγόριθμοι ασαφούς συσταδοποίησης

Fuzzy Clustering Algorithms (english)

  1. MSc thesis
  2. Γιαννάκης, Ζήνων
  3. Μεταπτυχιακές Σπουδές στα Μαθηματικά (ΜΣΜ)
  4. 19 November 2016 [2016-11-19]
  5. Ελληνικά
  6. 160
  7. Παπαδόπουλος, Βασίλειος
  8. Παπαδόπουλος, Βασίλειος | Ανούσης, Μιχαήλ
  9. συσταδοποίηση | ασαφής λογική | ασαφής συσταδοποίηση | αλγόριθμος ασαφών c-μέσων | clustering | fuzzy logic | fuzzy clustering | fuzzy c-means algorithm
  10. 2
  11. 13
  12. 29
  13. Περιέχει: πίνακες, σχήματα, διαγράμματα, εικόνες, φωτογραφίες και χάρτες.
    • Η συσταδοποίηση (ανάλυση συστάδων) αποτελεί μια σημαντική μέθοδο εξόρυξης δεδομένων κατά τη διαδικασία ανακάλυψης γνώσης σε βάσεις δεδομένων. Ομαδοποιεί τα δεδομένα σε συστάδες, έτσι, ώστε αυτά που ανήκουν στην ίδια συστάδα να παρουσιάζουν τη μεγαλύτερη δυνατή ομοιότητα και αυτά που βρίσκονται σε διαφορετικές συστάδες να έχουν τη μικρότερη δυνατή ομοιότητα μεταξύ τους. Θεωρείται ως μη επιβλεπόμενη κατηγοριοποίηση, καθώς δεν υπάρχει κάποια προηγούμενη γνώση για το πλήθος και τη δομή των συστάδων, ενώ πραγματοποιείται με πολλούς αλγορίθμους, διαφορετικών ιδιοτήτων και αποδόσεων, οι οποίοι βελτιώνονται συνεχώς. Η ανάλυση συστάδων χρησιμοποιείται στις οικονομικές επιστήμες, στην αναγνώριση προτύπων, στην τεχνητή νοημοσύνη και αλλού. Η ασαφής συσταδοποίηση είναι μια τεχνική συσταδοποίησης που χρησιμοποιεί έννοιες της ασαφούς λογικής και της θεωρίας ασαφών συνόλων. Επεκτείνει την έννοια της (αυστηρής) συσταδοποίησης, θεωρώντας ότι κάθε αντικείμενο ανήκει σε κάθε συστάδα με κάποιον βαθμό συμμετοχής και προσφέροντας έτσι μια λεπτομερέστερη επεξεργασία. Στο πρώτο κεφάλαιο της διπλωματικής εργασίας ορίζεται και αναλύεται η έννοια της συσταδοποίησης. Αναπτύσσονται τα βήματα της διαδικασίας εύρεσης των συστάδων, παρουσιάζονται τα μέτρα ομοιότητας που απαιτούνται και, ανάλογα με τον τρόπο οργάνωσης των συστάδων, διακρίνονται οι κατηγορίες των μεθόδων συσταδοποίησης, καθώς και οι πιο αντιπροσωπευτικοί αλγόριθμοι αυτών των μεθόδων. Στο δεύτερο κεφάλαιο εισάγεται η έννοια της ασαφούς λογικής, δίνονται οι βασικοί ορισμοί και αναφέρονται οι πράξεις και οι ιδιότητες των ασαφών συνόλων. Το τρίτο κεφάλαιο περιγράφει τη διαδικασία της ασαφούς συσταδοποίησης. Εξετάζεται λεπτομερώς ο αλγόριθμος fuzzy c-means, ο οποίος ανιχνεύει σφαιρικές συστάδες με σχεδόν παρόμοιο μέγεθος, ενώ μελετώνται δύο παραλλαγές του, οι αλγόριθμοι Gustafson-Kessel και Gath-Geva, οι οποίοι, σε αντίθεση με τον fuzzy c-means, μπορούν να εντοπίζουν συστάδες διαφορετικών σχημάτων, προσαρμόζοντας τοπικά τη μετρική απόστασης που χρησιμοποιούν. Η διπλωματική εργασία ολοκληρώνεται με το πειραματικό μέρος, όπου εκτελείται ο αλγόριθμος fuzzy c-means σε ένα σύνολο συγκεντρώσεων αέριων ρύπων, ερμηνεύονται τα αποτελέσματα της έρευνας και παρουσιάζονται τα συμπεράσματα.
    • Clustering (cluster analysis) is an important method of data mining in the process of Knowledge Discovery in Databases (KDD). It groups the data into clusters, so that those belonging to the same cluster present the greatest possible similarity and those that are located in different clusters have the least similarity to each other. This process is considered as unsupervised classification, as there is no prior knowledge about the crowd and structure of the clusters. It is performed with many algorithms, with different properties and yields, which are constantly improving. Cluster analysis is used in economic sciences, pattern recognition, artificial intelligence and elsewhere. Fuzzy clustering is a clustering technique that uses concepts of fuzzy logic and fuzzy sets theory. It expands the concept of (hard) clustering, by considering that each object belongs to every cluster with some degree of membership, and thus offers a more detailed processing. The first chapter of the thesis defines and analyzes the concept of clustering. The steps of the cluster analysis process are being developed, the required similarity measures are presented, and, according the organization of the clusters, the categories of clustering methods as well as the more representative algorithms of these methods, are distinguished. In the second chapter, the concept of fuzzy logic is introduced, the basic definitions are given and the operations and properties of the fuzzy sets are discussed. The third chapter describes the process of fuzzy clustering. The fuzzy c-means algorithm, which detects spherical clusters of almost similar size, is examined in detail. Then the two variants of it are presented; the Gustafson-Kessel and Gath-Geva algorithms, which can find clusters of different shapes by locally adapting the metric distance they use, unlike the fuzzy c-means. The thesis is concluded with the experimental part, where the fuzzy c-means algorithm is executed in a set of air pollutants concentrations, the results of the research are interpreted and the conclusions are presented.
  14. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.